Buscar en este blog

Mostrando entradas con la etiqueta recuperación de información.. Mostrar todas las entradas
Mostrando entradas con la etiqueta recuperación de información.. Mostrar todas las entradas

miércoles, 6 de octubre de 2010

Lenguajes documentales

"Un lenguaje documental es el instrumento de descripción de los documentos en un sistema de información", el cual transforma la información relativa a los documentos en datos manipulables, para favorecer el control y la validación de los datos.

Los lenguajes documentales han de conseguir que se produzca una búsqueda y recuperación de información lo más eficaz posible, evitando al máximo el ruido y el silencio:

Ruido: documentos parásitos seleccionados por el sistema y que no respondan a la pregunta.

Silencio: documentos que respodiendo a la pregunta, han sido indizados por términos distintos a la demanda.

Fuente: FOX, Virginia. Análisis documental de contenido. Argentina. Alfagrama ediciones. 2005. pp 190-191

martes, 14 de septiembre de 2010

OBJETIVOS DE LA RECUPERACIÓN DE INFORMACIÓN


Existen tres objetivos fundamentales identificados en la recuperación de información:

  • ·         Poder recuperar sobre cualquier tipo de documento.
  • ·         Permitir consultas en lenguaje natural, que el SRI pueda entender cualquier pregunta
  • ·         Buscar un mecanismo idóneo para evaluar y ajustar la relación entre pregunta y respuesta, la mejor comparación de resultados
Para optimizar los resultados se define un proceso genérico de la R.I y consiste en simplemente establecer cómo funciona un proceso normal de recuperación de información a través de entradas o consultas, procesos a través de query generados por el usuario y procesados por el sistema de búsqueda y recuperación, posteriormente se entrega una salida o resultados de búsqueda en un ranking determinado por el SRI.

miércoles, 8 de septiembre de 2010

INFORMACIÓN DIGITAL

El concepto de información digital se aplica para todo aquello que está representado mediante ceros y unos dentro de una computadora. La información digital no sólo son textos electrónicos, también se incluyen las imágenes, el audio y el video, que al igual que los textos tienen diferentes formatos, codificaciones y representaciones en el mundo electrónico. Documentos de texto, imágenes, videos, animaciones, sonidos, etc., son convertidos a formato digital y almacenados en archivos que se distinguen unos de otros mediante el empleo de etiquetas pegadas al nombre que distinguen su naturaleza (doc, txt, jpg, gif, wav, etc.).

Es aquí donde el trabajo de una biblioteca digital se vuelve más complejo ya que para conformar el repositorio de información se deben encontrar estándares eficientes para texto, imágenes, audio y video. La información digital deberá convertirse de su formato original a un formato estándar eficiente. En el modelo tratado en este trabajo se considera SGML como el estándar para la representación del texto, siendo ésta una tendencia mundial, ya que sus bondades y características para la estructuración de texto lo hacen un buen aliado de las bibliotecas digitales. Más adelante se hablará en detalle de este lenguaje. En audio y video no profundizaremos mucho ya que en esta primera etapa del proyecto estaremos enfocados principalmente a la integración de acervos digitales provenientes de textos e imágenes.

Un paso anterior y de gran importancia, es convertir los objetos no digitales en digitales. Una misma página de texto puede producirse y almacenarse de distintas formas, pues los programas de cómputo que se emplean para crearlos pueden manipular la información resultando archivos de menor o mayor tamaño y con una diferente codificación.

Consultado en: http://www.bibliodgsca.unam.mx/tesis/tes7cllg/sec_16.htm

DOCUMENTO ESTRUCTURADO

Es aquel que nos diferencia la estructura del documento, claramente identificado con sus partes constitutivas