"Un lenguaje documental es el instrumento de descripción de los documentos en un sistema de información", el cual transforma la información relativa a los documentos en datos manipulables, para favorecer el control y la validación de los datos.
Los lenguajes documentales han de conseguir que se produzca una búsqueda y recuperación de información lo más eficaz posible, evitando al máximo el ruido y el silencio:
Ruido: documentos parásitos seleccionados por el sistema y que no respondan a la pregunta.
Silencio: documentos que respodiendo a la pregunta, han sido indizados por términos distintos a la demanda.
Fuente: FOX, Virginia. Análisis documental de contenido. Argentina. Alfagrama ediciones. 2005. pp 190-191
Universidad de La Salle. Programa de Sistemas de Información. Recuperación de información
Buscar en este blog
Mostrando entradas con la etiqueta recuperación de información.. Mostrar todas las entradas
Mostrando entradas con la etiqueta recuperación de información.. Mostrar todas las entradas
miércoles, 6 de octubre de 2010
Lenguajes documentales
Publicado por
LORENA LOBO LEGUIZAMÓN
en
16:32
0
comentarios
Enviar por correo electrónicoEscribe un blogCompartir en XCompartir con FacebookCompartir en Pinterest
martes, 14 de septiembre de 2010
OBJETIVOS DE LA RECUPERACIÓN DE INFORMACIÓN
Existen tres objetivos fundamentales identificados en
la recuperación de información:
- · Poder recuperar sobre cualquier tipo de documento.
- · Permitir consultas en lenguaje natural, que el SRI pueda entender cualquier pregunta
- · Buscar un mecanismo idóneo para evaluar y ajustar la relación entre pregunta y respuesta, la mejor comparación de resultados
Para optimizar los resultados
se define un proceso genérico de la R.I y consiste en simplemente establecer cómo funciona un proceso normal de
recuperación de información a través de entradas o consultas, procesos a través
de query generados por el usuario y procesados por el sistema de búsqueda
y recuperación, posteriormente se entrega una salida o resultados de búsqueda en un ranking
determinado por el SRI.
Publicado por
Diego Avella
en
7:56
0
comentarios
Enviar por correo electrónicoEscribe un blogCompartir en XCompartir con FacebookCompartir en Pinterest
miércoles, 8 de septiembre de 2010
INFORMACIÓN DIGITAL
El concepto de información digital se aplica para todo aquello que está representado mediante ceros y unos dentro de una computadora. La información digital no sólo son textos electrónicos, también se incluyen las imágenes, el audio y el video, que al igual que los textos tienen diferentes formatos, codificaciones y representaciones en el mundo electrónico. Documentos de texto, imágenes, videos, animaciones, sonidos, etc., son convertidos a formato digital y almacenados en archivos que se distinguen unos de otros mediante el empleo de etiquetas pegadas al nombre que distinguen su naturaleza (doc, txt, jpg, gif, wav, etc.).
Es aquí donde el trabajo de una biblioteca digital se vuelve más complejo ya que para conformar el repositorio de información se deben encontrar estándares eficientes para texto, imágenes, audio y video. La información digital deberá convertirse de su formato original a un formato estándar eficiente. En el modelo tratado en este trabajo se considera SGML como el estándar para la representación del texto, siendo ésta una tendencia mundial, ya que sus bondades y características para la estructuración de texto lo hacen un buen aliado de las bibliotecas digitales. Más adelante se hablará en detalle de este lenguaje. En audio y video no profundizaremos mucho ya que en esta primera etapa del proyecto estaremos enfocados principalmente a la integración de acervos digitales provenientes de textos e imágenes.
Un paso anterior y de gran importancia, es convertir los objetos no digitales en digitales. Una misma página de texto puede producirse y almacenarse de distintas formas, pues los programas de cómputo que se emplean para crearlos pueden manipular la información resultando archivos de menor o mayor tamaño y con una diferente codificación.
Consultado en: http://www.bibliodgsca.unam.mx/tesis/tes7cllg/sec_16.htm
Publicado por
Diego Avella
en
11:23
0
comentarios
Enviar por correo electrónicoEscribe un blogCompartir en XCompartir con FacebookCompartir en Pinterest
DOCUMENTO ESTRUCTURADO
Es aquel que nos diferencia la estructura del documento, claramente identificado con sus partes constitutivas
Publicado por
Diego Avella
en
11:08
0
comentarios
Enviar por correo electrónicoEscribe un blogCompartir en XCompartir con FacebookCompartir en Pinterest
Suscribirse a:
Entradas (Atom)