Buscar en este blog

Mostrando entradas con la etiqueta lenguajes documentales. Mostrar todas las entradas
Mostrando entradas con la etiqueta lenguajes documentales. Mostrar todas las entradas

miércoles, 6 de octubre de 2010

Lenguajes documentales

"Un lenguaje documental es el instrumento de descripción de los documentos en un sistema de información", el cual transforma la información relativa a los documentos en datos manipulables, para favorecer el control y la validación de los datos.

Los lenguajes documentales han de conseguir que se produzca una búsqueda y recuperación de información lo más eficaz posible, evitando al máximo el ruido y el silencio:

Ruido: documentos parásitos seleccionados por el sistema y que no respondan a la pregunta.

Silencio: documentos que respodiendo a la pregunta, han sido indizados por términos distintos a la demanda.

Fuente: FOX, Virginia. Análisis documental de contenido. Argentina. Alfagrama ediciones. 2005. pp 190-191

lunes, 4 de octubre de 2010

Los lenguajes documentales en la recuperación de información


"Los lenguajes documentales surgen de la necesidad de recuperar información de una forma eficiente", "gracias a la normalización, las reglas y su notación eliminan una gran cantidad de problemas de los lenguajes naturales tales como la gramática, la redundancia, la polisemia, homoninia y sinonimia, entre otras, pues representa las áreas del conocimiento de forma sistémica, reduce la ambiguedad, aporta precisión y permite un mejor análisis de un campo determinado".

Fuente: SIERRA ESCOBAR, Luis Fernando.2010. Diccionario especializado en archivística: nexos y determinantes.Revista Códice. Volumen 6 No. 1. p 66-67

miércoles, 29 de septiembre de 2010

Objetivo de los Lenguajes Documentales.

Anteriormente ya habíamos mostrado algunos conceptos de Lenguajes Documentales, según algunos expertos en el tema, esta vez nos centraremos en el para qué de estos Lenguajes Documentales, todo con el ánimo de ir aclarando y ampliando de forma sencilla el entendimiento de este concepto y todas sus implicaciones en el ámbito de la recuperación de información.
En este sentido tenemos que el principal objetivo de los Lenguajes Documentales es el de hacer más fácil la recuperación de informacion y de documentos, buscando con esto reducir tiempos y esfuerzos para el usuario que realiza la búsqueda. Teniendo en cuenta que los Lenguajes Documentales poseen la capacidad para representar los mensajes contenidos en los documentos, esto permite cumplir estos objetivos específicos:
·         Normalizar: Lograr unificación en la terminología.
·         Induce: Es decir, le indica al usuario todas las posibles alternativas por medio de las cuales va a poder recuperar información.
·         Describe el contenido de los documentos: Después de la lectura e identificación de los conceptos contenidos en los documentos, éstos se representan mediante un lenguaje documental que proporciona un vocabulario unívoco que permite traducir los conceptos en términos normalizados.
·         Recuperación de la Información: El Lenguaje Documental tiene la capacidad de suministrar un vocabulario con los términos que se están demandando, es decir, proporciona los elementos que permiten realizar la búsqueda en niveles aun mas específicos.


Fuente:

Los lenguajes documentales. Disponible en: www3.unileon.es/dp/abd/tesauro/pagina/.../lengdocu.htm. (consultado 29 septiembre de 2010).

La organización de la información, los lenguajes documentales y la normalización. Disponible en: http://www.binal.ac.pa/archivos/catcoop/auts/orginfo.PDF. (consultado 29 septiembre de 2010).

lunes, 27 de septiembre de 2010

Lenguajes Documentales: Algunas definiciones.

El objetivo de este artículo, tal como lo presentamos con los conceptos de Recuperacion de Información, es hacer un recorrido por distintas definiciones dadas al concepto de Lenguajes  Documentales, para finalmente llegar a una conclusión general sobre esta.

Empezamos con Banca Gil quien dice que un Lenguaje Documental es el sistema artificial de símbolos estandarizados que facilitan la representación del contenido de los documentos para facilitar la recuperación manual o automática de la información solicitada por el usuario.

Por otra parte para Antonio García Gutiérrez, los lenguajes documentales están compuestos por un listado de términos que los constituyen como vocabulario, y por unas relaciones entre ellos que dinamizan esos vocabularios y le otorgan la categoría de lenguaje. Estos lenguajes se generan por el proceso del análisis de los documentos puesto que el objetivo que se persigue es el control y manipulación de sus contenidos para poder satisfacer las demandas de información.

J. Rowley, en su libro Organizing knowledge, usa el termino indexing languages refiriéndose a este como "una lista de términos o notaciones que pueden ser utilizados como punto de acceso en un índice"

Finalmente según la Norma Técnica Colombiana NTC 1544, Documentación, indización, Terminología,  el lenguaje documental es “un lenguaje artificial, construido con base en reglas preestablecidas, utilizando los sistemas de documentación para indización, con propósitos de almacenamiento y recuperación

Finalmente y tomando como base los conceptos dados anteriormente podemos afirmar que todos apuntan hacia lo mismo, es decir, aunque las definiciones son diferentes, el objetivo que persiguen es básicamente el mismo, decir que el lenguaje documental, es un listado de términos controlados, que van a permitir facilitar la recuperación de la información contenida en un determinado documento


Fuentes:

Los Lenguajes Documentales. Disponible en: http://www3.unileon.es/dp/abd/tesauro/pagina/conceptos/lengdocu.htm. (consultado 25 septiembre de 2010)

Analisis Documental y lenguajes Documentales. Disponible en: lavelablanca.neositios.com/downloads.php?id=11919&dId. (consultado 25 septiembre de 2010)

ICONTEC. Norma Tecnica Colombiana NTC 1544. Documentacion, Indizacion, Terminologia. Disponible en: http://www.sinab.unal.edu.co/ntc/NTC1544.pdf. (consultado 26 septiembre de 2010).

viernes, 10 de septiembre de 2010

MODELOS DE RECUPERACIÓN DE INFORMACIÓN

Como es bien conocido, en los últimos años se ha venido presentado el fenómeno de los Buscadores Online, y por ende se han producido toda una serie de repercusiones en la administración y recuperación de la información que estos buscadores nos entregan al momento de que lo solicitamos, en tal sentido es necesario saber el método, o los métodos que usan estos buscadores para acertar en la respuesta a la pregunta que se les plantea en un determinado momento.

En tal sentido, nos encontramos con que de forma general los modelos de recuperación de información están estructurados asi:
- Modelos Clasicos: en este se encuentra el modelo booleano y probalisitco.
- Modelos Estructurales: basado en listas no sobrepuestas y el método de nodos proximales.

Con el ánimo de presentar una comparación y descripción de los modelos de recuperación de información, presentamos el siguiente cuadro que permite una caracterización mucho más sencilla que la encontrada en la literatura que trata del tema:


Ítem / Modelos BooleanoVectorialProbalístico
DEs uno de los más usados para la RI, se basa en la agrupación de documentos compuestos por conjuntos de términos, y en el concepto de las preguntas como una expresión booleana.Presenta la posibilidad de emparejamiento parcial, por medio de la asignación de pesos no binarios a los términos índices de las preguntas y de los documentos, este peso sirve para comparar la similitud existente entre cada documento y la pregunta que hace el usuarioEs un modelo de recuperación clásico, el cual funciona en relación a la probabilidad de que un documento sea o no relevante o no para responder a una determinada pregunta.
C- Es un modelo simple que se basa en la teoría de conjuntos y el algebra booleana.
- Se basa en un criterio de decisión binario (pertinente o no pertinente).
- Es el modelo de mas uso, tanto en las bases de datos comerciales, como en los principales buscadores web
- Ordena los documentos recuperados en orden decreciente, teniendo en cuenta el grado de similitud con la pregunta formulada.
- Es más preciso, en tanto que arroja los resultados teniendo en cuenta los documentos que solo se emparejan con la pregunta.
- se basa en que, teniendo un documento, o determinado número de estos, y una
pregunta, se puede calcular la probabilidad de que ese documento sea relevante para esa pregunta.
- Los resultados no son mejores ni más acertados que en el modelo booleano y vectorial
B- Es un modelo de recuperación sencillo - Es más complejo que el Booleano, pero brinda mayor precisión.- Brinda un gran aporte a la RI en el fenómeno denominado retroalimentación por relevancia.
- Este modelo se usa principalmente para refinar los resultados de de la búsqueda.
D: Descripcion.      C: Caracteristicas.        B: Beneficios.


Estos que se mostraron, son los modelos más usados en la recuperación de información, pero hay que tener en cuenta que existen otros modelos que permiten, asi como los anteriores, la obtención de información. Estos modelos los describiremos brevemente a continuación:

- Modelo Basado en el Lenguaje: Es un modelo que se trabaja desde hace pocos años, en el cual una base de conocimientos intenta interpretar documentos textuales y crear listas de descriptores de forma automatizada, en este sentido se han creado lenguajes documentales que permiten la representación del conocimiento (lenguajes controlados, taxonomías, tesauros, ontologías etc.), esto teniendo en cuenta que el lenguaje natural es bastante ambiguo para que el contenido de los documentos sea recuperado de manera automatica.
Igualmente, para hacer descripción del contenido de los documentos Web se han establecido diversas estrategias: metadatos, lenguajes semánticos (XML, RDF, OWL) que permiten indizar los documentos y representar el conocimiento que estos poseen.

Por esto es que hoy día es fácil recuperar información de forma precisa haciendo uso de lenguajes documentales para representar el contenido semántico de estos documentos y soportar las inferencias lógicas.

-Modelo basado en lógica difusa: En este modelo los autores no asignan los grados de pertinencia de los documentos a los términos, adicional a esto, la aplicación de modelos borrosos es ideal para solucionar los problemas de incompletitud e imprecisión al momento de indexar un documento.
En la equiparación difusa, el cálculo se define teniendo en cuenta el grado de pertenencia de los términos.


Fuentes.

Universidad Complutense de Madrid. Departamento de Biblioteconomía y Documentación. Facultad de Ciencias de la Documentación. Martínez Comeche, Juan Antonio.