Buscar en este blog

martes, 2 de noviembre de 2010

La evaluación de la recuperación de información.


Cuando se produce una necesidad informativa, mediante una petición de información que se traduce en una estrategia de búsqueda, se interroga al conjunto de documentos con el fin de obtener un arespuesta a esa necesidad. Para saber en qué medida la respuesta cumple con las expectativas creadas ante la consulta, tenemos que evaluar los resultados.

La importancia en la evaluación en recuperación de información está muy ligada a la fase de investigación, ya que sin unas medidas eficaces y estandarizadas, y sin colecciones experimentales adecuadas, no podremos hacer ni evaluaciones de sistemas particulares, ni comparaciones fiables entre los resultados obtenidos con los distintos sistemas.

A continuación, se darán las diferencias entre el acceso físico a la información y el acceso lógico a la información:

Acceso físico a la información: Es cuando el usuario va a la biblioteca y mediante la signatura topográfica es capaz de localizar un libro.

Para ello, hay que evaluar si la biblioteca está bien organizada, y en su defecto, bien señalizada.

Acceso lógico a la información: Está relacionado con la búsqueda concreta de esa información. El usuario va a la biblioteca, hace una búsqueda y obtiene un resultado que le indicará en qué libro o revista es posible que se encuentre esa información.

Por otro lado, exsiten dos clases de evaluación de la recuperación de información:

Evaluación tradicional: Es el que mide objetivamente cómo se adecua la pregunta a la respuesta.

Evaluación orientada a los usuarios: Es el que mide la satisfacción del que ha hecho la demanda.

Fuente: GÓMEZ DÍAZ, Raquel. La lematización en español: una aplicación para la recuperación de información. España: Ediciones Trea. 2005. PP 82-83

Recuperación de información


La recuperación de la información no es un área estática sino que por el contrario, debe adaptarse al cambio y evolución de volumen, características y accesibilidad de la información. Su complejidad y madurez van desde la simple comparación de texto a la innovación de la búsqueda basada en contenido en medios digitales diversos.

Las definiciones de recuperación de información, con mucha amplitud, se refieren a:

• El estudio de los sistemas de indexación, búsqueda y recuperación de datos, particularmente texto y otras formas no estructuradas.

• Búsqueda de objetos que igualan una consulta en un cuerpo de información.

• Un área de especialización en Ciencias de la Computación que enfoca maneras sistemáticas de almacenamiento y recuperación de datos, incluyendo consideraciones de diseño e implementación de bases de datos.

• La recuperación de información relevante u objetos multimedia de grandes colecciones de información desde diversos métodos de almacenamiento y su precisión significativa al usuario.

El proceso de recuperación de información comprende dos actividades: la comparación y evaluación de las representaciones de documentos de acuerdo a una consulta formulada por el usuario, y la construcción de una función que ordene los documentos para presentarlos. Un usuario requiere información y su consulta es representada en un lenguaje de consulta que incluso puede ser lenguaje natural. Las palabras claves representan objetos documentales que mediante algoritmos de distinta eficacia son comparadas con esta consulta, y los resultados satisfactorios son mostrados al usuario que podrá, si lo desea, refinar la búsqueda.

Casanovas, Inés. Gestión de archivos electrónicos. Argentina: Alfagrama Ediciones, 2009. p 171.[Consultado el: 01-11-2010] Disponible en: http://site.ebrary.com/lib/bibliounisallesp/Doc?id=10345376&ppg=171

Recuperación de Información Visual – Tag Cloud.

¿Qué es el Tag Cloud?

Los Tag Cloud, más conocidos como “nubes de etiquetas”, son un modelo VIRI (Interface Visual de Recuperación de Información), con una lista ponderada de las palabras clave, esta herramienta ha adquirido mayor popularidad con el nacimiento y posicionamiento de aplicaciones de software social como flickr (www.flickr.com) o del.icio.us (www.del.icio.us.com), y actualmente son usados por un sinnúmero de sitios web.

En estos se muestran las palabras claves, o Tags, más populares, (esta popularidad se mide de acuerdo al número de veces que se ha usado una determinada palabra clave, es decir entre más veces  se menciona una palabra, mayor va a ser su popularidad) y una vez un usuario da clic sobre una de estas palabras claves obtendrá una lista de recursos que contienen esa palabra clave o tag, así como una lista de términos relacionados por los cuales puede orientar o complementar su búsqueda.

¿Qué es un tag?

Son términos o palabras clave en lenguaje no controlado con los que el usuario describe los recursos. Los índices agregados de gags suelen denominarse folksonomías.


Fuentes

WIKIPEDIA. Tag Cloud. [on line] <http://en.wikipedia.org/wiki/Tag_cloud>. [Consulta: 02/11/2010]

lunes, 1 de noviembre de 2010

Evaluación de un Sistema de Recuperación de Información: Exhaustividad y Precisión.




Para evaluar un Sistema de Recuperación de Información es necesario tener en cuenta variables como la exhaustividad y la precisión y una vez sean tomado estas dos variables se podrá determinar si un determinado Sistema de Recuperación de Información puede llegar a cubrir una determinada necesidad de información.



Las formulas para medir estas dos variables, son:

Número de documentos relevantes recuperados
Exhaustividad =      ________________________________________________   X 100
      Número total de documentos relevantes presentes en el fondo documental


                                                       Número de documentos relevantes recuperados
Precisión =                               ______________________________________   X 100
          Número total de documentos recuperados

Ejemplo Exhaustividad: supongamos que hacemos una búsqueda de un tema X, sobre una colección de 100 documentos, y como resultado de esta búsqueda obtenemos solo 6 documentos, quiere decir que si aplicamos la formula que acabamos de ver, entonces el índice de exhaustividad es del 6%.

Ejemplo precisión: Supongamos que la búsqueda es sobre 1000 documentos, caso en el que como respuesta solo se obtuvieron 100 documentos pro únicamente 20 responden directamente a los que se solicito, es decir relevantes, entonces el índice de precisión es del 20%.

En este sentido es claro que el índice de exhaustividad proporciona una medida del sistema para recuperar documentos que puedan ser relevantes para el usuario, el índice de precisión muestra la habilidad de sistema para evitar el ruido.

Es claro que el objetivo es llevar a la construcción de un sistema que brinde 100% de exhaustividad y precisión, en otras palabras sistemas que recuperen documentos relevantes y solo los relevantes. Teóricamente esto suena muy sencillo, pero en la práctica estos dos se comportan de forma antagónica, puesto que para aumentar el nivel de exhaustividad se requiere disminuir la precisión y viceversa,  y la razón es que si se quiere asegurar la precisión del sistema se hace necesario tomar medidas para hacer mas especifica la indización, es decir su un documento trata sobre archivos, entonces tendremos que diseñar un sistema de indización que tienda a indizar el documento con el descriptor archivos, y no con el descriptor gestión documental o archivistas, archivística, etc. Y así lograremos tener un sistema preciso, aunque si alguien llegase a buscar documentos sobre archivística, dejara de recuperar documentos relevantes sobre el tema general.

En la práctica se puede observar que los buscadores más usados en internet, como Google o AltaVista, Proporcionan buenas tasas de exhaustividad y esto lo podemos comprobar fácilmente en la cantidad de resultados que se nos entregan, pero es claro que la precisión es poco, pues de los cientos y miles de resultados que obtenemos, solo unos pocos nos van a servir para satisfacer la necesidad de información. 

En cambio existen sistemas muy especializados como ADAM o Cercador, los cuales usan un sistema de indización automatizado e intelectual, pueden brindar menor exhaustividad, pues los resultados que estos ofrecen son pocos, pero es seguro que la precisión esta casi en el 100%.

Fuentes.

GOMEZ DIAZ, Raquel. La evaluación en recuperación de la información [on line]. "Hipertext.net", núm. 1, 2003. <http://www.hipertext.net> [Consulta: 01/11/10]. ISSN 1695-549.

GARCÍA GÓMEZ, Juan Carlos. Aproximación a la evaluación cuantitativa de los Sistemas de Recuperación de Información de la prensa en Internet: Exhaustividad y precisión. [on line] <ibersid.eu/ojs/index.php/scire/article/download/1145/1127>. [consulta: 01/11/2010].

ADAM. Disponible en: http://www.adam.ac.uk/. [consulta: 01/11/2010].




domingo, 31 de octubre de 2010

Recuperación de Información: Búsqueda y recuperación de información, Estructuración.

Recuperación de Información: Búsqueda y recuperación de información, Estructuración.

Búsqueda y recuperación de información, Estructuración.



Para encontrar un tópico determinado al utilizar un motor de búsqueda, es de vital importancia como profesionales realizar una estructuración lógicamente organizada de términos, sintaxis y operadores que formen ecuaciones de búsqueda con el fin de restringir el basto numero de resultados que puede generar una operación no estructurada en un motor o en un directorio. La correcta recuperación de información se da cuando se cumplen los parámetros con los cuales funciona un motor determinado, es decir, preguntar de manera lógica y semanticamente acorde a las ontologías, tesauros, listas de términos o lenguajes documentales utilizados por el motor de búsqueda, sistema de recuperación de información o directorio de sitios.

Asimismo, es importante tener en cuenta otros aspectos a preguntarse como profesionales en sistemas de información y documentación del programa impartido por la Universidad de la Salle como que se quiere encontrar, para que se quiere encontrar, como se va a hacer y cuales son los resultados deseados. En este orden de ideas se podrá realizar una búsqueda exhaustiva y relevante con resultados acordes a la necesidad informativa el usuario que requiera la información.