Buscar en este blog

martes, 2 de noviembre de 2010

Recuperación de Información Visual – Tag Cloud.

¿Qué es el Tag Cloud?

Los Tag Cloud, más conocidos como “nubes de etiquetas”, son un modelo VIRI (Interface Visual de Recuperación de Información), con una lista ponderada de las palabras clave, esta herramienta ha adquirido mayor popularidad con el nacimiento y posicionamiento de aplicaciones de software social como flickr (www.flickr.com) o del.icio.us (www.del.icio.us.com), y actualmente son usados por un sinnúmero de sitios web.

En estos se muestran las palabras claves, o Tags, más populares, (esta popularidad se mide de acuerdo al número de veces que se ha usado una determinada palabra clave, es decir entre más veces  se menciona una palabra, mayor va a ser su popularidad) y una vez un usuario da clic sobre una de estas palabras claves obtendrá una lista de recursos que contienen esa palabra clave o tag, así como una lista de términos relacionados por los cuales puede orientar o complementar su búsqueda.

¿Qué es un tag?

Son términos o palabras clave en lenguaje no controlado con los que el usuario describe los recursos. Los índices agregados de gags suelen denominarse folksonomías.


Fuentes

WIKIPEDIA. Tag Cloud. [on line] <http://en.wikipedia.org/wiki/Tag_cloud>. [Consulta: 02/11/2010]

lunes, 1 de noviembre de 2010

Evaluación de un Sistema de Recuperación de Información: Exhaustividad y Precisión.




Para evaluar un Sistema de Recuperación de Información es necesario tener en cuenta variables como la exhaustividad y la precisión y una vez sean tomado estas dos variables se podrá determinar si un determinado Sistema de Recuperación de Información puede llegar a cubrir una determinada necesidad de información.



Las formulas para medir estas dos variables, son:

Número de documentos relevantes recuperados
Exhaustividad =      ________________________________________________   X 100
      Número total de documentos relevantes presentes en el fondo documental


                                                       Número de documentos relevantes recuperados
Precisión =                               ______________________________________   X 100
          Número total de documentos recuperados

Ejemplo Exhaustividad: supongamos que hacemos una búsqueda de un tema X, sobre una colección de 100 documentos, y como resultado de esta búsqueda obtenemos solo 6 documentos, quiere decir que si aplicamos la formula que acabamos de ver, entonces el índice de exhaustividad es del 6%.

Ejemplo precisión: Supongamos que la búsqueda es sobre 1000 documentos, caso en el que como respuesta solo se obtuvieron 100 documentos pro únicamente 20 responden directamente a los que se solicito, es decir relevantes, entonces el índice de precisión es del 20%.

En este sentido es claro que el índice de exhaustividad proporciona una medida del sistema para recuperar documentos que puedan ser relevantes para el usuario, el índice de precisión muestra la habilidad de sistema para evitar el ruido.

Es claro que el objetivo es llevar a la construcción de un sistema que brinde 100% de exhaustividad y precisión, en otras palabras sistemas que recuperen documentos relevantes y solo los relevantes. Teóricamente esto suena muy sencillo, pero en la práctica estos dos se comportan de forma antagónica, puesto que para aumentar el nivel de exhaustividad se requiere disminuir la precisión y viceversa,  y la razón es que si se quiere asegurar la precisión del sistema se hace necesario tomar medidas para hacer mas especifica la indización, es decir su un documento trata sobre archivos, entonces tendremos que diseñar un sistema de indización que tienda a indizar el documento con el descriptor archivos, y no con el descriptor gestión documental o archivistas, archivística, etc. Y así lograremos tener un sistema preciso, aunque si alguien llegase a buscar documentos sobre archivística, dejara de recuperar documentos relevantes sobre el tema general.

En la práctica se puede observar que los buscadores más usados en internet, como Google o AltaVista, Proporcionan buenas tasas de exhaustividad y esto lo podemos comprobar fácilmente en la cantidad de resultados que se nos entregan, pero es claro que la precisión es poco, pues de los cientos y miles de resultados que obtenemos, solo unos pocos nos van a servir para satisfacer la necesidad de información. 

En cambio existen sistemas muy especializados como ADAM o Cercador, los cuales usan un sistema de indización automatizado e intelectual, pueden brindar menor exhaustividad, pues los resultados que estos ofrecen son pocos, pero es seguro que la precisión esta casi en el 100%.

Fuentes.

GOMEZ DIAZ, Raquel. La evaluación en recuperación de la información [on line]. "Hipertext.net", núm. 1, 2003. <http://www.hipertext.net> [Consulta: 01/11/10]. ISSN 1695-549.

GARCÍA GÓMEZ, Juan Carlos. Aproximación a la evaluación cuantitativa de los Sistemas de Recuperación de Información de la prensa en Internet: Exhaustividad y precisión. [on line] <ibersid.eu/ojs/index.php/scire/article/download/1145/1127>. [consulta: 01/11/2010].

ADAM. Disponible en: http://www.adam.ac.uk/. [consulta: 01/11/2010].




domingo, 31 de octubre de 2010

Recuperación de Información: Búsqueda y recuperación de información, Estructuración.

Recuperación de Información: Búsqueda y recuperación de información, Estructuración.

Búsqueda y recuperación de información, Estructuración.



Para encontrar un tópico determinado al utilizar un motor de búsqueda, es de vital importancia como profesionales realizar una estructuración lógicamente organizada de términos, sintaxis y operadores que formen ecuaciones de búsqueda con el fin de restringir el basto numero de resultados que puede generar una operación no estructurada en un motor o en un directorio. La correcta recuperación de información se da cuando se cumplen los parámetros con los cuales funciona un motor determinado, es decir, preguntar de manera lógica y semanticamente acorde a las ontologías, tesauros, listas de términos o lenguajes documentales utilizados por el motor de búsqueda, sistema de recuperación de información o directorio de sitios.

Asimismo, es importante tener en cuenta otros aspectos a preguntarse como profesionales en sistemas de información y documentación del programa impartido por la Universidad de la Salle como que se quiere encontrar, para que se quiere encontrar, como se va a hacer y cuales son los resultados deseados. En este orden de ideas se podrá realizar una búsqueda exhaustiva y relevante con resultados acordes a la necesidad informativa el usuario que requiera la información.

viernes, 22 de octubre de 2010

VIRIs – Visual Information Retrieval Interfases. Interfases Visuales de Recuperación de Información.


En la anterior entrada de manera parcial vimos el concepto de VIRIs, ahora veremos su objetivo, el cual no solo está enfocado  en brindar ayuda al usuario para navegar  y recuperar aquella información que esta buscando, sino que además también brindan una visión global del conjunto documental, a través de la cual el usuario está en la libertad de predecir que puede encontrar e incluso permite la adquisición de nuevo conocimiento a través de la interiorización de la visualización.
Es claro que existen un sinnúmero de propuestas de VIRIs, y como es de suponer muchas de estas, no han tenido acogida por una u otra razón, pero ese es un tema en el que no vamos a centrarnos, lo que queremos es mostrar un esquema sencillo de análisis y evaluación de VIRIs, teniendo en cuenta algunas de las principales funcionalidades de estos sistemas, en este sentido, las funciones básicas de un VIRIs son:

- Resumen Información con el fin de ofrecer visualizaciones globales del conjunto documental.
- Resaltan la información más relevante para facilitar al usuario tener una vista previa y permitirle diferenciar lo relevante o no de la información que se le presenta.
- relaciona información semejante para brindar al usuario la facilidad de comprender y adquirir conocimiento nuevo a partir de las relaciones que se presentan a través de los documentos visuales.
Recuperan información para que el usuario pueda llegar a satisfacer su necesidad de información.






Fuentes::

Recuperación de Información. Universidad de La Salle.

Interfaz visual para recuperación de información basada en análisis de metadatos, escalamiento multidimensional y efecto ojo de pez. disponible en: http://www.nosolousabilidad.com/hassan/interfaz_visual.pdf. consutado 22 e octubre de 2010.

jueves, 21 de octubre de 2010

Modelos de Acceso a la Información

En esta entrada simplemente se van a trabajar las herramientas de visualización más usadas en la web actualmente, tal como su nombre lo indica estas permiten que una determinada pagina web se haga más popular, ya sea por palabras claves tags o cualquier otra, en la web.

Como bien lo sabemos la importancia de cualquier sistema de información, está dada por la cantidad y la calidad de la información contenida y recuperada al momento de una petición de un usuario con una necesidad de información, pero también por su findability, es decir la facilidad para encontrar dicha información.
En este sentido, nos encontramos entonces con unos modelos que determinan el acceso a la información, los cuales están diferenciados teniendo en cuenta el sentido en el que se produce el acceso a la información, en este caso Push y Pull.

En el modelo Push, conocido como filtrado de información,  por lo general el sistema informa al usuario sobre aquellos documentos que se acaban de incorporar al sistema y que posiblemente son de su interés, teniendo en cuenta el perfil del usuario o intereses previamente definidos por este, en tal sentido, se trata de una estrategia pasiva, por parte del usuario.
Por otra parte el modelo pull, o Recuperación de Información permite que sea el usuario de forma activa quien busque y acceda a la información que requiere, para lo cual dos estrategias de búsqueda, que dividiremos en dos grandes clases: querying (interrogación) y browsing (exploración)
Querying: En este el usuario introduce al sistema  una serie de palabras clave, que básicamente son la representación de su necesidad de información, para lo que el sistema regresa una serie resultados pertinentes  para la consulta realizada (por lo general estos resultados están ordenados por relevancia) un ejemplo que tenemos a la mano basado en querying son las búsquedas que realizamos en Google. Estos sistemas son útiles en la mayoría de los casos, aunque hay que tener en cuenta que no resultan eficientes cuando el usuario no tiene claro qué o sobre qué está buscando o cuando no tiene la capacidad de formalizar sus necesidades de información a través del lenguaje de consulta o lenguaje natural.

Por otra parte el modelo browsing, es opuesto al querying, en tanto que el usuario es quien explora de forma visual y espacial el conjunto documental, sin tener que expresar previamente las necesidades de  información, es decir, es el usuario quien decide navegar por el conjunto documental  y reconocer de forma visual lo que requiere, en lugar de especificar sus necesidades mediante un lenguaje de consulta.

Del browsing se pueden tomar varios tipos, teniendo en cuenta el grado de especificidad de la necesidad de información:
- De búsqueda directa: Cuando el usuario sabe lo que está buscando.
- De propósito general: El usuario explora fuentes que tienen una alta probabilidad de resultar interesantes de acuerdo a su necesidad de información.
- fortuito o por serendipia: Búsqueda al azar.

un ejemplo de browsing es la navegación hipertextual donde el usuario explora visualmente el conjunto documental que posee información aparentemente relevante  para su necesidad de información  y reconoce aquella información o aquellos enlaces que considera que lo llevarán a esta información que requiere, y se desplaza por este espacio de información saltando de página en página.

Entre los sistemas de información que brindan la posibilidad de búsqueda por Browsing, se pueden destacar aquellos que proveen un medio que permite realizar browsing grafico  por medio de las llamadas Interfaces Visuales de Recuperación de Información o VIRs ( Visual Information Retrieval Interfaces), este es similar al hipertextual, pero este posibilita al usuario visualizar documentos de forma global por medio de abstracción grafica y no necesariamente textual, a diferencia del hipertextual que solo permite la exploración de documentos por separado.


Fuentes

Push v/s Pul... Un cambio de mirada en el servicio Disponible en: < http://blog.maz.cl/2008/07/push-vs-pull-un-cambio-de-mirada-en-el.html> Consultado 20 de octubre de 2010.

Sistemas de Recomendación Semánticos. Un análisis del estado de la cuestión. Disponible en: <http://www.hipertext.net/web/pag286.htm.> Consultado 20 de octubre de 2010.