Buscar en este blog

miércoles, 3 de noviembre de 2010

Video trabajito by Lorena Lobo - recuperación de información - programa de sistemas de información - Universidad de La Salle

Los invito a que vean el siguiente video que hace referencia a la recuperación de información del programa de sistemas de información de la Universidad de La Salle.

http://www.youtube.com/watch?v=uOYuu74qLuA

Sistemas de Información, Entre el dilema de AND, OR o NOT


Dentro de la recuperación de información existen operadores que permiten enriquecer las búsquedas o extraer de las bases de datos información relevante y exhaustiva para el usuario del sistema de información, una de las formas más comunes de recuperar información a través de operadores es utilizando búsquedas booleanas las cuales tienen como palabras comodín los términos AND, OR y NOT que en algunas interfaces son reemplazados por el ampersamp (&), el signo + o el signo *.  Sin embargo esta no es la única forma de recuperar información o obtener resultados coherentes en una búsqueda de documental, esto está siempre de acuerdo a la plataforma, estructuración, notación y representación de los documentos dentro del DBMS, el ECM o el RMS.

Un ejemplo fehaciente de esto es el tipo de operadores que manejan algunas herramientas de escritorio, por citar un ejemplo el caso de google desktop search, echa mano de algunos operadores diseñados para realizar búsquedas específicas dentro del material indexado. En la URL a continuación se pueden encontrar estos mismos los cuales de acuerdo a su naturaleza pueden especificar si lo que se requiere es una búsqueda de un tipo de archivo específico, de un formato determinado o de un documento con un contenido explicito. http://desktop.google.com/support/bin/answer.py?hl=es&answer=10111, vale la pena resaltar que esta herramienta fue evaluada en la universidad de La Salle durante la cátedra de Recuperación de información y los resultados entregados al indexar una colección fueron acordes a lo esperado por un usuario final frente a un SRI.

La ventaja del uso de operadores y ecuaciones de búsqueda es que apuntan directamente a los lenguajes documentales que son los que representan la información contenida en los repositorios o bodegas de datos en las que reposen documentos estructurados o no estructurados. El motor de búsqueda google también tiene algunos operadores que generalmente no son conocidos por los usuarios pero que al ser utilizados enriquecen las búsquedas y los resultados categorizándolos de acuerdo a la necesidad de información.  En el vínculo a continuación se pueden encontrar algunos operadores como allintitle, allinurl, allintext y site entre otros. 

Archivistas: Una Profesión con Potencial.

Fue el título que el Diario la República dio a uno de sus artículos en el cual menciona algunas de las problemáticas que tiene la Sociedad Colombiana de Archivistas, entre otros.

http://www.slideshare.net/scarchivistas/archivistas-una-profesin-con-potencial

martes, 2 de noviembre de 2010

La evaluación de la recuperación de información.


Cuando se produce una necesidad informativa, mediante una petición de información que se traduce en una estrategia de búsqueda, se interroga al conjunto de documentos con el fin de obtener un arespuesta a esa necesidad. Para saber en qué medida la respuesta cumple con las expectativas creadas ante la consulta, tenemos que evaluar los resultados.

La importancia en la evaluación en recuperación de información está muy ligada a la fase de investigación, ya que sin unas medidas eficaces y estandarizadas, y sin colecciones experimentales adecuadas, no podremos hacer ni evaluaciones de sistemas particulares, ni comparaciones fiables entre los resultados obtenidos con los distintos sistemas.

A continuación, se darán las diferencias entre el acceso físico a la información y el acceso lógico a la información:

Acceso físico a la información: Es cuando el usuario va a la biblioteca y mediante la signatura topográfica es capaz de localizar un libro.

Para ello, hay que evaluar si la biblioteca está bien organizada, y en su defecto, bien señalizada.

Acceso lógico a la información: Está relacionado con la búsqueda concreta de esa información. El usuario va a la biblioteca, hace una búsqueda y obtiene un resultado que le indicará en qué libro o revista es posible que se encuentre esa información.

Por otro lado, exsiten dos clases de evaluación de la recuperación de información:

Evaluación tradicional: Es el que mide objetivamente cómo se adecua la pregunta a la respuesta.

Evaluación orientada a los usuarios: Es el que mide la satisfacción del que ha hecho la demanda.

Fuente: GÓMEZ DÍAZ, Raquel. La lematización en español: una aplicación para la recuperación de información. España: Ediciones Trea. 2005. PP 82-83

Recuperación de información


La recuperación de la información no es un área estática sino que por el contrario, debe adaptarse al cambio y evolución de volumen, características y accesibilidad de la información. Su complejidad y madurez van desde la simple comparación de texto a la innovación de la búsqueda basada en contenido en medios digitales diversos.

Las definiciones de recuperación de información, con mucha amplitud, se refieren a:

• El estudio de los sistemas de indexación, búsqueda y recuperación de datos, particularmente texto y otras formas no estructuradas.

• Búsqueda de objetos que igualan una consulta en un cuerpo de información.

• Un área de especialización en Ciencias de la Computación que enfoca maneras sistemáticas de almacenamiento y recuperación de datos, incluyendo consideraciones de diseño e implementación de bases de datos.

• La recuperación de información relevante u objetos multimedia de grandes colecciones de información desde diversos métodos de almacenamiento y su precisión significativa al usuario.

El proceso de recuperación de información comprende dos actividades: la comparación y evaluación de las representaciones de documentos de acuerdo a una consulta formulada por el usuario, y la construcción de una función que ordene los documentos para presentarlos. Un usuario requiere información y su consulta es representada en un lenguaje de consulta que incluso puede ser lenguaje natural. Las palabras claves representan objetos documentales que mediante algoritmos de distinta eficacia son comparadas con esta consulta, y los resultados satisfactorios son mostrados al usuario que podrá, si lo desea, refinar la búsqueda.

Casanovas, Inés. Gestión de archivos electrónicos. Argentina: Alfagrama Ediciones, 2009. p 171.[Consultado el: 01-11-2010] Disponible en: http://site.ebrary.com/lib/bibliounisallesp/Doc?id=10345376&ppg=171

Recuperación de Información Visual – Tag Cloud.

¿Qué es el Tag Cloud?

Los Tag Cloud, más conocidos como “nubes de etiquetas”, son un modelo VIRI (Interface Visual de Recuperación de Información), con una lista ponderada de las palabras clave, esta herramienta ha adquirido mayor popularidad con el nacimiento y posicionamiento de aplicaciones de software social como flickr (www.flickr.com) o del.icio.us (www.del.icio.us.com), y actualmente son usados por un sinnúmero de sitios web.

En estos se muestran las palabras claves, o Tags, más populares, (esta popularidad se mide de acuerdo al número de veces que se ha usado una determinada palabra clave, es decir entre más veces  se menciona una palabra, mayor va a ser su popularidad) y una vez un usuario da clic sobre una de estas palabras claves obtendrá una lista de recursos que contienen esa palabra clave o tag, así como una lista de términos relacionados por los cuales puede orientar o complementar su búsqueda.

¿Qué es un tag?

Son términos o palabras clave en lenguaje no controlado con los que el usuario describe los recursos. Los índices agregados de gags suelen denominarse folksonomías.


Fuentes

WIKIPEDIA. Tag Cloud. [on line] <http://en.wikipedia.org/wiki/Tag_cloud>. [Consulta: 02/11/2010]