Recuperación de Información

sábado, 11 de septiembre de 2010

ACCESO FÍSICO A LA INFORMACIÓN

Es el que concierne a cómo la información demandada es recuperada y representada de forma física al usuario. Tiene que ver con la manera que un sistema de recuperación de información encuentra dicha información, o indica ciertas directrices al usuario sobre cómo localizarla, una vez que le proporciona su dirección.

Colino Tomé, Adriana. Glosario de Recuperación de Información Web. En <http://www.um.es/gtiweb/adrico/#Consulta> Septiembre de 2010

viernes, 10 de septiembre de 2010

MODELOS DE RECUPERACIÓN DE INFORMACIÓN

Como es bien conocido, en los últimos años se ha venido presentado el fenómeno de los Buscadores Online, y por ende se han producido toda una serie de repercusiones en la administración y recuperación de la información que estos buscadores nos entregan al momento de que lo solicitamos, en tal sentido es necesario saber el método, o los métodos que usan estos buscadores para acertar en la respuesta a la pregunta que se les plantea en un determinado momento.

En tal sentido, nos encontramos con que de forma general los modelos de recuperación de información están estructurados asi:

- Modelos Clasicos: en este se encuentra el modelo booleano y probalisitco.

- Modelos Estructurales: basado en listas no sobrepuestas y el método de nodos proximales.

Con el ánimo de presentar una comparación y descripción de los modelos de recuperación de información, presentamos el siguiente cuadro que permite una caracterización mucho más sencilla que la encontrada en la literatura que trata del tema:

Ítem / Modelos	Booleano	Vectorial	Probalístico
D	Es uno de los más usados para la RI, se basa en la agrupación de documentos compuestos por conjuntos de términos, y en el concepto de las preguntas como una expresión booleana.	Presenta la posibilidad de emparejamiento parcial, por medio de la asignación de pesos no binarios a los términos índices de las preguntas y de los documentos, este peso sirve para comparar la similitud existente entre cada documento y la pregunta que hace el usuario	Es un modelo de recuperación clásico, el cual funciona en relación a la probabilidad de que un documento sea o no relevante o no para responder a una determinada pregunta.
C	- Es un modelo simple que se basa en la teoría de conjuntos y el algebra booleana. - Se basa en un criterio de decisión binario (pertinente o no pertinente). - Es el modelo de mas uso, tanto en las bases de datos comerciales, como en los principales buscadores web	- Ordena los documentos recuperados en orden decreciente, teniendo en cuenta el grado de similitud con la pregunta formulada. - Es más preciso, en tanto que arroja los resultados teniendo en cuenta los documentos que solo se emparejan con la pregunta.	- se basa en que, teniendo un documento, o determinado número de estos, y una pregunta, se puede calcular la probabilidad de que ese documento sea relevante para esa pregunta. - Los resultados no son mejores ni más acertados que en el modelo booleano y vectorial
B	- Es un modelo de recuperación sencillo	- Es más complejo que el Booleano, pero brinda mayor precisión.	- Brinda un gran aporte a la RI en el fenómeno denominado retroalimentación por relevancia. - Este modelo se usa principalmente para refinar los resultados de de la búsqueda.

D: Descripcion. C: Caracteristicas. B: Beneficios.

Estos que se mostraron, son los modelos más usados en la recuperación de información, pero hay que tener en cuenta que existen otros modelos que permiten, asi como los anteriores, la obtención de información. Estos modelos los describiremos brevemente a continuación:

- Modelo Basado en el Lenguaje: Es un modelo que se trabaja desde hace pocos años, en el cual una base de conocimientos intenta interpretar documentos textuales y crear listas de descriptores de forma automatizada, en este sentido se han creado lenguajes documentales que permiten la representación del conocimiento (lenguajes controlados, taxonomías, tesauros, ontologías etc.), esto teniendo en cuenta que el lenguaje natural es bastante ambiguo para que el contenido de los documentos sea recuperado de manera automatica.

Igualmente, para hacer descripción del contenido de los documentos Web se han establecido diversas estrategias: metadatos, lenguajes semánticos (XML, RDF, OWL) que permiten indizar los documentos y representar el conocimiento que estos poseen.

Por esto es que hoy día es fácil recuperar información de forma precisa haciendo uso de lenguajes documentales para representar el contenido semántico de estos documentos y soportar las inferencias lógicas.

-Modelo basado en lógica difusa: En este modelo los autores no asignan los grados de pertinencia de los documentos a los términos, adicional a esto, la aplicación de modelos borrosos es ideal para solucionar los problemas de incompletitud e imprecisión al momento de indexar un documento.

En la equiparación difusa, el cálculo se define teniendo en cuenta el grado de pertenencia de los términos.

Fuentes.

Universidad Complutense de Madrid. Departamento de Biblioteconomía y Documentación. Facultad de Ciencias de la Documentación. Martínez Comeche, Juan Antonio.

La recuperación de Información y los Sistemas de Recuperación de información SRI

Tramullas. J, ve la recuperación de información como una serie de actividades ejecutadas por el usuario para localizar y acceder recursos informativos “pertinentes”, la pertinencia y la relevancia de información es un factor diferenciador entre las acciones de cada sistema de recuperación de información. La diferencia entre google, ask, lycos, yahoo, gigablast y otros motores de búsqueda radica en la categorización o ranking asignado a los documentos puestos por los usuarios en red, también radica en la forma en que maneje la semántica y sus ontologías estén lógicamente organizadas para arrojar resultados acordes a las estructuras mentales del usuario que busca sin que este tenga que realizar un exhaustivo proceso manual de data mining (minería de datos).

Los algoritmos empleados nos facilitan la búsqueda y recuperación pero estos deben ir acompañados de un proceso realizado por el investigador de información que parte de una necesidad informativa definida a partir de la cual hace una búsqueda y posteriormente selecciona recursos de información. La consulta a estos recursos encontrados, la evaluación y la presentación que la herramienta hace al usuario determinan el curso de acción y la satisfacción de la necesidad informativa de este, La Universidad de La Salle a través de su cátedra de recuperación de información dictada en el programa de sistemas de información y documentación ha adoptado un enfoque orientado a rellenar estos vacios en los usuarios, en los procesos y en los sistemas de recuperación de información, SRI.

jueves, 9 de septiembre de 2010

SGBD Y RECUPERACIÓN DE INFORMACIÓN

Los sistemas gestores de bases de datos juegan un papel fundamental en los entornos de documentos electrónicos, virtuales y digitales. Si no fuese por estos, no existiría forma alguna de almacenar datos que son insumo para crear documentos. Sin embargo mas importante aun para las ciencias de la información pueden ser las plataformas de bases de datos institucionales que contienen millares de documentos esperando ser recuperados de los tanques de archivos que contienen estas plataformas. La Universidad de La Salle cuenta con afiliación a varias bases de datos comerciales e institucionales entre las que se encuentran THOMPSON, GALE, Library and Information Science, Proquest y Scielo entre otras. Al programa de sistemas de información y documentación le interesa una en particular L.I.S.T.A Library and Information Science Text and Abstracts por sus siglas en ingles. Esta base cuenta con un motor de búsqueda que permite realizar la recuperación de información y contenidos a través de operadores Booleanos generalmente. Para recuperar contenidos de calidad en estas bases, es necesario ser exhaustivo con los términos por que sus algoritmos de búsqueda son limitados y se requiere ser puntual en la pregunta o QUERY que se plantea.

miércoles, 8 de septiembre de 2010

XML

Extensible Markup Language, es un metalenguaje formado por etiquetas, permite definir la gramática de lenguajes específicos. Por lo tanto XML no es realmente un lenguaje en particular, sino una manera de definir lenguajes para diferentes necesidades, permite la compatibilidad entre sistemas para compartir la información de una manera segura, fiable y fácil

Disponible en: http://es.wikipedia.org/wiki/Extensible_Markup_Language

WORLD WIDE WEB

Es un sistema de documentos de hipertexto o hipermedios enlazados y accesibles a través de Internet. Con un navegador web, un usuario visualiza sitios web compuestos de páginas web que pueden contener texto, imágenes, videos u otros contenidos multimedia , y navega a través de ellas usando hiperenlaces

http://es.wikipedia.org/wiki/World_Wide_Web