Buscar en este blog

Mostrando entradas con la etiqueta query. Mostrar todas las entradas
Mostrando entradas con la etiqueta query. Mostrar todas las entradas

martes, 14 de septiembre de 2010

OBJETIVOS DE LA RECUPERACIÓN DE INFORMACIÓN


Existen tres objetivos fundamentales identificados en la recuperación de información:

  • ·         Poder recuperar sobre cualquier tipo de documento.
  • ·         Permitir consultas en lenguaje natural, que el SRI pueda entender cualquier pregunta
  • ·         Buscar un mecanismo idóneo para evaluar y ajustar la relación entre pregunta y respuesta, la mejor comparación de resultados
Para optimizar los resultados se define un proceso genérico de la R.I y consiste en simplemente establecer cómo funciona un proceso normal de recuperación de información a través de entradas o consultas, procesos a través de query generados por el usuario y procesados por el sistema de búsqueda y recuperación, posteriormente se entrega una salida o resultados de búsqueda en un ranking determinado por el SRI.

jueves, 9 de septiembre de 2010

SGBD Y RECUPERACIÓN DE INFORMACIÓN

Los sistemas gestores de bases de datos juegan un papel fundamental en los entornos de documentos electrónicos, virtuales y digitales. Si no fuese por estos, no existiría forma alguna de almacenar datos que son insumo para crear documentos. Sin embargo mas importante aun para las ciencias de la información pueden ser las plataformas de bases de datos institucionales que contienen millares de documentos esperando ser recuperados de los tanques de archivos que contienen estas plataformas. La Universidad de La Salle cuenta con afiliación a varias bases de datos comerciales e institucionales entre las que se encuentran THOMPSON, GALE, Library and Information Science, Proquest y Scielo entre otras. Al programa de sistemas de información y documentación le interesa una en particular L.I.S.T.A Library and Information Science Text and Abstracts por sus siglas en ingles. Esta base cuenta con un motor de búsqueda que permite realizar la recuperación de información y contenidos a través de operadores Booleanos generalmente. Para recuperar contenidos de calidad en estas bases, es necesario ser exhaustivo con los términos por que sus algoritmos de búsqueda son limitados y se requiere ser puntual en la pregunta o QUERY que se plantea.

martes, 7 de septiembre de 2010

Algunos problemas en recuperación de información

Algunos problemas en recuperación de información identificados durante la catedra de la Universidad de La Salle en el programa de sistemas de información son los siguientes:

• Trabajar con índices

• Como trabajar índices contra preguntas

• Como organizar resultados

Google cada mes optimiza su algoritmo para establecer la relevancia, los sistemas de recuperación tradicionales comparan los términos pertenecientes a un documento contra un conjunto de índices y posterior se organiza de una forma asignándole relevancia y ranking, sin embargo google hace buen uso de los tesauros con el fin de optimizar el proceso y apuntar al esquema mental del usuario que plantea el Query.

Para automatizar y optimizar las búsquedas y recuperación de información, se involucran procesos automatizados e informáticos como, hardware, software, colecciones de documentos, información digital, audio, video, texto, multimedia, codificaciones y otros objetos, generalmente los SRI son subsistemas de otros sistemas más grandes. Vasta con ver los ECM, ERM, ERP, Workflow que cuentan con subsistemas de recuperación para encontrar sus contenidos y que reducen la complejidad del problema documental y de archivos invertidos contenedores de metacontenidos.

Dado que los documentos puede ser cualquier objeto en la red hay que evaluar factores tales como la categorización, el formato, el tamaño del índice vs el tamaño de la colección para así asignar los elementos necesarios que permitan crear un SRI adecuado, es decir, interfaz, Querys, búsquedas, comparaciones, indexación, asignación de ranking y resultados de acuerdo a los listados de términos y reglas asociadas al SRI.

En este orden de ideas se convierte en un conjunto de procesos automatizados por los cuales el usuario accede a la información donde previamente se normalizan las preguntas y se indexa la documentación para que sea dada por este una categorización de utilidad a la respuesta devuelta por la maquina a una pregunta concreta de acuerdo a patrones semánticos.

La extracción de información como modelo para organización de resultados, es un proceso especializado de recuperación de información destinado únicamente a necesidades de información concreta. Es una búsqueda concreta sobre un listado de términos y basado en reglas asociadas que apuntan a una mayor exhaustividad en los resultados requeridos para saciar una necesidad informativa.