Recuperación de Información: ranking

Mostrando entradas con la etiqueta ranking. Mostrar todas las entradas

martes, 14 de septiembre de 2010

OBJETIVOS DE LA RECUPERACIÓN DE INFORMACIÓN

Existen tres objetivos fundamentales identificados en la recuperación de información:

· Poder recuperar sobre cualquier tipo de documento.
· Permitir consultas en lenguaje natural, que el SRI pueda entender cualquier pregunta
· Buscar un mecanismo idóneo para evaluar y ajustar la relación entre pregunta y respuesta, la mejor comparación de resultados

Para optimizar los resultados se define un proceso genérico de la R.I y consiste en simplemente establecer cómo funciona un proceso normal de recuperación de información a través de entradas o consultas, procesos a través de query generados por el usuario y procesados por el sistema de búsqueda y recuperación, posteriormente se entrega una salida o resultados de búsqueda en un ranking determinado por el SRI.

sábado, 11 de septiembre de 2010

METABUSCADORES

Sistemas desarrollados para mitigar el problema de tener que acceder a varios motores de búsqueda con el fin de recuperar información más completa sobre un tema, siendo estos sistemas los que se encargan de efectuarlos por el usuario. Un metabuscador colecciona las respuestas recibidas y las unifica. La principal ventaja es su capacidad de combinar resultados de diferentes fuentes mostrándoselas al usuario de forma simultánea.

Colino Tomé, Adriana. Glosario de Recuperación de Información Web. En <http://www.um.es/gtiweb/adrico/#Consulta> Septiembre de 2010

viernes, 10 de septiembre de 2010

La recuperación de Información y los Sistemas de Recuperación de información SRI

Tramullas. J, ve la recuperación de información como una serie de actividades ejecutadas por el usuario para localizar y acceder recursos informativos “pertinentes”, la pertinencia y la relevancia de información es un factor diferenciador entre las acciones de cada sistema de recuperación de información. La diferencia entre google, ask, lycos, yahoo, gigablast y otros motores de búsqueda radica en la categorización o ranking asignado a los documentos puestos por los usuarios en red, también radica en la forma en que maneje la semántica y sus ontologías estén lógicamente organizadas para arrojar resultados acordes a las estructuras mentales del usuario que busca sin que este tenga que realizar un exhaustivo proceso manual de data mining (minería de datos).

Los algoritmos empleados nos facilitan la búsqueda y recuperación pero estos deben ir acompañados de un proceso realizado por el investigador de información que parte de una necesidad informativa definida a partir de la cual hace una búsqueda y posteriormente selecciona recursos de información. La consulta a estos recursos encontrados, la evaluación y la presentación que la herramienta hace al usuario determinan el curso de acción y la satisfacción de la necesidad informativa de este, La Universidad de La Salle a través de su cátedra de recuperación de información dictada en el programa de sistemas de información y documentación ha adoptado un enfoque orientado a rellenar estos vacios en los usuarios, en los procesos y en los sistemas de recuperación de información, SRI.

martes, 7 de septiembre de 2010

Algunos problemas en recuperación de información

Algunos problemas en recuperación de información identificados durante la catedra de la Universidad de La Salle en el programa de sistemas de información son los siguientes:

• Trabajar con índices

• Como trabajar índices contra preguntas

• Como organizar resultados

Google cada mes optimiza su algoritmo para establecer la relevancia, los sistemas de recuperación tradicionales comparan los términos pertenecientes a un documento contra un conjunto de índices y posterior se organiza de una forma asignándole relevancia y ranking, sin embargo google hace buen uso de los tesauros con el fin de optimizar el proceso y apuntar al esquema mental del usuario que plantea el Query.

Para automatizar y optimizar las búsquedas y recuperación de información, se involucran procesos automatizados e informáticos como, hardware, software, colecciones de documentos, información digital, audio, video, texto, multimedia, codificaciones y otros objetos, generalmente los SRI son subsistemas de otros sistemas más grandes. Vasta con ver los ECM, ERM, ERP, Workflow que cuentan con subsistemas de recuperación para encontrar sus contenidos y que reducen la complejidad del problema documental y de archivos invertidos contenedores de metacontenidos.

Dado que los documentos puede ser cualquier objeto en la red hay que evaluar factores tales como la categorización, el formato, el tamaño del índice vs el tamaño de la colección para así asignar los elementos necesarios que permitan crear un SRI adecuado, es decir, interfaz, Querys, búsquedas, comparaciones, indexación, asignación de ranking y resultados de acuerdo a los listados de términos y reglas asociadas al SRI.

En este orden de ideas se convierte en un conjunto de procesos automatizados por los cuales el usuario accede a la información donde previamente se normalizan las preguntas y se indexa la documentación para que sea dada por este una categorización de utilidad a la respuesta devuelta por la maquina a una pregunta concreta de acuerdo a patrones semánticos.

La extracción de información como modelo para organización de resultados, es un proceso especializado de recuperación de información destinado únicamente a necesidades de información concreta. Es una búsqueda concreta sobre un listado de términos y basado en reglas asociadas que apuntan a una mayor exhaustividad en los resultados requeridos para saciar una necesidad informativa.

Recuperación de Información

Páginas

Buscar en este blog