Buscar en este blog

Mostrando entradas con la etiqueta Búsqueda y Recuperación de información. Mostrar todas las entradas
Mostrando entradas con la etiqueta Búsqueda y Recuperación de información. Mostrar todas las entradas

miércoles, 3 de noviembre de 2010

jueves, 16 de septiembre de 2010

LENGUAJES DOCUMENTALES

Cualquier sistema de signos destinados a la comunicación entre seres humanos, entre hombres y máquinas, o entre máquinas, que se estructura sobre un conjunto definido de reglas, convenciones y representaciones gráficas y/o fonológicas.


www.eubca.edu.uy/diccionario/letra_l.htm

NECESIDADES DEL USUARIO EN RECUPERACIÓN DE INFORMACIÓN

Cada usuario tiene diferentes necesidades, es importante soportar diferentes formas para encontrar información. Algunos usuarios saben exactamente qué es lo que buscan, quieren encontrarlo y terminar tan pronto sea posible. Otros usuarios no saben exactamente lo que buscan, llegan a la página con una vaga idea de la información que necesitan, después de explorar la página deben salir de ella con información o conocimientos que no sabían que necesitaban.

Se puede definir también como un vacio cognitivo, es decir, en el momento en el que no hay claridad en un determinado concepto da origen a una necesidad de Información, el problema de esto, es que es muy complejo saber cuáles son y cuántos son los conceptos que podrían solucionar esta necesidad de Información.

Tomado de : http://www.bibliodgsca.unam.mx/tesis/tes7cllg/sec_41.htm

COBERTURA

La cobertura es el alcance determinado a una búsqueda específica para que obtenga una gran cantidad de documentos al momento de realizar el proceso de recuperación de información.

Fuente: Los documentos de texto y su estructura (s.f)

martes, 14 de septiembre de 2010

LA EXTRACCION DE INFORMACION


La extracción de información, es una búsqueda manual o automática o de palabras, párrafos o trozos de textos que contengan información relevante buscada y representada de forma estructurada. El proceso de aplicar las reglas en los sistemas para llevar información de un sitio a otro se llama así: Extracción de información. La recuperación de datos que es otro concepto que no resuelve el problema de la RI, solo devuelve datos sobre un tema, es estructurado y para nada ambiguo en cuanto a consultas ya que en la recuperación una necesidad de información puede ser planteada en infinitas preguntas o formas. 

En la extracción de información habla sobre documentos no sobre datos, para los datos se usan sentencias estructuradas que dan un resultado estricto. Existen grandes diferencias entre recuperar datos e información: respecto a los Ítem: correspondencia entre pregunta respuesta, inferencia, Modelo de relación de requerimientos de sistema y satisfacción, especificación de la pregunta, respuesta al error, rapidez de la respuesta,  lenguaje de consulta, importancia, eficiencia y eficacia entre otras. El profesor Laureano Felipe Gómez del programa de sistemas de información de la Universidad de La Salle Diseñó una matriz donde se evalúan estos criterios.

Google desktop search como herramienta de recuperación de información

Este desarrollo de google permite indexar contenidos en diferentes formatos pese a que se demora en indexar, lo cual va de de acuerdo a la cantidad o peso de los documentos que se indexen, el programa usa los tiempos muertos del PC, hay q verificar los estatus y posterior cuando llega al 100% permite buscar, no genera avisos cuando acaba su proceso, simplemente pone a disposición del usuario la interfaz para que la búsqueda y recuperación. Esta misma tiene diferentes opciones avanzadas como instalar en la unidad que tenga espacio, modificación del registro y de la instalación a través de usuario administrador, ser utilizado de forma independiente en diferentes cuentas de Windows en una misma máquina, copia de seguridad del índice y restablecimiento de este mismo (restauración). Una de las desventajas de esta herramienta en la recuperación, es que por default tiene un número predeterminado de formatos, sin embargo muchos desarrolladores han generado plugg-ins para extender la compatibilidad con otros formatos de documentos de cualquier sistema de información.


Un buen instructivo para iniciar en el uso del Google Desktop Search se encuentra en el vínculo a continuación: http://desktop.google.com/support/bin/topic.py?topic=11570


sábado, 11 de septiembre de 2010

Metadatos


Es la información de la manera en que se organizan los datos de un documento así como los diferentes dominios de los datos y las relaciones que existen. En otras palabras son datos que identifican los datos del documento con el objetivo de tener un conocimiento avanzado sobre su existencia o características

METABUSCADORES


Sistemas desarrollados para mitigar el problema de tener que acceder a varios motores de búsqueda con el fin de recuperar información más completa sobre un tema, siendo estos sistemas los que se encargan de efectuarlos por el usuario. Un metabuscador colecciona las respuestas recibidas y las unifica. La principal ventaja es su capacidad de combinar resultados de diferentes fuentes mostrándoselas al usuario de forma simultánea.

Colino Tomé, Adriana. Glosario de Recuperación de Información Web. En <http://www.um.es/gtiweb/adrico/#Consulta> Septiembre de 2010

lunes, 6 de septiembre de 2010

Consideraciones sobre recuperación de información

Gerard Salton da lineamientos para introducirse a la recuperación de información. En su libro introduction to modern information retrieval de 1983, muestra a la IR (information retrieval) como un proceso interdisciplinario donde entran las ciencias de la información y documentación, la computación, la lingüística, la estadística la filología y los modelos matemáticos como la lógica de Boole. Básicamente busca recuperar información de conjuntos semánticos de datos a través de preguntas bien formuladas en formatos documentales que permitan recuperar términos indizados extraídos de los textos.

Los grandes teóricos de la recuperación de información anglosajones son: Gerard Salton, Rijsbergen, korfhage, Blair, Roberston, Willet, Sparek, Jones, Webber y Shannon. Ellos han fundamentado la recuperación de información a través de las ciencias de la computación, de la documentación y de la matemática. Internet ha permitido que millones de personas, culturas, idiomas en medio de tanto ruido documental permitan desarrollarse cognitivamente como usuarios para que las intersecciones de búsqueda planteadas a través de signos y formas semióticas den cabida a la recuperación documental.

Un importante libro sobre information retrieval se puede encontrar en el siguiente vinculo de la universidad de Stanford

http://nlp.stanford.edu/IR-book/pdf/irbookonlinereading.pdf

martes, 31 de agosto de 2010

Algunos Apuntes de Historia en la Recuperación de Información.

El termino Recuperación de Informacion, fue mencionado por primera vez hacia el ano de 1950 – aunque es claro que este es un concepto que en la práctica data de muchos años atrás – cuando Calvin N. Moores la definió como "la búsqueda de información en un stock de documentos, efectuada a partir de la especificación de un tema"[1], aunque este mismo autor más adelante decide ampliar aun mas este concepto manifestando para tal fin que “ la Recuperación de Informacion abarca los aspectos intelectuales de la descripción de información y su especificación para la búsqueda, y cualquier sistema, técnica o maquina que se utilice para llevar a cabo la operación”, y con esto, claramente, abre el concepto haciéndolo aplicable aun hoy, cuando ya han transcurrido más de 50 anos y claramente las tecnologías usadas para este proceso han cambiado significativamente, pero como ya se menciono, prácticamente este concepto, tiene cierto grado de validez.

Con la definición dada por Calvin N. Moores, se definían tres problemas, los cuales debían ser tratados por la Recuperación de Informacion:

- Como definir y organizar la información.

- Como especificar la búsqueda y

- Que sistemas y técnicas utilizar para este proceso.

Claramente se evidencia que estos problemas no son exclusivos de la Recuperación de Informacion, como la conocemos hoy en día, estos son simplemente la evidencia de las principales puntos de los que se encarga la Recuperación de Información, es decir las distintas áreas de trabajo, investigación y discusión, que básicamente reflejan las relaciones de interdisciplinariedad que intrínsecamente existen en la Recuperación de Informacion.

Posteriormente a esta época, y para ser más exactos en la fecha, hacia finales de los años 50 y comienzos de los 60, se dio inicio a otra época, cuya característica está enfocada en la gran cantidad de experimentos que se hacen en torno a la Recuperación de Informacion, construyendo para esto los primeros Sistemas de Informacion a gran escala. Un hito muy importante en esta época, y que claramente marco el desarrollo del concepto, fue la celebración en Washington, en 1958, de la Conferencia Internacional sobre Informacion Científica (International Conference on Scintific Information), evento que para la Británica Karen Spark Jones[2] marco el comienzo de la Recuperación de Informacion tal como la podemos evidenciar hoy día.

Ya para los años 70, y comenzara con esto, de forma resumida con el ánimo de profundizar sobre estos hitos históricos más adelante, lo que llamaremos la época de la madurez de la Recuperación de Informacion, teniendo que las dos características principales de esta época son:

• El nacimiento y posicionamiento de la Informacion Online, y ya con esto haciendo provecho de los primeros Sistemas de Recuperación de Informacion, y

• Refinamiento de las ideas y modelos estadísticos experimentados en años anteriores y consolidación de los mismos básicamente en dos modelos: los Modelos Vectoriales y los Modelos Probalísticos.

Otra etapa de que la se mencionara es la comprendida entre los anos de 1980 y 1990, caracterizada básicamente por la rápida expansión de internet, la aparición de software más sofisticado para la Recuperación de Informacion, y la aparición de las Bases de Datos en CD-Rom. En esta época se da un giro en lo que al concepto se refiere, teniendo que este se centra en el usuario como pieza clave en la Recuperación de Informacion.

Continuando con la parte histórica, de forma resumida, continuamos con la etapa comprendida entre 1990 y 2000 – hasta hace 10 años -, que muchos ya sabemos se caracteriza por la aparición de los computadores personales, obviamente con muchas más capacidad que la que presentaban los computadores hasta el momento; el desarrollo de motores de búsqueda[3] más o menos hacia el ano de 1993 cuando apareció Wandex, el cual indexaba paginas, pero también permitia la búsqueda, siendo la primera tecnología con la capacidad de “rastrear” en la red, y la aparición de otros sistemas y mejoras en la interfaz, que buscaba facilitar el acceso al usuario final y buscan favorecer la interacción entre el usuario y el sistema, haciendo de esta manera mas dinámico el proceso de Recuperación de Informacion.

Ya para finalizar este articulo, hablaremos del último periodo o etapa, que inicial en el año 2000 y va hasta el 2010, claramente la evolución informática de estos últimos 10 años ha marcado uno de los hitos más importantes, por no decir que el más importante, las computadoras evolucionaron trayendo con esto más capacidad, con menos tamaño, y claramente esta es una de las razones por las cuales existe tanta información – basta con decir que simplemente no ha existido un límite -, por otra parte las unidades de información empezaron a hacer parte de esta evolución, poniendo al servicio de los usuarios muchos de los documentos de sus colecciones, y con esto claramente, se da la participación de los profesionales de información en el fortalecimiento de la gran cantidad da información que circula libremente en la red. Otra de las características, es la facilidad de búsqueda, la interfaces de fácil uso, que prácticamente adivinan o por lo menos se acercan a lo que se está buscando, han hecho que sea más compleja la Recuperación de Información, pero con esto claramente más eficiente.


Fuentes:

[1] SALVADOR OLIVÁN, José Antonio. ARQUERO AVILÉS, Rosario. Una aproximación al concepto de Recuperación de Información en el marco de la ciencia de la documentación. México: Investigación Bibliotecológica, 2006. Vol. 20, Nº 41, pp. 13-41Disponible en: http://eprints.rclis.org/archive/00010615/01/IBI002004101.pdf

[2] Karen Spärck Jones (26 de agosto de 1935 – 4 de abril de 2007) fue una científica británica especializada en lingüística computación. Investigadora pionera en Recuperación de Información. En: http://es.wikipedia.org/wiki/Karen_Sp%C3%A4rck_Jones.

[3] Un motor de búsqueda es un sistema informático que busca archivos almacenados en servidores web gracias a su «spider» (o Web crawler. En: http://es.wikipedia.org/wiki/Motor_de_b%C3%BAsqueda