Buscar en este blog

martes, 14 de septiembre de 2010

LA EXTRACCION DE INFORMACION


La extracción de información, es una búsqueda manual o automática o de palabras, párrafos o trozos de textos que contengan información relevante buscada y representada de forma estructurada. El proceso de aplicar las reglas en los sistemas para llevar información de un sitio a otro se llama así: Extracción de información. La recuperación de datos que es otro concepto que no resuelve el problema de la RI, solo devuelve datos sobre un tema, es estructurado y para nada ambiguo en cuanto a consultas ya que en la recuperación una necesidad de información puede ser planteada en infinitas preguntas o formas. 

En la extracción de información habla sobre documentos no sobre datos, para los datos se usan sentencias estructuradas que dan un resultado estricto. Existen grandes diferencias entre recuperar datos e información: respecto a los Ítem: correspondencia entre pregunta respuesta, inferencia, Modelo de relación de requerimientos de sistema y satisfacción, especificación de la pregunta, respuesta al error, rapidez de la respuesta,  lenguaje de consulta, importancia, eficiencia y eficacia entre otras. El profesor Laureano Felipe Gómez del programa de sistemas de información de la Universidad de La Salle Diseñó una matriz donde se evalúan estos criterios.

Google desktop search como herramienta de recuperación de información

Este desarrollo de google permite indexar contenidos en diferentes formatos pese a que se demora en indexar, lo cual va de de acuerdo a la cantidad o peso de los documentos que se indexen, el programa usa los tiempos muertos del PC, hay q verificar los estatus y posterior cuando llega al 100% permite buscar, no genera avisos cuando acaba su proceso, simplemente pone a disposición del usuario la interfaz para que la búsqueda y recuperación. Esta misma tiene diferentes opciones avanzadas como instalar en la unidad que tenga espacio, modificación del registro y de la instalación a través de usuario administrador, ser utilizado de forma independiente en diferentes cuentas de Windows en una misma máquina, copia de seguridad del índice y restablecimiento de este mismo (restauración). Una de las desventajas de esta herramienta en la recuperación, es que por default tiene un número predeterminado de formatos, sin embargo muchos desarrolladores han generado plugg-ins para extender la compatibilidad con otros formatos de documentos de cualquier sistema de información.


Un buen instructivo para iniciar en el uso del Google Desktop Search se encuentra en el vínculo a continuación: http://desktop.google.com/support/bin/topic.py?topic=11570


lunes, 13 de septiembre de 2010

La Vida de Google en dos Minutos.

La historia de Google en dos minutos, desde el momento en que surgio la idea como propuesta de una tesis doctoral con el objetivo de mejorar las busquedas en internet, hasta hoy dia cuando es la principal herramienta para la recuperacion de informacion en la web. y la pregunta es, y ahora que se viene con Google.



Fuente: http://www.youtube.com/watch?v=EjN5avRvApk&feature=player_embedded


 http://es.wikipedia.org/wiki/Google

El proceso de Recuperación de Información

Como se menciona en el titulo, la Recuperación de Información es un proceso en que obviamente existe la intervención de unos elementos y unas actividades que básicamente están enfocadas a buscar y encontrar Información relevante que va a ayudar a satisfacer la necesidad de información de un usuario.


En la figura que se presenta a continuación se muestra el Modelo Global de Recuperación de Información, el cual muestra que el proceso de Recuperación de Información inicia cuando un usuario tiene una necesidad de Información y busca la forma de resolverla, haciendo la petición o consulta por medio de un lenguaje natural que finalmente se traduce al lenguaje del Sistema de Recuperación de Información, y es lo que comúnmente es conocido como estrategia de búsqueda; esta estrategia, como ya se mencionó , es introducida en un SRI, que localiza aquellos documentos que coinciden de forma total o parcial con la petición hecha por el usuario y los presenta al usuario, por lo general, ordenados de acuerdo a diferentes criterios entre ellos la relevancia y es ahí donde el usuario evalúa estos documentos para determinar los que cumplen con los requisitos de su búsqueda y finalmente van a satisfacer la necesidad que presentaba.

Este proceso finaliza cuando el usuario ha satisfecho la necesidad que presentó en un principio o ya sea cuando usuario considera que el Sistema de Recuperación de Información no puede satisfacer su necesidad de información, es decir que no le presenta los documentos que cubren esa necesidad de información que presentaba, en los casos que esto ocurre el usuario puede mejorar su estrategia de búsqueda gracias a los resultados que le presentó el SRI en esos documentos de su primera búsqueda.





Modelo Global de Recuperacion de Informacion.






Fuente: SALVADOR OLIVAN, Jose. Recuperacion de la Informacion. 1 Edicion 2008.

El nuevo reto del Profesional de Información - en el 2014 un 90 % del tráfico en Internet será video

Según un informe de Cisco Cisco Visual Network Index, se preevé que para el año 2014 el volúmen de videos en internet, esté cerca al 90 %, esto teniendo en cuenta los aumentos que ha presentado en los últimos años.

Esto representa un inminente cambio en las formas de recuperar la información, teniendo en cuenta esta premisa, para lo cual se hace necesario el aporte por parte de los Pofesionales de la Información a fin de garantizar que el usuario que tiene una necesidad de Información puede satisfacerla sin importar cual sea el formato en el que se muestra la información que soluciona esa necesidad.



 Fuente: http://www.idg.es/iworld/noticia.asp?id=99375&sec=iworld

Así será Google en el futuro




El futuro de el Gigante de internet, está encaminado a que Google valla mas allá de las búsquedas en tiempo real, el objetivo es poder anticiparse a las peticiones de los usuarios, es decir, "buscar sin buscar" y permitirá que los usuarios puedan tener información antes de buscarla.

Fuente: http://www.idg.es/iworld/video.asp?id=1920

domingo, 12 de septiembre de 2010

Sistemas de Recuperación de Información

Cualquier información promueve a los usuarios dotar de instrumentos de consulta, navegación y recuperación de información adecuados para satisfacer las necesidades de información. Sin embargo, existe una gran explosión documental y desconocemos cuál de éste gran volumen de documentos e información es útil y se pueda recuperar de una forma más fácil y que cumpla con unos ciertos requisitos durante su búsqueda.

Por ello, existen gran variedad de herramientas que permitan hacer búsquedas de información efectivas y que contengan conocimiento intelectual y válido para la investigación y el aprendizaje; estas herramientas se pueden resumir en cuatro siglas o en el mejor de los casos, en cuatro palabras: Sistemas Gestores de Bases de Datos – SGBD.

Estas herramientas se dividen en tres fases, las cuales permiten y facilitan el acceso y la recuperación de la información:

1- Sistemas de navegación de tipo jerárquico: este sistema permite estructurar jerárquicamente a información en clases y subclases, y es aquí donde el usuario decide qué opción se ajusta más a las necesidades de información (ejemplo: www.yahoo.com)

2- Sistemas de navegación hipertextuales: este sistema de búsqueda permite que el usuario vaya de un documento a otro con solo dar un click al activarse los vínculos estipulados en el mismo para tal fin.

Por otra parte, el documento hipertextual está formado por bloques o partes interrelacionadas entre sí, con un orden establecido que permita recorrer diversas direcciones web.

3- Sistemas de recuperación de información: aquí no se emplea la búsqueda a través de navegadores, sino que este tipo de búsqueda se hace por medio de un conjunto de operadores e instrucciones específicas que hacen posible efectuar la búsqueda de información más detallada y relevante.

La base de la recuperación de información en los sistemas informáticos se emplea el uso de álgebra booleana o ecuaciones de búsqueda, en donde hace combinaciones de búsqueda de términos o documentos mediante los operadores de unión, intersección y negación.

Especialistas en recuperación de información o intermediarios.

Aquí hace mención a los profesionales y especialistas en recuperación de información los cuales deben tener en cuenta que problemas deben resolver y qué técnicas y conocimientos deben poseer para hacer posible la búsqueda y recuperación de la información. Éstos especialistas también conocidos como intermediarios, son aquellas personas con capacidades y habilidades para conocer la necesidad de la información real del usuario y para la posterior búsqueda y recuperación en diferentes SRI y bases de datos.

Para hacer posible la satisfacción de la información a los usuarios por parte de los especialistas de información o intermediarios, ellos ayudan a diagnosticar el problema del usuario y a formular la consulta, sugieren los sistemas o bases de datos apropiadas para la búsqueda, traducen la consulta en estrategias de búsqueda adecuadas para el sistema o bases de datos a utilizar, realizan o modifican la búsqueda, evalúan los resultados, proporcionan al usuario los resultados adecuados y le aconsejan sobre las actividades que deben realizar posteriormente.

1. El proceso de búsqueda:

Es la actividad principal del especialista en recuperación de información. En dicho proceso se reflejan los conocimientos que deben poseer, las tareas y problemas a resolver y las técnicas a emplear, todo encaminado a la satisfacción de necesidades de un usuario en general.

El proceso de búsqueda según Bárbara Quint, se dividen en siete etapas:

1.1. Entrevista de referencia: Esta entrevista es realizada entre el usuario y el profesional de la información con el propósito de determinar la necesidad de información solicitada, y es aquí donde entra a jugar la interacción de búsqueda de información por parte del profesional de información, utilizando las herramientas necesarias para efectuar la búsqueda y obtener los resultados esperados por el usuario.

1.2. Revisión táctica: esta fase consiste en la revisión de la revisión de respuestas dadas por el usuario para efectuar la búsqueda, en donde se analizan todos aquellos aspectos que influyan en el proceso de búsqueda.

1.3. Selección de la(s) base(s) de datos: aquí el profesional de información valora las características de búsqueda disponibles en cada sistema o herramienta (catálogos, bases de datos, directorios, boletines, entre otros).

Después de determinar las características de cada una, se elige una o algunas de ellas que tenga relación con la información solicitada.

1.4. Formulación de estrategia de búsqueda: la finalidad de ésta etapa es traducir la petición del usuario en las sentencias de búsqueda que se van a introducir en la herramienta elegida para tal fin.

Esta búsqueda exige una serie de pasos:

• Análisis conceptual del tema de la búsqueda y determinar los conceptos más relevantes.
• Elegir los términos que mejor representen la petición de información.
• El profesional debe escribir en el lenguaje del sistema que vaya a utilizar, las sentencias de búsqueda; establecer relaciones lógicas entre los términos buscados utilizando los interfaces de búsqueda que posea el sistema empleado.

1.5. La búsqueda de información: una vez diseñada la estrategia de búsqueda, se ejecutan las búsquedas en el sistema elegido. Puede que se encuentren resultados satisfactorios en la búsqueda, pero en caso contrario, el profesional de información debe crear unas nuevas estrategias, con el objetivo de mejorar y conseguir información que el usuario necesita.

1.6. Feedback o revisión de los resultados: el profesional de información revisa los resultados obtenidos en el sistema. Si los resultados no son lo suficientemente relevantes, se revisa y se modifica la estrategia de búsqueda utilizando otros términos y otras bases de datos.

1.7. Presentación de los resultados de la búsqueda: cuando el profesional de información hace entrega de los resultados de búsqueda al usuario, él debe explicarle al usuario qué fuentes consultó, que estrategia de búsqueda utilizó y los registros que encontró, asegurándose que el usuario comprenda e interprete completamente la información

La recuperación de información online (teledocumentación)

La recuperación de información es asociada con el término teledocumentación, el cual hace referencia a la unión de telecomunicaciones + informática (telemática) + documentación. La teledocumentación es definida por Mercedes Caridad como “la aplicación telemática destinada a la recuperación de las fuentes a través de elementos informáticos y la telecomunicaciones”, y de esta forma, se destaca y se da a conocer la importancia de las tecnologías informáticas y telecomunicaciones en el acceso de información a distancia.

Por otro lado, la recuperación Online es la búsqueda y recuperación de información en bases de datos. Para hacer posible que la recuperación online pudiera tener lugar, fue necesario que se produjeran avances en la tecnología informática y en las telecomunicaciones, favoreciendo el acceso y la difusión de la información, creando a la vez una industria de la información

sábado, 11 de septiembre de 2010

SGML


Standard markup metalanguage. Estándar internacional para la definición de métodos de representación de texto en forma electrónica no ligados a ningún sistema ni a ningún dispositivo. Es un lenguaje más extenso que HTML. HTML es una aplicación de SGML. Se basa en un marcado genérico del documento para identificar sus partes lógicas de manera jerárquica. Permite que se definan lenguajes de marca de forma independiente, facilitando el intercambio de recursos ampliamente estructurados. SGML no es un lenguaje de marcas en sí mismo sino un estándar para la descripción de lenguajes de marcado (Metalenguaje). 

Colino Tomé, Adriana. Glosario de Recuperación de Información Web. En <http://www.um.es/gtiweb/adrico/#Consulta> Septiembre de 2010

Base de datos relacional


Es una base de datos en donde todos los datos visibles al usuario están organizados estrictamente como tablas de valores, y en donde todas las operaciones trabajan sobre las mismas. Estas tablas cumplen con unos criterios, estructuras y características que permiten que se efectúen relaciones de unas con otras

Marca


Es un dato extra que se introduce dentro del texto para delimitar sus partes. Esto con el fin de dar criterios que permitan hacer de un texto no estructurado característica de semiestructurado

Visor de archivos de texto


Reproductores portátiles que tiene la capacidad de mostrar por medio de una interfaz información  donde el  documento funciona como una sola unidad de información. Estos reproductores no pueden diferenciar el autor del texto aunque este apareciera al final de la información.