Recuperación de Información: Universidad de La Salle

Mostrando entradas con la etiqueta Universidad de La Salle. Mostrar todas las entradas

domingo, 3 de octubre de 2010

La Informática y la Recuperación de Información.

Desde la creación de este blog, habíamos hablado de la Recuperación de Información, de los Sistemas de Recuperación de Información, de las Bases de Datos, los Sistemas Gestores de Bases de Datos, Lenguajes Documentales, entre otros temas igualmente importantes, pero no habíamos hablado de la relación que existe entre la informática y la Recuperación de Información, por tal razón este articulo está orientado a mostrar la relación existente entre estas dos, todo con el ánimo de buscar una mejor comprensión de la importancia que tienen y finalmente mostrar la realidad a la que nos estamos enfrentando con el aumento y diversificación de las TIC’s.

Tenemos claro que la informática nace en los años 40, influenciada por distintas corrientes, en las cuales no vamos a enfatizar, esta es definida por Peter Denning como, el estudio sistemático de los procesos algorítmicos que describen y transforman información: su teoría, análisis, diseño, eficiencia, implementación y aplicación.

Es claro que muchas de las áreas de la informática son propias o están relacionadas con la recuperación de información, pues el enfoque y los problemas que la informática busca resolver están dirigidos al diseño de aplicaciones y de sistemas informáticos tanto de hardware como de software.

En nuestro caso los sistemas de recuperación de información y bases de datos están ocupados principalmente de la organización de los datos en un sistema, los modelos de representación, las operaciones para su almacenamiento y recuperación, la localización, la equiparación y recuperación, la interacción, el diseño de una arquitectura que permite una recuperación más eficiente, entre otras

Por otra parte la IA (Inteligencia Artificial) y la robótica, buscan modelar el conocimiento del hombre con el objetivo de construir sistemas automatizados que imiten el comportamiento del hombre o aumenten las capacidades de este, en tal sentido se tienen y aplican conceptos como lenguaje natural, redes semánticas, modelos de aprendizaje, redes neuronales, agentes inteligentes y robots en la web, temimos que pertenecen a la investigación en IA y a la recuperación de información.

Otro caso de relación entre la recuperación de información y la informática es la Interacción hombre maquina, que principalmente está encargada de diseñar interfaces en la cual intervienen también otras áreas como: los gráficos informáticos y la Psicología cognitiva.

Otras de las áreas que juegan un papel fundamental en la recuperación de información, son los algoritmos y estructuras de datos, lenguajes de programación, arquitecturas y Sistemas Operativos, y Redes. Teniendo para este caso que los dos últimos han llevado a que los ordenadores sean cada vez más potentes, rápidos y facilitando con esto que la búsqueda y recuperación de información sea cada vez más rápida y personalizada.

Para finalizar cabe aclarar que la recuperación de información desde un principio ha estado ligada a la ciencia de la informática, no solo por el uso de un computador y de las TIC’s como una herramienta de trabajo y que finalmente facilita la recuperación de información, sino porque gran parte de la investigación ha sido orientada al diseño de mejores sistemas de recuperación de información, en este sentido para Baeza Yates, el problema de la recuperación de información desde el área de la informática, esta principalmente en diseñar y construir índices eficientes para el procesamiento de las consultas de los usuarios con un alto rendimiento, y en el desarrollo de de algoritmos de rango que mejoren la calidad de los resultados obtenidos.

Fuentes.

P.J Denning. “Computer Science The Discipline” en: Encyclopedia of Computer Science, 2000 edition. London: Nature Publishing Group, 2000 < http://www.idi.ntnu.no/

Informatica. disponible en: http://es.wikipedia.org/wiki/Inform%C3%A1tica. [consultado 03 de octubre de 2010].

Alfabetización Informacional - Memoria de Clase.

Para inciar, es importante aclarar que la alfabetización informacional no es igual a la recuperación de información. Esta – la alfabetización informacional – es un concepto que debe estar en concordancia con la realidad en cuanto a la recuperación de información tal como a vivimos actualmente, es decir, se trata de enseñar al usuario a utilizar, buscar, evaluar, etc… la información que esta va a encontrar en la red, esto dado principalmente en un mundo en el que el concepto de biblioteca esta cambiando a tal punto que usuario no es quien debe ir a esta, si no que es esta la que debe dirigirse al usuario, y esto claramente lo hace con la publicación de sus colecciones en la red.

Se trata de hacer uso de la tecnología – entendiendo esta como un concepto que va mas alla de las maquinas, es decir, la intervención del hombre sobre el entorno para satisfacer sus necesidades y lograr un bienestar – para satisfacer una necesidad latente en un determinado usuario.

Según wikipedia, la alfabetización informacional “consiste en adquirir la capacidad de saber cuándo y por qué necesitas información, dónde encontrarla, y cómo evaluarla, utilizarla y comunicarla de manera ética.Se considera un prerrequisito para participar eficazmente en la Sociedad de la Información y es parte de los derechos básicos de la Humanidad para un aprendizaje de por vida”

En conclusión, difícilmente vamos a encontrar una definición exacta de este termino, pues en gran parte esta sujeto al cambio en las TIC’s (Tecnologias de la Informacion y Comunicación), pero una de las definiciones mas acertadas y completas es la siguiente, “La alfabetización informacional es un conjunto de habilidades que requieren las personas para "reconocer cuándo se necesita información y tener la capacidad para localizar, evaluar y utilizar eficazmente la información necesaria."

Fuentes.

- Alfabetización Informacional. Disponible en: http://es.wikipedia.org/wiki/Alfabetizaci%C3%B3n_informacional. [consultado 03 de octubre de 2010]

- Alfabetización Informacional. Normas sobre Competencias para la Educación Superior. American Library Association. 2006

- Alfabetización informacional: un enfoque postmoderno para la formación del ciudadano en la sociedad del conocimiento. Disponible en: http://proquest.umi.com/pqdweb?index=0&did=2101645551&SrchMode=1&sid=1&Fmt=3&VInst=PROD&VType=PQD&RQT=309&VName=PQD&TS=1286147660&clientId=51540. [consultado 03 de octubre de 2010]

Las Bases de Datos

Una base de datos es un “almacén” que permite guardar grandes volúmenes de información de forma organizada, para que posteriormente el usuario pueda recuperar esa información y utilizarla fácilmente.

Otra definición de base de datos puede ser la siguiente, Es una aplicación que permite almacenar y organizar de manera estructurada información sobre un determinado objeto. Por sus características las bases de datos pueden acumular una grandes volumenes de información, que posteriormente seran recuperados por cualquier usuario. En tal sentido una base de datos se convierte en la fuente principal de cualquier sistema de recuperación de información.

Características

Algunas de las principales características de las bases de datos, son las mencionadas a continuación:

Independencia lógica y física de los datos.
Redundancia mínima.
Acceso concurrente por parte de múltiples usuarios.
Integridad de los datos.
Consultas complejas optimizadas.
Seguridad de acceso y auditoría.
Respaldo y recuperación.
Acceso a través de lenguajes de programación estándar.

Fuentes:

que son las bases de datos?. disponible en: http://www.maestrosdelweb.com/principiantes/%C2%BFque-son-las-bases-de-datos/. [consultado 03 octubre de 2010]

Bases de datos. Disponible en: http://recuperainformacion.blogspot.com/search/label/recuperaci%C3%B3n%20de%20informaci%C3%B3n. [consultado 03 octubre de 2010]

miércoles, 29 de septiembre de 2010

Procesamiento del Lenguaje Natural

Es una subrama de la inteligencia artificial y de la lingüística. También se suele referir a esta rama de la informática de forma abreviada como PLN o NLP del inglés Natural Language Processing.

El objetivo del Procesamiento del Lenguaje Natural, es la construcción de sistemas y mecanismos que permitan la comunicación entre personas y maquinas, adicionalmente, busca que esos mecanismos sean lo mas eficientes posibles. Dicho en otras palabras, se busca crear programas que tengan la capacidad de analizar, entender y generar lenguajes como los que usa habitualmente el hombre, de tal forma que permita que permita la comunicación entre el hombre y el computador.

El procesamiento del Lenguaje Natural, tiene una relación directa con la Recuperación de Información, pues las dos tienen como objetivo desarrollar las herramientas que permitan al usuario hacer preguntas de cualquier forma y que el sistema sea capaz de responder de manera correcta a esa pregunta que formuló el usuario, tal como lo haría cualquier persona. Es a esto a lo que se le conoce como sistemas de question-answering. Entonces, un buscador de información que use procesamiento del lenguaje natural para la recuperación de información, sería diferente de un buscador tradicional en el sentido que el usuario podrá consultar la pregunta que tiene, tal cual como la está pensando, sin necesidad de buscar por los conceptos que cree que podrían servir para encontrar la información que desea

El procesamiento del lenguaje natural, además de usarse en el procesamiento y recuperación de información, es usado también en campos como la traducción automática, el reconocimiento del habla y la corrección de ortografía de textos.

Fuentes:

Procesamiento del lenguaje natural: revisión del estado actual, bases teóricas y aplicaciones (Parte I). Disponible en:

http://www.elprofesionaldelainformacion.com/contenidos/1997/enero/procesamiento_del_lenguaje_natural_revisin_del_estado_actual_bases_tericas_y_aplicaciones_parte_i.html (Consultado 17 de septiembre de 2010)

Lenguaje natural. Disponible en: http://es.wikipedia.org/wiki/Lenguaje_natural. (Consultado 17 de septiembre de 2010).

Objetivo de los Lenguajes Documentales.

Anteriormente ya habíamos mostrado algunos conceptos de Lenguajes Documentales, según algunos expertos en el tema, esta vez nos centraremos en el para qué de estos Lenguajes Documentales, todo con el ánimo de ir aclarando y ampliando de forma sencilla el entendimiento de este concepto y todas sus implicaciones en el ámbito de la recuperación de información.

En este sentido tenemos que el principal objetivo de los Lenguajes Documentales es el de hacer más fácil la recuperación de informacion y de documentos, buscando con esto reducir tiempos y esfuerzos para el usuario que realiza la búsqueda. Teniendo en cuenta que los Lenguajes Documentales poseen la capacidad para representar los mensajes contenidos en los documentos, esto permite cumplir estos objetivos específicos:

· Normalizar: Lograr unificación en la terminología.

· Induce: Es decir, le indica al usuario todas las posibles alternativas por medio de las cuales va a poder recuperar información.

· Describe el contenido de los documentos: Después de la lectura e identificación de los conceptos contenidos en los documentos, éstos se representan mediante un lenguaje documental que proporciona un vocabulario unívoco que permite traducir los conceptos en términos normalizados.

· Recuperación de la Información: El Lenguaje Documental tiene la capacidad de suministrar un vocabulario con los términos que se están demandando, es decir, proporciona los elementos que permiten realizar la búsqueda en niveles aun mas específicos.

Fuente:

Los lenguajes documentales. Disponible en: www3.unileon.es/dp/abd/tesauro/pagina/.../lengdocu.htm. (consultado 29 septiembre de 2010).

La organización de la información, los lenguajes documentales y la normalización. Disponible en: http://www.binal.ac.pa/archivos/catcoop/auts/orginfo.PDF. (consultado 29 septiembre de 2010).

lunes, 27 de septiembre de 2010

Lenguajes Documentales: Algunas definiciones.

El objetivo de este artículo, tal como lo presentamos con los conceptos de Recuperacion de Información, es hacer un recorrido por distintas definiciones dadas al concepto de Lenguajes Documentales, para finalmente llegar a una conclusión general sobre esta.

Empezamos con Banca Gil quien dice que un Lenguaje Documental es el sistema artificial de símbolos estandarizados que facilitan la representación del contenido de los documentos para facilitar la recuperación manual o automática de la información solicitada por el usuario.

Por otra parte para Antonio García Gutiérrez, los lenguajes documentales están compuestos por un listado de términos que los constituyen como vocabulario, y por unas relaciones entre ellos que dinamizan esos vocabularios y le otorgan la categoría de lenguaje. Estos lenguajes se generan por el proceso del análisis de los documentos puesto que el objetivo que se persigue es el control y manipulación de sus contenidos para poder satisfacer las demandas de información.

J. Rowley, en su libro Organizing knowledge, usa el termino indexing languages refiriéndose a este como "una lista de términos o notaciones que pueden ser utilizados como punto de acceso en un índice"

Finalmente según la Norma Técnica Colombiana NTC 1544, Documentación, indización, Terminología, el lenguaje documental es “un lenguaje artificial, construido con base en reglas preestablecidas, utilizando los sistemas de documentación para indización, con propósitos de almacenamiento y recuperación”

Finalmente y tomando como base los conceptos dados anteriormente podemos afirmar que todos apuntan hacia lo mismo, es decir, aunque las definiciones son diferentes, el objetivo que persiguen es básicamente el mismo, decir que el lenguaje documental, es un listado de términos controlados, que van a permitir facilitar la recuperación de la información contenida en un determinado documento

Fuentes:

Los Lenguajes Documentales. Disponible en: http://www3.unileon.es/dp/abd/tesauro/pagina/conceptos/lengdocu.htm. (consultado 25 septiembre de 2010)

Analisis Documental y lenguajes Documentales. Disponible en: lavelablanca.neositios.com/downloads.php?id=11919&dId. (consultado 25 septiembre de 2010)

ICONTEC. Norma Tecnica Colombiana NTC 1544. Documentacion, Indizacion, Terminologia. Disponible en: http://www.sinab.unal.edu.co/ntc/NTC1544.pdf. (consultado 26 septiembre de 2010).

viernes, 17 de septiembre de 2010

Relevancia en la RI

Creo que ya hemos hablado de esto, pero en este artículo lo detallaremos un poco más, intentando responder a la pregunta ¿Cuándo un documento es relevante?

Según la RAE el termino relevancia significa “cualidad o condición de relevante, importancia, significación”, por otra parte el termino relevante se define como “sobresaliente, destacado, importante o significativo”, en tal sentido, se considera relevante un documento recuperado cuando el contenido de esto tiene una significación o importancia respecto a la pregunta realizada por el usuario, es decir, con la necesidad de información del usuario.

Conocer y más importante aún, entender este término, nos brinda una ayuda muy importante, puesto que al momento de determinar exactamente cuando un documento se puede considerar relevante o no, surgen muchos problemas estrechamente relacionados con la naturaleza cognitiva de este proceso.

Como se había mencionado anteriormente, un documento se puede considerar relevante o no, en función de los motivos que dan origen a la necesidad de información, o del grado de conocimiento que se posea sobre el tema al momento de hacer la pregunta, es decir, el documento que para una persona es relevante, puede no ser relevante para otra persona que tiene una necesidad de información idéntica a la del primer sujeto.

Para finalizar basta con decir que

puede resultar aventurado calificar un documento como relevante con un tema, o por el contrario, calificarlo como no relevante de igual manera. Puesto que es común encontrar documentos que en alguno de sus apartados contienen información que puede resultar relevante para el usuario, pero que en el resto de su contenido no contiene información relevante. Para algunos autores, surge entonces el concepto de “relevancia parcial”, puesto que, la relevancia no puede medirse en términos binarios (sí/no), sino que puede adquirir muchos valores intermedios, es decir, una especie de escala de medición, (muy relevante, relevante, escasamente relevante, mínimamente relevante, etc.), lo que propicia que la relevancia pueda medirse en términos de función continua en lugar de una función binaria, la cual admite dos estados únicamente.

Fuentes:

Ontología sobre economía y recuperación de información. Disponible en: http://www.hipertext.net/web/pag259.htm. [Consultado 17 de septiembre de 2010].

Relevancia. Real Academia Española RAE. Disponible en: http://buscon.rae.es/draeI/SrvltConsulta?TIPO_BUS=3&LEMA=relevancia [Consultado 17 de septiembre de 2010].

Directorio de enlaces

Trucos para Posicionar tu Blog en Google

La entrada a continuación va dirigida a los compañeros que por alguna circunstancia no han podido añadir su blog al ranking, los siguientes consejos buscan que formemos una inteligencia colectiva ya que engañarnos a nosotros mismos dejando que otros hagan lo que necesitamos aprender, sea ingeniero de sistemas, diseñador grafico o web máster es una mala práctica que infortunadamente Google no detecta, digo yo, porque realmente al profesor se le puede engañar y salir bonitos en la foto en el primer lugar en google pero si en algún momento a quien adopte estas prácticas bajas y deshonestas se le solicita que inicie un blog desde cero para que nos comparta de su extraordinario conocimiento para posicionase en una semana en el primer lugar máxime con un pobre contenido, estamos seguros que su desempeño va a ser nulo frente al tablero y ni la ayuda del mismísimo Jesús, del novio o del extraño don sobrenatural de posicionar sobre blogs con mayor contenido, contará….

Entrando en materia, el misterioso ranking y el misterioso algoritmo que utiliza Google, efectivamente sigue siendo un misterio cada vez mas descubierto, si quieren saber más sobre los cambios que hace google entren a estos tres blogs: http://google.blogspace.com http://www.google.com/googleblog http://battellemedia.com sin embargo y ya entrando en materia, dividimos esta entrada en tres cosas fundamentales:

1. Relájese, no se estrese porque el blog no se haya posicionado aun, es mejor cargar de buenos e interesantes contenidos su blog que de cosas por debajo y ocultas para los visitantes que únicamente sirven para posicionarlo pese a un contenido mediocre, si el contenido es bueno y sus palabras clave se adaptan a los tesauros de google, el algoritmo del ranking valorará positivamente su blog.

2. Envíe su url al indexador de google, esto se realiza en www.google.com.co/addurl.html no se garantiza que sea indexada de inmediato pero garantizará que el spider (GoogleBot) visite su blog en un plazo no máximo de 4 semanas, aunque podría ser menos, eso no lo podemos medir como usuarios.

3. Lo más importante es lo que viene a continuación: Optimice su plantilla, i.e que debe hacer algunas modificaciones:

o Utilice las etiquetas más precisas y adecuadas a la entrada que publica

o Trate de utilizar el titulo al extremo izquierdo

o La primera oración de su blog debe ir en texto normal, no use negrillas, itálicas, etc.

o Utilice las negrillas únicamente en los párrafos de las entradas

o No duplique las palabras clave en la URL

o Ingrese enlaces relevantes “en el sitio”, de ser posible compartan enlaces con otros blogs del mismo tema

o Enlaces relevantes “hacia el sitio” si logran hacerlo desde un sitio que tenga PageRank mayor a 8, excelente

o Mantenga bajo el tamaño de la pagina, esto se logra evitando muchas imágenes y videos e ingresando mas .txt

o No utilice objetos de flash, google no los indexa, preferiblemente que todo sea .html o .htm

Estos cortos pero efectivos tips, nos ayudarán a todos a cumplir con la meta impuesta, sin embargo iteramos, nada más bonito que el aprendizaje a través de la investigación concienzuda y las buenas prácticas.

jueves, 16 de septiembre de 2010

NECESIDADES DEL USUARIO EN RECUPERACIÓN DE INFORMACIÓN

Cada usuario tiene diferentes necesidades, es importante soportar diferentes formas para encontrar información. Algunos usuarios saben exactamente qué es lo que buscan, quieren encontrarlo y terminar tan pronto sea posible. Otros usuarios no saben exactamente lo que buscan, llegan a la página con una vaga idea de la información que necesitan, después de explorar la página deben salir de ella con información o conocimientos que no sabían que necesitaban.

Se puede definir también como un vacio cognitivo, es decir, en el momento en el que no hay claridad en un determinado concepto da origen a una necesidad de Información, el problema de esto, es que es muy complejo saber cuáles son y cuántos son los conceptos que podrían solucionar esta necesidad de Información.

Tomado de : http://www.bibliodgsca.unam.mx/tesis/tes7cllg/sec_41.htm

Captar información – R.I

Selección manual o automática de información relevante o de interés que realizamos las personas al buscar algún tema específico. Es una selección natural de información en la que de toda la información que existe acerca de algún tema tomamos solo la que nos es de interés dependiendo de nuestra necesidad de información.

Metadatos Dublin Core en Recuperación de información

“Dublín Core” define una serie de 15 campos que pueden ser usados para describir un documento.

Elementos del Contenido

• Título (Title)

• Materia (Subject)

• Descripción (Description)

• Fuente (Source)

• Lenguaje (Language)

• Relación (Relation)

• Cobertura (Coverage)

Elementos de Propiedad Intelectual

• Autor (Creator)

• Editor (Publisher)

• Colaborador (Contributor)

• Derechos (Rights)

Elementos de Aplicación

• Fecha (Date)

• Tipo (Type)

• Formato (Format)

• Identificador (Identifier)

Ver más en: http://www.metadatos-xmlrdf.com/metadatos/dublin-core

La Generación Google

La Generación Google, es un término que hace referencia a la generación de jóvenes nacidos despúes de 1993, y que han crecido en un mundo lleno de información y tecnología dominado por internet, y en que como herramienta principal de recuperación de información se cuenta con el buscador Google.

Hoy día, nos encontramos en un mundo que vive la mayoría de su tiempo en internet, un mundo en el que se está dejando atrás el uso del cuaderno y de los apuntes en un papel, a un mundo en que el uso del computador, y más especificamente el computador personal, es algo indispensable para el desarrollo de nuestras actividades, principalmente en el campo académico, es decir, el estudiante de hoy, literalmente vive en internet, se alimenta de él y en gran parte depende él para alcanzar varios de sus objetivos.

Un apunte adicional sobre la Generación Google

En sentido literal, todos somos hoy en día generación Google: los datos demográficos de consumo tanto de Internet como de medios, cambian rápidamente esa presunta diferencia generacional. La evidencia indica que cada vez más personas, de todos los grupos de edad, usan Internet y tecnologías de la Web 2.0 para una variedad de propósitos.

para más información consulte este documento: http://www.eduteka.org/pdfdir/GeneracionGoogle.pdf

Fuentes:

La generación Google. Disponible en:http://blog.pucp.edu.pe/item/36426/la-generacion-google [Consultado 16 de septiembre de 2010].

La generación Google. Disponible en: http://www.eduteka.org/GeneracionGoogle.php [Consultado 16 de septiembre de 2010].

miércoles, 15 de septiembre de 2010

Infoxicación - Un concepto Real

No cabe duda que la infoxicación es una realidad. La revolución y adaptación de la red como consumo diario del ciudadano provoca que el usuario busque la información que necesita, en una web. A priori lo que es una gran ventaja, la gran oferta documental de internet, termina convirtiendose en una adversidad. como tal el problema no es del medio, sino del usuario que guiado por su necesidad de información y por su gula, no selecciona bien las fuentes o páginas que consulta y termina saturado de información, que en muchos no ayuda completamente a satisfacer esa necesidad de información que presenta. Al igual que otros campos, el problema sigue siendo la educación con respecto a la red y al mecanismo de búsqueda.

tomado de. Manuel Valero. / http://lalinotipia.blogspot.com/2008/02/un-concepto-real-infoxicacin.html

La Relevancia en la Recuperación de Información.

La relevancia es una de las propiedades más interesantes de los documentos y, por esta razón una de las más difíciles de definir,

de forma Intuitiva, se puede afirmar que un documentos es mas relevante en la medida que permita solucionar de forma eficiente una necesidad de información. Ahora bien, teniendo en cuenta esto. se evidencia que la relevancia no es una propiedad exclusiva de los documentos, sino que es una realidad, una coproducción triangular entre las características del documento, las características de la necesidad de información y las características de la persona que hace la pregunta. Es decir, la relevancia es subjetiva, en tanto que depende del criterio de quien tiene la necesidad de información para definir lo que es o no relevante, en otras palabras, "los documentos que para un usuario son relevantes, es posible que para otro usuario con la misma necesidad de información, no lo sean".

Por otro lado, la relevancia tiene grados, puesto que un documento no se limita a ser relevante o a no serlo, sino que la relevancia de un documento (como hemos visto en el ejemplo anterior) puede situarse en cualquier punto de un continuo de entre, por ejemplo, 0 y 1, en el cual el 0 representa la ausencia total de relevancia y el 1 la relevancia absoluta. Entre esos puntos, un documento muy semejante respecto a la pregunta podría tener una relevancia del 0.8, mientras que otro menos similar podría tener un relevancia del 0.5, etc. Naturalmente nada impide utilizar escalas de 0 a 10 en lugar de 0 a 1 o de tantos por ciento para representar el grado de relevancia de cada al usuario.

lo realmente importante aquí es si diferentes documentos tienen un grado de relevancia diferente respecto a una pregunta, entonces no tiene nada sentido que se entreguen estos documentos de forma aleatoria o bajo un orden poco eficiente como por ejemplo el título o la fecha de entrada en el fondo documental o la base de datos, en este sentido, es claro que este principio está muy claro para la mayoría de los motores de búsqueda de internet, pero aún está muy descuidado en algunos sistemas de Gestión Documental de las organizaciones.

En conclusión, lo que hacen la mayoría de los mejores Sistemas de Recuperación de Información, es intentar determinar la forma mas eficiente posible para determinar lo que es o no relevante para un usuario que presenta una necesidad de información, es decir si la respuesta a una pregunta incluye una lista de mil documentos, y estos documentos están distribuidos de forma aleatoria, no es lógico que el usuario tenga que revisar uno a uno esos mil documentos; lo lógico y lo que se busca es que el Sistema de Recuperación de Información, le entregue únicamente los documentos relevantes para este usuario, esto tendiendo en cuenta la pregunta que formuló, es decir, su necesidad de información.

Fuentes.

OLVERA LOBO, Mª Dolores Evaluacion de sistemas de recuperacion de informacion: aproximaciones y nuevas tendencias. disponible en:http://www.elprofesionaldelainformacion.com/contenidos/1999/noviembre/evaluacion_de_sistemas_de_r

ecuperacion_de_informacion_aproximaciones_y_nuevas_tendencias.html. [consultado 15 de septiembre de 2010 ]

Criterios de relevancia en los buscadores. disponible en: http://fabianperez.blogspot.com/2008/07/criterios-de-relevancia-en-los.html. [consultado 15 de septiembre de 2010 ]

martes, 14 de septiembre de 2010

LA EXTRACCION DE INFORMACION

La extracción de información, es una búsqueda manual o automática o de palabras, párrafos o trozos de textos que contengan información relevante buscada y representada de forma estructurada. El proceso de aplicar las reglas en los sistemas para llevar información de un sitio a otro se llama así: Extracción de información. La recuperación de datos que es otro concepto que no resuelve el problema de la RI, solo devuelve datos sobre un tema, es estructurado y para nada ambiguo en cuanto a consultas ya que en la recuperación una necesidad de información puede ser planteada en infinitas preguntas o formas.

En la extracción de información habla sobre documentos no sobre datos, para los datos se usan sentencias estructuradas que dan un resultado estricto. Existen grandes diferencias entre recuperar datos e información: respecto a los Ítem: correspondencia entre pregunta respuesta, inferencia, Modelo de relación de requerimientos de sistema y satisfacción, especificación de la pregunta, respuesta al error, rapidez de la respuesta, lenguaje de consulta, importancia, eficiencia y eficacia entre otras. El profesor Laureano Felipe Gómez del programa de sistemas de información de la Universidad de La Salle Diseñó una matriz donde se evalúan estos criterios.

domingo, 12 de septiembre de 2010

Sistemas de Recuperación de Información

Cualquier información promueve a los usuarios dotar de instrumentos de consulta, navegación y recuperación de información adecuados para satisfacer las necesidades de información. Sin embargo, existe una gran explosión documental y desconocemos cuál de éste gran volumen de documentos e información es útil y se pueda recuperar de una forma más fácil y que cumpla con unos ciertos requisitos durante su búsqueda.

Por ello, existen gran variedad de herramientas que permitan hacer búsquedas de información efectivas y que contengan conocimiento intelectual y válido para la investigación y el aprendizaje; estas herramientas se pueden resumir en cuatro siglas o en el mejor de los casos, en cuatro palabras: Sistemas Gestores de Bases de Datos – SGBD.

Estas herramientas se dividen en tres fases, las cuales permiten y facilitan el acceso y la recuperación de la información:

1- Sistemas de navegación de tipo jerárquico: este sistema permite estructurar jerárquicamente a información en clases y subclases, y es aquí donde el usuario decide qué opción se ajusta más a las necesidades de información (ejemplo: www.yahoo.com)

2- Sistemas de navegación hipertextuales: este sistema de búsqueda permite que el usuario vaya de un documento a otro con solo dar un click al activarse los vínculos estipulados en el mismo para tal fin.

Por otra parte, el documento hipertextual está formado por bloques o partes interrelacionadas entre sí, con un orden establecido que permita recorrer diversas direcciones web.

3- Sistemas de recuperación de información: aquí no se emplea la búsqueda a través de navegadores, sino que este tipo de búsqueda se hace por medio de un conjunto de operadores e instrucciones específicas que hacen posible efectuar la búsqueda de información más detallada y relevante.

La base de la recuperación de información en los sistemas informáticos se emplea el uso de álgebra booleana o ecuaciones de búsqueda, en donde hace combinaciones de búsqueda de términos o documentos mediante los operadores de unión, intersección y negación.

Especialistas en recuperación de información o intermediarios.

Aquí hace mención a los profesionales y especialistas en recuperación de información los cuales deben tener en cuenta que problemas deben resolver y qué técnicas y conocimientos deben poseer para hacer posible la búsqueda y recuperación de la información. Éstos especialistas también conocidos como intermediarios, son aquellas personas con capacidades y habilidades para conocer la necesidad de la información real del usuario y para la posterior búsqueda y recuperación en diferentes SRI y bases de datos.

Para hacer posible la satisfacción de la información a los usuarios por parte de los especialistas de información o intermediarios, ellos ayudan a diagnosticar el problema del usuario y a formular la consulta, sugieren los sistemas o bases de datos apropiadas para la búsqueda, traducen la consulta en estrategias de búsqueda adecuadas para el sistema o bases de datos a utilizar, realizan o modifican la búsqueda, evalúan los resultados, proporcionan al usuario los resultados adecuados y le aconsejan sobre las actividades que deben realizar posteriormente.

1. El proceso de búsqueda:

Es la actividad principal del especialista en recuperación de información. En dicho proceso se reflejan los conocimientos que deben poseer, las tareas y problemas a resolver y las técnicas a emplear, todo encaminado a la satisfacción de necesidades de un usuario en general.

El proceso de búsqueda según Bárbara Quint, se dividen en siete etapas:

1.1. Entrevista de referencia: Esta entrevista es realizada entre el usuario y el profesional de la información con el propósito de determinar la necesidad de información solicitada, y es aquí donde entra a jugar la interacción de búsqueda de información por parte del profesional de información, utilizando las herramientas necesarias para efectuar la búsqueda y obtener los resultados esperados por el usuario.

1.2. Revisión táctica: esta fase consiste en la revisión de la revisión de respuestas dadas por el usuario para efectuar la búsqueda, en donde se analizan todos aquellos aspectos que influyan en el proceso de búsqueda.

1.3. Selección de la(s) base(s) de datos: aquí el profesional de información valora las características de búsqueda disponibles en cada sistema o herramienta (catálogos, bases de datos, directorios, boletines, entre otros).

Después de determinar las características de cada una, se elige una o algunas de ellas que tenga relación con la información solicitada.

1.4. Formulación de estrategia de búsqueda: la finalidad de ésta etapa es traducir la petición del usuario en las sentencias de búsqueda que se van a introducir en la herramienta elegida para tal fin.

Esta búsqueda exige una serie de pasos:

• Análisis conceptual del tema de la búsqueda y determinar los conceptos más relevantes.
• Elegir los términos que mejor representen la petición de información.
• El profesional debe escribir en el lenguaje del sistema que vaya a utilizar, las sentencias de búsqueda; establecer relaciones lógicas entre los términos buscados utilizando los interfaces de búsqueda que posea el sistema empleado.

1.5. La búsqueda de información: una vez diseñada la estrategia de búsqueda, se ejecutan las búsquedas en el sistema elegido. Puede que se encuentren resultados satisfactorios en la búsqueda, pero en caso contrario, el profesional de información debe crear unas nuevas estrategias, con el objetivo de mejorar y conseguir información que el usuario necesita.

1.6. Feedback o revisión de los resultados: el profesional de información revisa los resultados obtenidos en el sistema. Si los resultados no son lo suficientemente relevantes, se revisa y se modifica la estrategia de búsqueda utilizando otros términos y otras bases de datos.

1.7. Presentación de los resultados de la búsqueda: cuando el profesional de información hace entrega de los resultados de búsqueda al usuario, él debe explicarle al usuario qué fuentes consultó, que estrategia de búsqueda utilizó y los registros que encontró, asegurándose que el usuario comprenda e interprete completamente la información

La recuperación de información online (teledocumentación)

La recuperación de información es asociada con el término teledocumentación, el cual hace referencia a la unión de telecomunicaciones + informática (telemática) + documentación. La teledocumentación es definida por Mercedes Caridad como “la aplicación telemática destinada a la recuperación de las fuentes a través de elementos informáticos y la telecomunicaciones”, y de esta forma, se destaca y se da a conocer la importancia de las tecnologías informáticas y telecomunicaciones en el acceso de información a distancia.

Por otro lado, la recuperación Online es la búsqueda y recuperación de información en bases de datos. Para hacer posible que la recuperación online pudiera tener lugar, fue necesario que se produjeran avances en la tecnología informática y en las telecomunicaciones, favoreciendo el acceso y la difusión de la información, creando a la vez una industria de la información

viernes, 10 de septiembre de 2010

La recuperación de Información y los Sistemas de Recuperación de información SRI

Tramullas. J, ve la recuperación de información como una serie de actividades ejecutadas por el usuario para localizar y acceder recursos informativos “pertinentes”, la pertinencia y la relevancia de información es un factor diferenciador entre las acciones de cada sistema de recuperación de información. La diferencia entre google, ask, lycos, yahoo, gigablast y otros motores de búsqueda radica en la categorización o ranking asignado a los documentos puestos por los usuarios en red, también radica en la forma en que maneje la semántica y sus ontologías estén lógicamente organizadas para arrojar resultados acordes a las estructuras mentales del usuario que busca sin que este tenga que realizar un exhaustivo proceso manual de data mining (minería de datos).

Los algoritmos empleados nos facilitan la búsqueda y recuperación pero estos deben ir acompañados de un proceso realizado por el investigador de información que parte de una necesidad informativa definida a partir de la cual hace una búsqueda y posteriormente selecciona recursos de información. La consulta a estos recursos encontrados, la evaluación y la presentación que la herramienta hace al usuario determinan el curso de acción y la satisfacción de la necesidad informativa de este, La Universidad de La Salle a través de su cátedra de recuperación de información dictada en el programa de sistemas de información y documentación ha adoptado un enfoque orientado a rellenar estos vacios en los usuarios, en los procesos y en los sistemas de recuperación de información, SRI.

jueves, 9 de septiembre de 2010

SGBD Y RECUPERACIÓN DE INFORMACIÓN

Los sistemas gestores de bases de datos juegan un papel fundamental en los entornos de documentos electrónicos, virtuales y digitales. Si no fuese por estos, no existiría forma alguna de almacenar datos que son insumo para crear documentos. Sin embargo mas importante aun para las ciencias de la información pueden ser las plataformas de bases de datos institucionales que contienen millares de documentos esperando ser recuperados de los tanques de archivos que contienen estas plataformas. La Universidad de La Salle cuenta con afiliación a varias bases de datos comerciales e institucionales entre las que se encuentran THOMPSON, GALE, Library and Information Science, Proquest y Scielo entre otras. Al programa de sistemas de información y documentación le interesa una en particular L.I.S.T.A Library and Information Science Text and Abstracts por sus siglas en ingles. Esta base cuenta con un motor de búsqueda que permite realizar la recuperación de información y contenidos a través de operadores Booleanos generalmente. Para recuperar contenidos de calidad en estas bases, es necesario ser exhaustivo con los términos por que sus algoritmos de búsqueda son limitados y se requiere ser puntual en la pregunta o QUERY que se plantea.

Recuperación de Información

Páginas

Buscar en este blog

domingo, 3 de octubre de 2010

La Informática y la Recuperación de Información.

Alfabetización Informacional - Memoria de Clase.

Las Bases de Datos

miércoles, 29 de septiembre de 2010

Procesamiento del Lenguaje Natural

Objetivo de los Lenguajes Documentales.

lunes, 27 de septiembre de 2010

Lenguajes Documentales: Algunas definiciones.

viernes, 17 de septiembre de 2010

Relevancia en la RI

Trucos para Posicionar tu Blog en Google

jueves, 16 de septiembre de 2010

NECESIDADES DEL USUARIO EN RECUPERACIÓN DE INFORMACIÓN

Captar información – R.I

Metadatos Dublin Core en Recuperación de información

La Generación Google

miércoles, 15 de septiembre de 2010

Infoxicación - Un concepto Real

La Relevancia en la Recuperación de Información.

martes, 14 de septiembre de 2010

LA EXTRACCION DE INFORMACION

domingo, 12 de septiembre de 2010

Sistemas de Recuperación de Información

Especialistas en recuperación de información o intermediarios.

La recuperación de información online (teledocumentación)

viernes, 10 de septiembre de 2010

La recuperación de Información y los Sistemas de Recuperación de información SRI

jueves, 9 de septiembre de 2010

SGBD Y RECUPERACIÓN DE INFORMACIÓN