Buscar en este blog

lunes, 8 de noviembre de 2010

El concepto de Recuperación de Información, abordado desde el campo de las ciencias de la documentación.

TEMA A TRATAR
El concepto de Recuperación de Información, abordado desde el campo de las ciencias de la documentación.

SUBTEMAS A TRATAR

1. identificar las premisas del documento.
2. Argumentar en máximo tres párrafos dónde se indique (critique, hable, resuma, comente, etc...), parecidos y diferencias de este texto respecto al tema trabajado en clase.
3. Proponer en máximo DOS párrafos: ¿según este documento qué temas faltaría tratar ò profundizar en clase?
4. Analizar y responder objetivamente la siguiente pregunta: ¿Para qué le sirve a un profesional de información en su entrono diario conocer los procesos, definiciones y modelos para recuperar información en documentos?

RESUMEN

La Recuperación de información es un tema, que en la praxis está relacionado con muchas disciplinas, (las ciencias de la información, ciencias de la documentación, la informática, la lingüística, entre otras) las cuales de una u otra forma se enfocan en facilitar que el documento que un determinado usuario está buscando, le sea entregado y que este documento logre satisfacer la necesidad de información que este usuario presento. La importancia de la Recuperación de Información, no solo desde nuestro campo, sino desde cualquiera, es brindar la posibilidad de que la información sea accesible, que no existan barreras que impidan la difusión y consumo de la misma, y permitir que las necesidades de información sean resueltas de la mejor forma posible.

PALABRAS CLAVES

Recuperación de Información, ciencias de la documentación, Universidad de La Salle.



TEXTO GENERAL DEL INFORME/TRABAJO

Las premisas identificadas en el texto son:
- No existe una única idea o definición de lo que significa trabajar o investigar en  Recuperación de Información, esto principalmente debido a la multidisciplinariedad de la RI.
- No hay una definición clara y precisa del término recuperación de Información, básicamente por lo mencionado anteriormente, aunque hay coincidencia en que el objetivo de la misma es proporcionar información relevante para satisfacer una necesidad de información.
- La Recuperación de Información requiere de la colaboración de varias disciplinas, puesto que el problema que esta aborda es bastante grande y complejo y no puede ser abordado por una sola área, o disciplina.
- El termino recuperación de Información aparece de forma implícita o explícita en el concepto de documentación.

Por otra parte en cuanto a la relación de los conceptos y temáticas de la lectura “Una Aproximación al Concepto de RI desde el marco de las Ciencias de la Documentación”, con los que se vieron en la clase recuperación de información de la Universidad de La Salle, puedo decir que intrínsecamente los conceptos los estuvieron presentes a lo largo del desarrollo de la materia. Se dejo claro que la recuperación de información, no está limitada a una sola área del conocimiento, y que es algo que va más allá del AND, OR y NOT.

Fue evidente que el desarrollo de la clase estuvo más enfocado a la parte práctica y quedaba a interés del alumno deducir e investigar un poco más acerca de este interesante tema, pero es evidente también que la mejor forma de aprender es la práctica.

Ahora bien, decir que faltó o no algún tema por desarrollar, es un tanto complejo, pues a mi modo de ver el tema se abordó de una manera muy general, y tratando de incluir todos, o por lo menos algunos puntos de vista de la recuperación de Información; a modo de ver algo que se tocó muy someramente, fue el tema relacionado con los sistemas o interfaces visuales de recuperación de información, pues como bien lo decía el profesor, la información es algo que no solo se produce en texto, y por ende no solo se recupera en texto, y fue un tema del cual solo se hablo un par de veces de manera parcial y resto quedo, o quedara, a interés de cada alumno.

Un tema que considero se debería abordar, es por llamarlo así, el futuro de la recuperación de información, es claro que hay camino medianamente definido, pero sería interesante saber o intentar saber, a que le apunta hoy la recuperación de información, teniendo en cuenta variables como el crecimiento de la información en formato electrónico y digital, los cambios en la manera de concebir la Internet, etc.

Considero que algo que sería importante puntualizar siempre antes de dar inicio a cualquier clase, es un poco de teoría, el concepto de recuperación de información, es un tanto complejo, y sería interesante conocer no solo las definiciones dadas por los grandes estudiosos del tema sino también el concepto o el punto de vista que tiene el docente frente a este.

Y finalmente, decir que para que les sirva la recuperación de información a los profesionales de la información, es como preguntarnos para que le sirve el horno a un panadero. Considero, o aseguro, que la razón de ser de nuestra profesión es brindar a las personas (usuarios) la posibilidad de acceder a la información que la sociedad genera, en tal sentido si no hay un concepto de recuperación de información, difícilmente vamos a poder garantizar el acceso a la información que se produce, entonces es nuestro deber tener en cuenta que en este camino no estamos solos, y eso es claro, la recuperación de información es bastante compleja para ser abordada solo por nosotros, pero es importante que seamos nosotros quienes le demos el rumbo a la recuperación de información.


CONCLUSIONES

Hace unos días leí un artículo en la red, no recuerdo en que periódico, pero recuerdo que decía que aproximadamente en 20 años se podría, por decirlo así, “escanear la mente humana” y almacenar en un disco duro toda la información que generó un individuo en el transcurso de su vida,  en ese momento en mi mente rondaron mil ideas, algunas relacionadas directamente con recuperación de información, otras con el tema de cómo se administrara, organizara y protegerá esa información, en fin, el punto es si hoy es complejo buscar en una base de datos que contiene unos cuantos millones de registros, que tan complejo será ubicar un dato en algo tan complejo como la mente humana?

sábado, 6 de noviembre de 2010

premisas recuperación de información - Comentarios lectura

Video aproximación a la RI


De acuerdo al Documento Una aproximación al concepto de recuperación de información desde el marco de la ciencia de la información, se pueden definir cinco premisas claras:



1.    Definición(es) de recuperación de información.

2.    Ciencias de la información y documentación (library and information science).
3.    Ciencias de la informática y de la computación.
4.    Interdisciplinariedad, interrelación y aspectos intelectuales de la recuperación.
      5. Teoría de la información y de la comunicación.



Ademas, de acuerdo al texto se puede extraer que:


El problema de la recuperación específicamente surge de la creación no controlada de documentos. No es una cuestión generada a partir de las ciencias de la computación, realmente éstas han ayudado a reducir la complejidad, sin embargo el desorden documental (entendiéndose dentro de éste la elaboración de innumerables documentos no estructurados) debe ser abordado bajo criterios establecidos por documentalistas y profesionales en información, es a partir de estos campos desde donde se deben establecer metodologías para la recuperación y la coherencia en la información entregada ya que ésta última como salida de un proceso, es un problema que se ha maximizado a causa de la poca interdisciplinariedad entre la ciencia de la información y otras áreas de la ciencia y tecnología. De otra parte, ésta fenomenología parece recurrente únicamente en Latinoamérica y países de habla hispana donde hay una marcada diferencia entre profesionales de ciencia de la información ó documentalistas y profesionales de las ciencias de la computación ya que puede existir el falso imaginario de que habitualmente los segundos desmejoran las condiciones laborales de los primeros, caso contrario en los países anglosajones donde hay avances significativos gracias a la colaboración entre grupos interdisciplinarios de profesionales en muchas ramas,  que trabajan apuntando hacia la construcción, diseño y desarrollo de una sociedad de la información y del conocimiento dentro de un modelo sustentable que entregue participación y ganancias equitativas para todos los participantes.


miércoles, 3 de noviembre de 2010

Video trabajito by Lorena Lobo - recuperación de información - programa de sistemas de información - Universidad de La Salle

Los invito a que vean el siguiente video que hace referencia a la recuperación de información del programa de sistemas de información de la Universidad de La Salle.

http://www.youtube.com/watch?v=uOYuu74qLuA

Sistemas de Información, Entre el dilema de AND, OR o NOT


Dentro de la recuperación de información existen operadores que permiten enriquecer las búsquedas o extraer de las bases de datos información relevante y exhaustiva para el usuario del sistema de información, una de las formas más comunes de recuperar información a través de operadores es utilizando búsquedas booleanas las cuales tienen como palabras comodín los términos AND, OR y NOT que en algunas interfaces son reemplazados por el ampersamp (&), el signo + o el signo *.  Sin embargo esta no es la única forma de recuperar información o obtener resultados coherentes en una búsqueda de documental, esto está siempre de acuerdo a la plataforma, estructuración, notación y representación de los documentos dentro del DBMS, el ECM o el RMS.

Un ejemplo fehaciente de esto es el tipo de operadores que manejan algunas herramientas de escritorio, por citar un ejemplo el caso de google desktop search, echa mano de algunos operadores diseñados para realizar búsquedas específicas dentro del material indexado. En la URL a continuación se pueden encontrar estos mismos los cuales de acuerdo a su naturaleza pueden especificar si lo que se requiere es una búsqueda de un tipo de archivo específico, de un formato determinado o de un documento con un contenido explicito. http://desktop.google.com/support/bin/answer.py?hl=es&answer=10111, vale la pena resaltar que esta herramienta fue evaluada en la universidad de La Salle durante la cátedra de Recuperación de información y los resultados entregados al indexar una colección fueron acordes a lo esperado por un usuario final frente a un SRI.

La ventaja del uso de operadores y ecuaciones de búsqueda es que apuntan directamente a los lenguajes documentales que son los que representan la información contenida en los repositorios o bodegas de datos en las que reposen documentos estructurados o no estructurados. El motor de búsqueda google también tiene algunos operadores que generalmente no son conocidos por los usuarios pero que al ser utilizados enriquecen las búsquedas y los resultados categorizándolos de acuerdo a la necesidad de información.  En el vínculo a continuación se pueden encontrar algunos operadores como allintitle, allinurl, allintext y site entre otros. 

Archivistas: Una Profesión con Potencial.

Fue el título que el Diario la República dio a uno de sus artículos en el cual menciona algunas de las problemáticas que tiene la Sociedad Colombiana de Archivistas, entre otros.

http://www.slideshare.net/scarchivistas/archivistas-una-profesin-con-potencial

martes, 2 de noviembre de 2010

La evaluación de la recuperación de información.


Cuando se produce una necesidad informativa, mediante una petición de información que se traduce en una estrategia de búsqueda, se interroga al conjunto de documentos con el fin de obtener un arespuesta a esa necesidad. Para saber en qué medida la respuesta cumple con las expectativas creadas ante la consulta, tenemos que evaluar los resultados.

La importancia en la evaluación en recuperación de información está muy ligada a la fase de investigación, ya que sin unas medidas eficaces y estandarizadas, y sin colecciones experimentales adecuadas, no podremos hacer ni evaluaciones de sistemas particulares, ni comparaciones fiables entre los resultados obtenidos con los distintos sistemas.

A continuación, se darán las diferencias entre el acceso físico a la información y el acceso lógico a la información:

Acceso físico a la información: Es cuando el usuario va a la biblioteca y mediante la signatura topográfica es capaz de localizar un libro.

Para ello, hay que evaluar si la biblioteca está bien organizada, y en su defecto, bien señalizada.

Acceso lógico a la información: Está relacionado con la búsqueda concreta de esa información. El usuario va a la biblioteca, hace una búsqueda y obtiene un resultado que le indicará en qué libro o revista es posible que se encuentre esa información.

Por otro lado, exsiten dos clases de evaluación de la recuperación de información:

Evaluación tradicional: Es el que mide objetivamente cómo se adecua la pregunta a la respuesta.

Evaluación orientada a los usuarios: Es el que mide la satisfacción del que ha hecho la demanda.

Fuente: GÓMEZ DÍAZ, Raquel. La lematización en español: una aplicación para la recuperación de información. España: Ediciones Trea. 2005. PP 82-83

Recuperación de información


La recuperación de la información no es un área estática sino que por el contrario, debe adaptarse al cambio y evolución de volumen, características y accesibilidad de la información. Su complejidad y madurez van desde la simple comparación de texto a la innovación de la búsqueda basada en contenido en medios digitales diversos.

Las definiciones de recuperación de información, con mucha amplitud, se refieren a:

• El estudio de los sistemas de indexación, búsqueda y recuperación de datos, particularmente texto y otras formas no estructuradas.

• Búsqueda de objetos que igualan una consulta en un cuerpo de información.

• Un área de especialización en Ciencias de la Computación que enfoca maneras sistemáticas de almacenamiento y recuperación de datos, incluyendo consideraciones de diseño e implementación de bases de datos.

• La recuperación de información relevante u objetos multimedia de grandes colecciones de información desde diversos métodos de almacenamiento y su precisión significativa al usuario.

El proceso de recuperación de información comprende dos actividades: la comparación y evaluación de las representaciones de documentos de acuerdo a una consulta formulada por el usuario, y la construcción de una función que ordene los documentos para presentarlos. Un usuario requiere información y su consulta es representada en un lenguaje de consulta que incluso puede ser lenguaje natural. Las palabras claves representan objetos documentales que mediante algoritmos de distinta eficacia son comparadas con esta consulta, y los resultados satisfactorios son mostrados al usuario que podrá, si lo desea, refinar la búsqueda.

Casanovas, Inés. Gestión de archivos electrónicos. Argentina: Alfagrama Ediciones, 2009. p 171.[Consultado el: 01-11-2010] Disponible en: http://site.ebrary.com/lib/bibliounisallesp/Doc?id=10345376&ppg=171

Recuperación de Información Visual – Tag Cloud.

¿Qué es el Tag Cloud?

Los Tag Cloud, más conocidos como “nubes de etiquetas”, son un modelo VIRI (Interface Visual de Recuperación de Información), con una lista ponderada de las palabras clave, esta herramienta ha adquirido mayor popularidad con el nacimiento y posicionamiento de aplicaciones de software social como flickr (www.flickr.com) o del.icio.us (www.del.icio.us.com), y actualmente son usados por un sinnúmero de sitios web.

En estos se muestran las palabras claves, o Tags, más populares, (esta popularidad se mide de acuerdo al número de veces que se ha usado una determinada palabra clave, es decir entre más veces  se menciona una palabra, mayor va a ser su popularidad) y una vez un usuario da clic sobre una de estas palabras claves obtendrá una lista de recursos que contienen esa palabra clave o tag, así como una lista de términos relacionados por los cuales puede orientar o complementar su búsqueda.

¿Qué es un tag?

Son términos o palabras clave en lenguaje no controlado con los que el usuario describe los recursos. Los índices agregados de gags suelen denominarse folksonomías.


Fuentes

WIKIPEDIA. Tag Cloud. [on line] <http://en.wikipedia.org/wiki/Tag_cloud>. [Consulta: 02/11/2010]

lunes, 1 de noviembre de 2010

Evaluación de un Sistema de Recuperación de Información: Exhaustividad y Precisión.




Para evaluar un Sistema de Recuperación de Información es necesario tener en cuenta variables como la exhaustividad y la precisión y una vez sean tomado estas dos variables se podrá determinar si un determinado Sistema de Recuperación de Información puede llegar a cubrir una determinada necesidad de información.



Las formulas para medir estas dos variables, son:

Número de documentos relevantes recuperados
Exhaustividad =      ________________________________________________   X 100
      Número total de documentos relevantes presentes en el fondo documental


                                                       Número de documentos relevantes recuperados
Precisión =                               ______________________________________   X 100
          Número total de documentos recuperados

Ejemplo Exhaustividad: supongamos que hacemos una búsqueda de un tema X, sobre una colección de 100 documentos, y como resultado de esta búsqueda obtenemos solo 6 documentos, quiere decir que si aplicamos la formula que acabamos de ver, entonces el índice de exhaustividad es del 6%.

Ejemplo precisión: Supongamos que la búsqueda es sobre 1000 documentos, caso en el que como respuesta solo se obtuvieron 100 documentos pro únicamente 20 responden directamente a los que se solicito, es decir relevantes, entonces el índice de precisión es del 20%.

En este sentido es claro que el índice de exhaustividad proporciona una medida del sistema para recuperar documentos que puedan ser relevantes para el usuario, el índice de precisión muestra la habilidad de sistema para evitar el ruido.

Es claro que el objetivo es llevar a la construcción de un sistema que brinde 100% de exhaustividad y precisión, en otras palabras sistemas que recuperen documentos relevantes y solo los relevantes. Teóricamente esto suena muy sencillo, pero en la práctica estos dos se comportan de forma antagónica, puesto que para aumentar el nivel de exhaustividad se requiere disminuir la precisión y viceversa,  y la razón es que si se quiere asegurar la precisión del sistema se hace necesario tomar medidas para hacer mas especifica la indización, es decir su un documento trata sobre archivos, entonces tendremos que diseñar un sistema de indización que tienda a indizar el documento con el descriptor archivos, y no con el descriptor gestión documental o archivistas, archivística, etc. Y así lograremos tener un sistema preciso, aunque si alguien llegase a buscar documentos sobre archivística, dejara de recuperar documentos relevantes sobre el tema general.

En la práctica se puede observar que los buscadores más usados en internet, como Google o AltaVista, Proporcionan buenas tasas de exhaustividad y esto lo podemos comprobar fácilmente en la cantidad de resultados que se nos entregan, pero es claro que la precisión es poco, pues de los cientos y miles de resultados que obtenemos, solo unos pocos nos van a servir para satisfacer la necesidad de información. 

En cambio existen sistemas muy especializados como ADAM o Cercador, los cuales usan un sistema de indización automatizado e intelectual, pueden brindar menor exhaustividad, pues los resultados que estos ofrecen son pocos, pero es seguro que la precisión esta casi en el 100%.

Fuentes.

GOMEZ DIAZ, Raquel. La evaluación en recuperación de la información [on line]. "Hipertext.net", núm. 1, 2003. <http://www.hipertext.net> [Consulta: 01/11/10]. ISSN 1695-549.

GARCÍA GÓMEZ, Juan Carlos. Aproximación a la evaluación cuantitativa de los Sistemas de Recuperación de Información de la prensa en Internet: Exhaustividad y precisión. [on line] <ibersid.eu/ojs/index.php/scire/article/download/1145/1127>. [consulta: 01/11/2010].

ADAM. Disponible en: http://www.adam.ac.uk/. [consulta: 01/11/2010].