Buscar en este blog

martes, 31 de agosto de 2010

Algunos Apuntes de Historia en la Recuperación de Información.

El termino Recuperación de Informacion, fue mencionado por primera vez hacia el ano de 1950 – aunque es claro que este es un concepto que en la práctica data de muchos años atrás – cuando Calvin N. Moores la definió como "la búsqueda de información en un stock de documentos, efectuada a partir de la especificación de un tema"[1], aunque este mismo autor más adelante decide ampliar aun mas este concepto manifestando para tal fin que “ la Recuperación de Informacion abarca los aspectos intelectuales de la descripción de información y su especificación para la búsqueda, y cualquier sistema, técnica o maquina que se utilice para llevar a cabo la operación”, y con esto, claramente, abre el concepto haciéndolo aplicable aun hoy, cuando ya han transcurrido más de 50 anos y claramente las tecnologías usadas para este proceso han cambiado significativamente, pero como ya se menciono, prácticamente este concepto, tiene cierto grado de validez.

Con la definición dada por Calvin N. Moores, se definían tres problemas, los cuales debían ser tratados por la Recuperación de Informacion:

- Como definir y organizar la información.

- Como especificar la búsqueda y

- Que sistemas y técnicas utilizar para este proceso.

Claramente se evidencia que estos problemas no son exclusivos de la Recuperación de Informacion, como la conocemos hoy en día, estos son simplemente la evidencia de las principales puntos de los que se encarga la Recuperación de Información, es decir las distintas áreas de trabajo, investigación y discusión, que básicamente reflejan las relaciones de interdisciplinariedad que intrínsecamente existen en la Recuperación de Informacion.

Posteriormente a esta época, y para ser más exactos en la fecha, hacia finales de los años 50 y comienzos de los 60, se dio inicio a otra época, cuya característica está enfocada en la gran cantidad de experimentos que se hacen en torno a la Recuperación de Informacion, construyendo para esto los primeros Sistemas de Informacion a gran escala. Un hito muy importante en esta época, y que claramente marco el desarrollo del concepto, fue la celebración en Washington, en 1958, de la Conferencia Internacional sobre Informacion Científica (International Conference on Scintific Information), evento que para la Británica Karen Spark Jones[2] marco el comienzo de la Recuperación de Informacion tal como la podemos evidenciar hoy día.

Ya para los años 70, y comenzara con esto, de forma resumida con el ánimo de profundizar sobre estos hitos históricos más adelante, lo que llamaremos la época de la madurez de la Recuperación de Informacion, teniendo que las dos características principales de esta época son:

• El nacimiento y posicionamiento de la Informacion Online, y ya con esto haciendo provecho de los primeros Sistemas de Recuperación de Informacion, y

• Refinamiento de las ideas y modelos estadísticos experimentados en años anteriores y consolidación de los mismos básicamente en dos modelos: los Modelos Vectoriales y los Modelos Probalísticos.

Otra etapa de que la se mencionara es la comprendida entre los anos de 1980 y 1990, caracterizada básicamente por la rápida expansión de internet, la aparición de software más sofisticado para la Recuperación de Informacion, y la aparición de las Bases de Datos en CD-Rom. En esta época se da un giro en lo que al concepto se refiere, teniendo que este se centra en el usuario como pieza clave en la Recuperación de Informacion.

Continuando con la parte histórica, de forma resumida, continuamos con la etapa comprendida entre 1990 y 2000 – hasta hace 10 años -, que muchos ya sabemos se caracteriza por la aparición de los computadores personales, obviamente con muchas más capacidad que la que presentaban los computadores hasta el momento; el desarrollo de motores de búsqueda[3] más o menos hacia el ano de 1993 cuando apareció Wandex, el cual indexaba paginas, pero también permitia la búsqueda, siendo la primera tecnología con la capacidad de “rastrear” en la red, y la aparición de otros sistemas y mejoras en la interfaz, que buscaba facilitar el acceso al usuario final y buscan favorecer la interacción entre el usuario y el sistema, haciendo de esta manera mas dinámico el proceso de Recuperación de Informacion.

Ya para finalizar este articulo, hablaremos del último periodo o etapa, que inicial en el año 2000 y va hasta el 2010, claramente la evolución informática de estos últimos 10 años ha marcado uno de los hitos más importantes, por no decir que el más importante, las computadoras evolucionaron trayendo con esto más capacidad, con menos tamaño, y claramente esta es una de las razones por las cuales existe tanta información – basta con decir que simplemente no ha existido un límite -, por otra parte las unidades de información empezaron a hacer parte de esta evolución, poniendo al servicio de los usuarios muchos de los documentos de sus colecciones, y con esto claramente, se da la participación de los profesionales de información en el fortalecimiento de la gran cantidad da información que circula libremente en la red. Otra de las características, es la facilidad de búsqueda, la interfaces de fácil uso, que prácticamente adivinan o por lo menos se acercan a lo que se está buscando, han hecho que sea más compleja la Recuperación de Información, pero con esto claramente más eficiente.


Fuentes:

[1] SALVADOR OLIVÁN, José Antonio. ARQUERO AVILÉS, Rosario. Una aproximación al concepto de Recuperación de Información en el marco de la ciencia de la documentación. México: Investigación Bibliotecológica, 2006. Vol. 20, Nº 41, pp. 13-41Disponible en: http://eprints.rclis.org/archive/00010615/01/IBI002004101.pdf

[2] Karen Spärck Jones (26 de agosto de 1935 – 4 de abril de 2007) fue una científica británica especializada en lingüística computación. Investigadora pionera en Recuperación de Información. En: http://es.wikipedia.org/wiki/Karen_Sp%C3%A4rck_Jones.

[3] Un motor de búsqueda es un sistema informático que busca archivos almacenados en servidores web gracias a su «spider» (o Web crawler. En: http://es.wikipedia.org/wiki/Motor_de_b%C3%BAsqueda

Exhaustividad en la búsqueda y relevancia en los resultados de la recuperación de información

El desarrollo sustentable y maximización de los recursos está ligado al acceso a las nuevas tecnologías de la información (M. Castells) y a la nube (world wide web) el rol de los profesionales en información y tratamiento de documentos es fundamental ya que internet crece exponencialmente en miles de millones de páginas y no son comunes métodos que indicen o permitan tener métodos de recuperación óptimos para que la gente obtenga lo necesario en una primera búsqueda.

Sin embargo compañías como google trabajan para cambiar los paradigmas en formas de búsqueda que vienen desde mediados del siglo pasado. Universidades como Stanford y Glasgow, han publicado libros alusivos a la Information retrieval desde la óptica de Computing science sin dejar de lado las técnicas y métodos desarrollados por library and Information science. Estas metodologías apuntan a que para grandes cantidades de información se requiera un actor involucrado que organice, en este caso los robots de los motores de búsqueda. Dichos procesos logrados por algoritmos y arboles de decisión permiten a los sistemas ser precisos y exhaustivos para entregar en un ranking los resultados más relevantes y acordes a la entrada realizada por el investigador o solicitante de una respuesta de acuerdo su necesidad de información. En colombia, la universidad de La Salle y su programa de sistemas de información trabajan por lograr que los profesionales graduados posean las habilidades adecuadas para entrentar los retos que trae la búsqueda recuperacion de informacion en un entorno globalizado y competitivo.

lunes, 30 de agosto de 2010

Introducción a recuperación de información

Basta con una básica diagnosis a la exorbitante producción documental para saber que el mundo de la información es totalmente impredecible, Habiendo dejado una etapa agrícola e industrial, nos dirigimos hacia la aldea global que predijo Marshall McLuhan en los años 60, una sociedad del conocimiento donde los usuarios de información a diario levantan nuevos requerimientos que son un reto a desarrollar para profesionales de las ciencias de la información. Por este motivo es necesario ser creativos en mecanismos para que la gente acceda y conozca datos relevantes que posteriormente serán transformados en conocimiento práctico y digerible. Las habilidades básicas del profesional cuyo deber sea resolver estos problemas están centradas en competencias para búsqueda, análisis, diseminación y selección de contenidos que sean recuperables, es decir, debe anticipar al usuario y pensar, ¿si yo fuera usuario de un motor de búsqueda, como buscaría determinado tópico o temático? Estas premisas son básicas para evitar la infoxicación que puede llevar a un individuo a consumir elementos cognitivos que puedan desviarle de una búsqueda puntual acorde a su necesidad informativa.

Los enlaces a continuación son algunos videos dándonos una idea más aterrizada de lo que significa recuperación de información dentro del ámbito de la ciencia de la información, la bibliotecología y la archivística. Son solo algunas aproximaciones al concepto recuperación de información dados por alumnos de la Universidad de La Salle del programa Sistemas de Información y Documentación, bibliotecología y archivística. PSIBA

http://www.youtube.com/watch?v=QlcZ709UHmU


http://www.youtube.com/watch?v=6rdVyc94z_k&feature=related

http://www.youtube.com/watch?v=6QEJMlRzJkU&feature=related

http://www.youtube.com/watch?v=rE2vk8vfrmA&feature=related

http://www.youtube.com/watch?v=-8dqshUB8lc&feature=related

http://www.youtube.com/watch?v=vV3cg605bsY&feature=related

http://www.youtube.com/watch?v=nkMVGWZnWjE&feature=related

http://www.youtube.com/watch?v=_St6MkmWlp8&feature=related

miércoles, 25 de agosto de 2010

Entrevista Carlos Zapata, Representante Team Colombia.

Carlos Zapata, Representante Team Colombia, para el proyecto interPARES, habló para hora de negocios acerca de la recuperación de la memoria digital de nuestro país y las compañías.

http://www.caracol.com.co/PROGRAMA.ASPX?ID=555605&AU=1335964