Buscar en este blog

miércoles, 6 de octubre de 2010

Lenguajes documentales

"Un lenguaje documental es el instrumento de descripción de los documentos en un sistema de información", el cual transforma la información relativa a los documentos en datos manipulables, para favorecer el control y la validación de los datos.

Los lenguajes documentales han de conseguir que se produzca una búsqueda y recuperación de información lo más eficaz posible, evitando al máximo el ruido y el silencio:

Ruido: documentos parásitos seleccionados por el sistema y que no respondan a la pregunta.

Silencio: documentos que respodiendo a la pregunta, han sido indizados por términos distintos a la demanda.

Fuente: FOX, Virginia. Análisis documental de contenido. Argentina. Alfagrama ediciones. 2005. pp 190-191

lunes, 4 de octubre de 2010

Los lenguajes documentales en la recuperación de información


"Los lenguajes documentales surgen de la necesidad de recuperar información de una forma eficiente", "gracias a la normalización, las reglas y su notación eliminan una gran cantidad de problemas de los lenguajes naturales tales como la gramática, la redundancia, la polisemia, homoninia y sinonimia, entre otras, pues representa las áreas del conocimiento de forma sistémica, reduce la ambiguedad, aporta precisión y permite un mejor análisis de un campo determinado".

Fuente: SIERRA ESCOBAR, Luis Fernando.2010. Diccionario especializado en archivística: nexos y determinantes.Revista Códice. Volumen 6 No. 1. p 66-67

domingo, 3 de octubre de 2010

La Informática y la Recuperación de Información.

Desde la creación de este blog, habíamos hablado de la Recuperación de Información, de los Sistemas de Recuperación de Información, de las Bases de Datos, los Sistemas Gestores de Bases de Datos, Lenguajes Documentales, entre otros temas igualmente importantes, pero no habíamos hablado de la relación que existe entre la informática y la Recuperación de Información, por tal razón este articulo está orientado a mostrar la relación existente entre estas dos, todo con el ánimo de buscar una mejor comprensión de la importancia que tienen y finalmente mostrar la realidad a la que nos estamos enfrentando con el aumento y diversificación de las TIC’s.
Tenemos claro que la informática nace en los años 40, influenciada por distintas corrientes, en las cuales no vamos a enfatizar, esta es definida por Peter Denning como, el estudio sistemático de los procesos algorítmicos que describen y transforman información: su teoría, análisis, diseño, eficiencia, implementación y aplicación.
Es claro que muchas de las áreas de la informática son propias o están relacionadas con la recuperación de información, pues el enfoque y los problemas que la informática busca resolver están dirigidos al diseño de aplicaciones y de sistemas informáticos tanto de hardware como de software.
En nuestro caso los sistemas de recuperación de información y bases de datos están ocupados principalmente de la organización de los datos en un sistema, los modelos de representación, las operaciones para su almacenamiento y recuperación, la localización, la equiparación y recuperación, la interacción, el diseño de una arquitectura que permite una recuperación más eficiente, entre otras
Por otra parte la IA (Inteligencia Artificial) y la robótica, buscan modelar el conocimiento del hombre con el objetivo de construir sistemas automatizados que imiten el comportamiento del hombre o aumenten las capacidades de este, en tal sentido se tienen y aplican conceptos como lenguaje natural, redes semánticas, modelos de aprendizaje, redes neuronales, agentes inteligentes y robots en la web, temimos que pertenecen a la investigación en IA y a la recuperación de información.
Otro caso de relación entre la recuperación de información y la informática es la Interacción hombre maquina, que principalmente está encargada de diseñar interfaces en la cual intervienen también otras áreas como: los gráficos informáticos y la Psicología cognitiva.

Otras de las áreas que juegan un papel fundamental en la recuperación de información, son los algoritmos y estructuras de datos, lenguajes de programación, arquitecturas y Sistemas Operativos, y Redes. Teniendo para este caso que los dos últimos han llevado a que los ordenadores sean cada vez más potentes, rápidos y facilitando con esto que la búsqueda y recuperación de información sea cada vez más rápida y personalizada.
Para finalizar cabe aclarar que la recuperación de información desde un principio ha estado ligada a la ciencia de la informática, no solo por el uso de un computador y de las TIC’s como una herramienta de trabajo y que finalmente facilita la recuperación de información, sino porque gran parte de la investigación ha sido orientada al diseño de mejores sistemas de recuperación de información, en este sentido para Baeza Yates, el problema de la recuperación de información desde el área de la informática, esta principalmente en diseñar y construir índices eficientes para el procesamiento de las consultas de los usuarios con un alto rendimiento, y en el desarrollo de de algoritmos de rango que mejoren la calidad de los resultados obtenidos.

Fuentes.

P.J Denning. “Computer Science The Discipline” en: Encyclopedia of Computer Science, 2000 edition. London: Nature Publishing Group, 2000 < http://www.idi.ntnu.no/
Informatica. disponible en: http://es.wikipedia.org/wiki/Inform%C3%A1tica. [consultado 03 de octubre de 2010].



 

Alfabetización Informacional - Memoria de Clase.

Para inciar, es importante aclarar que la alfabetización informacional no es igual a la recuperación de información. Esta – la alfabetización informacional – es un concepto que debe estar en concordancia con la realidad en cuanto a la recuperación de información tal como a vivimos actualmente, es decir, se trata de enseñar al usuario a utilizar, buscar, evaluar, etc… la información que esta va a encontrar en la red, esto dado principalmente en un mundo en el que el concepto de biblioteca esta cambiando a tal punto que usuario no es quien debe ir a esta, si no que es esta la que debe dirigirse al usuario, y esto claramente lo hace con la publicación de sus colecciones en la red.
Se trata de hacer uso de la tecnología – entendiendo esta como un concepto que va mas alla de las maquinas, es decir, la intervención del hombre sobre el entorno para satisfacer sus necesidades y lograr un bienestar – para satisfacer una necesidad latente en un determinado usuario.
Según wikipedia, la alfabetización informacionalconsiste en adquirir la capacidad de saber cuándo y por qué necesitas información, dónde encontrarla, y cómo evaluarla, utilizarla y comunicarla de manera ética. Se considera un prerrequisito para participar eficazmente en la Sociedad de la Información y es parte de los derechos básicos de la Humanidad para un aprendizaje de por vida”
En conclusión, difícilmente vamos a encontrar una definición exacta de este termino, pues en gran parte esta sujeto al cambio en las TIC’s (Tecnologias de la Informacion y Comunicación), pero una de las definiciones mas acertadas y completas es la siguiente, “La alfabetización informacional es un conjunto de habilidades que requieren las personas para "reconocer cuándo se necesita información y tener la capacidad para localizar, evaluar y utilizar eficazmente la información necesaria." 

Fuentes.
- Alfabetización Informacional. Disponible en: http://es.wikipedia.org/wiki/Alfabetizaci%C3%B3n_informacional. [consultado 03 de octubre de 2010]
- Alfabetización Informacional. Normas sobre Competencias para la Educación Superior. American Library Association. 2006
- Alfabetización informacional: un enfoque postmoderno para la formación del ciudadano en la sociedad del conocimiento. Disponible en:    http://proquest.umi.com/pqdweb?index=0&did=2101645551&SrchMode=1&sid=1&Fmt=3&VInst=PROD&VType=PQD&RQT=309&VName=PQD&TS=1286147660&clientId=51540. [consultado 03 de octubre de 2010]

Las Bases de Datos

Una base de datos es un “almacén” que permite guardar grandes  volúmenes de información de forma organizada, para que posteriormente el usuario pueda recuperar esa información y utilizarla fácilmente.
Otra definición de base de datos puede ser la siguiente, Es una aplicación que permite almacenar y organizar de manera estructurada información sobre un determinado objeto. Por sus características las bases de datos pueden acumular una grandes volumenes de información, que posteriormente seran recuperados por cualquier usuario. En tal sentido una base de datos se convierte en la fuente principal de cualquier sistema de recuperación de información.
Características
Algunas de las principales características de las bases de datos, son las mencionadas a continuación:
  • Independencia lógica y física de los datos.
  • Redundancia mínima.
  • Acceso concurrente por parte de múltiples usuarios.
  • Integridad de los datos.
  • Consultas complejas optimizadas.
  • Seguridad de acceso y auditoría.
  • Respaldo y recuperación.
  • Acceso a través de lenguajes de programación estándar.

Fuentes:
que son las bases de datos?. disponible en: http://www.maestrosdelweb.com/principiantes/%C2%BFque-son-las-bases-de-datos/. [consultado 03 octubre de 2010]
Bases de datos. Disponible en: http://recuperainformacion.blogspot.com/search/label/recuperaci%C3%B3n%20de%20informaci%C3%B3n. [consultado 03 octubre de 2010]

miércoles, 29 de septiembre de 2010

Procesamiento del Lenguaje Natural

Es una subrama de la inteligencia artificial y de la lingüística. También se suele referir a esta rama de la informática de forma abreviada como PLN o NLP  del inglés Natural Language Processing.

El objetivo del Procesamiento del Lenguaje Natural, es la construcción de sistemas y mecanismos que permitan la comunicación entre personas y maquinas, adicionalmente, busca que esos mecanismos sean lo mas eficientes posibles. Dicho en otras palabras, se busca crear programas que tengan la capacidad de analizar, entender y generar lenguajes como los que usa habitualmente el hombre, de tal forma que permita que permita la comunicación entre el hombre y el computador.

El procesamiento del Lenguaje Natural, tiene una relación directa con la Recuperación de Información, pues las dos tienen como objetivo desarrollar las herramientas que permitan al usuario hacer preguntas de cualquier forma y que el sistema sea capaz de responder de manera correcta a esa pregunta que formuló el usuario, tal como lo haría cualquier persona. Es a esto a lo que se le conoce como sistemas de question-answering. Entonces, un buscador de información que use procesamiento del lenguaje natural para la recuperación de información, sería diferente de un buscador tradicional en el sentido que el usuario podrá consultar la pregunta que tiene, tal cual como la está pensando, sin necesidad de buscar por los conceptos que cree que podrían servir para encontrar la información que desea

El procesamiento del lenguaje natural, además de usarse en el procesamiento y recuperación de información, es usado también en campos como la traducción automática, el reconocimiento del habla y la corrección de ortografía de textos.

Fuentes:

Procesamiento del lenguaje natural: revisión del estado actual, bases teóricas y aplicaciones (Parte I). Disponible en:
http://www.elprofesionaldelainformacion.com/contenidos/1997/enero/procesamiento_del_lenguaje_natural_revisin_del_estado_actual_bases_tericas_y_aplicaciones_parte_i.html (Consultado 17 de septiembre de 2010)

Lenguaje natural. Disponible en: http://es.wikipedia.org/wiki/Lenguaje_natural. (Consultado 17 de septiembre de 2010).