Buscar en este blog

miércoles, 6 de octubre de 2010

Lenguajes documentales

"Un lenguaje documental es el instrumento de descripción de los documentos en un sistema de información", el cual transforma la información relativa a los documentos en datos manipulables, para favorecer el control y la validación de los datos.

Los lenguajes documentales han de conseguir que se produzca una búsqueda y recuperación de información lo más eficaz posible, evitando al máximo el ruido y el silencio:

Ruido: documentos parásitos seleccionados por el sistema y que no respondan a la pregunta.

Silencio: documentos que respodiendo a la pregunta, han sido indizados por términos distintos a la demanda.

Fuente: FOX, Virginia. Análisis documental de contenido. Argentina. Alfagrama ediciones. 2005. pp 190-191

lunes, 4 de octubre de 2010

Los lenguajes documentales en la recuperación de información


"Los lenguajes documentales surgen de la necesidad de recuperar información de una forma eficiente", "gracias a la normalización, las reglas y su notación eliminan una gran cantidad de problemas de los lenguajes naturales tales como la gramática, la redundancia, la polisemia, homoninia y sinonimia, entre otras, pues representa las áreas del conocimiento de forma sistémica, reduce la ambiguedad, aporta precisión y permite un mejor análisis de un campo determinado".

Fuente: SIERRA ESCOBAR, Luis Fernando.2010. Diccionario especializado en archivística: nexos y determinantes.Revista Códice. Volumen 6 No. 1. p 66-67

domingo, 3 de octubre de 2010

La Informática y la Recuperación de Información.

Desde la creación de este blog, habíamos hablado de la Recuperación de Información, de los Sistemas de Recuperación de Información, de las Bases de Datos, los Sistemas Gestores de Bases de Datos, Lenguajes Documentales, entre otros temas igualmente importantes, pero no habíamos hablado de la relación que existe entre la informática y la Recuperación de Información, por tal razón este articulo está orientado a mostrar la relación existente entre estas dos, todo con el ánimo de buscar una mejor comprensión de la importancia que tienen y finalmente mostrar la realidad a la que nos estamos enfrentando con el aumento y diversificación de las TIC’s.
Tenemos claro que la informática nace en los años 40, influenciada por distintas corrientes, en las cuales no vamos a enfatizar, esta es definida por Peter Denning como, el estudio sistemático de los procesos algorítmicos que describen y transforman información: su teoría, análisis, diseño, eficiencia, implementación y aplicación.
Es claro que muchas de las áreas de la informática son propias o están relacionadas con la recuperación de información, pues el enfoque y los problemas que la informática busca resolver están dirigidos al diseño de aplicaciones y de sistemas informáticos tanto de hardware como de software.
En nuestro caso los sistemas de recuperación de información y bases de datos están ocupados principalmente de la organización de los datos en un sistema, los modelos de representación, las operaciones para su almacenamiento y recuperación, la localización, la equiparación y recuperación, la interacción, el diseño de una arquitectura que permite una recuperación más eficiente, entre otras
Por otra parte la IA (Inteligencia Artificial) y la robótica, buscan modelar el conocimiento del hombre con el objetivo de construir sistemas automatizados que imiten el comportamiento del hombre o aumenten las capacidades de este, en tal sentido se tienen y aplican conceptos como lenguaje natural, redes semánticas, modelos de aprendizaje, redes neuronales, agentes inteligentes y robots en la web, temimos que pertenecen a la investigación en IA y a la recuperación de información.
Otro caso de relación entre la recuperación de información y la informática es la Interacción hombre maquina, que principalmente está encargada de diseñar interfaces en la cual intervienen también otras áreas como: los gráficos informáticos y la Psicología cognitiva.

Otras de las áreas que juegan un papel fundamental en la recuperación de información, son los algoritmos y estructuras de datos, lenguajes de programación, arquitecturas y Sistemas Operativos, y Redes. Teniendo para este caso que los dos últimos han llevado a que los ordenadores sean cada vez más potentes, rápidos y facilitando con esto que la búsqueda y recuperación de información sea cada vez más rápida y personalizada.
Para finalizar cabe aclarar que la recuperación de información desde un principio ha estado ligada a la ciencia de la informática, no solo por el uso de un computador y de las TIC’s como una herramienta de trabajo y que finalmente facilita la recuperación de información, sino porque gran parte de la investigación ha sido orientada al diseño de mejores sistemas de recuperación de información, en este sentido para Baeza Yates, el problema de la recuperación de información desde el área de la informática, esta principalmente en diseñar y construir índices eficientes para el procesamiento de las consultas de los usuarios con un alto rendimiento, y en el desarrollo de de algoritmos de rango que mejoren la calidad de los resultados obtenidos.

Fuentes.

P.J Denning. “Computer Science The Discipline” en: Encyclopedia of Computer Science, 2000 edition. London: Nature Publishing Group, 2000 < http://www.idi.ntnu.no/
Informatica. disponible en: http://es.wikipedia.org/wiki/Inform%C3%A1tica. [consultado 03 de octubre de 2010].



 

Alfabetización Informacional - Memoria de Clase.

Para inciar, es importante aclarar que la alfabetización informacional no es igual a la recuperación de información. Esta – la alfabetización informacional – es un concepto que debe estar en concordancia con la realidad en cuanto a la recuperación de información tal como a vivimos actualmente, es decir, se trata de enseñar al usuario a utilizar, buscar, evaluar, etc… la información que esta va a encontrar en la red, esto dado principalmente en un mundo en el que el concepto de biblioteca esta cambiando a tal punto que usuario no es quien debe ir a esta, si no que es esta la que debe dirigirse al usuario, y esto claramente lo hace con la publicación de sus colecciones en la red.
Se trata de hacer uso de la tecnología – entendiendo esta como un concepto que va mas alla de las maquinas, es decir, la intervención del hombre sobre el entorno para satisfacer sus necesidades y lograr un bienestar – para satisfacer una necesidad latente en un determinado usuario.
Según wikipedia, la alfabetización informacionalconsiste en adquirir la capacidad de saber cuándo y por qué necesitas información, dónde encontrarla, y cómo evaluarla, utilizarla y comunicarla de manera ética. Se considera un prerrequisito para participar eficazmente en la Sociedad de la Información y es parte de los derechos básicos de la Humanidad para un aprendizaje de por vida”
En conclusión, difícilmente vamos a encontrar una definición exacta de este termino, pues en gran parte esta sujeto al cambio en las TIC’s (Tecnologias de la Informacion y Comunicación), pero una de las definiciones mas acertadas y completas es la siguiente, “La alfabetización informacional es un conjunto de habilidades que requieren las personas para "reconocer cuándo se necesita información y tener la capacidad para localizar, evaluar y utilizar eficazmente la información necesaria." 

Fuentes.
- Alfabetización Informacional. Disponible en: http://es.wikipedia.org/wiki/Alfabetizaci%C3%B3n_informacional. [consultado 03 de octubre de 2010]
- Alfabetización Informacional. Normas sobre Competencias para la Educación Superior. American Library Association. 2006
- Alfabetización informacional: un enfoque postmoderno para la formación del ciudadano en la sociedad del conocimiento. Disponible en:    http://proquest.umi.com/pqdweb?index=0&did=2101645551&SrchMode=1&sid=1&Fmt=3&VInst=PROD&VType=PQD&RQT=309&VName=PQD&TS=1286147660&clientId=51540. [consultado 03 de octubre de 2010]

Las Bases de Datos

Una base de datos es un “almacén” que permite guardar grandes  volúmenes de información de forma organizada, para que posteriormente el usuario pueda recuperar esa información y utilizarla fácilmente.
Otra definición de base de datos puede ser la siguiente, Es una aplicación que permite almacenar y organizar de manera estructurada información sobre un determinado objeto. Por sus características las bases de datos pueden acumular una grandes volumenes de información, que posteriormente seran recuperados por cualquier usuario. En tal sentido una base de datos se convierte en la fuente principal de cualquier sistema de recuperación de información.
Características
Algunas de las principales características de las bases de datos, son las mencionadas a continuación:
  • Independencia lógica y física de los datos.
  • Redundancia mínima.
  • Acceso concurrente por parte de múltiples usuarios.
  • Integridad de los datos.
  • Consultas complejas optimizadas.
  • Seguridad de acceso y auditoría.
  • Respaldo y recuperación.
  • Acceso a través de lenguajes de programación estándar.

Fuentes:
que son las bases de datos?. disponible en: http://www.maestrosdelweb.com/principiantes/%C2%BFque-son-las-bases-de-datos/. [consultado 03 octubre de 2010]
Bases de datos. Disponible en: http://recuperainformacion.blogspot.com/search/label/recuperaci%C3%B3n%20de%20informaci%C3%B3n. [consultado 03 octubre de 2010]

miércoles, 29 de septiembre de 2010

Procesamiento del Lenguaje Natural

Es una subrama de la inteligencia artificial y de la lingüística. También se suele referir a esta rama de la informática de forma abreviada como PLN o NLP  del inglés Natural Language Processing.

El objetivo del Procesamiento del Lenguaje Natural, es la construcción de sistemas y mecanismos que permitan la comunicación entre personas y maquinas, adicionalmente, busca que esos mecanismos sean lo mas eficientes posibles. Dicho en otras palabras, se busca crear programas que tengan la capacidad de analizar, entender y generar lenguajes como los que usa habitualmente el hombre, de tal forma que permita que permita la comunicación entre el hombre y el computador.

El procesamiento del Lenguaje Natural, tiene una relación directa con la Recuperación de Información, pues las dos tienen como objetivo desarrollar las herramientas que permitan al usuario hacer preguntas de cualquier forma y que el sistema sea capaz de responder de manera correcta a esa pregunta que formuló el usuario, tal como lo haría cualquier persona. Es a esto a lo que se le conoce como sistemas de question-answering. Entonces, un buscador de información que use procesamiento del lenguaje natural para la recuperación de información, sería diferente de un buscador tradicional en el sentido que el usuario podrá consultar la pregunta que tiene, tal cual como la está pensando, sin necesidad de buscar por los conceptos que cree que podrían servir para encontrar la información que desea

El procesamiento del lenguaje natural, además de usarse en el procesamiento y recuperación de información, es usado también en campos como la traducción automática, el reconocimiento del habla y la corrección de ortografía de textos.

Fuentes:

Procesamiento del lenguaje natural: revisión del estado actual, bases teóricas y aplicaciones (Parte I). Disponible en:
http://www.elprofesionaldelainformacion.com/contenidos/1997/enero/procesamiento_del_lenguaje_natural_revisin_del_estado_actual_bases_tericas_y_aplicaciones_parte_i.html (Consultado 17 de septiembre de 2010)

Lenguaje natural. Disponible en: http://es.wikipedia.org/wiki/Lenguaje_natural. (Consultado 17 de septiembre de 2010).

Objetivo de los Lenguajes Documentales.

Anteriormente ya habíamos mostrado algunos conceptos de Lenguajes Documentales, según algunos expertos en el tema, esta vez nos centraremos en el para qué de estos Lenguajes Documentales, todo con el ánimo de ir aclarando y ampliando de forma sencilla el entendimiento de este concepto y todas sus implicaciones en el ámbito de la recuperación de información.
En este sentido tenemos que el principal objetivo de los Lenguajes Documentales es el de hacer más fácil la recuperación de informacion y de documentos, buscando con esto reducir tiempos y esfuerzos para el usuario que realiza la búsqueda. Teniendo en cuenta que los Lenguajes Documentales poseen la capacidad para representar los mensajes contenidos en los documentos, esto permite cumplir estos objetivos específicos:
·         Normalizar: Lograr unificación en la terminología.
·         Induce: Es decir, le indica al usuario todas las posibles alternativas por medio de las cuales va a poder recuperar información.
·         Describe el contenido de los documentos: Después de la lectura e identificación de los conceptos contenidos en los documentos, éstos se representan mediante un lenguaje documental que proporciona un vocabulario unívoco que permite traducir los conceptos en términos normalizados.
·         Recuperación de la Información: El Lenguaje Documental tiene la capacidad de suministrar un vocabulario con los términos que se están demandando, es decir, proporciona los elementos que permiten realizar la búsqueda en niveles aun mas específicos.


Fuente:

Los lenguajes documentales. Disponible en: www3.unileon.es/dp/abd/tesauro/pagina/.../lengdocu.htm. (consultado 29 septiembre de 2010).

La organización de la información, los lenguajes documentales y la normalización. Disponible en: http://www.binal.ac.pa/archivos/catcoop/auts/orginfo.PDF. (consultado 29 septiembre de 2010).

martes, 28 de septiembre de 2010

Ontologías en la Recuperación de Información

Las ontologías son utilizadas con frecuencia en la recuperación de datos indexación semántica de los documentos y la organización de los resultados de búsqueda. Las ontologías proporcionan los elementos léxicos, permiten la normalización conceptual y proporcionan distintos tipos de relaciones.


Estas permiten trabajar con conceptos, en lugar de trabajar con palabras clave,
en los sistemas de recuperación de información. Por otra parte, éstas describen el contenido de los repositorios
de datos independientemente de la representación sintáctica de los mismos,
logrando con esto su integración semántica, esto desde el punto de vista de las fuentes de Información.


Fuentes:

Jimeno-Yepes, A., Berlanga-Llavori, R., & Rebholz-Schuhmann, D.. (2010). Ontology refinement for improved information retrieval. Information Processing & Management, 46(4), 426. Retrieved September 28, 2010, from ABI/INFORM Global. (Document ID: 2049742521).

lunes, 27 de septiembre de 2010

Lenguajes Documentales: Algunas definiciones.

El objetivo de este artículo, tal como lo presentamos con los conceptos de Recuperacion de Información, es hacer un recorrido por distintas definiciones dadas al concepto de Lenguajes  Documentales, para finalmente llegar a una conclusión general sobre esta.

Empezamos con Banca Gil quien dice que un Lenguaje Documental es el sistema artificial de símbolos estandarizados que facilitan la representación del contenido de los documentos para facilitar la recuperación manual o automática de la información solicitada por el usuario.

Por otra parte para Antonio García Gutiérrez, los lenguajes documentales están compuestos por un listado de términos que los constituyen como vocabulario, y por unas relaciones entre ellos que dinamizan esos vocabularios y le otorgan la categoría de lenguaje. Estos lenguajes se generan por el proceso del análisis de los documentos puesto que el objetivo que se persigue es el control y manipulación de sus contenidos para poder satisfacer las demandas de información.

J. Rowley, en su libro Organizing knowledge, usa el termino indexing languages refiriéndose a este como "una lista de términos o notaciones que pueden ser utilizados como punto de acceso en un índice"

Finalmente según la Norma Técnica Colombiana NTC 1544, Documentación, indización, Terminología,  el lenguaje documental es “un lenguaje artificial, construido con base en reglas preestablecidas, utilizando los sistemas de documentación para indización, con propósitos de almacenamiento y recuperación

Finalmente y tomando como base los conceptos dados anteriormente podemos afirmar que todos apuntan hacia lo mismo, es decir, aunque las definiciones son diferentes, el objetivo que persiguen es básicamente el mismo, decir que el lenguaje documental, es un listado de términos controlados, que van a permitir facilitar la recuperación de la información contenida en un determinado documento


Fuentes:

Los Lenguajes Documentales. Disponible en: http://www3.unileon.es/dp/abd/tesauro/pagina/conceptos/lengdocu.htm. (consultado 25 septiembre de 2010)

Analisis Documental y lenguajes Documentales. Disponible en: lavelablanca.neositios.com/downloads.php?id=11919&dId. (consultado 25 septiembre de 2010)

ICONTEC. Norma Tecnica Colombiana NTC 1544. Documentacion, Indizacion, Terminologia. Disponible en: http://www.sinab.unal.edu.co/ntc/NTC1544.pdf. (consultado 26 septiembre de 2010).

viernes, 17 de septiembre de 2010

Relevancia en la RI

Creo que ya hemos hablado de esto, pero en este artículo lo detallaremos un poco más, intentando responder a la pregunta ¿Cuándo un documento es relevante?

Según la RAE  el termino relevancia significa “cualidad o condición de relevante, importancia, significación”, por otra parte el termino relevante se define como “sobresaliente, destacado, importante o significativo”, en tal sentido, se considera relevante un documento recuperado cuando el contenido de esto tiene una significación o importancia respecto a la pregunta realizada por el usuario, es decir, con la necesidad de información del usuario.

Conocer y más importante aún, entender este término, nos brinda una ayuda muy importante, puesto que al momento de determinar exactamente cuando un documento se puede considerar relevante o no, surgen muchos problemas estrechamente relacionados con la naturaleza cognitiva de este proceso.


Como se había mencionado anteriormente, un documento se puede considerar relevante o no, en función de los motivos que dan origen a la necesidad de información, o del grado de conocimiento que se posea sobre el tema al momento de hacer la pregunta, es decir, el documento que para una persona es relevante, puede no ser relevante para otra persona que tiene una necesidad de información idéntica a la del primer sujeto.

Para finalizar basta con decir que

puede resultar aventurado calificar un documento como relevante con un tema, o por el contrario, calificarlo como no relevante de igual manera. Puesto que es común encontrar documentos que en alguno de sus apartados contienen información que puede resultar relevante para el usuario, pero que en el resto de su contenido no contiene información relevante. Para algunos autores, surge entonces el concepto de “relevancia parcial”, puesto  que, la relevancia no puede medirse en términos binarios (sí/no), sino que puede adquirir muchos valores intermedios, es decir, una especie de escala de medición, (muy relevante, relevante, escasamente relevante, mínimamente relevante, etc.), lo que propicia que la relevancia pueda medirse en términos de función continua en lugar de una función binaria, la cual admite dos estados únicamente.

Fuentes:

Ontología sobre economía y recuperación de información. Disponible en: http://www.hipertext.net/web/pag259.htm. [Consultado 17 de septiembre de 2010].

Relevancia. Real Academia Española RAE. Disponible en: http://buscon.rae.es/draeI/SrvltConsulta?TIPO_BUS=3&LEMA=relevancia [Consultado 17 de septiembre de 2010].

Directorio de enlaces

Trucos para Posicionar tu Blog en Google

La entrada a continuación va dirigida a los compañeros que por alguna circunstancia no han podido añadir su blog al ranking, los siguientes consejos buscan que formemos una inteligencia colectiva ya que  engañarnos a nosotros mismos dejando que otros hagan lo que necesitamos aprender, sea ingeniero de sistemas, diseñador grafico o web máster es una mala práctica que infortunadamente Google no detecta, digo yo,  porque realmente al profesor se le puede engañar y salir bonitos en la foto en el primer lugar en google pero si en algún momento a quien adopte estas prácticas bajas y deshonestas se le solicita que inicie un blog desde cero para que nos comparta de su extraordinario conocimiento para posicionase en una semana en el primer lugar máxime con un pobre contenido, estamos seguros que su desempeño va a ser nulo frente al tablero y ni la ayuda del mismísimo Jesús, del novio o del extraño don sobrenatural de posicionar sobre blogs con mayor contenido, contará….
Entrando en materia, el misterioso ranking y el misterioso algoritmo que utiliza Google, efectivamente sigue siendo un misterio cada vez mas descubierto, si quieren saber más sobre los cambios que hace google entren a estos tres blogs: http://google.blogspace.com http://www.google.com/googleblog http://battellemedia.com sin embargo y ya entrando en materia, dividimos esta entrada en tres cosas fundamentales:
1.       Relájese, no se estrese porque el blog no se haya posicionado aun, es mejor cargar de buenos e interesantes contenidos su blog que de cosas por debajo y ocultas para los visitantes que únicamente sirven para posicionarlo pese a un contenido mediocre, si el contenido es bueno y sus palabras clave se adaptan a los tesauros de google, el algoritmo del ranking valorará positivamente su blog.
2.       Envíe su url al indexador de google, esto se realiza en www.google.com.co/addurl.html no se garantiza que sea indexada de inmediato pero garantizará que el spider (GoogleBot) visite su blog en un plazo no máximo de 4 semanas, aunque podría ser menos, eso no lo podemos medir como usuarios.
3.       Lo más importante es lo que viene a continuación: Optimice su plantilla, i.e que debe hacer algunas modificaciones:
o   Utilice las etiquetas más precisas y adecuadas a la entrada que publica
o   Trate de utilizar el titulo al extremo izquierdo
o   La primera oración de su blog debe ir en texto normal, no use negrillas, itálicas, etc.
o   Utilice las negrillas únicamente en los párrafos de las entradas
o   No duplique las palabras clave en la URL
o   Ingrese enlaces relevantes “en el sitio”, de ser posible compartan enlaces con otros blogs del mismo tema
o   Enlaces relevantes “hacia el sitio” si logran hacerlo desde un sitio que tenga PageRank mayor a 8, excelente
o   Mantenga bajo el tamaño de la pagina, esto se logra evitando muchas imágenes y videos e ingresando mas .txt
o   No utilice objetos de flash, google no los indexa, preferiblemente que todo sea .html o .htm
Estos cortos pero efectivos tips, nos ayudarán a todos a cumplir con la meta impuesta, sin embargo iteramos, nada más bonito que el aprendizaje a través de la investigación concienzuda y las buenas prácticas.

jueves, 16 de septiembre de 2010

LENGUAJES DOCUMENTALES

Cualquier sistema de signos destinados a la comunicación entre seres humanos, entre hombres y máquinas, o entre máquinas, que se estructura sobre un conjunto definido de reglas, convenciones y representaciones gráficas y/o fonológicas.


www.eubca.edu.uy/diccionario/letra_l.htm

ESTRUCTURA

Distribución e interrelación de las diferentes partes que componen un objeto o una idea; Se dice de un cuerpo u objeto que se encuentra construido de diferentes partes


es.wiktionary.org/wiki/estructura

DECODIFICACION

En Comunicación, operación por la cual se utiliza un código para descifrar e interpretar un mensaje formulado en otro código, en la "recuperación de información", adquiere un enfoque a nivel de interfaz ya que es la forma en que la maquina decodifica la búsqueda del usuario.

I DECODE.

"Universidad de La Salle" "Programa de Sistemas de información" Tomado de : http://www.eubca.edu.uy/diccionario/letra_d.htm

NECESIDADES DEL USUARIO EN RECUPERACIÓN DE INFORMACIÓN

Cada usuario tiene diferentes necesidades, es importante soportar diferentes formas para encontrar información. Algunos usuarios saben exactamente qué es lo que buscan, quieren encontrarlo y terminar tan pronto sea posible. Otros usuarios no saben exactamente lo que buscan, llegan a la página con una vaga idea de la información que necesitan, después de explorar la página deben salir de ella con información o conocimientos que no sabían que necesitaban.

Se puede definir también como un vacio cognitivo, es decir, en el momento en el que no hay claridad en un determinado concepto da origen a una necesidad de Información, el problema de esto, es que es muy complejo saber cuáles son y cuántos son los conceptos que podrían solucionar esta necesidad de Información.

Tomado de : http://www.bibliodgsca.unam.mx/tesis/tes7cllg/sec_41.htm

COBERTURA

La cobertura es el alcance determinado a una búsqueda específica para que obtenga una gran cantidad de documentos al momento de realizar el proceso de recuperación de información.

Fuente: Los documentos de texto y su estructura (s.f)

LA PRECISIÓN EN LA RECUPERACIÓN DE INFORMACIÓN

"En consecuencia a la búsqueda de un usuario, se puede decir que cuando se conoce la necesidad de información, Se sabe qué es lo que se está buscando"

Una de las cualidades que deben poseer las notaciones o los conceptos de un lenguaje documental, de modo de proporcionar el mayor ajuste posible con la terminología y la temática de los documentos. // 2. En Terminología, uno de los atributos más importantes que debe tener un término, para reflejar los caracteres esenciales que están presentes en su definición. // 3. En Recuperación de la Información, correspondencia entre la ecuación de búsqueda y el grado de relevancia del documento recuperado, o, dicho de otra manera, la capacidad mensurable de un sistema de almacenamiento y recuperación, de no recuperar documentos no relevantes.

Tomado de http://www.eubca.edu.uy/diccionario/letra_p.htm

Captar información – R.I

Selección manual o automática de información relevante o de interés que realizamos las personas al buscar algún tema específico. Es una selección natural de información en la que de toda la información que existe acerca de algún tema tomamos solo la que nos es de interés dependiendo de nuestra necesidad de información.

Metadatos Dublin Core en Recuperación de información

“Dublín Core” define una serie de 15 campos que pueden ser usados para describir un documento.


Elementos del Contenido

• Título (Title)

• Materia (Subject)

• Descripción (Description)

• Fuente (Source)

• Lenguaje (Language)

• Relación (Relation)

• Cobertura (Coverage)

Elementos de Propiedad Intelectual

• Autor (Creator)

• Editor (Publisher)

• Colaborador (Contributor)

• Derechos (Rights)

Elementos de Aplicación

• Fecha (Date)

• Tipo (Type)

• Formato (Format)

• Identificador (Identifier)

Ver más en: http://www.metadatos-xmlrdf.com/metadatos/dublin-core

La Generación Google

La Generación Google, es un término que hace referencia a la generación de jóvenes nacidos despúes de 1993, y que han crecido en un mundo lleno de información y tecnología dominado por internet, y en que como herramienta principal de recuperación de información se cuenta con el buscador Google.

Hoy día, nos encontramos en un mundo que vive la mayoría de su tiempo en internet, un mundo en el que se está dejando atrás el uso del cuaderno y de los apuntes en un papel, a un mundo en que el uso del computador, y más especificamente el computador personal, es algo indispensable para el desarrollo de nuestras actividades, principalmente en el campo académico, es decir, el estudiante de hoy, literalmente vive en internet, se alimenta de él y en gran parte depende él para alcanzar varios de sus objetivos.


Un apunte adicional sobre la Generación Google

En sentido literal, todos somos hoy en día generación Google: los datos demográficos de consumo tanto de Internet como de medios, cambian rápidamente esa presunta diferencia generacional. La evidencia indica que cada vez más personas, de todos los grupos de edad, usan Internet y tecnologías de la Web 2.0 para una variedad de propósitos.

para más información consulte este documento: http://www.eduteka.org/pdfdir/GeneracionGoogle.pdf


Fuentes:

La generación Google. Disponible en:http://blog.pucp.edu.pe/item/36426/la-generacion-google [Consultado 16 de septiembre de 2010].

La generación Google. Disponible en: http://www.eduteka.org/GeneracionGoogle.php [Consultado 16 de septiembre de 2010].

miércoles, 15 de septiembre de 2010

Infoxicación - Un concepto Real

No cabe duda que la infoxicación es una realidad. La revolución y adaptación de la red como consumo diario del ciudadano provoca que el usuario busque la información que necesita, en una web. A priori lo que es una gran ventaja, la gran oferta documental de internet, termina convirtiendose en una adversidad. como tal el problema no es del medio, sino del usuario que guiado por su necesidad de información y por su gula, no selecciona bien las fuentes o páginas que consulta y termina saturado de información, que en muchos no ayuda completamente a satisfacer esa necesidad de información  que presenta. Al igual que otros campos, el problema sigue siendo la educación con respecto a la red y al mecanismo de búsqueda.






tomado de. Manuel Valero. /  http://lalinotipia.blogspot.com/2008/02/un-concepto-real-infoxicacin.html

La Relevancia en la Recuperación de Información.

La relevancia es una de las propiedades más interesantes de los documentos y, por esta razón una de las más difíciles de definir,
de forma Intuitiva, se puede afirmar que un documentos es mas relevante en la medida que permita solucionar de forma eficiente una necesidad de información. Ahora bien, teniendo en cuenta esto. se evidencia que la relevancia no es una propiedad exclusiva de los documentos, sino que es una realidad, una coproducción triangular entre las características del documento, las características de la necesidad de información y las características de la persona que hace la pregunta. Es decir, la relevancia es subjetiva, en tanto que depende del criterio de quien tiene la necesidad de información para definir lo que es o no relevante, en otras palabras, "los documentos que para un usuario son relevantes, es posible que para otro usuario con la misma necesidad de información, no lo sean".

Por otro lado, la relevancia tiene grados,  puesto que un documento no se limita a ser relevante o a no serlo, sino que la relevancia de un documento (como hemos visto en el ejemplo anterior) puede situarse en cualquier punto de un continuo de entre, por ejemplo, 0 y 1, en el cual el 0 representa la ausencia total de relevancia y el 1 la relevancia absoluta. Entre esos puntos, un documento muy semejante respecto a la pregunta podría tener una relevancia del 0.8, mientras que otro menos similar podría tener un relevancia del 0.5, etc. Naturalmente nada impide utilizar escalas de 0 a 10 en lugar de 0 a 1 o de tantos por ciento para representar el grado de relevancia de cada al usuario.

lo realmente importante aquí es si diferentes documentos tienen un grado de relevancia diferente respecto a una pregunta, entonces no tiene nada sentido que se entreguen estos documentos de forma aleatoria o bajo un orden poco eficiente como por ejemplo el título o la fecha de entrada en el fondo documental o la base de datos,  en este sentido, es claro que este principio está muy claro para la mayoría de los motores de búsqueda de internet, pero aún está muy descuidado en algunos sistemas de Gestión Documental de las organizaciones.

En conclusión, lo que hacen la mayoría de los mejores Sistemas de Recuperación de Información,  es intentar determinar la forma mas eficiente posible para determinar lo que es o no relevante para un usuario que presenta una necesidad de información, es decir si la respuesta a una pregunta incluye una lista de mil documentos, y estos documentos están distribuidos de forma aleatoria, no es lógico que el usuario tenga que revisar uno a uno esos mil documentos; lo lógico y lo que se busca es que el Sistema de Recuperación de Información, le entregue únicamente los documentos relevantes para este usuario, esto tendiendo en cuenta la pregunta que formuló, es decir, su necesidad de información.


Fuentes.

OLVERA LOBO, Mª Dolores Evaluacion de sistemas de recuperacion de informacion: aproximaciones y nuevas tendencias. disponible en:http://www.elprofesionaldelainformacion.com/contenidos/1999/noviembre/evaluacion_de_sistemas_de_r
ecuperacion_de_informacion_aproximaciones_y_nuevas_tendencias.html. [consultado 15 de septiembre de 2010 ]

Criterios de relevancia en los buscadores. disponible en: http://fabianperez.blogspot.com/2008/07/criterios-de-relevancia-en-los.html. [consultado 15 de septiembre de 2010 ]

martes, 14 de septiembre de 2010

PROBLEMAS DE LOS LENGUAJES DE CONSULTA Y RECUPERACION DE INFORMACION - Deshatelets


La pregunta se puede formular desde tres ámbitos por lo cual se requiere un proceso de estandarizar. Una cosa es como se pregunta y otra como el sistema entiende por lo cual se requiere un proceso de transformación de la pregunta. 

El primer lenguaje que empleamos es el lenguaje natural el cual esta asociado a las reglas lingüísticas del idioma y al manejo de las expresiones. Es subjetivo y las reglas semánticas y sintácticas cambian de acuerdo a la región, lo ideal es que se aplique la forma de la pregunta en el lenguaje natural y arroje el resultado deseado, par esto se debe hacer un análisis lingüístico con términos relacionados, sinónimos, antónimos etc.

Lenguaje natural restringido: subconjunto de lenguaje natural, términos controlados dentro de los que se encuentran:

  • Listas
  • Anillos de sinónimos
  • Taxonomías
  • Tesauros

La ventajas que trae el uso de estas herramientas es que cambian las expresiones de búsqueda por lo cual se usan menos términos y es efectivo para buscar en bases de datos documentales. Se corre el riesgo de que lo que encuentre el usuario no sea lo adecuado
Lenguaje artificial: (Lenguaje informático)
Si la información a representar es limitada en cuanto a la variedad se puede una representación poco ambigua, es decir, un lenguaje artificial. Se debe transformar la búsqueda de ser una expresión a ser una ecuación, ahí nacen las ecuaciones de búsqueda.
Existen varios lenguajes y estándares para formular ecuaciones de búsqueda dentro de los cuales se encuentran: CCL Norma Z39, CQL Context Query Language from Library of Congress, PLQL, SFQL, SQL: BUSCAR NORMAS ISO.

Al ir transformando los lenguajes se va generando ruido documental por lo cual es necesario reducir los niveles de ruido. Sin embargo es así más fácil recuperar a pesar del ruido. Estos estándares surgen del planteamiento: ¿cómo preguntar? De hecho existen profesionales dedicados a esta temática, a extraer términos o conjuntos de términos normalmente en lenguaje natural, también a estructurar ecuaciones y  conjuntos de términos.  ¿Por qué una pregunta no puede ser un documento? Lo puede ser!!!, de hecho EBSCO permite subir un articulo y confrontarlo para búsqueda.  LILACS es un sistema latinoamericano que permite hacer esto también.

OBJETIVOS DE LA RECUPERACIÓN DE INFORMACIÓN


Existen tres objetivos fundamentales identificados en la recuperación de información:

  • ·         Poder recuperar sobre cualquier tipo de documento.
  • ·         Permitir consultas en lenguaje natural, que el SRI pueda entender cualquier pregunta
  • ·         Buscar un mecanismo idóneo para evaluar y ajustar la relación entre pregunta y respuesta, la mejor comparación de resultados
Para optimizar los resultados se define un proceso genérico de la R.I y consiste en simplemente establecer cómo funciona un proceso normal de recuperación de información a través de entradas o consultas, procesos a través de query generados por el usuario y procesados por el sistema de búsqueda y recuperación, posteriormente se entrega una salida o resultados de búsqueda en un ranking determinado por el SRI.