Buscar en este blog

Mostrando entradas con la etiqueta Documento. Mostrar todas las entradas
Mostrando entradas con la etiqueta Documento. Mostrar todas las entradas

jueves, 16 de septiembre de 2010

Metadatos Dublin Core en Recuperación de información

“Dublín Core” define una serie de 15 campos que pueden ser usados para describir un documento.


Elementos del Contenido

• Título (Title)

• Materia (Subject)

• Descripción (Description)

• Fuente (Source)

• Lenguaje (Language)

• Relación (Relation)

• Cobertura (Coverage)

Elementos de Propiedad Intelectual

• Autor (Creator)

• Editor (Publisher)

• Colaborador (Contributor)

• Derechos (Rights)

Elementos de Aplicación

• Fecha (Date)

• Tipo (Type)

• Formato (Format)

• Identificador (Identifier)

Ver más en: http://www.metadatos-xmlrdf.com/metadatos/dublin-core

martes, 14 de septiembre de 2010

PROBLEMAS DE LOS LENGUAJES DE CONSULTA Y RECUPERACION DE INFORMACION - Deshatelets


La pregunta se puede formular desde tres ámbitos por lo cual se requiere un proceso de estandarizar. Una cosa es como se pregunta y otra como el sistema entiende por lo cual se requiere un proceso de transformación de la pregunta. 

El primer lenguaje que empleamos es el lenguaje natural el cual esta asociado a las reglas lingüísticas del idioma y al manejo de las expresiones. Es subjetivo y las reglas semánticas y sintácticas cambian de acuerdo a la región, lo ideal es que se aplique la forma de la pregunta en el lenguaje natural y arroje el resultado deseado, par esto se debe hacer un análisis lingüístico con términos relacionados, sinónimos, antónimos etc.

Lenguaje natural restringido: subconjunto de lenguaje natural, términos controlados dentro de los que se encuentran:

  • Listas
  • Anillos de sinónimos
  • Taxonomías
  • Tesauros

La ventajas que trae el uso de estas herramientas es que cambian las expresiones de búsqueda por lo cual se usan menos términos y es efectivo para buscar en bases de datos documentales. Se corre el riesgo de que lo que encuentre el usuario no sea lo adecuado
Lenguaje artificial: (Lenguaje informático)
Si la información a representar es limitada en cuanto a la variedad se puede una representación poco ambigua, es decir, un lenguaje artificial. Se debe transformar la búsqueda de ser una expresión a ser una ecuación, ahí nacen las ecuaciones de búsqueda.
Existen varios lenguajes y estándares para formular ecuaciones de búsqueda dentro de los cuales se encuentran: CCL Norma Z39, CQL Context Query Language from Library of Congress, PLQL, SFQL, SQL: BUSCAR NORMAS ISO.

Al ir transformando los lenguajes se va generando ruido documental por lo cual es necesario reducir los niveles de ruido. Sin embargo es así más fácil recuperar a pesar del ruido. Estos estándares surgen del planteamiento: ¿cómo preguntar? De hecho existen profesionales dedicados a esta temática, a extraer términos o conjuntos de términos normalmente en lenguaje natural, también a estructurar ecuaciones y  conjuntos de términos.  ¿Por qué una pregunta no puede ser un documento? Lo puede ser!!!, de hecho EBSCO permite subir un articulo y confrontarlo para búsqueda.  LILACS es un sistema latinoamericano que permite hacer esto también.

LA EXTRACCION DE INFORMACION


La extracción de información, es una búsqueda manual o automática o de palabras, párrafos o trozos de textos que contengan información relevante buscada y representada de forma estructurada. El proceso de aplicar las reglas en los sistemas para llevar información de un sitio a otro se llama así: Extracción de información. La recuperación de datos que es otro concepto que no resuelve el problema de la RI, solo devuelve datos sobre un tema, es estructurado y para nada ambiguo en cuanto a consultas ya que en la recuperación una necesidad de información puede ser planteada en infinitas preguntas o formas. 

En la extracción de información habla sobre documentos no sobre datos, para los datos se usan sentencias estructuradas que dan un resultado estricto. Existen grandes diferencias entre recuperar datos e información: respecto a los Ítem: correspondencia entre pregunta respuesta, inferencia, Modelo de relación de requerimientos de sistema y satisfacción, especificación de la pregunta, respuesta al error, rapidez de la respuesta,  lenguaje de consulta, importancia, eficiencia y eficacia entre otras. El profesor Laureano Felipe Gómez del programa de sistemas de información de la Universidad de La Salle Diseñó una matriz donde se evalúan estos criterios.

domingo, 12 de septiembre de 2010

La recuperación de información online (teledocumentación)

La recuperación de información es asociada con el término teledocumentación, el cual hace referencia a la unión de telecomunicaciones + informática (telemática) + documentación. La teledocumentación es definida por Mercedes Caridad como “la aplicación telemática destinada a la recuperación de las fuentes a través de elementos informáticos y la telecomunicaciones”, y de esta forma, se destaca y se da a conocer la importancia de las tecnologías informáticas y telecomunicaciones en el acceso de información a distancia.

Por otro lado, la recuperación Online es la búsqueda y recuperación de información en bases de datos. Para hacer posible que la recuperación online pudiera tener lugar, fue necesario que se produjeran avances en la tecnología informática y en las telecomunicaciones, favoreciendo el acceso y la difusión de la información, creando a la vez una industria de la información

sábado, 11 de septiembre de 2010

Visor de archivos de texto


Reproductores portátiles que tiene la capacidad de mostrar por medio de una interfaz información  donde el  documento funciona como una sola unidad de información. Estos reproductores no pueden diferenciar el autor del texto aunque este apareciera al final de la información. 

miércoles, 8 de septiembre de 2010

DOCUMENTO

Es el testimonio material de un hecho o acto realizado en el ejercicio de sus funciones por instituciones o personas físicas, jurídicas, públicas o privadas, registrado en una unidad de información en cualquier tipo de soporte (papel, cintas, discos magnéticos, películas, fotografías, etcétera) en lengua natural o convencional. Es el testimonio de una actividad humana fijada en un soporte.


Documento disponible En http://es.wikipedia.org/wiki/