Buscar en este blog

Mostrando entradas con la etiqueta necesidad de información. Mostrar todas las entradas
Mostrando entradas con la etiqueta necesidad de información. Mostrar todas las entradas

sábado, 6 de noviembre de 2010

premisas recuperación de información - Comentarios lectura

Video aproximación a la RI


De acuerdo al Documento Una aproximación al concepto de recuperación de información desde el marco de la ciencia de la información, se pueden definir cinco premisas claras:



1.    Definición(es) de recuperación de información.

2.    Ciencias de la información y documentación (library and information science).
3.    Ciencias de la informática y de la computación.
4.    Interdisciplinariedad, interrelación y aspectos intelectuales de la recuperación.
      5. Teoría de la información y de la comunicación.



Ademas, de acuerdo al texto se puede extraer que:


El problema de la recuperación específicamente surge de la creación no controlada de documentos. No es una cuestión generada a partir de las ciencias de la computación, realmente éstas han ayudado a reducir la complejidad, sin embargo el desorden documental (entendiéndose dentro de éste la elaboración de innumerables documentos no estructurados) debe ser abordado bajo criterios establecidos por documentalistas y profesionales en información, es a partir de estos campos desde donde se deben establecer metodologías para la recuperación y la coherencia en la información entregada ya que ésta última como salida de un proceso, es un problema que se ha maximizado a causa de la poca interdisciplinariedad entre la ciencia de la información y otras áreas de la ciencia y tecnología. De otra parte, ésta fenomenología parece recurrente únicamente en Latinoamérica y países de habla hispana donde hay una marcada diferencia entre profesionales de ciencia de la información ó documentalistas y profesionales de las ciencias de la computación ya que puede existir el falso imaginario de que habitualmente los segundos desmejoran las condiciones laborales de los primeros, caso contrario en los países anglosajones donde hay avances significativos gracias a la colaboración entre grupos interdisciplinarios de profesionales en muchas ramas,  que trabajan apuntando hacia la construcción, diseño y desarrollo de una sociedad de la información y del conocimiento dentro de un modelo sustentable que entregue participación y ganancias equitativas para todos los participantes.


miércoles, 3 de noviembre de 2010

Sistemas de Información, Entre el dilema de AND, OR o NOT


Dentro de la recuperación de información existen operadores que permiten enriquecer las búsquedas o extraer de las bases de datos información relevante y exhaustiva para el usuario del sistema de información, una de las formas más comunes de recuperar información a través de operadores es utilizando búsquedas booleanas las cuales tienen como palabras comodín los términos AND, OR y NOT que en algunas interfaces son reemplazados por el ampersamp (&), el signo + o el signo *.  Sin embargo esta no es la única forma de recuperar información o obtener resultados coherentes en una búsqueda de documental, esto está siempre de acuerdo a la plataforma, estructuración, notación y representación de los documentos dentro del DBMS, el ECM o el RMS.

Un ejemplo fehaciente de esto es el tipo de operadores que manejan algunas herramientas de escritorio, por citar un ejemplo el caso de google desktop search, echa mano de algunos operadores diseñados para realizar búsquedas específicas dentro del material indexado. En la URL a continuación se pueden encontrar estos mismos los cuales de acuerdo a su naturaleza pueden especificar si lo que se requiere es una búsqueda de un tipo de archivo específico, de un formato determinado o de un documento con un contenido explicito. http://desktop.google.com/support/bin/answer.py?hl=es&answer=10111, vale la pena resaltar que esta herramienta fue evaluada en la universidad de La Salle durante la cátedra de Recuperación de información y los resultados entregados al indexar una colección fueron acordes a lo esperado por un usuario final frente a un SRI.

La ventaja del uso de operadores y ecuaciones de búsqueda es que apuntan directamente a los lenguajes documentales que son los que representan la información contenida en los repositorios o bodegas de datos en las que reposen documentos estructurados o no estructurados. El motor de búsqueda google también tiene algunos operadores que generalmente no son conocidos por los usuarios pero que al ser utilizados enriquecen las búsquedas y los resultados categorizándolos de acuerdo a la necesidad de información.  En el vínculo a continuación se pueden encontrar algunos operadores como allintitle, allinurl, allintext y site entre otros. 

jueves, 21 de octubre de 2010

Modelos de Acceso a la Información

En esta entrada simplemente se van a trabajar las herramientas de visualización más usadas en la web actualmente, tal como su nombre lo indica estas permiten que una determinada pagina web se haga más popular, ya sea por palabras claves tags o cualquier otra, en la web.

Como bien lo sabemos la importancia de cualquier sistema de información, está dada por la cantidad y la calidad de la información contenida y recuperada al momento de una petición de un usuario con una necesidad de información, pero también por su findability, es decir la facilidad para encontrar dicha información.
En este sentido, nos encontramos entonces con unos modelos que determinan el acceso a la información, los cuales están diferenciados teniendo en cuenta el sentido en el que se produce el acceso a la información, en este caso Push y Pull.

En el modelo Push, conocido como filtrado de información,  por lo general el sistema informa al usuario sobre aquellos documentos que se acaban de incorporar al sistema y que posiblemente son de su interés, teniendo en cuenta el perfil del usuario o intereses previamente definidos por este, en tal sentido, se trata de una estrategia pasiva, por parte del usuario.
Por otra parte el modelo pull, o Recuperación de Información permite que sea el usuario de forma activa quien busque y acceda a la información que requiere, para lo cual dos estrategias de búsqueda, que dividiremos en dos grandes clases: querying (interrogación) y browsing (exploración)
Querying: En este el usuario introduce al sistema  una serie de palabras clave, que básicamente son la representación de su necesidad de información, para lo que el sistema regresa una serie resultados pertinentes  para la consulta realizada (por lo general estos resultados están ordenados por relevancia) un ejemplo que tenemos a la mano basado en querying son las búsquedas que realizamos en Google. Estos sistemas son útiles en la mayoría de los casos, aunque hay que tener en cuenta que no resultan eficientes cuando el usuario no tiene claro qué o sobre qué está buscando o cuando no tiene la capacidad de formalizar sus necesidades de información a través del lenguaje de consulta o lenguaje natural.

Por otra parte el modelo browsing, es opuesto al querying, en tanto que el usuario es quien explora de forma visual y espacial el conjunto documental, sin tener que expresar previamente las necesidades de  información, es decir, es el usuario quien decide navegar por el conjunto documental  y reconocer de forma visual lo que requiere, en lugar de especificar sus necesidades mediante un lenguaje de consulta.

Del browsing se pueden tomar varios tipos, teniendo en cuenta el grado de especificidad de la necesidad de información:
- De búsqueda directa: Cuando el usuario sabe lo que está buscando.
- De propósito general: El usuario explora fuentes que tienen una alta probabilidad de resultar interesantes de acuerdo a su necesidad de información.
- fortuito o por serendipia: Búsqueda al azar.

un ejemplo de browsing es la navegación hipertextual donde el usuario explora visualmente el conjunto documental que posee información aparentemente relevante  para su necesidad de información  y reconoce aquella información o aquellos enlaces que considera que lo llevarán a esta información que requiere, y se desplaza por este espacio de información saltando de página en página.

Entre los sistemas de información que brindan la posibilidad de búsqueda por Browsing, se pueden destacar aquellos que proveen un medio que permite realizar browsing grafico  por medio de las llamadas Interfaces Visuales de Recuperación de Información o VIRs ( Visual Information Retrieval Interfaces), este es similar al hipertextual, pero este posibilita al usuario visualizar documentos de forma global por medio de abstracción grafica y no necesariamente textual, a diferencia del hipertextual que solo permite la exploración de documentos por separado.


Fuentes

Push v/s Pul... Un cambio de mirada en el servicio Disponible en: < http://blog.maz.cl/2008/07/push-vs-pull-un-cambio-de-mirada-en-el.html> Consultado 20 de octubre de 2010.

Sistemas de Recomendación Semánticos. Un análisis del estado de la cuestión. Disponible en: <http://www.hipertext.net/web/pag286.htm.> Consultado 20 de octubre de 2010.

domingo, 3 de octubre de 2010

Alfabetización Informacional - Memoria de Clase.

Para inciar, es importante aclarar que la alfabetización informacional no es igual a la recuperación de información. Esta – la alfabetización informacional – es un concepto que debe estar en concordancia con la realidad en cuanto a la recuperación de información tal como a vivimos actualmente, es decir, se trata de enseñar al usuario a utilizar, buscar, evaluar, etc… la información que esta va a encontrar en la red, esto dado principalmente en un mundo en el que el concepto de biblioteca esta cambiando a tal punto que usuario no es quien debe ir a esta, si no que es esta la que debe dirigirse al usuario, y esto claramente lo hace con la publicación de sus colecciones en la red.
Se trata de hacer uso de la tecnología – entendiendo esta como un concepto que va mas alla de las maquinas, es decir, la intervención del hombre sobre el entorno para satisfacer sus necesidades y lograr un bienestar – para satisfacer una necesidad latente en un determinado usuario.
Según wikipedia, la alfabetización informacionalconsiste en adquirir la capacidad de saber cuándo y por qué necesitas información, dónde encontrarla, y cómo evaluarla, utilizarla y comunicarla de manera ética. Se considera un prerrequisito para participar eficazmente en la Sociedad de la Información y es parte de los derechos básicos de la Humanidad para un aprendizaje de por vida”
En conclusión, difícilmente vamos a encontrar una definición exacta de este termino, pues en gran parte esta sujeto al cambio en las TIC’s (Tecnologias de la Informacion y Comunicación), pero una de las definiciones mas acertadas y completas es la siguiente, “La alfabetización informacional es un conjunto de habilidades que requieren las personas para "reconocer cuándo se necesita información y tener la capacidad para localizar, evaluar y utilizar eficazmente la información necesaria." 

Fuentes.
- Alfabetización Informacional. Disponible en: http://es.wikipedia.org/wiki/Alfabetizaci%C3%B3n_informacional. [consultado 03 de octubre de 2010]
- Alfabetización Informacional. Normas sobre Competencias para la Educación Superior. American Library Association. 2006
- Alfabetización informacional: un enfoque postmoderno para la formación del ciudadano en la sociedad del conocimiento. Disponible en:    http://proquest.umi.com/pqdweb?index=0&did=2101645551&SrchMode=1&sid=1&Fmt=3&VInst=PROD&VType=PQD&RQT=309&VName=PQD&TS=1286147660&clientId=51540. [consultado 03 de octubre de 2010]

miércoles, 29 de septiembre de 2010

Objetivo de los Lenguajes Documentales.

Anteriormente ya habíamos mostrado algunos conceptos de Lenguajes Documentales, según algunos expertos en el tema, esta vez nos centraremos en el para qué de estos Lenguajes Documentales, todo con el ánimo de ir aclarando y ampliando de forma sencilla el entendimiento de este concepto y todas sus implicaciones en el ámbito de la recuperación de información.
En este sentido tenemos que el principal objetivo de los Lenguajes Documentales es el de hacer más fácil la recuperación de informacion y de documentos, buscando con esto reducir tiempos y esfuerzos para el usuario que realiza la búsqueda. Teniendo en cuenta que los Lenguajes Documentales poseen la capacidad para representar los mensajes contenidos en los documentos, esto permite cumplir estos objetivos específicos:
·         Normalizar: Lograr unificación en la terminología.
·         Induce: Es decir, le indica al usuario todas las posibles alternativas por medio de las cuales va a poder recuperar información.
·         Describe el contenido de los documentos: Después de la lectura e identificación de los conceptos contenidos en los documentos, éstos se representan mediante un lenguaje documental que proporciona un vocabulario unívoco que permite traducir los conceptos en términos normalizados.
·         Recuperación de la Información: El Lenguaje Documental tiene la capacidad de suministrar un vocabulario con los términos que se están demandando, es decir, proporciona los elementos que permiten realizar la búsqueda en niveles aun mas específicos.


Fuente:

Los lenguajes documentales. Disponible en: www3.unileon.es/dp/abd/tesauro/pagina/.../lengdocu.htm. (consultado 29 septiembre de 2010).

La organización de la información, los lenguajes documentales y la normalización. Disponible en: http://www.binal.ac.pa/archivos/catcoop/auts/orginfo.PDF. (consultado 29 septiembre de 2010).

viernes, 17 de septiembre de 2010

Relevancia en la RI

Creo que ya hemos hablado de esto, pero en este artículo lo detallaremos un poco más, intentando responder a la pregunta ¿Cuándo un documento es relevante?

Según la RAE  el termino relevancia significa “cualidad o condición de relevante, importancia, significación”, por otra parte el termino relevante se define como “sobresaliente, destacado, importante o significativo”, en tal sentido, se considera relevante un documento recuperado cuando el contenido de esto tiene una significación o importancia respecto a la pregunta realizada por el usuario, es decir, con la necesidad de información del usuario.

Conocer y más importante aún, entender este término, nos brinda una ayuda muy importante, puesto que al momento de determinar exactamente cuando un documento se puede considerar relevante o no, surgen muchos problemas estrechamente relacionados con la naturaleza cognitiva de este proceso.


Como se había mencionado anteriormente, un documento se puede considerar relevante o no, en función de los motivos que dan origen a la necesidad de información, o del grado de conocimiento que se posea sobre el tema al momento de hacer la pregunta, es decir, el documento que para una persona es relevante, puede no ser relevante para otra persona que tiene una necesidad de información idéntica a la del primer sujeto.

Para finalizar basta con decir que

puede resultar aventurado calificar un documento como relevante con un tema, o por el contrario, calificarlo como no relevante de igual manera. Puesto que es común encontrar documentos que en alguno de sus apartados contienen información que puede resultar relevante para el usuario, pero que en el resto de su contenido no contiene información relevante. Para algunos autores, surge entonces el concepto de “relevancia parcial”, puesto  que, la relevancia no puede medirse en términos binarios (sí/no), sino que puede adquirir muchos valores intermedios, es decir, una especie de escala de medición, (muy relevante, relevante, escasamente relevante, mínimamente relevante, etc.), lo que propicia que la relevancia pueda medirse en términos de función continua en lugar de una función binaria, la cual admite dos estados únicamente.

Fuentes:

Ontología sobre economía y recuperación de información. Disponible en: http://www.hipertext.net/web/pag259.htm. [Consultado 17 de septiembre de 2010].

Relevancia. Real Academia Española RAE. Disponible en: http://buscon.rae.es/draeI/SrvltConsulta?TIPO_BUS=3&LEMA=relevancia [Consultado 17 de septiembre de 2010].

Directorio de enlaces

jueves, 16 de septiembre de 2010

NECESIDADES DEL USUARIO EN RECUPERACIÓN DE INFORMACIÓN

Cada usuario tiene diferentes necesidades, es importante soportar diferentes formas para encontrar información. Algunos usuarios saben exactamente qué es lo que buscan, quieren encontrarlo y terminar tan pronto sea posible. Otros usuarios no saben exactamente lo que buscan, llegan a la página con una vaga idea de la información que necesitan, después de explorar la página deben salir de ella con información o conocimientos que no sabían que necesitaban.

Se puede definir también como un vacio cognitivo, es decir, en el momento en el que no hay claridad en un determinado concepto da origen a una necesidad de Información, el problema de esto, es que es muy complejo saber cuáles son y cuántos son los conceptos que podrían solucionar esta necesidad de Información.

Tomado de : http://www.bibliodgsca.unam.mx/tesis/tes7cllg/sec_41.htm

miércoles, 15 de septiembre de 2010

Infoxicación - Un concepto Real

No cabe duda que la infoxicación es una realidad. La revolución y adaptación de la red como consumo diario del ciudadano provoca que el usuario busque la información que necesita, en una web. A priori lo que es una gran ventaja, la gran oferta documental de internet, termina convirtiendose en una adversidad. como tal el problema no es del medio, sino del usuario que guiado por su necesidad de información y por su gula, no selecciona bien las fuentes o páginas que consulta y termina saturado de información, que en muchos no ayuda completamente a satisfacer esa necesidad de información  que presenta. Al igual que otros campos, el problema sigue siendo la educación con respecto a la red y al mecanismo de búsqueda.






tomado de. Manuel Valero. /  http://lalinotipia.blogspot.com/2008/02/un-concepto-real-infoxicacin.html

La Relevancia en la Recuperación de Información.

La relevancia es una de las propiedades más interesantes de los documentos y, por esta razón una de las más difíciles de definir,
de forma Intuitiva, se puede afirmar que un documentos es mas relevante en la medida que permita solucionar de forma eficiente una necesidad de información. Ahora bien, teniendo en cuenta esto. se evidencia que la relevancia no es una propiedad exclusiva de los documentos, sino que es una realidad, una coproducción triangular entre las características del documento, las características de la necesidad de información y las características de la persona que hace la pregunta. Es decir, la relevancia es subjetiva, en tanto que depende del criterio de quien tiene la necesidad de información para definir lo que es o no relevante, en otras palabras, "los documentos que para un usuario son relevantes, es posible que para otro usuario con la misma necesidad de información, no lo sean".

Por otro lado, la relevancia tiene grados,  puesto que un documento no se limita a ser relevante o a no serlo, sino que la relevancia de un documento (como hemos visto en el ejemplo anterior) puede situarse en cualquier punto de un continuo de entre, por ejemplo, 0 y 1, en el cual el 0 representa la ausencia total de relevancia y el 1 la relevancia absoluta. Entre esos puntos, un documento muy semejante respecto a la pregunta podría tener una relevancia del 0.8, mientras que otro menos similar podría tener un relevancia del 0.5, etc. Naturalmente nada impide utilizar escalas de 0 a 10 en lugar de 0 a 1 o de tantos por ciento para representar el grado de relevancia de cada al usuario.

lo realmente importante aquí es si diferentes documentos tienen un grado de relevancia diferente respecto a una pregunta, entonces no tiene nada sentido que se entreguen estos documentos de forma aleatoria o bajo un orden poco eficiente como por ejemplo el título o la fecha de entrada en el fondo documental o la base de datos,  en este sentido, es claro que este principio está muy claro para la mayoría de los motores de búsqueda de internet, pero aún está muy descuidado en algunos sistemas de Gestión Documental de las organizaciones.

En conclusión, lo que hacen la mayoría de los mejores Sistemas de Recuperación de Información,  es intentar determinar la forma mas eficiente posible para determinar lo que es o no relevante para un usuario que presenta una necesidad de información, es decir si la respuesta a una pregunta incluye una lista de mil documentos, y estos documentos están distribuidos de forma aleatoria, no es lógico que el usuario tenga que revisar uno a uno esos mil documentos; lo lógico y lo que se busca es que el Sistema de Recuperación de Información, le entregue únicamente los documentos relevantes para este usuario, esto tendiendo en cuenta la pregunta que formuló, es decir, su necesidad de información.


Fuentes.

OLVERA LOBO, Mª Dolores Evaluacion de sistemas de recuperacion de informacion: aproximaciones y nuevas tendencias. disponible en:http://www.elprofesionaldelainformacion.com/contenidos/1999/noviembre/evaluacion_de_sistemas_de_r
ecuperacion_de_informacion_aproximaciones_y_nuevas_tendencias.html. [consultado 15 de septiembre de 2010 ]

Criterios de relevancia en los buscadores. disponible en: http://fabianperez.blogspot.com/2008/07/criterios-de-relevancia-en-los.html. [consultado 15 de septiembre de 2010 ]

lunes, 13 de septiembre de 2010

El proceso de Recuperación de Información

Como se menciona en el titulo, la Recuperación de Información es un proceso en que obviamente existe la intervención de unos elementos y unas actividades que básicamente están enfocadas a buscar y encontrar Información relevante que va a ayudar a satisfacer la necesidad de información de un usuario.


En la figura que se presenta a continuación se muestra el Modelo Global de Recuperación de Información, el cual muestra que el proceso de Recuperación de Información inicia cuando un usuario tiene una necesidad de Información y busca la forma de resolverla, haciendo la petición o consulta por medio de un lenguaje natural que finalmente se traduce al lenguaje del Sistema de Recuperación de Información, y es lo que comúnmente es conocido como estrategia de búsqueda; esta estrategia, como ya se mencionó , es introducida en un SRI, que localiza aquellos documentos que coinciden de forma total o parcial con la petición hecha por el usuario y los presenta al usuario, por lo general, ordenados de acuerdo a diferentes criterios entre ellos la relevancia y es ahí donde el usuario evalúa estos documentos para determinar los que cumplen con los requisitos de su búsqueda y finalmente van a satisfacer la necesidad que presentaba.

Este proceso finaliza cuando el usuario ha satisfecho la necesidad que presentó en un principio o ya sea cuando usuario considera que el Sistema de Recuperación de Información no puede satisfacer su necesidad de información, es decir que no le presenta los documentos que cubren esa necesidad de información que presentaba, en los casos que esto ocurre el usuario puede mejorar su estrategia de búsqueda gracias a los resultados que le presentó el SRI en esos documentos de su primera búsqueda.





Modelo Global de Recuperacion de Informacion.






Fuente: SALVADOR OLIVAN, Jose. Recuperacion de la Informacion. 1 Edicion 2008.

viernes, 10 de septiembre de 2010

La recuperación de Información y los Sistemas de Recuperación de información SRI

Tramullas. J, ve la recuperación de información como una serie de actividades ejecutadas por el usuario para localizar y acceder recursos informativos “pertinentes”, la pertinencia y la relevancia de información es un factor diferenciador entre las acciones de cada sistema de recuperación de información. La diferencia entre google, ask, lycos, yahoo, gigablast y otros motores de búsqueda radica en la categorización o ranking asignado a los documentos puestos por los usuarios en red, también radica en la forma en que maneje la semántica y sus ontologías estén lógicamente organizadas para arrojar resultados acordes a las estructuras mentales del usuario que busca sin que este tenga que realizar un exhaustivo proceso manual de data mining (minería de datos).

Los algoritmos empleados nos facilitan la búsqueda y recuperación pero estos deben ir acompañados de un proceso realizado por el investigador de información que parte de una necesidad informativa definida a partir de la cual hace una búsqueda y posteriormente selecciona recursos de información. La consulta a estos recursos encontrados, la evaluación y la presentación que la herramienta hace al usuario determinan el curso de acción y la satisfacción de la necesidad informativa de este, La Universidad de La Salle a través de su cátedra de recuperación de información dictada en el programa de sistemas de información y documentación ha adoptado un enfoque orientado a rellenar estos vacios en los usuarios, en los procesos y en los sistemas de recuperación de información, SRI.

miércoles, 8 de septiembre de 2010

XML

Extensible Markup Language, es un metalenguaje formado por etiquetas, permite definir la gramática de lenguajes específicos. Por lo tanto XML no es realmente un lenguaje en particular, sino una manera de definir lenguajes para diferentes necesidades, permite la compatibilidad entre sistemas para compartir la información de una manera segura, fiable y fácil

Disponible en: http://es.wikipedia.org/wiki/Extensible_Markup_Language

RECUPERACIÓN DE INFORMACIÓN

Korfhage afirma que la Recuperación de Información RI es: “la localización y representación a un usuario de información relevante a una necesidad de información expresada como una pregunta” (Bordigon, 2007).

martes, 7 de septiembre de 2010

Memorias de Clase ¿QUÉ ES RECUPERACION DE INFORMACIÓN?

En esta clase definiremos que es Recuperación de Información, pero antes de que se de esta definición, es necesario definir el término “Necesidad de Información”, el cual se puede definir como un vacio cognitivo, es decir, en el momento en el que no hay claridad en un determinado concepto da origen a una necesidad de Información, el problema de esto, es que es muy complejo saber cuáles son y cuántos son los conceptos que podrían solucionar esta necesidad de Información.

La necesidad de Información se puede dividir en dos:

- Necesidad de información concreta: Es una necesidad de información bien rara, pues es muy específica y fácil de solucionar y se puede intuir que documentos pueden satisfacer esa necesidad. El hecho que exista un vacio conceptual bien definido permite establecer preguntas concretas que van a solucionar esa necesidad de información, es decir, a una necesidad concreta, una respuesta concreta.

- Necesidad de información orientada al problema: no hay una frontera temática definida, y por tanto no hay una conceptualización en la búsqueda, es decir, no hay una pregunta claramente definida, por tanto no hay una respuesta acertada o que satisfaga esa necesidad de información.

Mencionado esto podemos decir que: La necesidad de información es un problema de la Gestión de Conocimiento y por tanto la Recuperación de Información es un proceso de gestión del conocimiento, es decir, un proceso para satisfacer una necesidad de información (mas allá de and, or y not), que involucra el proceso para disminuir el problema de espacio conceptual, debido a que por lo general las preguntas están orientadas a un problema. Todo esto asociado a la gestión del conocimiento.
“La RI permite pasar de un estado actual del conocimiento a un estado necesario del conocimiento”. Ingerwersen.
Por tanto y teniendo en cuenta lo anteriormente mencionado, Recuperación de Información es el proceso de comparar una pregunta contra un conjunto de índices o comparar los términos de una pregunta contra los términos de un índice que son sacados de un conjunto de documentos, en otras palabras compara términos contra términos, teniendo en cuenta la Relevancia que presentan los términos dentro de estos índices y dentro de la pregunta.

Como todo este proceso no lo puede hacer un humano es necesario un Sistema de Recuperación de Información, que involucra procesos automatizados, manejo de Sistemas de Información, Hardware y Software, y colecciones de documentos electrónicos, es decir que estos últimos estén codificados electrónicamente.

Los Sistemas de Recuperación de Información tienen como finalidad almacenar, procesar, recuperar y difundir la información. Generalmente utiliza índices y compara las preguntas y ordena los resultados de acuerdo a la Relevancia del término que se está buscando.

Los Sistemas de Recuperación de Información están enfocados a recuperar contenidos no importa el soporte en el que estos se encuentren almacenados, por ejemplo, audio, video, texto, etc.… puesto que como lo manifestó el profesor, al comienzo de este curso, “documento es cualquier cosa que contenga información” por lo menos en el ámbito electrónico.

Un Sistema de Recuperación de Información es parte de la informática que estudia la Recuperación de Información (no datos) que pertenecen a una colección de documentos (documentos recuperados) para satisfacer una necesidad de información.

Recuperación de Información desde los Sistemas de Recuperación de Información: el conjunto de tareas proceso y procedimientos automatizados mediante los cuales los usuarios localizan y acceden a recursos de información relevantes o pertinentes que ayudan a resolver una necesidad de información.

Pero ¿qué es relevante y qué pertinente?
Relevantes: Importantes.
Pertinentes: Utiles.

Una maquina tiene la capacidad de inferir que documentos pueden ser importantes o útiles, es decir, relevantes o pertinentes, aunque ahí que aclara que la utilidad de un documento es subjetiva, pues está atado a la necesidad de cada persona, es decir, que no para todo el mundo es útil o inútil determinada información.

lunes, 6 de septiembre de 2010

Que es la necesidad de información desde la gestión del conocimiento

Necesidad de información: es el proceso en que el conocimiento tácito se convierte en explicito y donde la información se transforma en estructuras mentales que llenan vacios cognitivos, ahí surge la necesidad, cuando el ser humano no conoce, es acá donde se toca con la recuperación. No se sabe cuantos ni cuales contenidos puede llenar una necesidad de información.

Hay dos necesidades de información, una concreta en la cual se buscan contenidos muy específicos que contengan una respuesta puntual y concreta. La otra es la necesidad de información orientada al problema la cual permite conceptualizar la búsqueda y establecer límites ya que generalmente no puede se satisfecha. Pero que es la recuperación de información? Es un proceso de gestión de conocimiento para satisfacer una necesidad de información, es un proceso para acabar con el vacio conceptual. Belkin categoriza la RI como normalización del conocimiento sin embargo es necesario que sea categorizado esto a través de índices por lo cual RI es comparar una pregunta contra un conjunto de índices, es comprar los términos pertenecientes a un documento contra un conjunto de índices y posterior se organiza de una forma asignándole relevancia y ranking.

Algunos Conceptos Sobre la Recuperación de Información.

En este artículo, básicamente, mostraremos algunos conceptos que se han dado sobre la Recuperación de Información, se hará un análisis muy somero de los mismos con el fin de comprobar si existe una única definición de este término y saber si este ha variado desde la vez que fue formulado por Calvin N. Moors. Adicionalmente se buscara la identificación de aquellas variables que intervienen en este campo y finalmente desenmarañar las relaciones que existen entre la Recuperación de Información y otras disciplinas. Vale la pena aclarar que muchos de los términos acá mostrados provienen originalmente de lo que muchos llamaron “Information Retrieval”, la cual ha sido la base para la construcción del término Recuperación de Información, tal como lo mencionamos en un artículo pasado.

El primer concepto que deseamos presentar, y no quiere decir esto que sea más o menos importante que los demás, es el que da Peter Ingwersen, para quien la Recuperación de Información está relacionada con los procesos asociados a la representación, almacenamiento, búsqueda e identificación de información relevante para la necesidad de información de un usuario humano.

Por otra parte Van Rijsbergen, dice que “la Recuperación de Información está relacionada con la recuperación de aquellos documentos que sean probablemente relevantes para la necesidad de información del usuario expresada en una petición”. En su libro el destaca tres principales puntos de investigación en Recuperación de Información: Análisis de Contenido, Estructuras de Información y evaluación.

Para Charles Meadow, es un proceso de comunicación. Es el medio por el cual los usuarios de un sistema o servicio de información tienen la posibilidad de recuperar o encontrar los documentos, registros, imágenes, o registros de sonido que satisfagan sus necesidades o intereses. Más adelante este mismo autor continua afirmando que la Recuperación de Información implica encontrar información deseada en un gran banco de información o base de datos. Este proceso de buscar información en una Base de Datos, básicamente arranca desde dos puntos distintos, uno es el usuario que presenta una necesidad de información, y otro en la persona u organización que decide recoger, organizar y almacenar la información para que posteriormente sea buscada y recuperada.

Para Frederick W. Lancaster, la Recuperación de Información, tal como la podemos ver hoy día, es para el sinónimo de búsqueda de literatura; es decir, es buscar en una colección de documentos, para identificar aquellos que tratan sobre un cierto de tema, o más específicamente, que traten sobre el tema del termino de búsqueda que se ingreso. Posteriormente este mismo autor dice que la Recuperación de Información Convencional, es la búsqueda en línea, es decir haciendo uso de una conexión a internet, de datos electrónicos, haciendo este proceso de forma interactiva y en tiempo real. Por lo general esto significa, por una parte, que el usuario construye una estrategia de búsqueda, en la cual hace uso de términos con distintas relaciones lógicas y que, por otra parte, el programa divide la base de datos en dos conjuntos: elementos recuperados y elementos no recuperados, teniendo en cuenta en este caso que se puede considerar que un sistema avanzado viene siendo el que se desvía de esta norma y que permite plantear el termino o la petición de búsqueda de una forma diferente a la booleana y que arroga como resultado un producto poco convencional, como por ejemplo que los resultados aparezcan ordenados teniendo en cuenta su relevancia o que no sea referencias bibliográficas.

Karen Sparck Jones y Peter Willet, señalan que la Recuperación Información puede llegar a ser considerada como sinónimo de Recuperación de Documentos, y actualmente como Recuperación de texto, y esto implica dos actividades que están relacionadas, pero son diferentes: indización, que se refiere a la representación de los documentos y de la petición de información, y búsqueda.

Por otra parte, Stephen Harter nos da una visión muy diferente y más restringida de la Recuperación de Información, al tener en cuenta solamente a los Sistemas de Recuperación de Información Online accesibles públicamente, y así, la Recuperación de Información Online, es un proceso en el cual un ser humano que hace uso de un terminal informático para interactuar con un servicio de búsqueda, en un intento de satisfacer una Necesidad de Información.

Por último, Robert R. Morfare indica que Almacenamiento y Recuperación de Información son dos caras de la misma moneda, pues si una persona desea buscar información, es necesario que esa información haya sido almacenada de alguna manera, y termina diciendo que buscar en una colección de documentos puede ser más fácil o más complicado dependiendo de cómo se haya organizado la información.

Del análisis de estos conceptos y luego de hacer una revisión bibliográfica que permitiera entender más a fondo los mismos, se han sacado las siguientes conclusiones:

• En la bibliografía consultada no existe una definición clara sobre el término Information Retrieval.

• Sobre la Recuperación de Información y lo que esta abarca no hay un único concepto sobre el significado. Todos los conceptos acá mencionados están basados en sus caractecteristicas funcionales o estructurales.

• Existe una coincidencia total en que el objetivo de la Recuperación de Información es proporcionar información relevante al usuario para satisfacer su Necesidad de Información.

• En esto es posible encontrar dos corrientes o tendencias que se pueden considerar representativas del pensamiento de los diferentes estudiosos de este campo: por una parte, aquellos que consideran la Recuperación de Información como un proceso de búsqueda y los que la consideran en un contexto más amplio, es decir que este incluye tanto la búsqueda como representación y almacenamiento de la Información.

Fuentes.

RODRÍGUEZ PEROJO, Keilyn. RONDA LEÓN, Rodrigo. Organización y Recuperación de Información: Un enfoque desde la perspectiva de automatización. 2007. Disponible en:http://site.ebrary.com/lib/bibliounisallesp/docDetail.action?docID=10179567&p00=peter%20ingwersen.

SALVADOR OLIVAN, Jose A. ARQUERO, Rosario. Una aproximación al concepto de recuperación de Información en el Marco de la Ciencia de la Documentación. Disponible en: http://www.ejournal.unam.mx/ibi/vol20-41/IBI002004101.pdf.

RODRÍGUEZ PEROJO , Keilyn y RONDA LEÓN Rodrigo. Organización y recuperación de la información: un enfoque desde la perspectiva de la automatización. Disponible en: http://bvs.sld.cu/revistas/aci/vol14_1_06/aci04106.htm.

PINTO MOLINA, Maria. Búsqueda y Recuperación de Información. Disponible en: http://www.mariapinto.es/e-coms/recu_infor.htm

Indización y recuperación por materias en los opacs de las bibliotecas españolas: ¿dos décadas de evaluación?. Disponible en: http://www.elprofesionaldelainformacion.com/contenidos/2006/marzo/2.pdf