Buscar en este blog

viernes, 22 de octubre de 2010

VIRIs – Visual Information Retrieval Interfases. Interfases Visuales de Recuperación de Información.


En la anterior entrada de manera parcial vimos el concepto de VIRIs, ahora veremos su objetivo, el cual no solo está enfocado  en brindar ayuda al usuario para navegar  y recuperar aquella información que esta buscando, sino que además también brindan una visión global del conjunto documental, a través de la cual el usuario está en la libertad de predecir que puede encontrar e incluso permite la adquisición de nuevo conocimiento a través de la interiorización de la visualización.
Es claro que existen un sinnúmero de propuestas de VIRIs, y como es de suponer muchas de estas, no han tenido acogida por una u otra razón, pero ese es un tema en el que no vamos a centrarnos, lo que queremos es mostrar un esquema sencillo de análisis y evaluación de VIRIs, teniendo en cuenta algunas de las principales funcionalidades de estos sistemas, en este sentido, las funciones básicas de un VIRIs son:

- Resumen Información con el fin de ofrecer visualizaciones globales del conjunto documental.
- Resaltan la información más relevante para facilitar al usuario tener una vista previa y permitirle diferenciar lo relevante o no de la información que se le presenta.
- relaciona información semejante para brindar al usuario la facilidad de comprender y adquirir conocimiento nuevo a partir de las relaciones que se presentan a través de los documentos visuales.
Recuperan información para que el usuario pueda llegar a satisfacer su necesidad de información.






Fuentes::

Recuperación de Información. Universidad de La Salle.

Interfaz visual para recuperación de información basada en análisis de metadatos, escalamiento multidimensional y efecto ojo de pez. disponible en: http://www.nosolousabilidad.com/hassan/interfaz_visual.pdf. consutado 22 e octubre de 2010.

jueves, 21 de octubre de 2010

Modelos de Acceso a la Información

En esta entrada simplemente se van a trabajar las herramientas de visualización más usadas en la web actualmente, tal como su nombre lo indica estas permiten que una determinada pagina web se haga más popular, ya sea por palabras claves tags o cualquier otra, en la web.

Como bien lo sabemos la importancia de cualquier sistema de información, está dada por la cantidad y la calidad de la información contenida y recuperada al momento de una petición de un usuario con una necesidad de información, pero también por su findability, es decir la facilidad para encontrar dicha información.
En este sentido, nos encontramos entonces con unos modelos que determinan el acceso a la información, los cuales están diferenciados teniendo en cuenta el sentido en el que se produce el acceso a la información, en este caso Push y Pull.

En el modelo Push, conocido como filtrado de información,  por lo general el sistema informa al usuario sobre aquellos documentos que se acaban de incorporar al sistema y que posiblemente son de su interés, teniendo en cuenta el perfil del usuario o intereses previamente definidos por este, en tal sentido, se trata de una estrategia pasiva, por parte del usuario.
Por otra parte el modelo pull, o Recuperación de Información permite que sea el usuario de forma activa quien busque y acceda a la información que requiere, para lo cual dos estrategias de búsqueda, que dividiremos en dos grandes clases: querying (interrogación) y browsing (exploración)
Querying: En este el usuario introduce al sistema  una serie de palabras clave, que básicamente son la representación de su necesidad de información, para lo que el sistema regresa una serie resultados pertinentes  para la consulta realizada (por lo general estos resultados están ordenados por relevancia) un ejemplo que tenemos a la mano basado en querying son las búsquedas que realizamos en Google. Estos sistemas son útiles en la mayoría de los casos, aunque hay que tener en cuenta que no resultan eficientes cuando el usuario no tiene claro qué o sobre qué está buscando o cuando no tiene la capacidad de formalizar sus necesidades de información a través del lenguaje de consulta o lenguaje natural.

Por otra parte el modelo browsing, es opuesto al querying, en tanto que el usuario es quien explora de forma visual y espacial el conjunto documental, sin tener que expresar previamente las necesidades de  información, es decir, es el usuario quien decide navegar por el conjunto documental  y reconocer de forma visual lo que requiere, en lugar de especificar sus necesidades mediante un lenguaje de consulta.

Del browsing se pueden tomar varios tipos, teniendo en cuenta el grado de especificidad de la necesidad de información:
- De búsqueda directa: Cuando el usuario sabe lo que está buscando.
- De propósito general: El usuario explora fuentes que tienen una alta probabilidad de resultar interesantes de acuerdo a su necesidad de información.
- fortuito o por serendipia: Búsqueda al azar.

un ejemplo de browsing es la navegación hipertextual donde el usuario explora visualmente el conjunto documental que posee información aparentemente relevante  para su necesidad de información  y reconoce aquella información o aquellos enlaces que considera que lo llevarán a esta información que requiere, y se desplaza por este espacio de información saltando de página en página.

Entre los sistemas de información que brindan la posibilidad de búsqueda por Browsing, se pueden destacar aquellos que proveen un medio que permite realizar browsing grafico  por medio de las llamadas Interfaces Visuales de Recuperación de Información o VIRs ( Visual Information Retrieval Interfaces), este es similar al hipertextual, pero este posibilita al usuario visualizar documentos de forma global por medio de abstracción grafica y no necesariamente textual, a diferencia del hipertextual que solo permite la exploración de documentos por separado.


Fuentes

Push v/s Pul... Un cambio de mirada en el servicio Disponible en: < http://blog.maz.cl/2008/07/push-vs-pull-un-cambio-de-mirada-en-el.html> Consultado 20 de octubre de 2010.

Sistemas de Recomendación Semánticos. Un análisis del estado de la cuestión. Disponible en: <http://www.hipertext.net/web/pag286.htm.> Consultado 20 de octubre de 2010.

martes, 19 de octubre de 2010

Análisis morfológico aplicado en la Recuperación de Información.

El análisis morfológico es un medio que permite poner a disposición del usuario, que usa un Sistema de Recuperación de Información, ayudas que le permitan obtener capacitación sobre cómo encontrar términos que para él (es usuario que realiza la búsqueda) son los más relevantes.
Existe un sistema llamado MARS (morphological Analisis for Retrieval Support) que brinda al usuario la opción de acceder a los datos mediante una búsqueda que es asistida o apoyada por un paquete lingüístico, el cual descompone las palabras que el usuario da al computador o al sistema de recuperación de información al mismo tiempo que da todas las palabras que lingüísticamente estén relacionadas con la palabra original.
Con el uso de un procedimiento como el que brinda MARS, el usuario que busca información solamente recibirá las palabras que realmente estén relacionadas con el término de la pregunta.
Fuentes:

Morfologia y sintaxis. disponible en : http://angarmegia.com/analisis_gramatical.htm [consultado el 18 de octubre de 2010]

MARS: a retrieval tool on the basis of morphological analysis. disponible en: http://portal.acm.org/citation.cfm?id=636829&dl=GUIDE&coll=GUIDE&CFID=109530467&CFTOKEN=34779737 [consultado en: 18 de octubre de 2010]

ALFABETIZACIÓN INFORMACIONAL


De acuerdo al concepto emitido por el profesor Laureano Felipe Gomez, catedratico de la Universidad de La Salle, los profesionales de información que no usen licenciamiento en los documentos permiten que cualquier persona haga lo que quiera con dicho material, esto basado en los lineamientos de reconocimiento de creative commons.

EL MUNDO ES DIGITAL

No se puede seguir pensando en físico o papel, el paradigma es cambiante y la tendencia del manejo de documentos no es lo que se produce, todo se vuelca hacia lo digital. Hay un cambio generacional chocante y se debería pensar en esto, la alfabetización no tiene que ver nada con recuperación, no es enseñar al usuario como hacer las cosas, de hecho los usuarios bajan su nivel de visitas a las bibliotecas, se requiere que sea la biblioteca la que vaya al usuario.

Plan de trabajo para la alfabetización informacional:

Conceptos sobre alfabetización según la universidad de la salle y el programa sistemas de información.
Tecnología: no es un tema asociado a las maquinas, la tecnología son los adelantos científicos plasmados en desarrollos, es la utilización responsable de los recursos sobre el entorno para incrementar el bienestar del hombre y satisfagan sus necesidades. El hombre ha evolucionado gracias a las tecnologías. Una de las partes de la tecnología es la de las TIC. Ley 1341 de 2009 donde estas son herramientas para manejar información, son únicamente un complemento.

Ej: pensar una nueva ruta para ir a la casa más rápido, automatización y optimización de procesos humanos, automatizar los procesos en los sistemas de información dentro de una sociedad del conocimiento.  

La información crece a ritmos abundantes y son las TIC las que permiten gestionar esta información, si se relega a trabajar en el físico difícilmente se podrá estar manejando toda esta información, por eso es necesario el profesional de sistemas de información dando directrices para la recuperación de información. 

MÁQUINA VIRTUAL - Memoria de Clase

¿Qué es una Máquina Virtual?

Es un Software que tiene la capacidad de emular a una computadora con el fin de ejecutar una determinada aplicación sin que sea necesario instalarla en el equipo en el que estamos trabajando, pero que se ejecuta como si estubiese instalada en el equipo.

Existen muchos usos para las máquinas virtuales, pero uno de los principales es para "probar" determinado software sin que sea necesario instalar este en el equipo y sin correr el riesgo que al instalarlo este dañe la configuración de nuestro sistema.



Fuente.

Apuntes de Clase Recuperación de Información, Unversidad de La Salle, Programa de Sistemas de Información y Documentación. Octubre de 2010

viernes, 15 de octubre de 2010

Thesaurus: an approach to hierarchical representation of knowledge.

Abstract. Knowledge Trees, keywords and hierarchical relationships are the principal reference to the researcher, student or any other kind of user. So, what is the labor, tools and role of the information science professional between retrieving processes and search results deliver? What kind of activities guarantees the effective and complete use of terms? Who is responsible for the reference’s integrity? Below are some considerations about the role of the IS professional into information society and the complex process of the thesauri elaboration, to allow the user to know information and retrieve coherent results. Some of its important elements are considered, to describe and analyze.
____________________________________________________________________________________

1 Best practices

The best way to follow a controlled vocabulary is the normalization; use of standards and correct use of terms and words, which are called “descriptors”. This is the main point, to get a general idea of the thesaurus and start to develop a clearly-defined-target, like an induction model and representation.
To begin the hard and exhaustive work of building a thesaurus, it is absolutely necessary to manage its principles, guidelines and context. One of the most important rules is the morphology of the descriptors. The structure plays an important step under the building, because semantically speaking, the thesaurus structure could be distinguished if we’re working either over an asymmetrical or symmetrical model of themes. The non-symmetrical scheme neither has nor works with equivalent descriptors. On the contrary, the symmetrical model can be used to generate relations between any other language. Those generic relations between terms are given by relational structures. On this point, the single concepts used to build the model, can use facets with shared characteristics. Other characteristics used as entities, processes, attributes, agents, geographical places and chronology must use exact terms. Here ambiguities become the issue, by eliminating inside a controlled vocabulary.  This problem can be resolved giving one specific meaning to the domain and avoiding the use of natural language.

2 Terms and representations

The qualifiers (specifications in parentheses) are important to specify meaning of some words. Homographs should be replaced by a common synonym if available, so as not to cause confusion. In fact, the indexer must avoid the use of ambiguity. Some exceptions from terms in more than a language must be specified in parentheses helping to give form to the terms and strictly taking a thematic meaning basis. An important consideration to watch should be to avoid the use of adjectives, adding unnecessary length or clumsiness, as the author says: use the appropriate capitalization, punctuation, diacritics and special characters of the individual languages  where the rules and conventions explain and clarify the thesaurus.
The compound of terms structured with more than a word is an important labor in the connection of concepts, neologisms and regional language. Over this point, two or more simple words or concepts must represent in a specific way the focus or head from a meaning. Differences and modifiers must use prepositions, nouns, adverbs only if necessary to distinguish clarity or give valor to the term or its equivalences.

3 The role of the “scientific of information”

As a professional and architect of the information, there are three points  relevant to consider in the building of equivalencies: Semantic, cultural and structural aspects  whose help to express general ideas from a specific area or facet giving a feedback target to possible solutions between descriptors and support from non equivalent terms.
Worldwide, the trend is going to the combination of thesaurus and their placement in graphical representations. Before starting some graphical constructions, one must create a terminology scheme and its appropriate knowledge tree from terms as commodities to undergo a process of transformation. The linking between thesauri is a complex labor to indexers and searchers. One must find the types of equivalence and map the headings. This  requires analysis and synthesis supporting the process in the IT and other kinds of tools like the Boolean operators, algorithms and onthologies. Encountering the equivalence and harmony from terms is the end and reason from thesaurus integration..

4 Controlled vocabularies evolution

Honestly speaking, subject headings are considered absolutely necessary to start a basis from a new technique or theory. They are condemned to disappear because the thesauri, onthologies and semantic associations are the future of retrieval and dissemination. This situation is necessary given by the proliferation or the IT; the uncontrolled production within normalization and new user requirements.

5 Inference

All at all, aspects like form, grammar, semantics, facets, descriptors and predefined terms are the inputs necessary to build, realize and integrate a thesaurus. In order to do this correctly under parameters into the tool construction, the librarian must have a lot of knowledge toward synthesis, analysis, interdisciplinary, and a holistic vision from the organization, archive, information unit, library or museum.


Referencias

[1]    RIESTHUIS, GERARD [et al...] Guidelines for multilingual Thesauri. [USA?], IFLA. April 2005. 17 p.