Recuperación de Información: indexación

Mostrando entradas con la etiqueta indexación. Mostrar todas las entradas

viernes, 17 de septiembre de 2010

Trucos para Posicionar tu Blog en Google

La entrada a continuación va dirigida a los compañeros que por alguna circunstancia no han podido añadir su blog al ranking, los siguientes consejos buscan que formemos una inteligencia colectiva ya que engañarnos a nosotros mismos dejando que otros hagan lo que necesitamos aprender, sea ingeniero de sistemas, diseñador grafico o web máster es una mala práctica que infortunadamente Google no detecta, digo yo, porque realmente al profesor se le puede engañar y salir bonitos en la foto en el primer lugar en google pero si en algún momento a quien adopte estas prácticas bajas y deshonestas se le solicita que inicie un blog desde cero para que nos comparta de su extraordinario conocimiento para posicionase en una semana en el primer lugar máxime con un pobre contenido, estamos seguros que su desempeño va a ser nulo frente al tablero y ni la ayuda del mismísimo Jesús, del novio o del extraño don sobrenatural de posicionar sobre blogs con mayor contenido, contará….

Entrando en materia, el misterioso ranking y el misterioso algoritmo que utiliza Google, efectivamente sigue siendo un misterio cada vez mas descubierto, si quieren saber más sobre los cambios que hace google entren a estos tres blogs: http://google.blogspace.com http://www.google.com/googleblog http://battellemedia.com sin embargo y ya entrando en materia, dividimos esta entrada en tres cosas fundamentales:

1. Relájese, no se estrese porque el blog no se haya posicionado aun, es mejor cargar de buenos e interesantes contenidos su blog que de cosas por debajo y ocultas para los visitantes que únicamente sirven para posicionarlo pese a un contenido mediocre, si el contenido es bueno y sus palabras clave se adaptan a los tesauros de google, el algoritmo del ranking valorará positivamente su blog.

2. Envíe su url al indexador de google, esto se realiza en www.google.com.co/addurl.html no se garantiza que sea indexada de inmediato pero garantizará que el spider (GoogleBot) visite su blog en un plazo no máximo de 4 semanas, aunque podría ser menos, eso no lo podemos medir como usuarios.

3. Lo más importante es lo que viene a continuación: Optimice su plantilla, i.e que debe hacer algunas modificaciones:

o Utilice las etiquetas más precisas y adecuadas a la entrada que publica

o Trate de utilizar el titulo al extremo izquierdo

o La primera oración de su blog debe ir en texto normal, no use negrillas, itálicas, etc.

o Utilice las negrillas únicamente en los párrafos de las entradas

o No duplique las palabras clave en la URL

o Ingrese enlaces relevantes “en el sitio”, de ser posible compartan enlaces con otros blogs del mismo tema

o Enlaces relevantes “hacia el sitio” si logran hacerlo desde un sitio que tenga PageRank mayor a 8, excelente

o Mantenga bajo el tamaño de la pagina, esto se logra evitando muchas imágenes y videos e ingresando mas .txt

o No utilice objetos de flash, google no los indexa, preferiblemente que todo sea .html o .htm

Estos cortos pero efectivos tips, nos ayudarán a todos a cumplir con la meta impuesta, sin embargo iteramos, nada más bonito que el aprendizaje a través de la investigación concienzuda y las buenas prácticas.

martes, 14 de septiembre de 2010

Google desktop search como herramienta de recuperación de información

Este desarrollo de google permite indexar contenidos en diferentes formatos pese a que se demora en indexar, lo cual va de de acuerdo a la cantidad o peso de los documentos que se indexen, el programa usa los tiempos muertos del PC, hay q verificar los estatus y posterior cuando llega al 100% permite buscar, no genera avisos cuando acaba su proceso, simplemente pone a disposición del usuario la interfaz para que la búsqueda y recuperación. Esta misma tiene diferentes opciones avanzadas como instalar en la unidad que tenga espacio, modificación del registro y de la instalación a través de usuario administrador, ser utilizado de forma independiente en diferentes cuentas de Windows en una misma máquina, copia de seguridad del índice y restablecimiento de este mismo (restauración). Una de las desventajas de esta herramienta en la recuperación, es que por default tiene un número predeterminado de formatos, sin embargo muchos desarrolladores han generado plugg-ins para extender la compatibilidad con otros formatos de documentos de cualquier sistema de información.

Un buen instructivo para iniciar en el uso del Google Desktop Search se encuentra en el vínculo a continuación: http://desktop.google.com/support/bin/topic.py?topic=11570

martes, 7 de septiembre de 2010

Algunos problemas en recuperación de información

Algunos problemas en recuperación de información identificados durante la catedra de la Universidad de La Salle en el programa de sistemas de información son los siguientes:

• Trabajar con índices

• Como trabajar índices contra preguntas

• Como organizar resultados

Google cada mes optimiza su algoritmo para establecer la relevancia, los sistemas de recuperación tradicionales comparan los términos pertenecientes a un documento contra un conjunto de índices y posterior se organiza de una forma asignándole relevancia y ranking, sin embargo google hace buen uso de los tesauros con el fin de optimizar el proceso y apuntar al esquema mental del usuario que plantea el Query.

Para automatizar y optimizar las búsquedas y recuperación de información, se involucran procesos automatizados e informáticos como, hardware, software, colecciones de documentos, información digital, audio, video, texto, multimedia, codificaciones y otros objetos, generalmente los SRI son subsistemas de otros sistemas más grandes. Vasta con ver los ECM, ERM, ERP, Workflow que cuentan con subsistemas de recuperación para encontrar sus contenidos y que reducen la complejidad del problema documental y de archivos invertidos contenedores de metacontenidos.

Dado que los documentos puede ser cualquier objeto en la red hay que evaluar factores tales como la categorización, el formato, el tamaño del índice vs el tamaño de la colección para así asignar los elementos necesarios que permitan crear un SRI adecuado, es decir, interfaz, Querys, búsquedas, comparaciones, indexación, asignación de ranking y resultados de acuerdo a los listados de términos y reglas asociadas al SRI.

En este orden de ideas se convierte en un conjunto de procesos automatizados por los cuales el usuario accede a la información donde previamente se normalizan las preguntas y se indexa la documentación para que sea dada por este una categorización de utilidad a la respuesta devuelta por la maquina a una pregunta concreta de acuerdo a patrones semánticos.

La extracción de información como modelo para organización de resultados, es un proceso especializado de recuperación de información destinado únicamente a necesidades de información concreta. Es una búsqueda concreta sobre un listado de términos y basado en reglas asociadas que apuntan a una mayor exhaustividad en los resultados requeridos para saciar una necesidad informativa.

Recuperación de Información

Páginas

Buscar en este blog