¿Como funcionan los buscadores de Internet?

googyamsn

altavista

 

 

 

Los servicios de búsqueda accesibles al público en la red (Google, Yahoo, msn, Altavista, Go, etc) usan varias técnicas para acelerar y refinar sus búsquedas.

Un modo de ahorrar tiempo de búsqueda consiste en comparar la pregunta del usuario de Internet con un archivo índice de datos procesados previamente y almacenado en una ubicación determinada, en lugar de comparar con millones de sitios de la red. Para actualizar los datos procesados, la base de datos ejecuta de manera periódica un programa llamado oruga para leer las páginas de Internet. Un programa diferente analiza las páginas resultantes para extraer términos clave de búsqueda. Estas palabras se guardan en el archivo índice junto con los enlaces a las páginas correspondientes. Entonces, las preguntas nuevas que envían los usuarios se comparan con este archivo índice.

La “búsqueda inteligente” o smart representation consiste en elaborar el índice según una estructura que reduzca al mínimo el tiempo de búsqueda. Los datos se ordenan con mucha mayor eficacia en forma de “árbol” que mediante un listado secuencial. En los índices arborescentes, la búsqueda comienza desde arriba o nudo de ráiz. Para localizar términos que comienzan por letras del alfabeto anteriores a la letra inicial de la palabra nudo, el buscador parte de la ramificación izquierda; y si la letra es posterior en el alfabeto, de la ramificación derecha. Cada nudo subsiguiente ofrece más ramificaciones hasta que se localiza el término en cuestión, o hasta concluir que no se encuentra en el árbol.

Como resultado de estas búsquedas suelen ofrecerse numerosos enlaces o URL (unified resource locator). Pero todos los enlaces resultantes tienen por lo general la misma relevancia, debido a las ambiguedades del idioma (i.e.: “jugar polo”, frente a “polo norte”). Para deducir los registros más pertinentes, el algoritmo de búsqueda aplica estrategias clasificatorias. Un método habitual, conocido como “peso según frecuencia”, asigna un peso relativo a las palabras para indicar su importancia en cada documento; la asignación de relevancia se basa en la distribución de las palabras y en la frecuencia con que aparecen. A las palabras que aparecen con mucha frecuencia (como “o”, “para” y “con”) y en muchos documentos se les atribuye mucho menos peso que a las que aparecen en pocos documentos y tienen más trascendencia semántica.

Pero que usa Google que hace más efectiva su búsqueda?. El análisis de enlaces, que constituye otra estrategia fundamental. Esta técnica estudia la naturaleza de cada página (si se trata de una “autoridad”, porque otras páginas remiten a ella, o si es un “eje”, porque remite a otras páginas).

About these ads

5 Respuestas a “¿Como funcionan los buscadores de Internet?

  1. Pingback: ¿Cómo funcionan los buscadores de Internet? // menéame

  2. Me gustaría agregar que Google a la hora de analizar los enlaces que dirigen hacia una página, analiza el texto que forma parte de él (anchor text) además para verificar su relevancia; es decir, el buscador analiza si este enlace se encuentra en un entorno relevante a la búsqueda que realizó el usuario (relevancia temática). Otro factor importante es el PageRank de ambas páginas enlazadas. Es de especial interés para el webmaster, seleccionar adecuadamente las palabras que se van a incluir.

  3. está bien conocer un poco más de los buscadores, deben tener un proceso complejo aunque parezca sencillo en apariencia.

  4. En realidad su funcionamiento basico es muy sencillo y cualquier lo puede entender, ahora conocer a fondo como hacer para lograr un primer lugar en una palabra competitiva ya es mucho mas dificil porque requiere experiencia.

  5. me gustaria saber mas del tema

Deja un comentario

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s