IDEM

¿Como funcionan los buscadores de Internet?

Junio 14, 2007 · 5 comentarios

googyamsn

altavista

 

 

 

Los servicios de búsqueda accesibles al público en la red (Google, Yahoo, msn, Altavista, Go, etc) usan varias técnicas para acelerar y refinar sus búsquedas.

Un modo de ahorrar tiempo de búsqueda consiste en comparar la pregunta del usuario de Internet con un archivo índice de datos procesados previamente y almacenado en una ubicación determinada, en lugar de comparar con millones de sitios de la red. Para actualizar los datos procesados, la base de datos ejecuta de manera periódica un programa llamado oruga para leer las páginas de Internet. Un programa diferente analiza las páginas resultantes para extraer términos clave de búsqueda. Estas palabras se guardan en el archivo índice junto con los enlaces a las páginas correspondientes. Entonces, las preguntas nuevas que envían los usuarios se comparan con este archivo índice.

La “búsqueda inteligente” o smart representation consiste en elaborar el índice según una estructura que reduzca al mínimo el tiempo de búsqueda. Los datos se ordenan con mucha mayor eficacia en forma de “árbol” que mediante un listado secuencial. En los índices arborescentes, la búsqueda comienza desde arriba o nudo de ráiz. Para localizar términos que comienzan por letras del alfabeto anteriores a la letra inicial de la palabra nudo, el buscador parte de la ramificación izquierda; y si la letra es posterior en el alfabeto, de la ramificación derecha. Cada nudo subsiguiente ofrece más ramificaciones hasta que se localiza el término en cuestión, o hasta concluir que no se encuentra en el árbol.

Como resultado de estas búsquedas suelen ofrecerse numerosos enlaces o URL (unified resource locator). Pero todos los enlaces resultantes tienen por lo general la misma relevancia, debido a las ambiguedades del idioma (i.e.: “jugar polo”, frente a “polo norte”). Para deducir los registros más pertinentes, el algoritmo de búsqueda aplica estrategias clasificatorias. Un método habitual, conocido como “peso según frecuencia”, asigna un peso relativo a las palabras para indicar su importancia en cada documento; la asignación de relevancia se basa en la distribución de las palabras y en la frecuencia con que aparecen. A las palabras que aparecen con mucha frecuencia (como “o”, “para” y “con”) y en muchos documentos se les atribuye mucho menos peso que a las que aparecen en pocos documentos y tienen más trascendencia semántica.

Pero que usa Google que hace más efectiva su búsqueda?. El análisis de enlaces, que constituye otra estrategia fundamental. Esta técnica estudia la naturaleza de cada página (si se trata de una “autoridad”, porque otras páginas remiten a ella, o si es un “eje”, porque remite a otras páginas).

Categorías: Internet

5 respuestas hasta el momento ↓

  • ¿Cómo funcionan los buscadores de Internet? // menéame // Junio 30, 2007 a 5:50 pm | Responder

    [...] ¿Cómo funcionan los buscadores de Internet?idem.wordpress.com/2007/06/14/%C2%BFcomo-funcionan-los-busca… por Marta.i.j hace pocos segundos [...]

  • Ricardo // Julio 15, 2007 a 4:13 pm | Responder

    Me gustaría agregar que Google a la hora de analizar los enlaces que dirigen hacia una página, analiza el texto que forma parte de él (anchor text) además para verificar su relevancia; es decir, el buscador analiza si este enlace se encuentra en un entorno relevante a la búsqueda que realizó el usuario (relevancia temática). Otro factor importante es el PageRank de ambas páginas enlazadas. Es de especial interés para el webmaster, seleccionar adecuadamente las palabras que se van a incluir.

  • ganar dinero // Noviembre 20, 2007 a 12:33 am | Responder

    está bien conocer un poco más de los buscadores, deben tener un proceso complejo aunque parezca sencillo en apariencia.

  • serious1 // Febrero 5, 2008 a 7:55 am | Responder

    En realidad su funcionamiento basico es muy sencillo y cualquier lo puede entender, ahora conocer a fondo como hacer para lograr un primer lugar en una palabra competitiva ya es mucho mas dificil porque requiere experiencia.

  • yadira // Septiembre 19, 2008 a 12:33 am | Responder

    me gustaria saber mas del tema

Dejar un comentario