viernes, 15 de agosto de 2014

¿Qué es un motor de búsqueda y como se indexa la información?

¿Qué es un motor de búsqueda?

Los motores de búsqueda son aplicaciones muy complejas que se actualizan constantemente.
Yo voy a describirlos de una forma sencilla. Así que pido disculpas por adelantado a aquellos que sean programadores o desarrolladores puesto que yo no lo soy.
Básicamente un motor de búsqueda es un software o programa que localiza contenidos en Internet de una forma rápida y muy eficiente para luego, en función de tus peticiones de búsqueda, presentarte los resultados que ha almacenado previamente en su base de datos.
Para ello previamente el motor de búsqueda ha creado su propia  base de datos para poder presentarte los diferentes resultados en función de tus peticiones de búsqueda.
La clave esta en como construyen su base de datos y categorizan después los resultados que van a mostrar a sus usuarios.
Ejemplos de buscadores conocido y que hayas utilizado son: Google, Bing y Yahoo.

¿Cómo funciona un motor de búsqueda?

Se puede decir, simplificando mucho que un motor de búsqueda consta de cuatro partes:
  • Un interfaz para el usuario para hacer peticiones de búsqueda
  • Un robot o spider que busca la información en Internet
  • Un algoritmo que conecta las peticiones de los usuarios con la base de datos
  • una base de datos donde se han indexado los contenidos
El corazón de todo motor de búsqueda es sin duda el algoritmo que dirige al robot o spider y después categoriza la información que se mostrará tras las peticiones de los usuarios.
Estos algoritmos son realmente complejos y solo sus propios desarrolladores saben como funcionan.
Sin embargo, el algoritmo no vale de nada si el buscador no cumple con otras dos funciones:
  1. Recoger la información usando técnicas de web crawling
  2. Almacenar e indexar la información
Los motores de búsqueda crean listados de páginas web utilizando sus spiders o robots a través de técnicas de web crawling y después organizan la información encontrada, creando indices de los contenidos. 

Organizando la información mediante la indexación

Una vez que el robot o spider, también conocido como web crawler (de ahí el nombre link crawling), encuentra la información, se crea un indice (index en inglés) con la información esencial de la página web que se almacena en la base de datos y que únicamente será mostrado a los usuarios cuando estos hagan su petición en el interfaz de búsquedas del motor de búsqueda.
De que se muestre o no lo información indexada bajo una petición del usuario depende en última instancia del algoritmo del buscador.
Por así decirlo el algoritmo:
hace de intermediario entre la base de datos y las peticiones del usuario.
Y es quien decide que información se va mostrar para una petición del usuario.
De que el algoritmo sea mejor o peor dependerá también la calidad de los resultados mostrados por el buscador. De ahí que sea la parte más importante de un buscador.
En relación a la calidad de los resultados mostrados por un buscador dependerá por supuesto el tipo de petición que se haga y por supuesto elegir el motor de búsqueda más apropiado para cada ocasión.

Tomado de :
http://papelesdeinteligencia.com/como-funciona-un-motor-de-busqueda/

No hay comentarios:

Publicar un comentario