Este documento describe diferentes tipos de sistemas de búsqueda de información en Internet, incluyendo índices temáticos, motores de búsqueda, directorios y metabuscadores. Explica que los motores de búsqueda usan "arañas" para indexar automáticamente páginas web y permitir búsquedas por palabras clave, mientras que los directorios requieren más mantenimiento humano y solo indexan páginas registradas de manera manual. También describe cómo los metabuscadores permiten buscar simultáneamente en múltiples mot
2. INDICES TEMATICOS
Son sistemas de búsqueda por temas o categorías jerarquizados
(aunque también suelen incluir sistemas de búsqueda por palabras
clave). Tienen un directorio navegable de temas. Dentro de cada
directorio podemos encontrar páginas relacionadas con ese tema.
Unos de los más grandes y populares del mundo es sin duda
Yahoo, unos le llaman página pero es sin duda uno de los más
grandes portales.
3. MOTORES DE BUSQUEDA
Son sistemas de búsqueda por palabras clave. Son bases de datos
que incorporan automáticamente páginas web mediante "robots" de
búsqueda por la red.
El rastreo de la web lo hace un programa, llamado araña ó motor
(de ahí viene el nombre del tipo de buscador). Este programa va
visitando las páginas y, a la vez, creando una base de datos en la
que relaciona la dirección de la página con las 100 primeras
palabras que aparecen en ella. Como era de esperar, el acceso a
esta base de datos se hace por palabras clave.
4. TIPOS DE MOTORES DE
BUSQUEDA
Los Spiders
La mayoría de grandes sitios internacionales que todos
usamos y conocemos son de este tipo. Requieren muchos
recursos para su funcionamiento. No están al alcance de
cualquiera.
Recorren las páginas recopilando información sobre los
contenidos de las páginas, principalmente el texto que en
ellas aparece. Cuando buscamos una información ellos
consultan con su software en su base de datos, con la
información que han recogido de las páginas y nos la
presentan clasificados por su relevancia. De las webs, los
buscadores pueden almacenar desde la página de entrada,
a todas las páginas de la web. Depende de los gustos del
buscador y la consideración de importancia que tenga la
web para ellos.
5. Los Directorios
Una barata tecnología, que es ampliamente utilizada por la
cantidad de programas scripts en el mercado. No se
requieren muchos recursos de informática. Están muy
extendidos en la red por estos motivos. En cambio, se
requiere mas soporte humano y mantenimiento.
Son completamente distintos a los spiders. En estos, los
algoritmos son mucho mas sencillos, presentando la
información sobre las webs registradas como una colección
de directorios. No recorren las webs ni almacenan sus
contenidos. Solo registran algunos de los datos de nuestra
página. Como el título y la descripción de la web que se
introduzcan a la hora de registrar las webs.
6. Los sistemas mixtos (Buscador -
Directorio)
Son una mezcla entre spider y
directorio. Además de tener
características de arañas, presentan
las webs registradas en catálogos
sobre contenidos. Informática,
cultura, sociedad. Que a su vez se
dividen en subsecciones.
7. FFA Enlaces gratuitos para todos
Cualquiera puede inscribir su página durante un tiempo
limitado en estos pequeños directorios. Los enlaces, no son
permanentes.
Buscadores de Portal
Bajo este título, englobamos los sistemas específicos de
sitio; aquellos que buscan información solo en su portal o
sitio web. Podríamos considerarlos como un directorio. No
obstante, como están basados en expresiones regulares y
consultas SQL, vamos a intentar ayudarles a manejar mejor
estas herramientas.
8. METABUSCADORES
En sencillas palabras, un Metabuscador es una página web
que busca la información que le solicitamos en varios
buscadores convencionales al mismo tiempo, con lo que
puede ahorrarnos tiempos de búsqueda de visitar y utilizar
varios buscadores a la vez.
Ósea, cuando utilizas un Metabuscador no busca en sus
propias bases de datos, sino que lo hacen en las bases de
datos de buscadores.
Lo que sí llama la atención es que la velocidad de búsqueda
es a veces mayos que si utilizásemos directamente un
buscador.