2. ¿QUÉ ES UN BUSCADOR?
Un buscador es una página de internet
búsquedas en la red. Su forma de utilización
con introducir una o más palabras clave
buscador generará una lista de páginas
guardan relación con el tema solicitado.
que permite realizar
es muy sencilla, basta
en una casilla y el
web que se supone
Aunque el modo de utilización es muy fácil a nivel básico, los
buscadores permiten opciones avanzadas para refinar la búsqueda,
cuyo resultado puede ser en muchas ocasiones de miles de
páginas. Mediante estas opciones avanzadas se puede acotar la
búsqueda y obtener un número de páginas más manejable.
3. CLASIFICACIÓN
Los buscadores más habituales para localizar información en
Internet son:
Motores de búsqueda: Su función es localizar documentos de
hipertexto. La mayoría permite la búsqueda por palabras clave y
nos permiten asociar estas palabras clave a través de operadores
boléanos. Ejemplos de Motores de búsqueda son: Google, Yahoo,
MSN Search, Ask Jeeves, A9, Altavista, Fast, Northern Light o
WiseNut.
4. Meta buscadores: Permiten realizar una búsqueda en varios
buscadores a la vez. Uno de sus inconvenientes, es que no
suele ser posible precisar la búsqueda, ya que cada uno de
los motores que engloba tiene sus propias características de
búsqueda.
Ejemplos de meta buscadores son: Copernic, Dogpile,
Vivísimo, Metacrawler C4, Ixquick Metasearch o Profusion.
5. Directorios: son elaborados y organizados por personas, de esta
manera están clasificados por temas jerárquicamente. No precisan
de motores de búsquedas ya que permiten descender por las
diferentes categorías. Entre las ventajas de los directorios se
encuentran la calidad de la indización y sus inconvenientes son su
lentitud y su reducido catálogo. Muchas veces, el orden en el que
están colocadas las webs responde a criterios comerciales.
Los principales son: Yahoo, Dmoz, Galaxy
Podemos señalar como buscadores también, los anillos web que son
grupos de sitios web relacionados con un tema; los portales y los
canales temáticos y los blogs.
6. Clases de buscadores:
Buscadores jerárquicos: Son los motores de
búsqueda que disponen de los spiders más
potentes,
rastrean
Internet,
buscando
información e indexándola palabra por palabra. A
esta clase pertenecen los buscadores: Bing,
Yahoo! y Google.
7. Directorios: Son pequeños buscadores, es
nacesario la participación humana. Tienen
la ventaja de que la información es
clasificada
y
ordenada
de
manera
jerárquica. El directorio más conocido es
DMOZ.
8. Metabuscadores: Son buscadores sin un motor de
búsqueda propio, lanzan la consulta a varios buscadores
jerárquicos y los resultados son obtenidos de éstos.
Buscador verticales: Son buscadores especializados en
una temática concreta, tienen su propio motor de
búsqueda pero limitado a ciertas categorías. El spider no
rastrea Internet en busca de dominios, éstos son
introducidos por un administrador que acepta y rechaza
según ciertos criterios. Dos ejemplos, el buscador
de
noticiasCunoticias.com
y
el
buscador
de retroinformática cuRetro.
9.
Buscadores semánticos: Es la última generación de buscadores,
realizan la búsqueda atendiendo al significado del grupo de palabras.
Es decir, un buscador inteligente. Buscador Cuasar
Cuasar es un híbrido de buscador jerárquico y semántico, realiza las
funciones propias de un completo buscador al estilo de Google.
Rastrea Internet en busca de nuevos dominios, manipula la
información;
clasifica,
ordena,
categoriza,
comprende
la
información y muestra resultados.
10. Además, Cuasar tiene características propias de buscador
vertical. Para ciertas búsquedas se transforma en un
completo buscador especializado, ¿cómo? poco a poco lo
iremos viendo.
Por último, destacar que Cuasar también tiene cierta relación
con los directorios, la información es categorizada pero a
diferencia de que dicho proceso es 100% automático e
independiente de la intervención humana.
Poco a poco iré destripando el cerebro de Cuasar y
mostrando las distintas fases de desarrollo.
11. Historia
y
buscadores:
cronología
de
los
1994
–
WebCrawler
Nació como un proyecto universitario, en la Universidad de
Washington (EE.UU.) Su creador, Brian Pinkerton vendió el Motor
de Búsqueda a AOL a mediados de 1995 el cual a fines de 1996 fue
adquirido por Excite!. Fue el primer Motor de Búsqueda en crear y
utilizar el estándar de exclusión de Robots o Spiders. Actualmente
pertenece a InfoSpace, una empresa de soluciones inalámbricas de
Internet.
12. 1994
–
Lycos
Al igual que otros Motores de Búsqueda, Lycos nació como proyecto
de Investigación de la Universidad de Carnegie Mellon por el Dr.
Michael Mauldin. Lycos fue la primera empresa en Internet en basar
su publicidad en CPM (costo por miles de visualizaciones) la cual es
actualmente un estándar en la industria de Internet. En Abril de
1998, Lycos adquirió la corporación WiseWire la cual es destacada
por su software de creación de directorios. Ahora, WiseWire respalda
los Directorios Web de Lycos, las cuales son creadas automática y
colaborativamente por los usuarios. También incluyó en su base al
directorio ODP (Open Director y Project, el directorio de sitios del
World Wide Web más grande, organizado en categorías y totalmente
construido de forma manual, por usuarios de Internet. Más adelante
se presenta al ODP con mayor detalle). Actualmente Lycos pertenece
a la empresa española de contenidos de Internet Terra.
13. 1994
–
Excite
Fundado por Mark Van Haren, Ryan McIntyre, Ben Lutch, Joe Kraus,
Graham Spencer y Martin Reinfried. Estas personas (cinco hackers y
un experto en ciencias políticas), investigaron para la Biblioteca de la
Universidad de Stanford, cual sería la mejor forma de buscar y
recuperar información para solucionar el problema de dicha
biblioteca. En Diciembre de 1994, Kleiner, Perkins, Caulfield, Byers y
una empresa constituida por capitales de riesgo invirtieron en Excite!
USD 4000 para la compra de los primeros equipos. A mediados de
1996 adquieren al Motor de Búsqueda Magellan y a fines del mismo
año adquieren también WebCrawler. Anteriormente denominado
Architext, está siendo desarrollado y administrado en California y
ofrece búsquedas basadas en palabras claves o basadas en
conceptos (no sólo buscando los términos deseados por el usuario
sino también los similares). También Excite! provee una interesante
forma de alineación de páginas dinámicas para diferentes sistemas
operativos.
14. 1995
–
AltaVista
Nació en los Laboratorios de Digital Equipment Corp. (DEC Research)
en Palo Alto, California, EE.UU. Sus dueños actuales son COMPAQ y
CMGI Inc. En primer término, los ingenieros de DEC Research,
crearon un software llamado “Spider” o “Crawl” el cual rastreaba
Internet, indizando y mostrando la información recolectada. La
innovación más notable de este Motor de Búsqueda, fue la inclusión
de búsqueda multi lengua en Internet, siendo el primero en soportar
chino, japonés y coreano utilizando los servicios del traductor Babel
Fish (Primer traductor en línea en Internet). Otra de las innovaciones
presentadas por este Motor, fue la de permitir búsquedas multimedia,
para explorar Internet por fotografías, videos y música, estimados en
aquel momento en más de 90 millones de objetos. En abril de 2003
fue adquirido por Overture, empresa que luego fue adquirida por
Yahoo! por su experiencia en el ramo de promoción web mediante
pay per clic.
15. 1995
–
Yahoo!
Es un caso muy especial porque debe ser el portal de búsqueda de
Internet, más viejo, conocido y visitado, pero la mayoría de sus
usuarios no saben que Yahoo! es principalmente un directorio Web y
no un verdadero Motor de Búsqueda. Por lo tanto, su estructura está
basada en sitios Web propuestos por usuarios y no por los
encontrados por un Robot o Spider. Creado por David Filo y Jerry
Yang, Ingenieros Eléctricos de la Universidad de Stanford,
comenzaron su catálogo en Abril de 1994, para mantener y rastrear
los sitios de su propio interés. Yahoo! en sus inicios residía en la
máquina de Yang, llamada, “akebono”, mientras que el Motor de
Búsqueda se encontraba en la maquina de Filo llamada “konishiki”
(ambos nombres en homenaje a los legendarios luchadores de sumo
Hawaianos).
16. 1996
–
Inktomi
Inktomi deriva de un Motor de Búsqueda desarrollado por la
Universidad de Berkeley, California, EE.UU. Fue fundado en 1996
por dos estudiantes de dicha Universidad, llamados Eric Brewer y
Paul Gauthier. Su nombre deriva de una leyenda de los Indios
Lakota, que trata de una araña tramposa. Inktomi, es conocido por
su habilidad en derrotar a sus adversarios comerciales con ingenio y
astucia. Provee servicio de búsqueda a una importante legión de
empresas de la web como: HotBot, AOL, ICQ, GeoCities, Search
MSN, GoTo, Canada.com, RadarUol, entre otros. Inktomi no sólo es
conocido por su potente Motor de Búsqueda, sino también por
lograr la confección de directorios utilizando las páginas obtenidas
por su Spider. La tecnología llamada “Concept Induction™”
automáticamente analiza y categoriza millones de documentos. Esta
tecnología incorpora algoritmos, que tratan de modelar la
concepción humana para comprender la información. En marzo de
2003 fue adquirido por Yahoo, para ser la base del nuevo motor de
búsqueda de Yahoo!.
17. 1996
–
HotBot
Su diseño y operación estuvieron a cargo de la
revista
Wired,
siendo
vendida
a
Lycos.
Actualmente los resultados de HotBot son
provistos por otro Motor de Búsqueda: Inktomi u
otros motores, el cual se vio anteriormente.
18. 1997
–
Google
Google al igual que la mayoría de los Motores de Búsqueda de
Internet, nació como un proyecto de investigación universitaria de
dos alumnos: Sergey Brin y Larry Page. Fue en la Universidad de
Stanford, EE.UU. en 1997. En 1999, recibió más de 20 millones de
dólares de capitales privados, lo cual le permitió estar ubicado
dentro de los mejores Buscadores del Netscape Netcenter. A partir
de Julio del 2000, paso a ser el principal Motor de Búsqueda de
Yahoo!. En marzo del 2000, innovó el mercado de Motores de
Búsqueda con su algoritmo PageRank, siendo usado por primera vez
en el proyecto Open Directory. Dicho algoritmo, convirtió a Google
en uno de los Buscadores más efectivos del mercado, utilizando
dicho sistema.
19. 1997
–
Fast
El Motor de Búsqueda Fast Search & Transfer, conocido como
FAST o como AllTheWeb.com, fue creado en la Universidad
de Ciencia y Tecnología de Noruega (NTNU) en Julio de
1997. Su dueño y administrador es Fast Search & Transfer
ASA Technologies y fue lanzado a Internet a mediados de
1998; posee una de las bases de datos más grandes de la
actualidad. Su sostén principal ha sido la búsqueda
especifica de multimedia. A modo de ejemplo, el conjunto de
direcciones de FTP para MP3, WAV, RA y otros tipos de
archivos multimedia, es una de las colecciones más grandes
de la Web. Fue adquirido por Yahoo.
20. 1997
–
Ask
Es parte de la compañía InterActive Corporation, fundada en
1996 por Garrett Gruener y David Warthen en Berkeley,
California. El programa original fue implementado por Gary
Chevsky basado en su propio diseño. Los primeros
inversionistas fue el Grupo RODA. La idea que dio lugar a
Ask.com fue la capacidad de responder preguntas realizadas
en lenguaje natural. Ask.com fue el primer buscador
comercial del tipo pregunta-respuesta desarrollado para
WWW. Permite una amplia variedad de consultas realizadas
en inglés, así como las tradicionales búsquedas con palabras
clave, y pretende que las búsquedas sean más intuitivas que
con los otros.
21. 1998
–
DirectHit
DirectHit fue creado en Marzo de 1998. Su trabajo consiste en
monitorear los clics que realizan los usuarios en otros Motores
de Búsqueda de los resultados que ven. Cuanto más veces se
visita un sitio, mejor es su posición en la calificación. También
reconoce frases directamente. Pero, por otro lado, tiene las
desventajas que muestra sólo los primeros diez hipervínculos
y es imposible buscar dentro de una categoría determinada.
Adquirido posteriormente por Ask Jeeves, dueño de Teoma.
22. 1998
–
Teoma
Es uno de los últimos Motores de Búsqueda, el cual ha realizado su
presentación pública (Versión Beta) a fines del mes de mayo de
1998. Utilizando tecnología desarrollada por una Fundación Federal
de Proyectos de Investigación, se implementó en 1998 en los
laboratorios de la Universidad de Rutgers. Teoma devuelve tres
tipos diferentes de resultados. En la parte superior de la pantalla,
se observan los tópicos relacionados con la palabra clave buscada
agrupados en forma de carpetas. Esta estructura, facilita el
refinamiento de la búsqueda con un simple clic en el tópico
asociado a la palabra buscada. En la parte inferior, se agrupan los
resultados recuperados, ordenados por relevancia que Teoma le ha
asignado respecto a la palabra clave buscada.
23. 1998
–
Open
Directory
Project
(ODP)
Es el directorio más grande y fraternal de la Web, el cual es
construido y mantenido por un gran número de voluntarios. Su
principal misión es la de colaborar en forma constructiva en el
crecimiento de Internet. El ODP provee los medios necesarios para
una organización eficiente. Algunos de los usuarios de ODP
(llamados editores), organizan pequeñas porciones de la red para
descartar los sitios de pobre contenido y quedarse sólo con los más
relevantes. Por esta razón es que el ODP podría llegar a convertirse
en el directorio definitivo de la Web. Fue fundado bajo el espíritu del
movimiento “Open Source”, siendo un directorio sin fines de lucro el
cual es muy respetado.
24. 2009
–
Bing
El buscador Bing tiene como meta organizar las búsquedas de tal
manera que navegar sea muy fácil para el usuario. Comienza con el
panel de exploración. Los enlaces profundos permiten a los
usuarios tener una vista previa del sitio Web. Dependiendo de si se
tiene suficiente información está disponible para crear una vista
previa, puedes utilizar el ratón sobre un enlace sobre los resultados
de búsquedas, lo cual te puede dar una idea de lo que puedes
obtener si pinchas en dicho enlace. Para conseguir información
rápida que no s interesa, como pueden ser resultados de deportes
o el tiempo, existe una opción de respuestas rápidas, las cuales
muestran información relevante basado en nuestra petición. Esto
significa que si has preguntado algo sobre vacaciones en algún
punto determinado, el buscador Bing se centrará en los datos más
relevantes para intentar ahorrarte tiempo.