Este documento describe los diferentes tipos de buscadores web, incluyendo buscadores jerárquicos, directorios, metabuscadores y multibuscadores. También discute la historia de los primeros buscadores como Wandex y WebCrawler y cómo Google revolucionó el campo con su algoritmo PageRank. Finalmente, cubre conceptos como la "Internet profunda" y los buscadores más populares actualmente como Google, Baidu y Bing.
1. BUSCADORES O MOTORES DE
BUSQUEDA WEB
INTERNET PROFUNDA U
OCULTA
Tecnología En Logística
K. Anderson Bustamante Diaz
2. ¿Que es un buscador web
o motor de búsqueda?
Son sistemas informáticos que nos dan la posibilidad de
consultar una gigantesca base de datos para encontrar
archivos, noticias, información, páginas web.
Los buscadores web incorporan automáticamente páginas
web mediante programas informáticos llamados “Spider“,
encargado de localizar de forma automatizada y metódica
todas esas actualizaciones que se producen en los
millones de web sites cada segundo.
3. Historia
El primer buscador fue "Wandex", un índice (ahora
desaparecido) realizado por el World Wide Web Wanderer,
un robot desarrollado por Mattew Gray en el MIT, en 1993.
Otro de los primeros buscadores, Aliweb, también apareció
en 1993 y todavía está en funcionamiento.
El primer motor de búsqueda de texto completo fue
WebCrawler, que apareció en 1994. A diferencia de sus
predecesores, éste permitía a sus usuarios una búsqueda
por palabras en cualquier página web, lo que llegó a ser un
estándar para la gran mayoría de los buscadores.
WebCrawler fue asimismo el primero en darse a conocer
ampliamente entre el público. También apareció en 1994
Lycos (que comenzó en la Carnegie Mellon University).
4. Muy pronto aparecieron muchos más buscadores, como
Excite, Infoseek, Inktomi, Northern Light y Altavista. De
algún modo, competían con directorios (o índices
temáticos) populares tales como Yahoo!. Más tarde, los
directorios se integraron o se añadieron a la tecnología
de los buscadores para aumentar su funcionalidad.
Antes del advenimiento de la Web, había motores de
búsqueda para otros protocolos o usos, como el
buscador Archie, para sitios FTP anónimos y el motor de
búsqueda Verónica, para el protocolo Gopher.
5. Con la llegada de Google, el modo en que los motores
de búsqueda funcionaban cambió de forma radical,
democratizando los resultados que se ofrecen en su
buscador. Google basó el funcionamiento de su motor
de búsqueda en la relevancia de los contenidos de cada
sitio web para los propios usuarios, es decir, priorizando
aquellos resultados que los usuarios consideraban más
relevantes para una temática concreta. Para ello patentó
su famoso PageRank, un conjunto de algoritmos que
valoraban la relevancia de un sitio web asignándole un
valor numérico del 0 al 10.
6. Clasificación de los buscadores web
Se pueden clasificar en cuatro tipos:
Buscadores jerárquicos: interfaces de interrogación textual contra
bases de datos de representaciones de páginas web, creadas según
un modelo vectorial.
Directorios: directorios de enlaces a páginas (agrupando sus enlaces
por categorías) que ofrecen motores de búsqueda interna.
Metabuscadores: interfaces de reenvío de búsqueda a múltiples
buscadores.
Multibuscadores: se limitan a colocar en una página web una lista
con los buscadores más comunes y con una ventana de texto para
poder enviar la cadena de búsqueda introducida por el usuario a cada
uno de ellos.
7. BUSCADORES JERÁRQUICOS
(ARAÑAS O SPIDERS)
Las arañas (también llamadas "spiders") de los motores de
búsqueda, recorren las páginas recopilando información
sobre los contenidos de las páginas. Cuando se busca una
información concreta en los buscadores.
ellos consultan su base de datos y presentan resultados
clasificados por su relevancia para esa búsqueda concreta
8. DIRECTORIOS
Los directorios son listas de recursos organizados por
categorías temáticas que se estructuran jerárquicamente
en un árbol de materias que permite visualizar los recursos
descendiendo desde los temas más generales situados en
las ramas superiores, a los temas más específicos
situados en las ramas inferiores.
Las categorías ofrecen una lista de enlaces a las páginas
que aparecen referenciadas en el buscador. Así pues, los
directorios o índices se estructuran por temas o categorías
principales que contienen otras subcategorías, y así
sucesivamente hasta que al final se ofrecen enlaces
directos a otras páginas o recursos de Internet.
9. METABUSCADORES
Permiten buscar en varios buscadores al mismo tiempo.
Los metabuscadores no almacenan las descripciones de
páginas en sus bases de datos, sino que contienen los
registros de los motores de búsqueda y la información
sobre ellos, adecuando su expresión a los diferentes
motores para remitir la consulta a los motores.
Una vez que reciben la respuesta, la remiten al usuario no
directamente, sino tras realizar un filtrado de los
resultados..
10. MULTIBUSCADORES
se limitan a colocar en una página web una lista con los
buscadores más comunes y con una ventana de texto para
poder enviar la cadena de búsqueda introducida por el usuario a
cada uno de ellos.
También pueden enviar la cadena de búsqueda a una serie de
motores de búsqueda e índices temáticos previamente
definidos. Una vez realizada la consulta a los buscadores
prefijados, el multibuscador devolverá la información de todos
los enlaces encontrados.
Con la utilización de multibuscadores, el usuario se evita tener
que ir de buscador en buscador hasta encontrar la información
deseada.
11. BUSCADORES MAS
POPULARES
En el siguiente listado mostramos los buscadores mas utilizados en
Internet:
• Google: el buscador más utilizado en Internet con más del 67% de
usuarias de la red. Propiedad de Google Inc. El objetivo principal del
buscador de Google es el contenido de alta calidad en las páginas
web, en lugar de otro tipo de datos.
• Baidu: el buscador web utilizado en China, con los más de 1300
millones de habitantes, es un buscador que no para de crecer. con un
18% de busquedas en la red.
• Bing: el buscador de la compañia Microsoft, anteriormente Live
Search, Windows Live Search y MSN Search, menos del 10% de los
internautas utilizan este motor de búsqueda.
• Yahoo: es el buscador más utilizado por los profesionales en la
informática, propiedad de la empresa Yahoo! Inc.
• Yandex: el motor de búsqueda de Rusia, es un buscador que está en
auge gracias a la gran población rusa.
12. METABUSCADORES O BUSCADORES
MÚLTIPLE DE INTERNET
Los metabuscadores de Internet más importantes son:
• Zoo
• Web Crawler
• Ixquick
• Excite
• Dogpile
• Zuula
• Mamma
13. DIRECTORIOS DE INTERNET
Los directivos más importantes son:
• dmoz: puedes ver más información en el post directorio
DMOZ donde se contara como podemos darnos de alta
en el directorio, porque si tu web es de mucha calidad,
estar en este directorio mejoraría mucho nuestro
posicionamiento web.
• AboutUs
• craigslist
• Best of the Web
14. Otros Buscadores De Internet
Existen multitud de buscadores diferentes en la red, no solo
existen los buscadores lideres, hay cientos de diferentes
buscadores como:
• Ask
• Aol
• Clusty
• Exalead
• Excite
• Gigablast
• Lycos
• Zuula
• Zapmeta
15. Ranking de Buscadores
Como vemos en el siguiente ranking de los buscadores
más utilizados
BUSCADOR
GOOGLE
BAIDU
BING
YAHOO
AOL
ASK
EXCITE
16. Ranking Buscadores 2015 PC
Google - Global
Baidu
yahoo - Global
AOL - global
Ask - Global
Excite
17. Ranking Buscadores 2015 Móvil -
Tablet
Google - Global
Yahoo - Global
Bing
Baidu
ask - Global
AOL - Global
18. INTERNET PROFUNDA U
OCULTA
Se conoce como internet profunda, internet invisible o
internet oculta al contenido de internet que no es indexado
por los motores de búsqueda convencionales, debido a
diversos factores.
El término se atribuye al informático Mike Bergman. Es el
opuesto al Internet superficial.
19. ORIGEN
La principal causa de la existencia de la internet profunda
es la imposibilidad de los motores de búsqueda
(DuckDuckGo, Google, Yahoo , Bing, etc.) de encontrar o
indexar gran parte de la información existente en internet.
La red oscura conforma una comunidad a nivel mundial
que nace por la necesidad que ciertas personas tenían de
que su contenido no fuera público ni fácilmente accesible
en la que prima la protección de la identidad de los
usuarios.
20. Debajo de la imagen pública de internet corre subterránea
una red oscura cuyos mensajes, páginas, blogs y chats no
se pueden rastrear. Ahí conviven hackers, crackers,
criptoanarquistas y ciberactivistas, pero también
narcotraficantes y pedófilos. En sus sitios se pueden
adquirir productos ilegales: drogas y hormonas, armas,
pasaportes y tarjetas de crédito robados, fotos y videos
snuff… Sus transacciones se realizan con una moneda
virtual y una regla única: Encriptar la información y
mantener el anonimato de los navegantes.