Este documento describe los diferentes tipos de sistemas de búsqueda en Internet, incluyendo motores de búsqueda como Google y Bing, directorios como Yahoo y Reddit, y metabuscadores que permiten realizar búsquedas en varios motores a la vez. Explica cómo funcionan los motores de búsqueda utilizando algoritmos secretos y "arañas" para indexar contenido web, y proporciona consejos para mejorar las búsquedas.
Clasificaciones, modalidades y tendencias de investigación educativa.
Tema 4 funcionamiento de los motores de busqueda
1. Las redes sociales y la Administración Pública
1
• TEMA 4.- FUNCIONAMIENTO DE LOS MOTORES DE BÚSQUEDA
Una de las preguntas que habitualmente nos hacemos como usuarios de Internet es: ¿cómo
funcionan los sistemas de búsqueda que nos permiten navegar por la información que se
encuentra en Internet?
Atrás han quedado aquellos momentos en los que para buscar algo había que recurrir a revistas,
guías telefónicas o recortes de periódicos antiguos... Para organizar el contenido en Internet,
tenemos varias opciones: los motores de búsqueda, los directorios y los metabuscadores.
4.1.- Los motores de búsqueda
Los motores de búsqueda son sistemas informáticos que nos brindan la posibilidad de consultar
una enorme base de datos para encontrar páginas. Es un modo de dar con la información que
buscamos pero de una forma rápida y muy sencilla. Para ello, utilizamos
diferentes navegadores de internet como Internet Explore, Chrome, Firefox, Safari, etc.
DESCÁRATE LA ÚLTIMA VERSIÓN DEL NAVEGADOR
2. Las redes sociales y la Administración Pública
2
A continuación, y una vez dentro, vamos a su buscador donde introduciremos una palabra clave,
también denominada “keyword”. Así nos aparecerán los listados relacionados con lo que
buscamos. Tendremos a nuestra disposición muchas páginas con una decena de entradas cada
una. Cada entrada corresponde a una página web diferente, pero casi nadie visita las páginas que
se encuentren más allá de la primera o como mucho segunda página, salvo que se trate de
búsquedas muy concretas.
Inicialmente, los motores de búsqueda fueron gestionados por los propios usuarios pero,
conforme el volumen de material fue creciendo, las empresas vieron un filón importante en la
gestión de este contenido. Por ello, posteriormente, incluyeron en dichos motores algún tipo de
publicidad que rentabilizase el sistema.
Igualmente, los motores de búsqueda evolucionaron a portales de información con noticias y
contenidos propios que terminaron por volver a simplificarse, aunque hoy en día ofrecen
aplicaciones avanzadas, e incluso sistemas operativos basados en sus bases de datos.
En tu ordenador puedes escoger cuál es el motor de búsqueda predeterminado o cambiarlo en
función de tus gustos.
3. Las redes sociales y la Administración Pública
3
Algunos de los buscadores más populares son:
Ø Google: el mejor y más popular buscador que existe en la Internet. Fue creado en el año
1997 y más del 90% de los usuarios de la red utilizan su servicio. Además de ser un
motor de búsqueda, con el tiempo ha ido ampliando sus servicios hasta convertirse en el
líder absoluto. El objetivo principal del buscador de Google es el contenido de alta
calidad en las páginas web, en lugar de otro tipo de datos. Ofrece también otros
productos y servicios como el correo electrónico llamado Gmail, sus servicios de mapas
Google Maps y Google Earth, el sitio web de vídeos YouTube y otras utilidades web
como Google Libros o Google Noticias, Google Chrome y la red social Google+. Por
otra parte, lidera el desarrollo del sistema operativo basado en Linux, Android, orientado
a teléfonos inteligentes, tabletas, televisores y automóviles y en gafas de realidad
aumentada, las ya famosas Google Glass.
Ø Bing: Antes lo conocíamos con el nombre de Live Search, Windows Live Search y MSN
Search. Es el buscador oficial de Microsoft y se caracteriza por tener una imagen de
fondo muy atractiva. Además de la búsqueda tradicional te permite realizar una lista de
búsquedas relacionadas y personalizarlas de acuerdo a tus preferencias.
Ø Baidu: el buscador web utilizado en China, con los más de 1.300 millones de
habitantes, es un buscador que no para de crecer con un 18% de búsquedas en la red.
4. Las redes sociales y la Administración Pública
4
Ø Yahoo: Durante muchos años, fue el líder en búsquedas y poco a poco se fue haciendo
conocido como un portal, en el que además de buscar contenidos obtenías servicios de
alta calidad. Sin duda, el competidor nato de Google.
Ø Ask.com: También conocido como Ask Jeeves es un buscador que se caracteriza por la
respuesta a distintas preguntas. A simple vista parece un motor de búsqueda como
cualquier otro, sin embargo, intenta responder de forma sencilla aquellas preguntas que
pueden surgir a través de la búsqueda de la palabra clave que has realizado.
Ø Yandex: el motor de búsqueda de Rusia, es un buscador que está en auge gracias a la
gran población rusa.
Podemos utilizar cualquier buscador pero el sistema que se encarga de buscar todos estos datos,
para después ser enviados a analizar, se llama Spider.
Es un robot (código informático) que analiza cada web y los enlaces hasta que consigue
convertir toda esa trama de información en algo que pueda ser procesado por el motor de
búsqueda. Una vez el Spider ha realizado su trabajo, se indexa esa información de tal forma que
se pueda realizar una búsqueda para mostrar los datos de forma rápida al usuario. Sin embargo,
el robot no siempre se lleva consigo todos los datos de un sitio web…
5. Las redes sociales y la Administración Pública
5
Determina la importancia de este y, si analiza que los datos no son demasiado importantes para
la comunidad, simplemente envía una o dos páginas de información para el indexado. Por el
contrario, si evalúa y decide que la web es de alto valor en contenido, entonces envía toda la
información.
Esto significa que, para cada término introducido por el usuario, el buscador efectuará de forma
automática un cálculo y devolverá los resultados ordenados por relevancia. ¿Cómo se realiza
dicho cálculo? Esa es la pregunta del millón. Se realiza según un ALGORITMO diferente
para cada buscador. Obviamente, dicho algoritmo funciona en base a una fórmula, la cual no
se conoce.
Los directivos del principal buscador de la red, por supuesto nos referimos a Google, son tan
celosos con la fórmula de su algoritmo que ni siquiera sus propios empleados la conocen con
exactitud. Además, cada cierto tiempo se introducen cambios en la misma. Por consiguiente, al
tratarse de un algoritmo secreto, NADIE puede garantizar una primera posición en Google,
aunque sí una mejoría notable.
El ingeniero de Google Matt Cutts nos explica cómo funciona Google como motor de búsqueda
en el siguiente vídeo sobre el que puedes pulsar: https://youtu.be/MY42gAZqlSQ o bien lo
encontrarás en Youtube bajo el título: Como funciona el motor de búsqueda Google – Español
6. Las redes sociales y la Administración Pública
6
Google ha ido modificando los parámetros de dicho algoritmo con el fin de mejorar y afinar sus
búsquedas, tratando de que los primeros resultados sean siempre los que mejor casen con la
búsqueda del usuario y que tengan la máxima calidad tanto en estructura como en contenidos,
dando cada vez más relevancia a la actualización de los mismos.
De cara al usuario el trabajo de indexación es primordial. A la hora de buscar cualquier
elemento se hará por palabras claves, estas son las palabras más relevantes de un tema. Añadir a
una búsqueda artículos o determinantes no modifica la búsqueda, dado que lo realmente
importante son las palabras clave o keywords que se introducen.
Estos son algunos trucos:
Ø Si la frase que se introduce se encuentra entre “” (comillas) se buscará la totalidad del
contenido y no las palabras clave sueltas. Ten en cuenta que algunos resultados
relevantes pueden no mostrarse al utilizar las comillas en las búsquedas. Por ejemplo, si
se utilizan comillas para buscar "Alexander Bell", se omitirán las páginas que hagan
referencia a Alexander G. Bell.
Ø Busca en un sitio web específico: incluye site: delante de la consulta de búsqueda si
estás seguro de que la información que te interesa está incluida en un determinado tipo
de sitio (.org o .edu) o en un sitio específico. Por ejemplo, site:edu o site:nytimes.com
Ø Busca páginas relacionadas: utiliza el operador related: para buscar páginas que tengan
un contenido similar al de otra. Para ello, escribe related: seguido de la dirección del
sitio web. Por ejemplo, si encuentras un sitio web que te guste, puedes utilizar
related:[URL del sitio] para acceder a sitios web similares. Un caso real sería:
related:tusrecetasdecocina.com/receta-de-gazpacho-andaluz/
Ø Si a las palabras clave se le añade un + delante devolverá una búsqueda más cerrada,
eliminando aquellas otras palabras que puedan ser sinónimos o búsquedas relacionadas.
Ø No te preocupes por las mayúsculas. La Búsqueda de Google no distingue entre
mayúsculas y minúsculas. Obtendrás los mismos resultados al buscar tanto new york
times como New York Times. También corregirá la ortografía en caso de que escribas
una letra mal.
7. Las redes sociales y la Administración Pública
7
4.2.- Los directorios o marcadores sociales
Los directorios son servicios que organizan todas las direcciones web de forma jerarquizada, en
categorías y subcategorías, de tal forma que se pueda ir seleccionando lo que más interesa en
cada caso. Sería como una gran biblioteca mundial donde se puede acceder a secciones como
humanidades, arte, ciencia, noticias, etc. Aunque son más populares entre el público anglosajón,
son un gran recurso para obtener respuestas a preguntas complejas de todo tipo y perfectas para
encontrar fuentes de información especializadas, aplicaciones y recursos.
Los directorios albergan diferentes web por categorías y los propios webmasters pueden
dirigirse directamente a dichos directorios para que alberguen su propia web. Por lo tanto, los
marcadores sociales son herramientas que posibilitan la compilación de sitios web favoritos en
línea, de manera colaborativa, clasificada, organizada y accesible desde Internet.
Para organizar los enlaces se describe su contenido a través de etiquetas o tags. Las etiquetas
son palabras clave que los usuarios asignan a los favoritos para describirlos y facilitar el
almacenamiento y la posterior recuperación. En general la mayoría de estos servicios ofrece
prestaciones tales como la suscripción gratuita on line, un sistema de alerta que avisa al usuario
sobre las modificaciones en las categorías que interesan, la adición de notas o comentarios de
los usuarios, el envío de recomendaciones por correo y la creación de redes sociales entre
usuarios con los mismos intereses, entre otras. Aquí tienes algunos ejemplos:
• Quora – www.quora.com es una red social de preguntas indexadas por un motor de
búsqueda.
• Yahoo Answers – https://es.answers.yahoo.com es el directorio de preguntas puesto en
marcha por yahoo
• Reddit – www.reddit.com se trata de un marcador social donde se agregan y agrupan
contenidos sobre un mismo tema
• Delicious – delicious.com también es un marcador social muy popular donde se agregan
páginas de valor o buen contenido
• Digg – digg.com es un servicio donde reflejan los contenidos más compartidos y visitados
cada día.
8. Las redes sociales y la Administración Pública
8
4.3.- Metabuscadores
Los metabuscadores son sistemas que albergan en una misma herramienta diferentes buscadores.
Es decir, son buscadores de buscadores.
De esta forma se pueden poner varias palabras clave que devolverán los resultados de diferentes
motores, como Yahoo, Bing, Google, etc. Son menos usados que los buscadores en sí, pero son
interesantes si se pretende encontrar algo difícil de localizar.
Los metabuscadores permiten realizar búsquedas en varios motores al mismo tiempo, de tal
forma que se puede tener más fácil el acceso a la información que se busca.
Ø Mamma – www.mamma.com es uno de los más efectivos. Puede segmentar las
búsquedas por web, imágenes, video,noticias, conenido local y articulos de interés
Ø Metacrawler – www.metacrawler.co.uk es un metabuscador muy sencillo y fácil de usar
Ø OJOSE – www.ojose.com es un metabuscador especializado en recursos científicos y de
la web profunda
Ø Ixquick – www.ixquick.com
Ø Dogpile – www.dogpile.com uno de los clásicos
Ø Yippy – yippy.com
Ø DeeperWeb – deeperweb.com Otro metabuscador para la web profunda