Centro de Competencias Posicionamiento y Redes Sociales Fernando Fominaya [email_address] 29 de julio de 2010 Google: cómo funciona y en qué nos afecta
Cómo busca Google WEB Crawler Module Repositorio de páginas Módulo de indexación Consulta Módulo de clasificación Índice Contenidos usuario Índice Estructura Índice especial
Módulos independientes de la consulta Crawler Module: crea las arañas que peinan la red en busca de páginas web. A partir de una url inicial, el algoritmo va recorriendo urls vinculadas. Arroja dos valores: Una lista de urls identificadas. La estructura de vínculos de las urls. Ejemplo para cuatro urls: Cuando una url 1 contiene un hipervínculo a una url 2, la matriz contiene un 1 en (url1/url2). 1 0 0 0 1 0 0 0 0 1 1 1 url 1 url 2 url 4 url 1 url 2 url 4 0 1 1 1 url 3 url 3
Módulo de Indexación: poda las páginas hasta dejar solo la información fundamental. Tiene especialmente en cuenta títulos, descripciones, hipervínculos, palabras en negrita o en tamaño destacado. La información se guarda en índices. Hay tres principales: Índice de contenido: guarda la información relevante del contenido de las páginas. Índice de estructura: guarda la información de la estructura de hipervínculos. Índice especial: información sobre imágenes, pdfs, etc. Módulos independientes de la consulta
Índice de contenido: guarda los términos que figuran en cada página indexada. Ejemplo: Término 1: (ábaco) – url 2,34,543 “ Término 10: (azuzar) – url 12,23,323,433,825 “ Término m: (zorro) – url 34,222,323,487,825 Módulos independientes de la consulta
Procesado de consultas Módulo de consultas (Query Module): cuando el usuario introduce la consulta, busca páginas con resultados relevantes. La consulta “azuzar zorro”, dará como resultado en el ejemplo anterior las páginas 323 y 825, que son las que tiene los dos términos. Muchos buscadores solo llegan hasta aquí. En Google los resultados son pasados al Módulo de clasificación (Ranking Module), que decide la importancia de cada resultado y, por tanto, el orden en el que deben aparecer.
Clasificación de resultados relevantes Módulo de clasificación ( Ranking ). Clasifica los resultados en función de la: Puntuación por contenido (relevancia) Puntuación por popularidad (autoridad o PageRank).
Puntuación por contenido (relevancia): Tiene en cuenta, por ejemplo, si el término buscado está en el  título , en los  metatags  y  cuantas veces aparece en el texto . Ejemplo: zorro url 323 ( 1 , 1 , 5 ), 825 ( 0 , 0 , 3 ). La puntuación por contenido es de 7 para la url 323 y de 3 para la 825. Si la búsqueda es de dos términos (“azuzar zorro”), se multiplican las puntuaciones de cada término. Clasificación de resultados relevantes
Clasificación de resultados relevantes
Puntuación por popularidad (autoridad o PageRank) de mi página. Es la suma de las puntuaciones por popularidad de todas las páginas que señalan a mi url. Cuanto más importantes son las páginas a las que está vinculada mi url, más autoridad tiene. Hay un factor corrector que penaliza el exceso de vínculos. También influye la antigüedad de la url. La barra de Google en el navegador da un PageRank aproximado de la página visualizada. El máximo es 10. Clasificación de resultados relevantes PageRank
Un buen resumen:
¿Cómo ha influido Google en el desarrollo de la red? Antes de Google la web era estática y primaba el volumen. La importancia de la vinculación de páginas recompensa el intercambio de información y el referenciar las fuentes. Casi no se puede tener un portal popular si no hay un blog integrado. Se promociona la comunicación bidireccional. Se puede llegar “arriba” solo con mérito. A menudo encontramos un modesto tweet en primera posición del buscador.
Referencias Referencias: PPCBlog Bloggingpro Inbound Marketing, B. Halligan, D.Shah Page Rank and beyond, Langville and Meyer

¿Cómo funciona Google?

  • 1.
    Centro de CompetenciasPosicionamiento y Redes Sociales Fernando Fominaya [email_address] 29 de julio de 2010 Google: cómo funciona y en qué nos afecta
  • 2.
    Cómo busca GoogleWEB Crawler Module Repositorio de páginas Módulo de indexación Consulta Módulo de clasificación Índice Contenidos usuario Índice Estructura Índice especial
  • 3.
    Módulos independientes dela consulta Crawler Module: crea las arañas que peinan la red en busca de páginas web. A partir de una url inicial, el algoritmo va recorriendo urls vinculadas. Arroja dos valores: Una lista de urls identificadas. La estructura de vínculos de las urls. Ejemplo para cuatro urls: Cuando una url 1 contiene un hipervínculo a una url 2, la matriz contiene un 1 en (url1/url2). 1 0 0 0 1 0 0 0 0 1 1 1 url 1 url 2 url 4 url 1 url 2 url 4 0 1 1 1 url 3 url 3
  • 4.
    Módulo de Indexación:poda las páginas hasta dejar solo la información fundamental. Tiene especialmente en cuenta títulos, descripciones, hipervínculos, palabras en negrita o en tamaño destacado. La información se guarda en índices. Hay tres principales: Índice de contenido: guarda la información relevante del contenido de las páginas. Índice de estructura: guarda la información de la estructura de hipervínculos. Índice especial: información sobre imágenes, pdfs, etc. Módulos independientes de la consulta
  • 5.
    Índice de contenido:guarda los términos que figuran en cada página indexada. Ejemplo: Término 1: (ábaco) – url 2,34,543 “ Término 10: (azuzar) – url 12,23,323,433,825 “ Término m: (zorro) – url 34,222,323,487,825 Módulos independientes de la consulta
  • 6.
    Procesado de consultasMódulo de consultas (Query Module): cuando el usuario introduce la consulta, busca páginas con resultados relevantes. La consulta “azuzar zorro”, dará como resultado en el ejemplo anterior las páginas 323 y 825, que son las que tiene los dos términos. Muchos buscadores solo llegan hasta aquí. En Google los resultados son pasados al Módulo de clasificación (Ranking Module), que decide la importancia de cada resultado y, por tanto, el orden en el que deben aparecer.
  • 7.
    Clasificación de resultadosrelevantes Módulo de clasificación ( Ranking ). Clasifica los resultados en función de la: Puntuación por contenido (relevancia) Puntuación por popularidad (autoridad o PageRank).
  • 8.
    Puntuación por contenido(relevancia): Tiene en cuenta, por ejemplo, si el término buscado está en el título , en los metatags y cuantas veces aparece en el texto . Ejemplo: zorro url 323 ( 1 , 1 , 5 ), 825 ( 0 , 0 , 3 ). La puntuación por contenido es de 7 para la url 323 y de 3 para la 825. Si la búsqueda es de dos términos (“azuzar zorro”), se multiplican las puntuaciones de cada término. Clasificación de resultados relevantes
  • 9.
  • 10.
    Puntuación por popularidad(autoridad o PageRank) de mi página. Es la suma de las puntuaciones por popularidad de todas las páginas que señalan a mi url. Cuanto más importantes son las páginas a las que está vinculada mi url, más autoridad tiene. Hay un factor corrector que penaliza el exceso de vínculos. También influye la antigüedad de la url. La barra de Google en el navegador da un PageRank aproximado de la página visualizada. El máximo es 10. Clasificación de resultados relevantes PageRank
  • 11.
  • 12.
    ¿Cómo ha influidoGoogle en el desarrollo de la red? Antes de Google la web era estática y primaba el volumen. La importancia de la vinculación de páginas recompensa el intercambio de información y el referenciar las fuentes. Casi no se puede tener un portal popular si no hay un blog integrado. Se promociona la comunicación bidireccional. Se puede llegar “arriba” solo con mérito. A menudo encontramos un modesto tweet en primera posición del buscador.
  • 13.
    Referencias Referencias: PPCBlogBloggingpro Inbound Marketing, B. Halligan, D.Shah Page Rank and beyond, Langville and Meyer

Notas del editor

  • #2 Os quiero comentar brevemente qué vamos a hacer en el CC. Para eso lo mejor es empezar por contar por qué lo hemos fundado. Vamos a ponernos en contexto. El 60% de los españoles usa internet, por tanto la mayoría de la población. Lo usa para adquirir información y para tomar decisiones.
  • #13 Si destaco el trabajo de los demás, me ayudo