SE O MÁNTICA @lakil  -  SEO-20.com Lakil Essady
Modelo clásico de indexación
Funcionamiento actual de los buscadores Bases de datos de Google Índice inverso G   g l e
P recio, entrada, incluyen,conferencias,talleres,total, suman, horas, contenidos impartidos,4,salas,paralelas,ponentes, im...
La búsqueda en el índice es muy fácil usando booleanos  OR  y  AND
<ul><li>Meter todas las palabras en un saco no permite tener en cuenta las relaciones semánticas y sintácticas entre ellas...
¿SEMÁNTICA?
 
 
Belén Esteban la caga con la  cirugía estética Belén estaban ha intentado mejorar su cara y la ha cagado todavía más…  su ...
 
Resultados no relevantes
¿Porqué ocurre esto?
Falta de ontologías una ontología define los términos que se usan para describir y representar un cierto dominio.
Objeto Sujeto Predicado Estructura de una Ontología El recurso que  vayamos a describir Propiedad o relación del sujeto El...
Congreso Web reunión charla Ponentes personas expertos 4 de junio SEO buscadores marketing día fecha tiempo ahora actualme...
Congreso Web reunión charla Ponentes personas expertos 4 de junio SEO buscadores marketing día fecha tiempo ahora actualme...
Congreso SEO Profesional reunión charla Ponentes personas expertos Miguel López 4 de junio SEO buscadores marketing día fe...
El problema es que necesitamos muchísimas  ontologías  para que esto funcione.
Ontologías  más usadas
<ul><li>FOAF  (http://xmlns.com/foaf/0.1/): describiendo personas, las relaciones entre ellas y las cosas que crean y hace...
RDF
RDFa <div> Mi nombre es Roberto Sánchez, pero me llaman &quot;Rober&quot;. Esta es mi página principal:  <a href=&quot;htt...
RDFa HTML con RDFa <div xmlns:v=&quot; http://rdf.data-vocabulary.org/# &quot; typeof=&quot;v:Person&quot;> Mi nombre es  ...
RDFa HTML con RDFa  http://rdf.data-vocabulary.org/# <rdfs:Class rdf:ID=&quot; Person &quot;> <rdfs:comment>Represents a P...
RDFa HTML con RDFa  http://rdf.data-vocabulary.org/# Postal-code Adress Postal-code Street-adress region Country-name
RDFa HTML con RDFa  http://rdf.data-vocabulary.org/# Para visualizar Datos de archivos RDFa como  http://rdf.data-vocabula...
 
HTML5 y los microdatos
 
Mi nombre es Roberto Sánchez, pero me llaman &quot;Rober&quot;. Esta es mi página principal:  www.example.com. Vivo en Alc...
HTML enriquecido con Microdatos <div itemscope itemtype=&quot; http://data-vocabulary.org/Person &quot;>   Mi nombre es  <...
Microdatos  http://data-vocabulary.org/Person
schema.org Una serie de microdatos esquemas que los Webmasters podrían utilizar para sus Páginas Web para mejorar su apari...
<ul><li>Painting </li></ul><ul><li>Photograph </li></ul><ul><li>Recipe </li></ul><ul><li>Review </li></ul><ul><li>Sculptur...
 
 
 
 
 
 
Si le  estructuramos  tanto nuestros datos, será posible que Agentes inteligentes como Google  accedan  a nuestros datos, ...
Posible impacto comercial
Interpretación  de estructuras sintácticas
<ul><li>La separación de las palabras usando métodos estadísticos no permite identificar expresiones hechas o nombres de i...
Puta  AND  Madre Puta  OR  Madre Puta Madre – estupendo - genial
El gran incendio de Chicago del siglo XX
Para ello tiene que entender bien las sintagmas. <ul><li>Hay muchísimas posibles sintagmas: </li></ul><ul><li>El gran ince...
 
El gran incendio de Chicago del siglo XX
El video del incendio subido a facebook
Para entender los núcleos de las sintagmas Google estaría usando ya los llamados N-gramas: N-gramas: se usan para procesar...
 
En 2006 Google proceso una base de datos de 1.024.908.267.229 palabras en inglés (Un archivo comprimido de 24 GB) y se ha ...
Con la nueva infraestructura de Cafeine, probablemente esto ya esté en funcionamiento El gran Gran incendio Gran de chicag...
Comprar los resultados en un texto con otros resultados en otros documentos y calcular la probabilidad de aparición de un ...
Con la nueva infraestructura de  Cafeine , probablemente esto ya esté en funcionamiento
<ul><li>Implicaciones de los avances en la interpretación del lenguaje humano: </li></ul><ul><li>Usar siempre que podamos ...
 
¿PREGUNTAS? Twitter @lakil Blog SEO-20.com Gracias  
Próxima SlideShare
Cargando en…5
×

SEO y Web Semántica en Congreso Web

15.431 visualizaciones

Publicado el

Conferencia sobre el SEO y la semántica en Congreso Web Zaragoza. Microformatos, microdatos, ontologías etc.

Publicado en: Tecnología
6 comentarios
21 recomendaciones
Estadísticas
Notas
Sin descargas
Visualizaciones
Visualizaciones totales
15.431
En SlideShare
0
De insertados
0
Número de insertados
9.527
Acciones
Compartido
0
Descargas
193
Comentarios
6
Recomendaciones
21
Insertados 0
No insertados

No hay notas en la diapositiva.

SEO y Web Semántica en Congreso Web

  1. 1. SE O MÁNTICA @lakil - SEO-20.com Lakil Essady
  2. 2. Modelo clásico de indexación
  3. 3. Funcionamiento actual de los buscadores Bases de datos de Google Índice inverso G g l e
  4. 4. P recio, entrada, incluyen,conferencias,talleres,total, suman, horas, contenidos impartidos,4,salas,paralelas,ponentes, importante, networking, 500,asistentes España.
  5. 5. La búsqueda en el índice es muy fácil usando booleanos OR y AND
  6. 6. <ul><li>Meter todas las palabras en un saco no permite tener en cuenta las relaciones semánticas y sintácticas entre ellas. </li></ul><ul><li>Para mejorar este sistema se está trabajando en 2 líneas: </li></ul><ul><li>Entender las relaciones entre palabras ( semántica ) </li></ul><ul><li>Identificar grupos de palabras ( sintaxis ) </li></ul>
  7. 7. ¿SEMÁNTICA?
  8. 10. Belén Esteban la caga con la cirugía estética Belén estaban ha intentado mejorar su cara y la ha cagado todavía más… su nariz parece de una adicta a la droga… http://www.exemple.com/answers/belen-esteban-321/ * La noticia es solo ejemplo y no es un contenido real
  9. 12. Resultados no relevantes
  10. 13. ¿Porqué ocurre esto?
  11. 14. Falta de ontologías una ontología define los términos que se usan para describir y representar un cierto dominio.
  12. 15. Objeto Sujeto Predicado Estructura de una Ontología El recurso que vayamos a describir Propiedad o relación del sujeto El Valor del sujeto o el otro objeto con el que se quiere establecer una relación
  13. 16. Congreso Web reunión charla Ponentes personas expertos 4 de junio SEO buscadores marketing día fecha tiempo ahora actualmente mes hoy Evento seo conferencia Esta semana Ejemplo de una ontología
  14. 17. Congreso Web reunión charla Ponentes personas expertos 4 de junio SEO buscadores marketing día fecha tiempo ahora actualmente mes hoy Evento seo conferencia Esta semana Ejemplo de una ontología El buscador entenderá las relaciones entre palabras, y devolverá un resultado relevante
  15. 18. Congreso SEO Profesional reunión charla Ponentes personas expertos Miguel López 4 de junio SEO buscadores marketing día fecha tiempo ahora actualmente mes hoy Evento conferencia Esta semana Ejemplo de una ontología SEO es marketing se lleva acabo en buscadores Conferencia se lleva a cabo en un evento Congreso Web es un evento Congreso Web habla de SEO semana período de tiempo de siete días consecutivos 4 de junio es hoy Hoy forma parte de esta semana Congreso Web es esta semana Conferencia seo esta semana = Congreso Web
  16. 19. El problema es que necesitamos muchísimas ontologías para que esto funcione.
  17. 20. Ontologías más usadas
  18. 21. <ul><li>FOAF (http://xmlns.com/foaf/0.1/): describiendo personas, las relaciones entre ellas y las cosas que crean y hacen. </li></ul><ul><li>Geospatial (http://www.w3.org/2003/01/geo/wgs84_pos#): describiendo la posición de los objetos. </li></ul><ul><li>DOAP (http://usefulinc.com/ns/doap#): Describiendo proyectos de software libre mediante RDF, y que así puedan ser procesados fácilmente de una manera automática. </li></ul><ul><li>GoodRelations es un vocabulario estándar para comercio electrónico. </li></ul><ul><li>RDFa </li></ul><ul><li>OWL </li></ul><ul><li>ETC… </li></ul>
  19. 22. RDF
  20. 23. RDFa <div> Mi nombre es Roberto Sánchez, pero me llaman &quot;Rober&quot;. Esta es mi página principal: <a href=&quot;http://www.example.com&quot;> www.example.com </a>. Vivo en Alcobendas (Madrid) y trabajo de ingeniero en ACME S.A. </div> HTML sin RDF
  21. 24. RDFa HTML con RDFa <div xmlns:v=&quot; http://rdf.data-vocabulary.org/# &quot; typeof=&quot;v:Person&quot;> Mi nombre es <span property=&quot;v:name &quot;> Roberto Sánchez </span> , pero me llaman <span property=&quot;v:nickname&quot; > Rober </span>. Esta es mi página principal: <a href=&quot;http://www.example.com&quot; rel=&quot;v:url&quot; > www.example.com </a>. Vivo en Alcobendas (Madrid) y trabajo de <span property=&quot;v:title&quot; > ingeniero </span> en <span property=&quot;v:affiliation&quot; > ACME S.A. </span>. </div> Declarar el NameSpace que vaymos a usar
  22. 25. RDFa HTML con RDFa http://rdf.data-vocabulary.org/# <rdfs:Class rdf:ID=&quot; Person &quot;> <rdfs:comment>Represents a Person, living/dead/fictional.</rdfs:comment> <rdfs:subClassOf rdf:resource=&quot;http://www.w3.org/1999/02/22-rdf-syntax-ns#Resource&quot;/> </rdfs:Class> <rdf:Property rdf:ID=&quot; name &quot;> <rdfs:domain rdf:resource=&quot;http://www.w3.org/1999/02/22-rdf-syntax-ns#Resource&quot;/> </rdf:Property> <rdf:Property rdf:ID=&quot; nickname &quot;> <rdfs:domain rdf:resource=&quot;#Person&quot;/> </rdf:Property> <rdf:Property rdf:ID=&quot; photo &quot;> <rdfs:domain rdf:resource=&quot;http://www.w3.org/1999/02/22-rdf-syntax-ns#Resource&quot;/> </rdf:Property>
  23. 26. RDFa HTML con RDFa http://rdf.data-vocabulary.org/# Postal-code Adress Postal-code Street-adress region Country-name
  24. 27. RDFa HTML con RDFa http://rdf.data-vocabulary.org/# Para visualizar Datos de archivos RDFa como http://rdf.data-vocabulary.org/# Se puede usar RDF Gravity 1.0
  25. 29. HTML5 y los microdatos
  26. 31. Mi nombre es Roberto Sánchez, pero me llaman &quot;Rober&quot;. Esta es mi página principal: www.example.com. Vivo en Alcobendas (Madrid) y trabajo de ingeniero en ACME S.A. Texto <div> Mi nombre es Roberto Sánchez, pero me llaman &quot;Rober&quot;. Esta es mi página principal: <a href=&quot;http://www.example.com&quot;> www.example.com </a>. Vivo en Alcobendas (Madrid) y trabajo de ingeniero en ACME S.A. </div> HTML clásico
  27. 32. HTML enriquecido con Microdatos <div itemscope itemtype=&quot; http://data-vocabulary.org/Person &quot;> Mi nombre es <span itemprop=&quot;name&quot;> Roberto Sánchez </span> , pero me llaman <span itemprop=&quot;nickname&quot;> Rober </span> . Esta es mi página principal: <a href=&quot;http://www.example.com&quot; itemprop=&quot;url&quot;> www.example.com </a> . Vivo en Alcobendas (Madrid) y trabajo de <span itemprop=&quot;title&quot;> ingeniero </span> en <span itemprop=&quot;affiliation&quot;> ACME S.A. </span> . </div>
  28. 33. Microdatos http://data-vocabulary.org/Person
  29. 34. schema.org Una serie de microdatos esquemas que los Webmasters podrían utilizar para sus Páginas Web para mejorar su apariencia en buscadores, pactados por Google Yahoo y Bing
  30. 35. <ul><li>Painting </li></ul><ul><li>Photograph </li></ul><ul><li>Recipe </li></ul><ul><li>Review </li></ul><ul><li>Sculpture </li></ul><ul><li>TVEpisode </li></ul><ul><li>TVSeason </li></ul><ul><li>TVSeries </li></ul><ul><li>WebPage </li></ul><ul><li>WebPageElement </li></ul><ul><li>Event </li></ul><ul><li>Organization </li></ul><ul><li>Person </li></ul><ul><li>Place </li></ul><ul><li>Product </li></ul><ul><li>CreativeWork </li></ul><ul><li>Article </li></ul><ul><li>Blog </li></ul><ul><li>Book </li></ul><ul><li>ItemList </li></ul><ul><li>Map </li></ul><ul><li>MediaObject </li></ul><ul><li>Movie </li></ul><ul><li>MusicPlaylist </li></ul><ul><li>MusicRecording </li></ul>
  31. 42. Si le estructuramos tanto nuestros datos, será posible que Agentes inteligentes como Google accedan a nuestros datos, que las puedan compartir , y presentar de la forma (diseño) que ellos quieran.
  32. 43. Posible impacto comercial
  33. 44. Interpretación de estructuras sintácticas
  34. 45. <ul><li>La separación de las palabras usando métodos estadísticos no permite identificar expresiones hechas o nombres de identidades. </li></ul><ul><li>Tirar cohetes </li></ul><ul><li>Tocar los huevos </li></ul><ul><li>De puta madre </li></ul><ul><li>Dar la lata </li></ul>
  35. 46. Puta AND Madre Puta OR Madre Puta Madre – estupendo - genial
  36. 47. El gran incendio de Chicago del siglo XX
  37. 48. Para ello tiene que entender bien las sintagmas. <ul><li>Hay muchísimas posibles sintagmas: </li></ul><ul><li>El gran incendio </li></ul><ul><li>Chicago en el siglo XX </li></ul><ul><li>El grán incendio de chicago del siglo XX </li></ul>
  38. 50. El gran incendio de Chicago del siglo XX
  39. 51. El video del incendio subido a facebook
  40. 52. Para entender los núcleos de las sintagmas Google estaría usando ya los llamados N-gramas: N-gramas: se usan para procesar estadísticamente el lenguaje humano, y detectar las posibles sintagmas. Unigramas: unidades de una sola palabra Bigramas: unidades de dos palabras Trigramas: unidades de tres palabras …
  41. 54. En 2006 Google proceso una base de datos de 1.024.908.267.229 palabras en inglés (Un archivo comprimido de 24 GB) y se ha encontrado: Número de fichas: 1.024.908.267.229 Número de frases: 95.119.665.584 Número de unigramas: 13.588.391 Número de bigramas: 314.843.401 Número de trigramas: 977.069.902 Número de fourgrams: 1.313.818.354 Número de fivegrams: 1.176.470.663
  42. 55. Con la nueva infraestructura de Cafeine, probablemente esto ya esté en funcionamiento El gran Gran incendio Gran de chicago De chicago gran Chicago XX Siglo XX ….
  43. 56. Comprar los resultados en un texto con otros resultados en otros documentos y calcular la probabilidad de aparición de un término determinado: G-gramas Probabilidad de aparición El gran SI Gran incendio NO Gran de chicago SI De chicago gran NI Siglo XX SI … …
  44. 57. Con la nueva infraestructura de Cafeine , probablemente esto ya esté en funcionamiento
  45. 58. <ul><li>Implicaciones de los avances en la interpretación del lenguaje humano: </li></ul><ul><li>Usar siempre que podamos un etiquetado semántico </li></ul><ul><li>El orden en el que se escriben las palabras es importante, la presencia de las palabras clave de forma aislada no funcionará igual de bien. </li></ul><ul><li>Las preposiciones vuelven a ser importantes, los n-gramas los toman en cuenta para poder identificar el núcleo del sintagma. </li></ul><ul><li>La Relevancia supera a popularidad. </li></ul>
  46. 60. ¿PREGUNTAS? Twitter @lakil Blog SEO-20.com Gracias 

×