Charla que di en CLINIC SUMMIT (10/2019), en Ensalada SEO (11/2019) y en SEOnderground (09/2020). Conté la importancia y la necesidad del desarrollo transdisciplinario del profesional SEO . Concretamente me centré en la aplicación de ciencia de datos en proyectos de posicionamiento orgánico.
Mostré ejemplos prácticos en Python y R de visualización, data mining, machine learning, experimentación y predicción aplicados en casos reales.
2. @natzir9 en #SEOnderground
En 2019, Google hizo 3.620
actualizaciones de su algoritmo
(~10 al día, 8 veces más que en
2009) basados en 464.065
experimentos con ‘qualities’.
Google Updates
INCERTIDUMBRE
https://www.google.com/search/howsearchworks/mission/users/
3. @natzir9 en #SEOnderground
En 2019, Google hizo 3.620
actualizaciones de su algoritmo
(~10 al día, 8 veces más que en
2009) basados en 464.065
experimentos con ‘qualities’.
Google Updates
INCERTIDUMBRE
https://www.google.com/search/howsearchworks/mission/users/
4. @natzir9 en #SEOnderground
Los 200 factores de Google no
existen. Son un mito extendido
de correlaciones. Pueden haber
decenas de miles y no sabemos
el peso de cada uno ni como se
interrelacionan entre sí.
Ranking Factors
INCERTIDUMBRE
https://moz.com/blog/the-myth-of-googles-200-ranking-factors
5. @natzir9 en #SEOnderground
Los 200 factores de Google no
existen. Son un mito extendido
de correlaciones. Pueden haber
decenas de miles y no sabemos
el peso de cada uno ni como se
interrelacionan entre sí.
Ranking Factors
INCERTIDUMBRE
https://moz.com/blog/the-myth-of-googles-200-ranking-factors
6. @natzir9 en #SEOnderground
Sector lleno de especulación y
conjeturas. Se hace un SEO de
checklist basado en “verbatim”
y falacias argumentativas que
se aprovecha de los sesgos
cognitivos.
Mala praxis
INCERTIDUMBRE
https://www.semrush.com/blog/guide-to-biggest-seo-myths-on-web/
https://es.wikipedia.org/wiki/Anexo:Sesgos_cognitivos
Photo: Thomas Herbrich
7. @natzir9 en #SEOnderground
Sector lleno de especulación y
conjeturas. Se hace un SEO de
checklist basado en “verbatim”
y falacias argumentativas que
se aprovecha de los sesgos
cognitivos.
Mala praxis
INCERTIDUMBRE
https://www.semrush.com/blog/guide-to-biggest-seo-myths-on-web/
https://es.wikipedia.org/wiki/Anexo:Sesgos_cognitivos
9. @natzir9 en #SEOnderground
INCERTIDUMBRE
En un entorno donde cada vez
tenemos menos control hacen
falta más respuestas.
El problema es que hay que
saber hacer las preguntas
correctas.
https://en.wikipedia.org/wiki/There_are_known_knowns
10. @natzir9 en #SEOnderground
SEO DEL RENACIMIENTO
“Nuevos problemas, requieren
nuevas soluciones; los problemas
sin resolver necesitan ser
repensados bajo nuevas
perspectivas”
https://patriciasalgado.com/2018/07/profesionales-del-renacimiento/
11. @natzir9 en #SEOnderground
SEO DEL RENACIMIENTO
“Nuevos problemas, requieren
nuevas soluciones; los problemas
sin resolver necesitan ser
repensados bajo nuevas
perspectivas”
https://patriciasalgado.com/2018/07/profesionales-del-renacimiento/
12. @natzir9 en #SEOnderground
SEO DEL RENACIMIENTO
DEEP
BROAD
Habilidad y conocimiento para trabajar fuera
de tu disciplina
Experiencia y
dominio en una
disciplina
concreta
Metáfora usada para describir a un
profesional con diversas habilidades.
La barra horizontal es la habilidad para
colaborar e innovar entre disciplinas, con
expertos en otras áreas, con el fin de
aplicar conocimiento en áreas en la que
uno no es un experto.
Profesional T-SHAPE
https://en.wikipedia.org/wiki/T-shaped_skills
13. @natzir9 en #SEOnderground
SEO DEL RENACIMIENTO
SEO
TECH & CODING, UX & UI, RESEARCH,
DATA ANALYSIS, CONTENT & PR
Metáfora usada para describir a un
profesional con diversas habilidades.
La barra horizontal es la habilidad para
colaborar e innovar entre disciplinas, con
expertos en otras áreas, con el fin de
aplicar conocimiento en áreas en la que
uno no es un experto.
Profesional T-SHAPE
https://en.wikipedia.org/wiki/T-shaped_skills
14. @natzir9 en #SEOnderground
SEO DEL RENACIMIENTO = DATA SCIENTIST
http://drewconway.com/zia/2013/3/26/the-data-science-venn-diagram
https://twitter.com/natzir9/status/1175698776226455553
Un SEO técnico no es un
científico de datos
16. @natzir9 en #SEOnderground
SEO DEL RENACIMIENTO = DATA SCIENTIST
Validez
Intuición
Automatización
Insight
Habilidades del SEO del renacimiento
• Automatizar tareas
• Usar datos para resolver problemas complejos
• Escribir historias convincentes de ideas difíciles
de entender
• Experimentar e inventar nuevos y efectivos
procesos
https://www.ranksense.com/empowering-a-new-generation-of-seos-with-python/
18. @natzir9 en #SEOnderground
SEO DEL RENACIMIENTO = DATA SCIENTIST
http://ucanalytics.com/blogs/r-vs-python-comparison-and-awsome-books-free-pdfs-to-learn-them/
19. 19
@natzir9 en #SEOnderground
CASO PRÁCTICO #1
• Topic modeling con TF-IDF
(TfidfVectorizer) y NMF
(técnica de ML de aprendizaje
no supervisado)
Recomendador semántico
de interlazado de artículos
https://gist.github.com/natzir
20. 20
@natzir9 en #SEOnderground
CASO PRÁCTICO #2
• Scrapping de la SERP de Google
para una query (en cualquier
localización e idioma)
• Etiquetado gramatical (PoS
tagging con Spacy) y
visualización de los resultados
Analizador semántico de la
SERP de Google
https://gist.github.com/natzir
21. 21
@natzir9 en #SEOnderground
CASO PRÁCTICO #3
• Se conecta a la API de GA
• Le indicas los dos segmentos del
test y las fechas antes y después
del cambio
• Calcula el impacto estimado del
efecto que tuvo lugar en esas
fechas
SEO A/B Testing con
CausalImpact en Python
http://bit.ly/seo-split-test
22. 22
@natzir9 en #SEOnderground
CASO PRÁCTICO #4
• Se conecta a la API de GA
• Le indicas un segmento y las
fechas antes y después del
cambio
• Calcula el impacto estimado del
efecto que tuvo lugar en esas
fechas
Test secuencial SEO con
CausalImpact en R
https://gist.github.com/natzir
23. 23
@natzir9 en #SEOnderground
CASO PRÁCTICO #5
• Se conecta a la API de GA
• Descompone el tráfico orgánico
en tendencia, estacionalidad (S)
y residuo
• Usa la estacionalidad como
variable exógena (X) para
mejorar el modelo
• Mediante pmdarima prueba
diversos modelos y se queda con
el mejor (menor AIC)
SEO forecasting con
SARIMAX y pmdarima
https://gist.github.com/natzir
24. 24
@natzir9 en #SEOnderground
CASO PRÁCTICO #6
• Se conecta a la API de SC
• Le indicas una propiedad,
dispositivo y las RegExp de las
secciones
• Crea una matriz con los datos de
SC para detectar oportunidades
• Organiza los datos por secciones
y por topics
• Crea una tabla con las URLs que
tienes que trabajar
Google Search Console
Opportunity Matrix
https://gist.github.com/natzir
25. 25
@natzir9 en #SEOnderground
CASO PRÁCTICO #7
• Revisa si la top query para la que
rankea cada URL está en el título
y la meta descripción
• Revisa que el título y la
descripción no se corte
• Revisa que los anchors text
internos y externos contengan la
top query
• Revisa si el CTR es mayor o igual
al promedio
CTR & Position Booster
https://gist.github.com/natzir
26. 26
@natzir9 en #SEOnderground
CASO PRÁCTICO #8
• Identifica posibles problemas de
canibalización con los datos de
Search Console
• Agrega de forma automática los
títulos y las meta descripciones
para facilitar el análisis.
Cannibalization
https://www.youtube.com/watch?v=zI_jkhSyAew
https://gist.github.com/natzir
27. 27
@natzir9 en #SEOnderground
RECURSOS ÚTILES
• Extracción de los datos de
Google Trends
• Predicción de la tendencia de
los términos
• Text mining de los términos
para encontrar relaciones
Minado de Google Trends
con R by @Eeysirhc
https://www.christopheryee.org/blog/mining-
google-trends-data-with-r-featuring-gtrendsr/
28. 28
@natzir9 en #SEOnderground
RECURSOS ÚTILES
• Dado un set de datos inicial de
contenidos, predice la
categoría del artículo
basándose en la url, el titular y
el texto
Clasificador de texto con
Python by @kav_gan
https://kavita-ganesan.com/news-classifier-with-
logistic-regression-in-python/
29. 29
@natzir9 en #SEOnderground
RECURSOS ÚTILES
• Descripción de imágenes
• Respuestas desde imágenes
• Q&A desde un texto
• Resumen de artículos
• Generación de artículos
Generando texto de
forma automática by
@hamletbatista
https://www.deepcrawl.com/blog/webinars/scaling-
automated-quality-text-generation-for-enterprise-
sites/
30. 30
@natzir9 en #SEOnderground
RECURSOS ÚTILES
• Descripción de imágenes
• Respuestas desde imágenes
• Q&A desde un texto
• Resumen de artículos
• Generación de artículos
Generando texto de
forma automática by
@hamletbatista
https://www.deepcrawl.com/blog/webinars/scaling-
automated-quality-text-generation-for-enterprise-
sites/
31. 31
@natzir9 en #SEOnderground
RECURSOS ÚTILES
• Descripción de imágenes
• Respuestas desde imágenes
• Q&A desde un texto
• Resumen de artículos
• Generación de artículos
Generando texto de
forma automática by
@hamletbatista
https://www.deepcrawl.com/blog/webinars/scaling-
automated-quality-text-generation-for-enterprise-
sites/
32. 32
@natzir9 en #SEOnderground
RECURSOS ÚTILES
• Encuentra dominios expirados
• Extracción de entidades de la
SERP
• Redirect mapping automático
• Resumen de artículos para
metadescripciones
• Y mucho más
Redefining Technical SEO
by @fighto
https://searchwilderness.com/mozcon-2019/
33. 33
@natzir9 en #SEOnderground
RECURSOS ÚTILES
• Estado del arte en Computer
Vision, NLP, Predicción, ML,
AI….
• Copias el fichero notebook en
Google Colab y ”ya” lo puedes
usar para tus proyectos.
Papers With Code
https://paperswithcode.com/sota
34. 34
@natzir9 en #SEOnderground
A QUIÉN SEGUIR EN DATA SCIENCE + SEO
@hamletbatista
ranksense.com
Hamlet Batista
@kav_gan
kavita-ganesan.com
Kavita Ganesan
searchwilderness.com
Paul Shapiro
@aysunakarsu
searchdatalogy.com
Aysun Akarsu
@jroakes
codeseo.io
@dawnieando
bertey.com
Dawn Anderson
@Eeysirhc
christopheryee.org
Christopher Yee
JR Oakes
@fighto
@DataChaz
charlywargnier.com
Charly Wargnier
jcchouinard.com
JC Chouinard
@GregBernhardt4
importsem.com
Greg Bernhardt
@BritneyMuller
codeseo.io
@jamesaphoenix12
understandingdata.com
James Phoenix
Britney Muller
@ChouinardJC
@cyberandy
wordlift.io
Andrea Volpini
@eliasdabbas
advertools.readthedocs.io
Elias Dabbas
35. 35
@natzir9 en #SEOnderground
PARA EMPEZAR EN PYTHON Y DATA SCIENCE
Manipulación y
análisis de datos
Pandas
Funciones
matemáticas de
alto nivel para
vectores y matrices
NumPy
Scraping de
documentos HTML
BeautifulSoup
Generación de
gráficos
matplotlib
36. 36
@natzir9 en #SEOnderground
PARA EMPEZAR EN PYTHON Y DATA SCIENCE
Machine Learing
para clasificación y
regresión
scikit-learn
El paquete
científico más
completo
scipy
Liberías de
Procesamiento de
Lenguaje Natural
spaCy & NLTK
Redes Neuronales,
Deep Learning y se
puede ejecurar
sobre Tensor Flow
Keras
NLTK
37. 37
@natzir9 en #SEOnderground
DÓNDE APRENDER DATA SCIENCE ONLINE
Data Scientist with
Python
DataCamp
Professional
Certificate in Data
Science
HardvardX
Machine Learning
A-Z™: Hands-On
Python & R In Data
Science
Udemy
Applied Data
Science with
Python
Specialization
Coursera