SEOWars: Rstudio aplicado a SEO #sob22

20/6/22 1
@mjcachon
#SOB2022
SEo WARS
@mjcachon
#SOB2022

20/6/22 3
@mjcachon
#SOB2022
“Deja que el pasado muera.
Mátalo, si es necesario”

20/6/22 4
@mjcachon
#SOB2022
2008
Lenguaje: COBOL

20/6/22 5
@mjcachon
#SOB2022
2010
Lenguajes: Js, Php, Java

20/6/22 6
@mjcachon
#SOB2022
2017-2019
Lenguaje: Python

20/6/22 7
@mjcachon
#SOB2022
2019-2020
Lenguaje: C

20/6/22 9
@mjcachon
#SOB2022
Pero entonces…

20/6/22 10
@mjcachon
#SOB2022
2020-2021
Lenguaje: R, SQL

20/6/22 11
@mjcachon
#SOB2022
DISCLAIMER: No quiero ser programadora

20/6/22 12
@mjcachon
#SOB2022
Mi objetivo real es…
ENTENDER
(y abrir mi mente)

20/6/22 13
@mjcachon
#SOB2022
Entender los fundamentos básicos
de la programación

20/6/22 14
@mjcachon
#SOB2022
Entender cómo mejoramos en SEO
con programación

20/6/22 15
@mjcachon
#SOB2022
Entender cómo ahorrar tiempo (y
dinero) en tareas y análisis SEO

20/6/22 16
@mjcachon
#SOB2022
Entender cómo ganar cierta
autonomía para no depender

20/6/22 17
@mjcachon
#SOB2022
Entender el potencial de todo lo que
se puede hacer

20/6/22 18
@mjcachon
#SOB2022
Y en suma: APRENDER

20/6/22 19
@mjcachon
#SOB2022
Aprender
Compartir
Repetir

20/6/22 20
@mjcachon
#SOB2022
RACIONALIZANDO COMO HACEMOS
ANÁLISIS
INCIDENCIA
RECOLECTAR
DATOS
EXPLORAR
DATOS
PREPARAR
DATOS
VISUALIZAR
DATOS
ANÁLISIS
NOS VAMOS A CENTRAR AQUÍ

20/6/22 21
@mjcachon
#SOB2022
“No. No lo
intentes.
Hazlo, o no lo
hagas, pero no
lo intentes”

20/6/22 22
@mjcachon
#SOB2022
EXCEL, ¿HÉROE O
VILLANO?

20/6/22 23
@mjcachon
#SOB2022
¡ DEPENDE !

20/6/22 24
@mjcachon
#SOB2022
VIVIMOS RODEADOS DE EXCEL / CSV / SHEETS

20/6/22 25
@mjcachon
#SOB2022
CASO DE USO:
BUSQUEMOS KEYWORDS RELACIONADAS
CON MARCAS DE DEPORTE

20/6/22 26
@mjcachon
#SOB2022
¿CÓMO LO HARÍAMOS CON EXCEL?
1. Abrir ficheros uno a uno y fusionarlos en uno solo
2. Usar filtros o fórmulas avanzadas para ir sustituyendo celdas vacías
3. Quitar duplicados en base a la columna keywords
4. Ordenar por volumen (o criterio elegido)
5. ¿Queremos incluso, clusterizar por temas?

20/6/22 27
@mjcachon
#SOB2022
NOS VAMOS A ENCONTRAR CON:
DATOS VACÍOS
INTERCALADOS

20/6/22 28
@mjcachon
#SOB2022
ELEMENTOS SIN
DATOS

20/6/22 29
@mjcachon
#SOB2022
MENOS AGILIDAD PARA
HACER AGRUPACIONES

20/6/22 30
@mjcachon
#SOB2022
=SI(ESNUMERO(HALLAR(”luanvi";C21));”luanvi";SI(ESNU
MERO(HALLAR(”nike";C21));”nike";SI(ESNUMERO(HALLA
R(”adidas";C21));”adidas";SI(ESNUMERO(HALLAR(”sketc
hers";C21));”sketchers";SI(ESNUMERO(HALLAR(”new
balance";C21));”new balance";”otras")))))

20/6/22 33
@mjcachon
#SOB2022
1.Abrir ficheros uno a uno y fusionarlos en uno solo.
setwd("~/Downloads/nueva/")
lst <- list.files()
df <- data.frame()
for(table in lst){
dataFromExcel <- read_excel(table)
df <- rbind(df,dataFromExcel)
}

20/6/22 34
@mjcachon
#SOB2022
2.Usar filtros o fórmulas avanzadas para ir sustituyendo
celdas vacías
df <- df %>% mutate_if(is.numeric , replace_na, replace = 1)
df <- df %>% mutate_if(is.character , replace_na, replace = "unknown")
df <- df %>% mutate_if(is.logical , replace_na, replace = "unknown")
df <- df[!duplicated(df[,c('Keywords')]),]
df_limpio <- df[with(df, order(-df$`Search Volume (Average)`)), ]

20/6/22 35
@mjcachon
#SOB2022
3.Quitar duplicados en base a la columna keywords

20/6/22 36
@mjcachon
#SOB2022
4.Ordenar por volumen (o criterio elegido)

20/6/22 37
@mjcachon
#SOB2022
6. ¿Queremos incluso, clusterizar por temas?
df_limpio$topic[grepl("nike",
df_limpio$Keywords)] <- "nike"
df_limpio$topic[grepl("adidas",
df_limpio$Keywords)] <- "adidas"
df_limpio$topic[grepl("asics",
df_limpio$Keywords)] <- "asics"
df_limpio$topic[grepl("new balance",
df_limpio$Keywords)] <- "new balance”
…

20/6/22 38
@mjcachon
#SOB2022
SCRIPT PARA HACER ESTA TAREA: SE EJECUTA
EN SEGUNDOS

20/6/22 40
@mjcachon
#SOB2022
CHAMPIONS
POTENTIAL
CHAMPIONS
NICHE

20/6/22 41
@mjcachon
#SOB2022
Fuente imagen: revistagq.com
“Así es cómo se gana una guerra.
No luchando contra lo que odias,
sino salvando lo que amas”

20/6/22 42
@mjcachon
#SOB2022
CASO DE USO:
DATOS DE HERRAMIENTAS SEO QUE
PODEMOS PROCESAR, LIMPIAR Y
AMPLIAR

20/6/22 43
@mjcachon
#SOB2022
ANÁLISIS DE BACKLINKS CON AHREFS
LOS DATOS
AGREGADOS NO LOS
TENEMOS EN EL
EXPORT

20/6/22 44
@mjcachon
#SOB2022
ANÁLISIS DE BACKLINKS CON AHREFS
LOS DATOS
AGREGADOS NO LOS
TENEMOS EN EL
EXPORT

20/6/22 45
@mjcachon
#SOB2022
DESCARGA DE TODOS LOS BACKLINKS

20/6/22 46
@mjcachon
#SOB2022
OPCIÓN EXTRA: API AHREFS CON SCREAMING FROG
PERO: SOLO
SACA 3
MÉTRICAS

20/6/22 48
@mjcachon
#SOB2022
CRUZANDO DATOS Y MAXIMIZANDO LA
INFORMACIÓN

20/6/22 49
@mjcachon
#SOB2022
LOS ENLACES
EXTERNOS LLEGAN
A PÁGINAS
INTERNAS CON ALTO
LINK SCORE

20/6/22 50
@mjcachon
#SOB2022
RANGOS, TIPOS, ORÍGENES Y DESTINOS

20/6/22 51
@mjcachon
#SOB2022
LOS ENLACES
EXTERNOS LLEGAN A
PÁGINAS DE MENOS
DE 500 PALABRAS

20/6/22 52
@mjcachon
#SOB2022
INFORMACIÓN

20/6/22 53
@mjcachon
#SOB2022
Habilitar el inspector en Screaming Frog

20/6/22 54
@mjcachon
#SOB2022
EXISTEN POST QUE
FUERON
RASTREADOS HACE
8 MESES

20/6/22 55
@mjcachon
#SOB2022
PRÁCTICAMENTE
TODAS SE RESPETAN
TODOS LOS
CANONICALS

20/6/22 56
@mjcachon
#SOB2022
INFORMACIÓN

20/6/22 57
@mjcachon
#SOB2022
No hay API de SISTRIX en Screaming Frog

20/6/22 58
@mjcachon
#SOB2022
Añadir métricas de SISTRIX al crawleo

20/6/22 59
@mjcachon
#SOB2022
Fuente imagen: starwars.fandom.com
“Este es el camino”

20/6/22 60
@mjcachon
#SOB2022
Rastrea Indexa Rankea
ANÁLISIS SEO RECURRENTES
• RASTREABILIDAD
• LOGS
• ROBOTS.TXT
• SITEMAP
• …
• INDEXABILIDAD
• META ROBOTS
• CANONICAL
• COBERTURA
• …
• RANKINGS
• POPULARIDAD
• TRÁFICO
• CONTENIDOS
• …

20/6/22 61
@mjcachon
#SOB2022
CASO DE USO:
AUTOMATIZAR ANÁLISIS RECURRENTES Y
CREANDO DOCUMENTO DESDE R

20/6/22 63
@mjcachon
#SOB2022
Distribución de hits por estado de indexabilidad

20/6/22 64
@mjcachon
#SOB2022
Distribución de hits por versión de ua y día

20/6/22 65
@mjcachon
#SOB2022
Rango de visibilidad según Intent
RANKINGS ACTUALES
CON INTENCIÓN DE
TRANSACCIÓN

20/6/22 66
@mjcachon
#SOB2022
Rango de visibilidad según rankings
Otros posibles cruces de datos:
1. Search Intent
2. Tipo de keyword
3. Rango de volumen/competencia
4. Tipo de url
https://www.mjcachon.com/blog/analizar-visibilidad-sistrix-r/

20/6/22 67
@mjcachon
#SOB2022
Fuente imagen: wallpaperaccess.com
“Que la fuerza te acompañe”

20/6/22 68
@mjcachon
#SOB2022
CLIENTE :
“Quiero trasmitir mis
preocupaciones con la
tendencia de Sistrix”

20/6/22 69
@mjcachon
#SOB2022
¿SE VIENE DRAMA?

20/6/22 70
@mjcachon
#SOB2022
1. ¿Rumores de Update?
12 de enero https://www.seroundtable.com/google-algorithm-update-january-12-30748.html
27 de enero https://www.seroundtable.com/small-google-search-ranking-algorithm-update-30843.html
8 de febrero https://www.seroundtable.com/google-search-ranking-algorithm-update-30898.html
17 de febrero https://www.seroundtable.com/google-search-ranking-algorithm-update-february-17th-30944.html
2 y 3 de marzo https://www.seroundtable.com/google-search-ranking-algorithm-update-31028.html
6 y 7 de marzo https://www.seroundtable.com/google-search-ranking-algorithm-instability-update-31047.html
11 de marzo https://www.seroundtable.com/google-search-ranking-update-last-night-31067.html
30 de marzo https://www.seroundtable.com/google-search-ranking-algorithm-update-31167.html
30 de abril https://www.seroundtable.com/google-ranking-algorithm-update-product-reviews-related-31348.html
7 y 9 de mayor https://www.seroundtable.com/google-search-ranking-algorithm-tremors-31389.html
13 de mayo https://www.seroundtable.com/google-search-ranking-algorithm-update-31415.html
19 y 20 de mayo https://www.seroundtable.com/google-search-ranking-algorithm-update-31452.html
22 de mayo https://www.seroundtable.com/google-algorithm-update-huge-31464.html
CONJETURAS INICIALES

20/6/22 71
@mjcachon
#SOB2022
2. SISTRIX
- Ya sabéis que SISTRIX solo se fija en 1.000.000 de palabras, por lo que en sectores con
cierto volumen de palabras, el gráfico en ocasiones puede estar desalineado con el tráfico orgánico (no digo
que sea el caso).
- Todas las herramientas atraviesan por bugs y momentos en los que los datos pueden
fluctuar por dichos errores puntuales

20/6/22 72
@mjcachon
#SOB2022
% de la realidad
Representativo, pero parcial

20/6/22 73
@mjcachon
#SOB2022
3. ¿Incidencias arrastradas en el tiempo?
Categoría 1
Categoría 2
Categoría 3
Categoría 4
…
…

20/6/22 75
@mjcachon
#SOB2022
La gráfica roja es lo que más se
parecería a la tendencia de SISTRIX
Datos sin estacionalidad

20/6/22 76
@mjcachon
#SOB2022
Observaciones reales
Estacionalidad identificada
Tendencia a largo plazo
Ruido/Hechos no previsibles

20/6/22 77
@mjcachon
#SOB2022
LECTURAS E INTERPRETACIONES
1. La tendencia se ha frenado, pero sigue siendo ascendente, no hay caída como tal, pero
desaceleramos.
2. En la última fila se ve que en 2020, los meses de marzo abril y mayo, mayoritariamente,
tienen unos picos que no son medibles en la serie temporal, pero que podemos asociar al
confinamiento (15 de marzo a 21 de junio).
3. Más recientemente, se ve que en mayo hay un pico imprevisible, que quizás puede ser
debido a los rumores de update, pero esto es solo una hipótesis o conjetura, no sé si
vosotros podéis ubicar algún otro fenómeno o suceso en mayo que pueda ser externo a
Analytics.

20/6/22 78
@mjcachon
#SOB2022
Forecast en el
momento de la caída
Vs
Realidad

20/6/22 79
@mjcachon
#SOB2022
Fuente imagen: espinof.com
“La capacidad de hablar no te
hace inteligente”

20/6/22 80
@mjcachon
#SOB2022
Acceso a APIs

20/6/22 81
@mjcachon
#SOB2022
API DE SISTRIX
https://api.sistrix.com/domain.sichtbarkeitsindex
?api_key=[API_KEY]
&country=es
&date=2022-06-17
&mobile=yes
&domain=seonthebeach.es
“ENTRAR A COGER DATOS DE SISTRIX SIN USAR LA INTERFAZ DE SISTRIX”
https://www.mjcachon.com/blog/api-sistrix-r-usos/

20/6/22 83
@mjcachon
#SOB2022
How it started…

20/6/22 84
@mjcachon
#SOB2022
How
its going…
https://www.mjcachon.com/google-core-updates/

20/6/22 85
@mjcachon
#SOB2022 https://www.mjcachon.com/google-core-updates/
How
its going…

20/6/22 86
@mjcachon
#SOB2022
SI NO TE HE CONVENCIDO YO, AL
MENOS, HAZ CASO A JOHNMU
https://johnmu.com/2022-r-startup/

20/6/22 87
@mjcachon
#SOB2022
¿Alguna duda?
¡GRACIAS!
hola@laikateam.com

20/6/22 89
@mjcachon
#SOB2022
Recursos adicionales
1. https://remibacha.com/en/r-seo-guide/
2. https://remibacha.com/en/backlinks-r/
3. https://remibacha.com/en/keyword-clustering-r/
4. https://www.quora.com/Can-R-be-used-for-SEO
5. https://www.rforseo.com/
6. https://www.gokam.co.uk/export-your-data-from-r/
7. https://www.gokam.co.uk/perform-automatic-browser-tests-with-selenium-r/
8. https://www.dataquest.io/blog/r-api-tutorial/
9. https://data-seo.com/2017/12/28/advanced-r-programming-seo-crawler/
10. https://code.markedmondson.me/search-console-google-analytics-r-keyword-research/
11. https://josebaruiz.com/como-descubrir-contenido-duplicado-en-seo-utilizando-r-el-lenguaje-de-programacion-estadistica/
12. https://journeytodatascientist.blog/2020/03/24/tf-idf-for-seo-with-r/
13. https://woutersfaq.medium.com/using-r-programming-to-utilise-google-ads-data-for-seo-keyword-research-778c1bb381fe
14. https://edit.co.uk/blog/keyword-rankings-and-forecasting-in-seo-using-shiny/
15. https://data4seo.wordpress.com/category/r/
16. https://slcladal.github.io/textanalysis.html
17. https://chryswoods.com/text_analysis_r/ngrams.html
18. https://www.tidytextmining.com/ngrams.html
19. https://www.gokam.co.uk/seo-cannibalization-r/
20. https://medium.com/the-artificial-impostor/analyzing-tweets-with-r-92ff2ef990c6
21. https://rpubs.com/ceshine/tweet_analysis
22. https://martijnvanvreeden.nl/visualising-google-analytics-internal-search-data-with-r/
23. https://www.doparank.fr/script-r/search-console-comment-recuperer-les-donnees-avec-r/
24. http://gameofseo.fr/2017/05/identifier-co-occurrences-r/

SEOWars: Rstudio aplicado a SEO #sob22

Recomendados

Recomendados

Más contenido relacionado

La actualidad más candente

La actualidad más candente (20)

Más de MJ Cachón Yáñez

Más de MJ Cachón Yáñez (20)

SEOWars: Rstudio aplicado a SEO #sob22