Bots and trolls in Mexican Elections 2018

En 2018 un grupo de
programadores, periodistas y
estrategas digitales nos dimos a la
tarea de encabezar una
investigación de análisis de big
data en redes sociales durante las
elecciones en 2018 en México.
El proyecto no tuvo fines de lucro,
fue hecho con objetivo periodístico
realizado gracias al apoyo de un
mini grant recibido del TechCamp,
iniciativa diplomática de
capacitación en soluciones
tecnológicas, que forma parte de la
Oficina de Programas de
Información Internacional en el
Departamento de Estado de los
Estados Unidos.
Buscamos desarrollar un
metodología para encontrar a las
cuentas sospechosas de ser bots o
trolls mercenarios parte de una red
orquestada para amplificar cierto
contenido y exponerlos a la opinión
pública con la esperanza de que
periodistas y ciudadanos tengan
recursos para diferenciar entre un
troll humano normal de un bot o
troll mercenario, es decir cuentas
operando de forma concertada
para lograr inferir en la
conversación electoral en México
METODOLOGIA
DETECCION DE
BOTS EN LA
ELECCIONES DE
MEXICO

Recopilamos más de 20 millones de datos
buscando primero detectar los patrones
normales de comportamiento entre los
usuarios de Twitter y poder contrastarlos con
aquellos que perecieran estar participando
en amplificación anormal de la conversación
electoral y comprobar si, por su actividad
anómala, se trataba de cuentas no orgánicas;
es decir: bots o milicias digitales de trolls.
Este trabajo no tuvo la intención de verificar
la veracidad de los contenidos en las
conversaciones en redes sociales sobre el
proceso electoral presidencial de México: no
fue un esfuerzo encaminado a la
comprobación de los hechos. Nuestro
objetivos fueron:
1. Detectar los principales tópicos de
carácter electoral que se convirtieron en
tendencia y que mostraron indicios de ser
creados o amplificados por cuentas
irregulares.
2. Analizar las caracteristicas de dichas
cuentas
3. Detectar la naturaleza de los trolls que
atacan cuentas de medios, periodistas y
figuras públicas durante este proceso
electoral.
4. Crear un protocolo para identificar
fácilmente bots o trolls mercenarios que
estén amplificando de forma anormal la
conversación en redes sociales.
La metodología utilizada, la información
elaborada con los datos recopilados y las
conclusiones de este trabajo de investigación
periodística son responsabilidad del equipo
de voluntarios que integran este proyecto
ADRIANA PEÑA JOHANSSON

CRITERIOS PARA
IDENTIFICAR A
UN BOT O
GRANJA DE
MILICIAS
DIGITALES DE
TROLLES EN
REDES SOCIALES
En base a información
previa de otros estudios
seguimos algunos de
siguientes criterios para
buscar identificar las
cuentas sospechosas *
1. Nombre de la cuenta: resalta la
presencia de caracteres inusuales
como @arturo162547751.
2. Relación de seguidores a cuentas que
siguen: por ejemplo tener muy pocos
seguidores y seguir a un gran número
de cuentas.
3. Frecuencia de actividad: cuántas
veces postea, a qué horas, las zonas
horarias de actividad comparadas con
el idioma o país de residencia que
indica la cuenta, etc.
4. Trolls /Bots rastreadores: cuentas que
siguen ciertos tópicos y twittean o
retwitean cuando algo sobre ese
tópico sucede. Al analizar el código se
pueden encontrar claves como:
cuando X pase entonces twittear Y.
5. Bot/Trolls amplificadores: siguen
determinadas cuentas y cuando
dicha presenta actividad, los bots o
troll también postean algo.
6. Perfiles suplantados: usan imágenes
de otras cuentas reales, así como
nombres similares de cuentas activas
o ya canceladas.
7. Nombres de cuentas pirata: tener un
nombre de cuenta que imitan el de
cuentas reales mediante pequeñas
variaciones en el nombre de la cuenta
gracias al uso de caracteres
numéricos, una o dos letras
diferentes, o guiones y puntos; por
ejemplo @apenaj es la cuenta real y
las cuentas piratas serian @_apenaj o
@aPenaJ
8. Idioma: las cuentas han twitteado en
diferentes idiomas* Puedes consultar la extensa
bibliografía de estudios e
investigaciones periodísticas al
en la sección bibliografía

ADVERNATIVA
CRITERIOS PARA
IDENTIFICAR GRANJAS
DE TROLLES EN REDES
SOCIALES
Otro nivel de análisis para encontrar
cuentas anómalas o cuentas creadas en
granjas de milicias digitales de trolls es
analizar clústers o familias de cuentas
las cuales compartan las siguientes
características:
1. Fueron creadas en las mismas
fechas.
2. Su retwiiteo es inter-amplificador;
es decir: se trata de cuentas que se
relacionan entre si retwittándose
una a la otra con casi de forma
exclusiva o con frecuencia
anormal.
3. Tienen patrones similares de twitts
o retwiits alrededor de tópicos,
posteando al mismo tiempo, con
el mismo sentimiento o tono
incluso mismas palabras o
hashtags.

70 MILLONES
DE DATOS
Utilizamos dos plataformas de acopio de
datos desarrolladas en México por
expertos en programación de
herramientas de análisis en redes
sociales en español. Monobinario.
plataforma desarrollada por el
programador Erick Kelly, colaborador de
este proyecto y KarmaPulse, la única
plataforma de análisis en redes sociales
con inteligencia artificial para revisar el
sentimiento de las conversaciones en
español.
Recopilamos dos bases de datos, una de
22 millones de datos recabados entre el
20 de abril al 20 de julio 2018 y otra de 47
millones de datos del 1 de abril al 15 de
julio de 2018
Recopilamos todas la informacion
posteada en las cuentas publicas de
Twitter y Facebook de los 5 candidatos a
la presidencia, asi como todas las
conversaciones que incluyeran nombres,
siglas y apodos (incluidos los posibles
errores de ortografía
El universo de cuentas y topicos
analizado incluyó a los partidos
políticos así como las de sus principales
colaboradores; organizaciones
gubernamentales y no
gubernamentales relacionadas con el
proceso electoral y se dio de alta un
número de cuentas de periodistas que
tienen un importante número de
seguidores
Un equipo de periodistas definió los
hechos noticiosos alrededor los
candidatos y este proceso electoral que
se convirtieron en tópicos y etiquetas
usados en ambas redes sociales.
Se creó un tesauro de palabras con
todas sus variaciones para filtrar los
datos recopilados y hacer un análisis
más preciso de patrones de
comportamiento en relación a cada
tema.
Se puso especial atención en aquellos
que, por su naturaleza, pudieran ser
idóneos para amplificaciones anómalas
o propagandísticas; por ejemplo:
“AMLO” y “Venezuela”, o Ricardo Anaya
y “lavado de dinero”.
1.8 MILLONES
DE CUENTAS
EN TWITTER
ADVERNATIVA

15%.
RESUMEN DE
HALLAZGOS
Evidencia de patrones de
comportamiento anormal en Twitter
durante las elecciones presidenciales
de México en 2018.
30%De la conversación sobre las
elecciones mostro evidencia
de no ser orgánica, es decir
mostro patrones anormales
De las cuentas que participaron
activamente en redes sociales
durante las elecciones en
México mostraron alta
probabilidad de ser anómalas

RESUMEN DE
HALLAZGOS
Evidencia de patrones de
comportamiento anormal en Twitter
durante las elecciones presidenciales
de México en 2018.
cuentas sin seguidores
twittearon intensamente sobre
los candidatos AMLO y ANAYA
12,499
de esas cuentas fueron
canceladas en agosto a
un mes después de las
elecciones.*
90%
(* desconocemos si fue parte de la depuración mundial que hizo Twitter en
2018 de cuentas sospechosas)
38 %
De las cuentas con menos de 10
seguidores que postearon sobre
alguno de los dos candidatos fueron
creadas en abril 2018
30%
de las cuentas con menos de
10 seguidores que postearon
sobre algún candidato dejaron
de postear cualquier
contenido después del 1 de
Julio.
Todas estas cuentas que analizamos con menos de 10 seguidores tenían en
común el postear para alabar a los candidatos o criticar agresivamente algún
aspecto político y el 90% solo postearon contenido político en relación a las
elecciones. (ningún post de sus perros, sus gatos o el tráfico, o el clima)

1. Nombres: Una gran cantidad de
cuentas con nombres con caracteres
inusuales como @arturo162547751
2. Relacion Followers a numero de
cuentas que siguen: Cuentas con una
relación muy desbalanceada de
seguidores a cuentas que siguen,
encontramos 12,499 cuentas sin
seguidores que twittearon activamente
sobre los dos candidatos a la
presidencia de México ALMO y ANAYA.
El 90% de estas cuentas fueron
eliminadas unos meses después por
Twitter, sin embargo estuvieron activas
desde varios meses antes de la
elecciones.
3. Intensidad de posteo: Cuentas con
intensidad de twitteo muy por encima a
lo normal. Como la cuenta de
@Jcjuarezyke2707 que retuiteo mas de
700 veces mas que la media de las
cuentas normales y lo hizo solo para
retwittear post del candidato Jaime
Rodriguez (esta cuenta esta ya cancelda
por Twitter)
4. Idioma: encontramos cuentas tuiteando
en diferentes idiomas y diversos tópicos.
Si bien el uso de comunicación bilingüe
no hace una cuenta sospechosa si lo
hace el hecho de que en un periodo de
tiempo esa cuenta posteara en español
sobre las elecciones Mexicanas y meses
antes lo hiciera en ingles sobre otros
temas totalmente ajenos a la política
latinoamericana.
5. Sin fotografia en el perfil: 88% de las
cuentas que detectamos con intensa
actividad durante las elecciones y que no
tenían ningún seguidor tampoco tenían un
perfil con fotografía de una persona.
6. Fecha simultanea de creacion de la cuenta:
La mayoría de las cuentas que
identificamos presentaban
comportamientos anormales y que
retwittearon a favor de Andres Manuel
Lopez Obrador o contra Ricardo Anaya o el
PRI no tenían seguidores y fueron creadas
en abril 2018
7. Monotematicas: Casi todas las cuentas
amplificadoras de los temas politicos solo
postearon mono tematicamente. Es decir
solo postraron contenido sobre política y
con una marcada postura a favor o en
contra de algún candidato o partido
8. Grupos de Trolls, o milicias digitales
amplificadores: Grupos de cuentas cuya
una funcion pareciera haber sido re-
twittearn intensamente algunos twits de
cuentas con mas seguidores o
influenciadores, como la cuenta
IsmaelBombero (proAMLO), dicha cuenta
fue cancelada por Twitter después de las
elecciones
Encontramos evidencia de cuentas que
cumplían con los criterios de ser cuentas
sospechosas de ser bots o granjas de trolls
PATRONES DE CUENTAS CON
COMPORTAMIENTO ANORMAL
EN TWITTER DURANTE LAS
ELECCIONES EN MEXICO
ADVERNATIVA

COMPORTAMIENTO
NORMAL
No podemos determinar qué es anormal
si no sabemos qué es normal.
Con base en investigaciones ya realizadas
sobre cómo se comporta una cuenta
normal que opina sobre procesos
electorales en Latinoamérica, nos dimos a
la tarea de establecer qué es un patrón
normal tanto de la emisión de contenido
original como de la relacionada con el
contenido amplificado o retweeteado.
Comportamiento normal en Twitter
La frecuencia con al que las personas
postean o re-postean contenido en redes
sociales tiene que ver no solo con su
estilo, edad u objetivo de uso de redes
sociales, sino también con el tipo de
evento o contenido del cual se postea.
En este caso el universo analizado fueron
solo Twitts y ReTwitts sobre temas
electorales
70%
ReTwitts
El otro fueron
amplificaciones de esos
contenido o ReTwitts
30%
Twitts
Del contenido en Twitter sobre las
elecciones fueron Twitts
ADVERNATIVA

Twitts
1.8 millones de cuentas
postearon una media de
1 vez por mes
Solo el 0.04%
Twitteraron mas de
30 veces x mes
ReTwitts
El 81% de las 1,8 millones
de cuentas analizadas
ReTwittearon de 1-4
veces por mes
Solo el 2.54%
Retwittearon mas
de 30 veces x mes
La intensidad de posteo de
contenido original, es decir de
Twitts fue la mitad que la de
ReTwitteo.
La media de Twitteo original
fue de 1 por mes y la media de
ReTwitteo fue de 2
Esta baja intensidad de posteo
coincide con indicadores
publicados en otros estudios
que apuntan a que hay más
consumidores pasivos de
contenido en redes sociales
que productores de contenido

COMPORTAMIENTO
NORMAL
Analizamos el universo de las 1.8 millones de
cuentas que postearon contenido en Twitter
sobre los temas electorales para buscar la
relacion entre numero de seguidores y
activadad.
encontramos el 15% de cuentas que postearon
algo durante los cuatro meses que racabamos
informacion tenian cero seguidores.
Solo el 2% de las cuentas tenian mas de 4000
seguidores,
La media de seguidores de las cuentas que
partciparon en la conversacion sobre las
elecciones fue de 173.
17millones
de seguidores
0
Seguidores
ADVERNATIVA
173
Media de
Seguidores que
tienen los
usuarios

HIPER
AMPLIFICADORES
DE CONVERSACION
EN TWITTER
DURANTE LAS
ELECCIONES
Identificamos las 500 cuentas que
retwittearon más frecuentemente durante
los 4 meses que recopilamos información así
como las 500 cuentas con mayor número de
seguidores que twitearon o retwittearon
sobre las elecciones.
Detectamos también a los influenciadores de
cada grupo de conversación analizado sobre
cada uno de los cinco candidatos, los temas a
favor o en contra de candidatos y temas
neutros como “debate” o “elecciones 2018” así
como los influenciadores de tópicos
relacionados a posturas como “AMLO” y
“Venezuela” o “Nunca el PRIAN”.
Analizamos las cuentas que amplificaron
intensamente las publicaciones de los
periodistas como Carmen Aristegui, Carlos
Loret de Mola, Joaquín López Dóriga y Paola
Rojas, así los de la cuenta de periodismo de
factchecking Verificado 2018
3%De las cuentas generaron
el 50% de los ReTwitts
sobre temas electorales.
ADVERNATIVA
Los híper
amplificadores que
incidieron en la
conversación con su
intensidad posteo
generaron un total
de 6.2 millones de
retwitts.
Estas cuentas no
necesariamente coinciden
con aquellos que tienen
más seguidores

LA CONVERSACION
SOBRE LAS ELECCIONES
FUE PROVOCADA POR
UN NUMERO MUY
REDUCIDO DE CUENTAS
ADVERNATIVA
1.7%De las cuentas generaron
el 50% de los Twitts con
contenido original sobre
temas electorales.
90 %
Cuentas
generaron
20% del
contenido
posteado
1.7 %
Cuentas
generaron
50% del
contenido
posteado7.3 %
Cuentas
generaron
30% del
contenido
posteado

1.- groyperproject 3164
2.- AdrianaT9735 2853
3.- alejandrinacar4 2827
4.- carmitamocas 2385
5.- lauritamo22 2365
5.- betz_zavala 2339
7.- BetitoHapo 2317
8.- Besamelculo1 2298
9.- MarianoBurnett 2182
10.- ursusnero 2123
1.- JoseLuisHS_ 52,838
2.- CARRODPER 8,396
3.- MX_en140 7,300
4.- FranLuva 7,064
5.- letymaldo 6,952
5.- ManuelVegaCln 6,740
7.- Nacion321 6,383
8.- NoticiasMVS 6,298
9.- ALASDELALMARB 6,254
10.- politicomx 5,862
TOP 10 TWITTEADORES
SOBRE LAS ELECCIONES DE
MEXICO
Las dos cuentas que mas Twittearon y la que más Re Twittearon
durante las elecciones ya no son cuentas activas.
Solo 4 medios de comunicación destancan como hiper
generadores de contenido en Twitter durante las elecciones

.
PATRONES DE LAS CUENTAS
QUE TWITTEARON SOBRE
ALGUNO DE LOS CANDIDATOS
LIDERE EN LAS ENCUESTAS
ADVERNATIVA
Para limitar aún más el universo se prestó
especial atención en las conversaciones
orientadas a los candidatos presidenciales
punteros en las encuestas: Ricardo Anaya
Cortés y Andrés Manuel López Obrador
(AMLO).
El análisis de estas dos submuestras arrojó:
12,499 cuentas sin seguidores twittearon
intensamente sobre alguno o ambos
candidatos a la republica
286 mil retwittearon algo sobre AMLO
225 mil lo hicieron sobre Ricardo Anaya
Estas muestras no fueron seleccionadas
por incluir comentarios a favor o en contra
de estos candidatos.
Haciendo un muestro meses después de
las elecciones encontramos a muchas de
ellas fueron eliminadas por Twitter: en julio
decenas de millones de cuentas fueron
apagadas pues se consideraban
sospechosas de ser automatizadas o falsas
en el mundo
Hemos preservado esta base datos con
toda la la actividad de esas 12,499 para
futuras investigaciones
50 cuentas de hiperinfluenciadores
retwittearon sobre ANAYA y 85 lo hicieron
sobre AMLO
15% de la cuentas que
retwittearon sobre Anaya o
AMLO tenían menos de 20
seguidores

3%
12,500 cuentas que
postearon algo en relación a
AMLO o ANAYA no tenían
seguidores y aun así postearon
intensamente
PATRONES SOSPECHOSOS EN
LAS CUENTAS QUE TWITTEARON
SOBRE ALGUNO DE LOS
CANDIDATOS LIDERE EN LAS
ENCUESTAS
ADVERNATIVA
90%
de las cuentas en Twitter con cero seguidores que
postearon algo sobre AMLO o ANAYA fueron creadas
entre 2017 y 2018
de las cuentas con cero seguidores fueron creadas
en el 2018
60%
Dos meses después de las elecciones de México 2018 se verificó que:
de las cuentas con cero seguidores que retwittearon sobre
Ricardo Anaya fueron eliminadas
90%
70%
que retwittearon sobre AMLO con cero
seguidores ya no existen.
de la cuentas con cero seguidores que
retwittearon sobre AMLO habian posteado
en otro idioma anteriormente

Las cuentas más sospechosas de ser
Bots o Trolls no fueron las que
tenían más seguidores
necesariamente, al contrario.
Encontramos que fueron las
cuentas con mucho menos
seguidores de lo normal que
postearon con mayor frecuencia a lo
normal
ENCONTRAMOS CUENTAS CON
NUMERO DE SEGUIDORES MUY
POR ABAJO DEL NORMAL PERO
FRECUENCIA DE ACTIVIDAD
ARRIBA DEL NORMAL
15% de las cuentas que
participaron activamente en redes
sociales tenían alta probabilidad de
ser anómalas
Así se empezó a considerar que las
cuentas sospechosas de ser
amplificadores anómalos no estaban
necesariamente en el grupo de
influenciadores principales.
Había un comportamiento más anormal
en las cuentas con un número de
seguidores muy por debajo de la media y
cuya actividad estaba por arriba de la
media de dos retwitts.
ADVERNATIVA

Múltiples estudios apuntan a una
serie de indicios de que una cuenta
podría no ser orgánica.
Quien mejor resume los criterios de
cómo distinguir un bot o un troll
mercenario podría ser el artículo The
follower factory publicado por “The
New York Times” que precisa ciertas
características en algunos elementos
de la cuenta
Cabe reconocer que esta
investigación tuvo recursos muy
limitados para procesar los millones
de datos que recopilamos, así que
decidimos hacer minería de datos en
las cuentas que mostraban patrones
fuera de la norma. Es decir mucha
actividad, pocos seguidores, o
muchísimos seguidores
Hicimos muestras de esos grupos y
seguimos cuatro diferentes
metodologías para detectar cuentas
con los patrones que otros estudios
han evidenciado como bots o trolls en
otros países
Bots automáticos o Trolles a
sueldo
1. Nombre de la cuenta:
2. Relación de seguidores a
cuentas que siguen
3. Frecuencia de actividad:
4. Trolls /Bots rastreadores:
5. Bot/Trolls amplificadores:
6. Perfiles suplantados:
7. Nombres de cuentas pirata:
8. Idioma:
Granjas de Trolles
1. Fecha de creación similar
2. Retwiiteo inter-amplificador
3. Tienen patrones similares de
twitts o retwiits
COMBINACION DE MINERIA
DE DATOS Y ANALISIS
PERIODISTICO PARA
ENCONTRAR EVIDENCIAS
DE CUENTAS
SOSPECHOSAS EN TWITTER
Criterios para detectar
ADVERNATIVA

Método 1: Herramienta automatizada
open source de detección de bots
Manualmente se analizó cada una de
las top 500 cuentas que Retwittearon
mas durante los cuatro meses
Revisamos cada una de esas cuentas
con la herramienta Botometer, una
colaboración entre Indiana University
Network Science Institute (IUNI) y el
Center for Complex Networks and
Systems Research (CNetS).
Esta herramienta califica mediante un
algoritmo propietario la naturaleza de
las cuentas en relación a la posibilidad
de que sean bots, calificando con un
ranking entre 0 y 5 el grado de
comportamiento tipo bot que esa
cuenta presenta: una calificación de 5
señala a un bot y una cuenta con
ranking de O se da a una que no lo es.
Botometer es un algoritmo de
aprendizaje automático capacitado
para clasificar una cuenta como bot o
humano en base a decenas de miles
de ejemplos etiquetados.
.
El API de Botometer, extrae unas
1,200 funciones para caracterizar el
perfil, los amigos, la estructura de la
red social, los patrones de actividad
temporal, el idioma y el sentimiento
de la cuenta.
Las características son utilizadas por
varios modelos de aprendizaje
automático para calcular los
puntajes del bot.
De acuerdo a esta herramienta
entre las top 500 cuentas en
Twitter que retwittearon en
todo el universo de 21 millones
de twitts no detectamos
ningún bot.
Sin embargo varias de esas cuentas
fueron posteriormente eliminadas
de Twitter, por lo que consideramos
que esta herramienta quizá no
detecte Trolles humanos a sueldo.
No nos fue posible establecer
contacto con los creadores de dicha
herramienta para exponerles el caso
HERRAMIENTA
AUTOMATIZADA OPEN
SOURCE DE DETECCION
DE BOTS

HERRAMIENTA
AUTOMATIZADA OPEN
SOURCE DE DETECCION
DE BOTS
La herramienta Bootometer no califico como boots ninunga de las top 500
cuentas que mas Retwittearon, sin embargo varias de estas cuentas fueron
eliminadas en meses posteriores a las elecciones

ANALISIS MANUAL DE
UNA MUESTRA
EVIDENCIO
COMPORTAMIENTOS
SOSPECHOSOS EN
LOS CLOSTERS DE
CUENTAS CON POCOS
SEGUIDORES
Método 2: Análisis manual de
una muestra
Se procedió a analizar manualmente
una muestra de 250 cuentas
seleccionadas aleatoriamente de un
universo de 1,000 cuentas que
mostraron actividad con palabras
claves definidas en el tesauro de
filtros contra Anaya o pro AMLO, con
menos de 10 seguidores.
Los aspectos que se observaron con
atención especial fueron:
Fecha de creación
Presencia de foto de perfil
Temas de conversación
Posteo de contenido original
Intensidad de la actividad
postelectoral (luego del 1 de julio)
40%De las cuentas que con 10
seguidores o menos que
postearon contenido
sobre algún candidato
fueron creadas en Abril
2018.
ADVERNATIVA
Así se encontró un
patrón que apuntaba a
cuentas anómalas que
fueron creadas entre
enero y abril de 2018,
carecían de foto de
perfil, sólo habían
emitido tweets sobre
cuestiones electorales y
su actividad luego del 1
de julio era casi nula.

Encontramos patrones
anormales en una muestra de
1,000 cuentas que retwittearon
sobre AMLO o Anaya con pocos
seguidores mostraron que:
PATRON ANORMAL
DE
COMPORTAMIENTO
EN CUENTAS CON
10 O MENOS
SEGUIDORES
Ejemplo de cuentas con menos de 10
seguidores que ya no están activas y que
participaron a favor o en contra de Anaya
y AMLO
Porcentaje de cuentas con 10 o menos
seguidores con patrones anormales

Se revisó una muestra de las cuentas con menos de 100 seguidores y
se encontró el mismo porcentaje de cuentas de reciente creación, un
porcentaje mayor de cuentas que sí tenían fotografía de perfil y
tuvieron actividad post electoral, además de la detección de un
porcentaje mucho menor de cuentas no activas.
A continuación se muestra un ejemplo del análisis cualitativo manual
que se hizo en las cuentas con menos de 50 seguidores que
participaron en la conversación a favor de AMLO o en contra de
Ricardo Anaya.
Los patrones de comportamiento daban indicios de que
estas cuentas tenían una probabilidad altísima de ser trolls
mercenarios: cuentas creadas expresamente con el
propósito de amplificar tópicos a favor o en contra de algún
candidato.
PATRONES
SOSPECHOSOS EN
CUENTAS CON 100 O
MENOS SEGUIDORES

DETENCION DE
GRANJAS DE TROLLS O
MILICIAS DIGITALES DE
CUENTAS
INTERRELACIONADAS
Realizamos minería de datos manual
para la detección de granjas de
cuentas de milicias de trolls o bots
hiper amplificado de forma
sospechosa la conversación en redes
sociales sobre las elecciones
Para encontrar evidencia de que
estas cuentas formaban parte de
granjas de trolls mercenarios o que
eran bots que hiper amplificaran la
conversación se procedió a realizar
un análisis semi-manual de
relacionamiento de las cuentas que
identificamos con alta posibilidad de
ser anómalas.
Las cuentas que mayor número de
anomalías presentaron, tanto en su
perfil como en el comportamiento
de su actividad, fueron analizadas
aún más detenidamente.
Se identificó qué cuentas seguían,
qué cuentas retwitteaban y cómo se
relacionaban entre ellas,
encontrando comportamientos
altamente sospechosos en estas
cuentas con cero seguidores que
retwittearon intensamente.
1. Cuentas que retwitteaban solo los
posts de la cuenta de Twitter del
candidato a la presidencia el
Bronco. @JaimeRzNL
2. Casi todas las cuentas fueron
creadas en el 2018
principalmente en los meses de
abril y marzo
3. Una intensidad de actividad muy
por encima de la media normal.
Entre 13 y 1.4 retwitts diarios
cuando la media mensual es de 2
retwitts por mes
4. Encontramos lo que parece ser
una granja de cuentas con la
única actividad de retwittear otra
cuenta que ya fue cancelada en
Twitter que apoyaba al PRD
@IsmaelBombero
5. Cuentas retwitteadoras de temas
en contra de Anaya y del PRI
6. Cuentas retwitteadoras de temas
a favor de AMLO
7. Cuentas con nombres altamente
sospechosos como
TrnuYN0yYDODxkJ o
LuisFra40303003

Muestra de cuentas retwitteadoras o amplificadoras de otras cuentas
DETENCION DE GRANJAS
DE TROLLS O MILICIAS
DIGITALES DE CUENTAS
INTERRELACIONADAS
Muestra de cuentas Retwitteadoras o amplificadoras de otras cuentas

En este paso de la investigación se
implementó un algoritmo
desarrollado por KarmaPulse para las
elecciones presidenciales de México
en 2018 que pondera distintos
criterios para asignar a cada mensaje
una probabilidad de ser actividad
inorgánica, o sea aquella que no
proviene de ciudadanos reales.
Dicho desarrollo toma en cuenta la
cantidad de tuits emitidos por cada
usuario dentro de la conversación,
siendo un índice alto en esta
medición un indicador de actividad
inorgánica.
Estas cuentas tienden a generar un
elevado número de retwiits y no
participar en intercambios con otros
usuarios.
Se inspecciona la procedencia de
cada uno de los mensajes,
encontrando que existen esfuerzos
evidentes de automatizar la
generación contenido desde
aplicaciones que no suelen ser
utilizados por ciudadanos comunes y
corrientes.
ANALISIS SEMANTICO Y
MATEMATICO DE CUENTAS
QUE TWITTEARON SOBRE
LAS ELECCIONES
Se encontró que el 30% de la
conversación en Twitter durante
las elecciones presidenciales en
México en 2018 muestra patrones
de comportamiento concordante
con las características de
conversaciones no orgánicas lo
que equivale a un una
probabilidad muy alta de ser
generadas por bots o granjas de
trolls o milicias digitales de trolls
Otro criterio que se utiliza para
determinar la veracidad de las
cuentas es la diversidad temática que
exhibe una cuenta participante: las
cuentas de ciudadanos reales tienden
a hablar sobre distintos tópicos que
corresponden a los intereses reales de
la persona, mientras que en las
cuentas inorgánicas los temas suelen
no variar y girar en un mismo asunto.
El análisis del lenguaje determina si
una cuenta muestra rasgos de
automatización puesto que la
connotación de los mensajes tiende a
no cambiar a favor o en contra de
alguno de los candidatos.
También se encuentra que aquellas
cuentas que utilizan construcciones
sintácticas más básicas y poco
elaboradas son las que tienden a ser
inorgánicas.
30%
Conversaciones no
orgánicas

Muestra de cuentas retwitteadoras o amplificadoras de otras cuentas
ANALISIS SEMANTICO DE 47
MILLONES DE POSTS CON LA
PLATAFORMA KARMAPULSE
ADVERNATIVA
45% de las conversaciones en julio 2018 sobre temas electorales
mostraron patrones de comportamiento semántico y matemático
con indicios de ser anormales

ADVERNATIVA
CONCLUSIONES
Nos encontramos ante un fenómeno
mucho más complejo de lo que
anticipamos
Detectar anomalías en las
conversaciones en redes sociales
requiere de recursos tecnológicos y
humanos sumamente robustos que
muy pocas compañías tienen y mucho
menos la comunidad periodística en
México.
.
Las herramientas automatizadas de
código abierto no fuero de utilidad para
detectar bots en en esta investigación
Sin embargo vía la minería de datos y
el análisis matemático y periodístico
mostramos evidencias claras de
anomalías en la conversación en redes
sociales. durante las elecciones en
México en el 2018.
Creemos que los
resultados de esta
investigación pueden
aportar una metodología
de criterios fácilmente
observables para calificar
como sospechosas ciertas
cuentas que pudieran
estar amplificando de
forma anormal algún
tópico.

INVESTIGACIONES FUTURAS
Consideramos que la base de datos de 21 millones de
observación es un archivo histórico de lo que pasó en las redes
sociales en México durante los comicios presidenciales de este
año, por lo que se pone a disposición de instituciones,
universidades u organismos con objeto de impacto social y
transparencia periodística dicha información.
Si está interesado en descargar esta base de 21 millones de datos,
envíenos un e-mail a:
Adriana Peña Johansson Erick Kelly
MonoBinario
Sistema de escucha y atención a
clientes via redes sociales para
minimizar crisis de relaciones publicar
y maximizar la atención al cliente.
Erick Kelly
ericrkl@monobinario.com
Agradecemos la
contribución de las
plataformas de Análisis
de tendencias en Redes
Sociales
Karma Pulse
Empresa de desarrollo mexicana que
ayuda comprender la opinión pública
y la evolución de los temas en la
conversación social, con una fuerte
especialización en sus algoritmos de
inteligencia artificial que interpretan y
conocen el idioma español de manera
muy precisa.
CEO y CoFounder
Ximena Iñigo
Ximena@karmapulse.com
Director Operaciones
Andres Mesa
andres@karmapulse.com
AGRADECIMIENTOS
erickl@monobinario.comadriana@advernativa.com

Adriana Peña Johansson
Coordinadora general del Proyecto
de detección de anomalías en
redes sociales
Fundadora Advernativa un consultora
de negocios para medios, en Los
Ángeles California. Adriana es
estratega de marketing y negocios,
pionera en medios digitales. Con más
de 20 años de liderazgo en marketing
digital y publicidad. Ha dirigido con
éxito iniciativas de medios digitales en
América Latina y Estados Unidos.
Miembro activo del Interactive Media
Group de la Academia de Artes y
Ciencias de la Televisión en Los
Ángeles, y participando en el jurado
que evalúa a los nominados para los
premios Interactive EMMY desde 2013.
Miembro de la junta directiva de
SembraMedia, una asociación sin fines
de lucro dedicada a apoyar a los
empresarios de medios digitales en
América Latina, los Estados Unidos y
España.
Fue miembro fundador de la
Asociación Mexicana de Internet
donde publico múltiples estudios
sobre hábitos de Internet, comercio
electrónico y banca en línea.
Trainer for U.S. State Department
Media Tech Camp y frecuente speaker
en foros de Mercadotecnia y Medios
en Estados Unidos y Latinoamérica
adriana@advernativa.com
Erick Kelly
Coordinación de Tecnología de
Minería de Datos
Líder en Latinoamérica de Tecnología
Minería de datos en redes sociales.
Fundador Monobinario. Con 30 años de
experiencia en TI como programador, Eric
fue pionero en México en desarrollar
herramientas de escucha en redes
sociales, iniciando su primera plataforma
con este fin en 2007.
Ha seguido la evolución de las
plataformas, siendo invitado
contantemente por principales
compañías del mundo a probar versiones
de programas betas de las APIs de las
principales redes como Twitter, Facebook,
Instagram, YouTube y Foursquare.
Con un pie en el Espectro Autista y el otro
en el mundo espiritual (AspieShaman), su
innata capacidad de "pensar en
imágenes", la facilidad para detectar
cierto tipo de patrones y esa insaciable
necesidad de conocimiento lo hacen ideal
para el análisis y desarrollo de sistemas de
información.
Es también instructor, consultor,
diseñador de sistemas,
telecomunicaciones, multimedia, video
digital, presentaciones de negocios,
experto en plataforma Macintosh (Mac OS
7, 8, 9 y X), administrador y programador
en aplicaciones internet e intranet en
plataformas Unix, Linux, Mac OS X y
Darwin.
ericrkl@monobinario.com
PARTICIPANTES
EN ESTE
PROYECTO

PARTICIPANTES
EN ESTE
PROYECTO
Saúl Zamora Pérez
Analista Matemático Big Data
Matemático egresado de la Universidad
Nacional Autónoma de México con un
postgrado en Inteligencia de Negocios en
ITAM y otro en Minería de Datos en la
UNAM.
Es experto en administración, análisis y
visualización de datos, con dominio en
programación y uso de SQL, MYSQL,
Integración de Datos (ETL) Cubos OLAP
entre otros.
saul.zamora@gmail.com
Paola Monserrat Contreras Ortega
Análisis periodístico de conversaciones en
redes sociales
Periodista, editora web en Periódico
Imagen de Zacatecas
Egresada de la Licenciatura de
Comunicación de la Universidad de la
Vera-Cruz. Técnico Superior en Marketing
de Contenidos.
Coordinadora de equipos humanos para
la realización de proyectos televisivos;
productora multimedia para diferentes
áreas de la comunicación; generadora de
contenidos multimedia y analista online
de marcas.
contrerarasmonse2601@gmail.com
Guadalupe Isabel Medellín Beltrán
Coordinadora de análisis periodístico de
conversaciones en redes sociales.
Jefa del Área de Administración Web y Redes
Sociales de Periódico Imagen de Zacatecas.
Es comunicóloga y periodista por la
Universidad Norte de México, y tiene
experiencia en docencia y trabajo con
adolescentes.
Ha sido líder de equipos de trabajo con
enfoque administrativo, periodístico y de
análisis de contenidos.
Coordina equipos de trabajo para la
elaboración de trabajos periodísticos,
generación de contenido multimedia y
emprendimiento de proyectos informativos y
comerciales.
Fue una de las periodistas invitada al Tech
Camp U.S. State Department en la Ciudad de
México en 2017
isabelmedellinbeltran@gmail.com

Estudio Eleccion 2018 en Mexico
KarmaPulse
Botometer
Botometer que es una colaboración
entre Indiana University Network
Science Institute (IUNI) y el Center
for Complex Networks and Systems
Research (CNetS)
The Follower Factory, New York
Times
Identifying viral bots and cyborgs in
social media
Analyzing tweets and posts around
Trump, Russia, and the NFL using
information entropy, network
analysis, and community detection
algorithms
#ElectionWatch: Loves For Sale
In Brazil. Exposing a Brazilian network
which trades clicks for cash
https://medium.com/dfrlab/election
watch-loves-for-sale-in-brazil-
f8033427dbe0
Bots and Their Influence During the
Mexican Presidential Election – A
Network Science Perspective
“Sospechamos que las granjas de
Troll son muy comunes en México, ya
que los administradores de las
comunidades de medios sociales son
baratos y existe evidencia de que
esta práctica se usó en el pasado”
http://maven7us.com/bot-analysis/
REFERENCIAS Y
BIBLIOGRAFIA
How Trump Conquered Facebook—
Without Russian Ads
https://www.wired.com/story/how-
trump-conquered-facebookwithout-
russian-ads/
4 resources for fighting fake news
https://tiie.w3.uvm.edu/blog/fighting-
fake-news/#.W62kwhNKhTY
Online Human-Bot Interactions:
Detection, Estimation, and
Characterization Onur Varol,1,*
Emilio Ferrara,2 Clayton A. Davis,1
Filippo Menczer,1 Alessandro Flammini1
1Center for Complex Networks and
Systems Research, Indiana University,
Bloomington, US 2 Information
Sciences Institute, University of
Southern California, Marina del Rey, CA,
US
https://arxiv.org/pdf/1703.03107v2.pdf
Twitter suspended more than 70
million accounts in May and June, and
the pace has continued in July, The
Whashington Post
SparkToro™ is a new software company
from Moz founder, Rand Fishkin.
Fake Followers Audit
Colección de Flipboard sobre articulos
e investigaciones del tema
https://flipboard.com/@adrianapenajoha/fake-
news-and-brand-safety-12tgretuy

Bots and trolls in Mexican Elections 2018

Recomendados

Recomendados

Más contenido relacionado

Similar a Bots and trolls in Mexican Elections 2018

Similar a Bots and trolls in Mexican Elections 2018 (20)

Más de Adriana Peña Johansson

Más de Adriana Peña Johansson (8)

Bots and trolls in Mexican Elections 2018