SlideShare una empresa de Scribd logo
1 de 33
Descargar para leer sin conexión
En 2018 un grupo de
programadores, periodistas y
estrategas digitales nos dimos a la
tarea de encabezar una
investigación de análisis de big
data en redes sociales durante las
elecciones en 2018 en México.
El proyecto no tuvo fines de lucro,
fue hecho con objetivo periodístico
realizado gracias al apoyo de un
mini grant recibido del TechCamp,
iniciativa diplomática de
capacitación en soluciones
tecnológicas, que forma parte de la
Oficina de Programas de
Información Internacional en el
Departamento de Estado de los
Estados Unidos.
Buscamos desarrollar un
metodología para encontrar a las
cuentas sospechosas de ser bots o
trolls mercenarios parte de una red
orquestada para amplificar cierto
contenido y exponerlos a la opinión
pública con la esperanza de que
periodistas y ciudadanos tengan
recursos para diferenciar entre un
troll humano normal de un bot o
troll mercenario, es decir cuentas
operando de forma concertada
para lograr inferir en la
conversación electoral en México
METODOLOGIA
DETECCION DE
BOTS EN LA
ELECCIONES DE
MEXICO
Recopilamos más de 20 millones de datos
buscando primero detectar los patrones
normales de comportamiento entre los
usuarios de Twitter y poder contrastarlos con
aquellos que perecieran estar participando
en amplificación anormal de la conversación
electoral y comprobar si, por su actividad
anómala, se trataba de cuentas no orgánicas;
es decir: bots o milicias digitales de trolls.
Este trabajo no tuvo la intención de verificar
la veracidad de los contenidos en las
conversaciones en redes sociales sobre el
proceso electoral presidencial de México: no
fue un esfuerzo encaminado a la
comprobación de los hechos. Nuestro
objetivos fueron:
1. Detectar los principales tópicos de
carácter electoral que se convirtieron en
tendencia y que mostraron indicios de ser
creados o amplificados por cuentas
irregulares.
2. Analizar las caracteristicas de dichas
cuentas
3. Detectar la naturaleza de los trolls que
atacan cuentas de medios, periodistas y
figuras públicas durante este proceso
electoral.
4. Crear un protocolo para identificar
fácilmente bots o trolls mercenarios que
estén amplificando de forma anormal la
conversación en redes sociales.
La metodología utilizada, la información
elaborada con los datos recopilados y las
conclusiones de este trabajo de investigación
periodística son responsabilidad del equipo
de voluntarios que integran este proyecto
ADRIANA PEÑA JOHANSSON
CRITERIOS PARA
IDENTIFICAR A
UN BOT O
GRANJA DE
MILICIAS
DIGITALES DE
TROLLES EN
REDES SOCIALES
En base a información
previa de otros estudios
seguimos algunos de
siguientes criterios para
buscar identificar las
cuentas sospechosas *
1. Nombre de la cuenta: resalta la
presencia de caracteres inusuales
como @arturo162547751.
2. Relación de seguidores a cuentas que
siguen: por ejemplo tener muy pocos
seguidores y seguir a un gran número
de cuentas.
3. Frecuencia de actividad: cuántas
veces postea, a qué horas, las zonas
horarias de actividad comparadas con
el idioma o país de residencia que
indica la cuenta, etc.
4. Trolls /Bots rastreadores: cuentas que
siguen ciertos tópicos y twittean o
retwitean cuando algo sobre ese
tópico sucede. Al analizar el código se
pueden encontrar claves como:
cuando X pase entonces twittear Y.
5. Bot/Trolls amplificadores: siguen
determinadas cuentas y cuando
dicha presenta actividad, los bots o
troll también postean algo.
6. Perfiles suplantados: usan imágenes
de otras cuentas reales, así como
nombres similares de cuentas activas
o ya canceladas.
7. Nombres de cuentas pirata: tener un
nombre de cuenta que imitan el de
cuentas reales mediante pequeñas
variaciones en el nombre de la cuenta
gracias al uso de caracteres
numéricos, una o dos letras
diferentes, o guiones y puntos; por
ejemplo @apenaj es la cuenta real y
las cuentas piratas serian @_apenaj o
@aPenaJ
8. Idioma: las cuentas han twitteado en
diferentes idiomas* Puedes consultar la extensa
bibliografía de estudios e
investigaciones periodísticas al
en la sección bibliografía
ADVERNATIVA
CRITERIOS PARA
IDENTIFICAR GRANJAS
DE TROLLES EN REDES
SOCIALES
Otro nivel de análisis para encontrar
cuentas anómalas o cuentas creadas en
granjas de milicias digitales de trolls es
analizar clústers o familias de cuentas
las cuales compartan las siguientes
características:
1. Fueron creadas en las mismas
fechas.
2. Su retwiiteo es inter-amplificador;
es decir: se trata de cuentas que se
relacionan entre si retwittándose
una a la otra con casi de forma
exclusiva o con frecuencia
anormal.
3. Tienen patrones similares de twitts
o retwiits alrededor de tópicos,
posteando al mismo tiempo, con
el mismo sentimiento o tono
incluso mismas palabras o
hashtags.
70 MILLONES
DE DATOS
Utilizamos dos plataformas de acopio de
datos desarrolladas en México por
expertos en programación de
herramientas de análisis en redes
sociales en español. Monobinario.
plataforma desarrollada por el
programador Erick Kelly, colaborador de
este proyecto y KarmaPulse, la única
plataforma de análisis en redes sociales
con inteligencia artificial para revisar el
sentimiento de las conversaciones en
español.
Recopilamos dos bases de datos, una de
22 millones de datos recabados entre el
20 de abril al 20 de julio 2018 y otra de 47
millones de datos del 1 de abril al 15 de
julio de 2018
Recopilamos todas la informacion
posteada en las cuentas publicas de
Twitter y Facebook de los 5 candidatos a
la presidencia, asi como todas las
conversaciones que incluyeran nombres,
siglas y apodos (incluidos los posibles
errores de ortografía
El universo de cuentas y topicos
analizado incluyó a los partidos
políticos así como las de sus principales
colaboradores; organizaciones
gubernamentales y no
gubernamentales relacionadas con el
proceso electoral y se dio de alta un
número de cuentas de periodistas que
tienen un importante número de
seguidores
Un equipo de periodistas definió los
hechos noticiosos alrededor los
candidatos y este proceso electoral que
se convirtieron en tópicos y etiquetas
usados en ambas redes sociales.
Se creó un tesauro de palabras con
todas sus variaciones para filtrar los
datos recopilados y hacer un análisis
más preciso de patrones de
comportamiento en relación a cada
tema.
Se puso especial atención en aquellos
que, por su naturaleza, pudieran ser
idóneos para amplificaciones anómalas
o propagandísticas; por ejemplo:
“AMLO” y “Venezuela”, o Ricardo Anaya
y “lavado de dinero”.
1.8 MILLONES
DE CUENTAS
EN TWITTER
ADVERNATIVA
15%.
RESUMEN DE
HALLAZGOS
Evidencia de patrones de
comportamiento anormal en Twitter
durante las elecciones presidenciales
de México en 2018.
30%De la conversación sobre las
elecciones mostro evidencia
de no ser orgánica, es decir
mostro patrones anormales
De las cuentas que participaron
activamente en redes sociales
durante las elecciones en
México mostraron alta
probabilidad de ser anómalas
RESUMEN DE
HALLAZGOS
Evidencia de patrones de
comportamiento anormal en Twitter
durante las elecciones presidenciales
de México en 2018.
cuentas sin seguidores
twittearon intensamente sobre
los candidatos AMLO y ANAYA
12,499
de esas cuentas fueron
canceladas en agosto a
un mes después de las
elecciones.*
90%
(* desconocemos si fue parte de la depuración mundial que hizo Twitter en
2018 de cuentas sospechosas)
38 %
De las cuentas con menos de 10
seguidores que postearon sobre
alguno de los dos candidatos fueron
creadas en abril 2018
30%
de las cuentas con menos de
10 seguidores que postearon
sobre algún candidato dejaron
de postear cualquier
contenido después del 1 de
Julio.
Todas estas cuentas que analizamos con menos de 10 seguidores tenían en
común el postear para alabar a los candidatos o criticar agresivamente algún
aspecto político y el 90% solo postearon contenido político en relación a las
elecciones. (ningún post de sus perros, sus gatos o el tráfico, o el clima)
1. Nombres: Una gran cantidad de
cuentas con nombres con caracteres
inusuales como @arturo162547751
2. Relacion Followers a numero de
cuentas que siguen: Cuentas con una
relación muy desbalanceada de
seguidores a cuentas que siguen,
encontramos 12,499 cuentas sin
seguidores que twittearon activamente
sobre los dos candidatos a la
presidencia de México ALMO y ANAYA.
El 90% de estas cuentas fueron
eliminadas unos meses después por
Twitter, sin embargo estuvieron activas
desde varios meses antes de la
elecciones.
3. Intensidad de posteo: Cuentas con
intensidad de twitteo muy por encima a
lo normal. Como la cuenta de
@Jcjuarezyke2707 que retuiteo mas de
700 veces mas que la media de las
cuentas normales y lo hizo solo para
retwittear post del candidato Jaime
Rodriguez (esta cuenta esta ya cancelda
por Twitter)
4. Idioma: encontramos cuentas tuiteando
en diferentes idiomas y diversos tópicos.
Si bien el uso de comunicación bilingüe
no hace una cuenta sospechosa si lo
hace el hecho de que en un periodo de
tiempo esa cuenta posteara en español
sobre las elecciones Mexicanas y meses
antes lo hiciera en ingles sobre otros
temas totalmente ajenos a la política
latinoamericana.
5. Sin fotografia en el perfil: 88% de las
cuentas que detectamos con intensa
actividad durante las elecciones y que no
tenían ningún seguidor tampoco tenían un
perfil con fotografía de una persona.
6. Fecha simultanea de creacion de la cuenta:
La mayoría de las cuentas que
identificamos presentaban
comportamientos anormales y que
retwittearon a favor de Andres Manuel
Lopez Obrador o contra Ricardo Anaya o el
PRI no tenían seguidores y fueron creadas
en abril 2018
7. Monotematicas: Casi todas las cuentas
amplificadoras de los temas politicos solo
postearon mono tematicamente. Es decir
solo postraron contenido sobre política y
con una marcada postura a favor o en
contra de algún candidato o partido
8. Grupos de Trolls, o milicias digitales
amplificadores: Grupos de cuentas cuya
una funcion pareciera haber sido re-
twittearn intensamente algunos twits de
cuentas con mas seguidores o
influenciadores, como la cuenta
IsmaelBombero (proAMLO), dicha cuenta
fue cancelada por Twitter después de las
elecciones
Encontramos evidencia de cuentas que
cumplían con los criterios de ser cuentas
sospechosas de ser bots o granjas de trolls
PATRONES DE CUENTAS CON
COMPORTAMIENTO ANORMAL
EN TWITTER DURANTE LAS
ELECCIONES EN MEXICO
ADVERNATIVA
COMPORTAMIENTO
NORMAL
No podemos determinar qué es anormal
si no sabemos qué es normal.
Con base en investigaciones ya realizadas
sobre cómo se comporta una cuenta
normal que opina sobre procesos
electorales en Latinoamérica, nos dimos a
la tarea de establecer qué es un patrón
normal tanto de la emisión de contenido
original como de la relacionada con el
contenido amplificado o retweeteado.
Comportamiento normal en Twitter
La frecuencia con al que las personas
postean o re-postean contenido en redes
sociales tiene que ver no solo con su
estilo, edad u objetivo de uso de redes
sociales, sino también con el tipo de
evento o contenido del cual se postea.
En este caso el universo analizado fueron
solo Twitts y ReTwitts sobre temas
electorales
70%
ReTwitts
El otro fueron
amplificaciones de esos
contenido o ReTwitts
30%
Twitts
Del contenido en Twitter sobre las
elecciones fueron Twitts
ADVERNATIVA
Twitts
1.8 millones de cuentas
postearon una media de
1 vez por mes
Solo el 0.04%
Twitteraron mas de
30 veces x mes
ReTwitts
El 81% de las 1,8 millones
de cuentas analizadas
ReTwittearon de 1-4
veces por mes
Solo el 2.54%
Retwittearon mas
de 30 veces x mes
La intensidad de posteo de
contenido original, es decir de
Twitts fue la mitad que la de
ReTwitteo.
La media de Twitteo original
fue de 1 por mes y la media de
ReTwitteo fue de 2
Esta baja intensidad de posteo
coincide con indicadores
publicados en otros estudios
que apuntan a que hay más
consumidores pasivos de
contenido en redes sociales
que productores de contenido
COMPORTAMIENTO
NORMAL
Analizamos el universo de las 1.8 millones de
cuentas que postearon contenido en Twitter
sobre los temas electorales para buscar la
relacion entre numero de seguidores y
activadad.
encontramos el 15% de cuentas que postearon
algo durante los cuatro meses que racabamos
informacion tenian cero seguidores.
Solo el 2% de las cuentas tenian mas de 4000
seguidores,
La media de seguidores de las cuentas que
partciparon en la conversacion sobre las
elecciones fue de 173.
17millones
de seguidores
0
Seguidores
ADVERNATIVA
173
Media de
Seguidores que
tienen los
usuarios
HIPER
AMPLIFICADORES
DE CONVERSACION
EN TWITTER
DURANTE LAS
ELECCIONES
Identificamos las 500 cuentas que
retwittearon más frecuentemente durante
los 4 meses que recopilamos información así
como las 500 cuentas con mayor número de
seguidores que twitearon o retwittearon
sobre las elecciones.
Detectamos también a los influenciadores de
cada grupo de conversación analizado sobre
cada uno de los cinco candidatos, los temas a
favor o en contra de candidatos y temas
neutros como “debate” o “elecciones 2018” así
como los influenciadores de tópicos
relacionados a posturas como “AMLO” y
“Venezuela” o “Nunca el PRIAN”.
Analizamos las cuentas que amplificaron
intensamente las publicaciones de los
periodistas como Carmen Aristegui, Carlos
Loret de Mola, Joaquín López Dóriga y Paola
Rojas, así los de la cuenta de periodismo de
factchecking Verificado 2018
3%De las cuentas generaron
el 50% de los ReTwitts
sobre temas electorales.
ADVERNATIVA
Los híper
amplificadores que
incidieron en la
conversación con su
intensidad posteo
generaron un total
de 6.2 millones de
retwitts.
Estas cuentas no
necesariamente coinciden
con aquellos que tienen
más seguidores
LA CONVERSACION
SOBRE LAS ELECCIONES
FUE PROVOCADA POR
UN NUMERO MUY
REDUCIDO DE CUENTAS
ADVERNATIVA
1.7%De las cuentas generaron
el 50% de los Twitts con
contenido original sobre
temas electorales.
90 %
Cuentas
generaron
20% del
contenido
posteado
1.7 %
Cuentas
generaron
50% del
contenido
posteado7.3 %
Cuentas
generaron
30% del
contenido
posteado
1.- groyperproject 3164
2.- AdrianaT9735 2853
3.- alejandrinacar4 2827
4.- carmitamocas 2385
5.- lauritamo22 2365
5.- betz_zavala 2339
7.- BetitoHapo 2317
8.- Besamelculo1 2298
9.- MarianoBurnett 2182
10.- ursusnero 2123
1.- JoseLuisHS_ 52,838
2.- CARRODPER 8,396
3.- MX_en140 7,300
4.- FranLuva 7,064
5.- letymaldo 6,952
5.- ManuelVegaCln 6,740
7.- Nacion321 6,383
8.- NoticiasMVS 6,298
9.- ALASDELALMARB 6,254
10.- politicomx 5,862
TOP 10 TWITTEADORES
SOBRE LAS ELECCIONES DE
MEXICO
Las dos cuentas que mas Twittearon y la que más Re Twittearon
durante las elecciones ya no son cuentas activas.
Solo 4 medios de comunicación destancan como hiper
generadores de contenido en Twitter durante las elecciones
.
PATRONES DE LAS CUENTAS
QUE TWITTEARON SOBRE
ALGUNO DE LOS CANDIDATOS
LIDERE EN LAS ENCUESTAS
ADVERNATIVA
Para limitar aún más el universo se prestó
especial atención en las conversaciones
orientadas a los candidatos presidenciales
punteros en las encuestas: Ricardo Anaya
Cortés y Andrés Manuel López Obrador
(AMLO).
El análisis de estas dos submuestras arrojó:
12,499 cuentas sin seguidores twittearon
intensamente sobre alguno o ambos
candidatos a la republica
286 mil retwittearon algo sobre AMLO
225 mil lo hicieron sobre Ricardo Anaya
Estas muestras no fueron seleccionadas
por incluir comentarios a favor o en contra
de estos candidatos.
Haciendo un muestro meses después de
las elecciones encontramos a muchas de
ellas fueron eliminadas por Twitter: en julio
decenas de millones de cuentas fueron
apagadas pues se consideraban
sospechosas de ser automatizadas o falsas
en el mundo
Hemos preservado esta base datos con
toda la la actividad de esas 12,499 para
futuras investigaciones
50 cuentas de hiperinfluenciadores
retwittearon sobre ANAYA y 85 lo hicieron
sobre AMLO
15% de la cuentas que
retwittearon sobre Anaya o
AMLO tenían menos de 20
seguidores
3%
12,500 cuentas que
postearon algo en relación a
AMLO o ANAYA no tenían
seguidores y aun así postearon
intensamente
PATRONES SOSPECHOSOS EN
LAS CUENTAS QUE TWITTEARON
SOBRE ALGUNO DE LOS
CANDIDATOS LIDERE EN LAS
ENCUESTAS
ADVERNATIVA
90%
de las cuentas en Twitter con cero seguidores que
postearon algo sobre AMLO o ANAYA fueron creadas
entre 2017 y 2018
de las cuentas con cero seguidores fueron creadas
en el 2018
60%
Dos meses después de las elecciones de México 2018 se verificó que:
de las cuentas con cero seguidores que retwittearon sobre
Ricardo Anaya fueron eliminadas
90%
70%
que retwittearon sobre AMLO con cero
seguidores ya no existen.
de la cuentas con cero seguidores que
retwittearon sobre AMLO habian posteado
en otro idioma anteriormente
Las cuentas más sospechosas de ser
Bots o Trolls no fueron las que
tenían más seguidores
necesariamente, al contrario.
Encontramos que fueron las
cuentas con mucho menos
seguidores de lo normal que
postearon con mayor frecuencia a lo
normal
ENCONTRAMOS CUENTAS CON
NUMERO DE SEGUIDORES MUY
POR ABAJO DEL NORMAL PERO
FRECUENCIA DE ACTIVIDAD
ARRIBA DEL NORMAL
15% de las cuentas que
participaron activamente en redes
sociales tenían alta probabilidad de
ser anómalas
Así se empezó a considerar que las
cuentas sospechosas de ser
amplificadores anómalos no estaban
necesariamente en el grupo de
influenciadores principales.
Había un comportamiento más anormal
en las cuentas con un número de
seguidores muy por debajo de la media y
cuya actividad estaba por arriba de la
media de dos retwitts.
ADVERNATIVA
Múltiples estudios apuntan a una
serie de indicios de que una cuenta
podría no ser orgánica.
Quien mejor resume los criterios de
cómo distinguir un bot o un troll
mercenario podría ser el artículo The
follower factory publicado por “The
New York Times” que precisa ciertas
características en algunos elementos
de la cuenta
Cabe reconocer que esta
investigación tuvo recursos muy
limitados para procesar los millones
de datos que recopilamos, así que
decidimos hacer minería de datos en
las cuentas que mostraban patrones
fuera de la norma. Es decir mucha
actividad, pocos seguidores, o
muchísimos seguidores
Hicimos muestras de esos grupos y
seguimos cuatro diferentes
metodologías para detectar cuentas
con los patrones que otros estudios
han evidenciado como bots o trolls en
otros países
Bots automáticos o Trolles a
sueldo
1. Nombre de la cuenta:
2. Relación de seguidores a
cuentas que siguen
3. Frecuencia de actividad:
4. Trolls /Bots rastreadores:
5. Bot/Trolls amplificadores:
6. Perfiles suplantados:
7. Nombres de cuentas pirata:
8. Idioma:
Granjas de Trolles
1. Fecha de creación similar
2. Retwiiteo inter-amplificador
3. Tienen patrones similares de
twitts o retwiits
COMBINACION DE MINERIA
DE DATOS Y ANALISIS
PERIODISTICO PARA
ENCONTRAR EVIDENCIAS
DE CUENTAS
SOSPECHOSAS EN TWITTER
Criterios para detectar
ADVERNATIVA
Método 1: Herramienta automatizada
open source de detección de bots
Manualmente se analizó cada una de
las top 500 cuentas que Retwittearon
mas durante los cuatro meses
Revisamos cada una de esas cuentas
con la herramienta Botometer, una
colaboración entre Indiana University
Network Science Institute (IUNI) y el
Center for Complex Networks and
Systems Research (CNetS).
Esta herramienta califica mediante un
algoritmo propietario la naturaleza de
las cuentas en relación a la posibilidad
de que sean bots, calificando con un
ranking entre 0 y 5 el grado de
comportamiento tipo bot que esa
cuenta presenta: una calificación de 5
señala a un bot y una cuenta con
ranking de O se da a una que no lo es.
Botometer es un algoritmo de
aprendizaje automático capacitado
para clasificar una cuenta como bot o
humano en base a decenas de miles
de ejemplos etiquetados.
.
El API de Botometer, extrae unas
1,200 funciones para caracterizar el
perfil, los amigos, la estructura de la
red social, los patrones de actividad
temporal, el idioma y el sentimiento
de la cuenta.
Las características son utilizadas por
varios modelos de aprendizaje
automático para calcular los
puntajes del bot.
De acuerdo a esta herramienta
entre las top 500 cuentas en
Twitter que retwittearon en
todo el universo de 21 millones
de twitts no detectamos
ningún bot.
Sin embargo varias de esas cuentas
fueron posteriormente eliminadas
de Twitter, por lo que consideramos
que esta herramienta quizá no
detecte Trolles humanos a sueldo.
No nos fue posible establecer
contacto con los creadores de dicha
herramienta para exponerles el caso
HERRAMIENTA
AUTOMATIZADA OPEN
SOURCE DE DETECCION
DE BOTS
HERRAMIENTA
AUTOMATIZADA OPEN
SOURCE DE DETECCION
DE BOTS
La herramienta Bootometer no califico como boots ninunga de las top 500
cuentas que mas Retwittearon, sin embargo varias de estas cuentas fueron
eliminadas en meses posteriores a las elecciones
ANALISIS MANUAL DE
UNA MUESTRA
EVIDENCIO
COMPORTAMIENTOS
SOSPECHOSOS EN
LOS CLOSTERS DE
CUENTAS CON POCOS
SEGUIDORES
Método 2: Análisis manual de
una muestra
Se procedió a analizar manualmente
una muestra de 250 cuentas
seleccionadas aleatoriamente de un
universo de 1,000 cuentas que
mostraron actividad con palabras
claves definidas en el tesauro de
filtros contra Anaya o pro AMLO, con
menos de 10 seguidores.
Los aspectos que se observaron con
atención especial fueron:
Fecha de creación
Presencia de foto de perfil
Temas de conversación
Posteo de contenido original
Intensidad de la actividad
postelectoral (luego del 1 de julio)
40%De las cuentas que con 10
seguidores o menos que
postearon contenido
sobre algún candidato
fueron creadas en Abril
2018.
ADVERNATIVA
Así se encontró un
patrón que apuntaba a
cuentas anómalas que
fueron creadas entre
enero y abril de 2018,
carecían de foto de
perfil, sólo habían
emitido tweets sobre
cuestiones electorales y
su actividad luego del 1
de julio era casi nula.
Encontramos patrones
anormales en una muestra de
1,000 cuentas que retwittearon
sobre AMLO o Anaya con pocos
seguidores mostraron que:
PATRON ANORMAL
DE
COMPORTAMIENTO
EN CUENTAS CON
10 O MENOS
SEGUIDORES
Ejemplo de cuentas con menos de 10
seguidores que ya no están activas y que
participaron a favor o en contra de Anaya
y AMLO
Porcentaje de cuentas con 10 o menos
seguidores con patrones anormales
Se revisó una muestra de las cuentas con menos de 100 seguidores y
se encontró el mismo porcentaje de cuentas de reciente creación, un
porcentaje mayor de cuentas que sí tenían fotografía de perfil y
tuvieron actividad post electoral, además de la detección de un
porcentaje mucho menor de cuentas no activas.
A continuación se muestra un ejemplo del análisis cualitativo manual
que se hizo en las cuentas con menos de 50 seguidores que
participaron en la conversación a favor de AMLO o en contra de
Ricardo Anaya.
Los patrones de comportamiento daban indicios de que
estas cuentas tenían una probabilidad altísima de ser trolls
mercenarios: cuentas creadas expresamente con el
propósito de amplificar tópicos a favor o en contra de algún
candidato.
PATRONES
SOSPECHOSOS EN
CUENTAS CON 100 O
MENOS SEGUIDORES
DETENCION DE
GRANJAS DE TROLLS O
MILICIAS DIGITALES DE
CUENTAS
INTERRELACIONADAS
Realizamos minería de datos manual
para la detección de granjas de
cuentas de milicias de trolls o bots
hiper amplificado de forma
sospechosa la conversación en redes
sociales sobre las elecciones
Para encontrar evidencia de que
estas cuentas formaban parte de
granjas de trolls mercenarios o que
eran bots que hiper amplificaran la
conversación se procedió a realizar
un análisis semi-manual de
relacionamiento de las cuentas que
identificamos con alta posibilidad de
ser anómalas.
Las cuentas que mayor número de
anomalías presentaron, tanto en su
perfil como en el comportamiento
de su actividad, fueron analizadas
aún más detenidamente.
Se identificó qué cuentas seguían,
qué cuentas retwitteaban y cómo se
relacionaban entre ellas,
encontrando comportamientos
altamente sospechosos en estas
cuentas con cero seguidores que
retwittearon intensamente.
1. Cuentas que retwitteaban solo los
posts de la cuenta de Twitter del
candidato a la presidencia el
Bronco. @JaimeRzNL
2. Casi todas las cuentas fueron
creadas en el 2018
principalmente en los meses de
abril y marzo
3. Una intensidad de actividad muy
por encima de la media normal.
Entre 13 y 1.4 retwitts diarios
cuando la media mensual es de 2
retwitts por mes
4. Encontramos lo que parece ser
una granja de cuentas con la
única actividad de retwittear otra
cuenta que ya fue cancelada en
Twitter que apoyaba al PRD
@IsmaelBombero
5. Cuentas retwitteadoras de temas
en contra de Anaya y del PRI
6. Cuentas retwitteadoras de temas
a favor de AMLO
7. Cuentas con nombres altamente
sospechosos como
TrnuYN0yYDODxkJ o
LuisFra40303003
Muestra	de	cuentas	retwitteadoras o	amplificadoras	de	otras	cuentas
DETENCION DE GRANJAS
DE TROLLS O MILICIAS
DIGITALES DE CUENTAS
INTERRELACIONADAS
Muestra de cuentas Retwitteadoras o amplificadoras de otras cuentas
En este paso de la investigación se
implementó un algoritmo
desarrollado por KarmaPulse para las
elecciones presidenciales de México
en 2018 que pondera distintos
criterios para asignar a cada mensaje
una probabilidad de ser actividad
inorgánica, o sea aquella que no
proviene de ciudadanos reales.
Dicho desarrollo toma en cuenta la
cantidad de tuits emitidos por cada
usuario dentro de la conversación,
siendo un índice alto en esta
medición un indicador de actividad
inorgánica.
Estas cuentas tienden a generar un
elevado número de retwiits y no
participar en intercambios con otros
usuarios.
Se inspecciona la procedencia de
cada uno de los mensajes,
encontrando que existen esfuerzos
evidentes de automatizar la
generación contenido desde
aplicaciones que no suelen ser
utilizados por ciudadanos comunes y
corrientes.
ANALISIS SEMANTICO Y
MATEMATICO DE CUENTAS
QUE TWITTEARON SOBRE
LAS ELECCIONES
Se encontró que el 30% de la
conversación en Twitter durante
las elecciones presidenciales en
México en 2018 muestra patrones
de comportamiento concordante
con las características de
conversaciones no orgánicas lo
que equivale a un una
probabilidad muy alta de ser
generadas por bots o granjas de
trolls o milicias digitales de trolls
Otro criterio que se utiliza para
determinar la veracidad de las
cuentas es la diversidad temática que
exhibe una cuenta participante: las
cuentas de ciudadanos reales tienden
a hablar sobre distintos tópicos que
corresponden a los intereses reales de
la persona, mientras que en las
cuentas inorgánicas los temas suelen
no variar y girar en un mismo asunto.
El análisis del lenguaje determina si
una cuenta muestra rasgos de
automatización puesto que la
connotación de los mensajes tiende a
no cambiar a favor o en contra de
alguno de los candidatos.
También se encuentra que aquellas
cuentas que utilizan construcciones
sintácticas más básicas y poco
elaboradas son las que tienden a ser
inorgánicas.
30%
Conversaciones no
orgánicas
Muestra	de	cuentas	retwitteadoras o	amplificadoras	de	otras	cuentas
ANALISIS SEMANTICO DE 47
MILLONES DE POSTS CON LA
PLATAFORMA KARMAPULSE
ADVERNATIVA
45% de las conversaciones en julio 2018 sobre temas electorales
mostraron patrones de comportamiento semántico y matemático
con indicios de ser anormales
ADVERNATIVA
CONCLUSIONES
Nos encontramos ante un fenómeno
mucho más complejo de lo que
anticipamos
Detectar anomalías en las
conversaciones en redes sociales
requiere de recursos tecnológicos y
humanos sumamente robustos que
muy pocas compañías tienen y mucho
menos la comunidad periodística en
México.
.
Las herramientas automatizadas de
código abierto no fuero de utilidad para
detectar bots en en esta investigación
Sin embargo vía la minería de datos y
el análisis matemático y periodístico
mostramos evidencias claras de
anomalías en la conversación en redes
sociales. durante las elecciones en
México en el 2018.
Creemos que los
resultados de esta
investigación pueden
aportar una metodología
de criterios fácilmente
observables para calificar
como sospechosas ciertas
cuentas que pudieran
estar amplificando de
forma anormal algún
tópico.
INVESTIGACIONES FUTURAS
Consideramos que la base de datos de 21 millones de
observación es un archivo histórico de lo que pasó en las redes
sociales en México durante los comicios presidenciales de este
año, por lo que se pone a disposición de instituciones,
universidades u organismos con objeto de impacto social y
transparencia periodística dicha información.
Si está interesado en descargar esta base de 21 millones de datos,
envíenos un e-mail a:
Adriana Peña Johansson Erick Kelly
MonoBinario
Sistema de escucha y atención a
clientes via redes sociales para
minimizar crisis de relaciones publicar
y maximizar la atención al cliente.
Erick Kelly
ericrkl@monobinario.com
Agradecemos la
contribución de las
plataformas de Análisis
de tendencias en Redes
Sociales
Karma Pulse
Empresa de desarrollo mexicana que
ayuda comprender la opinión pública
y la evolución de los temas en la
conversación social, con una fuerte
especialización en sus algoritmos de
inteligencia artificial que interpretan y
conocen el idioma español de manera
muy precisa.
CEO y CoFounder
Ximena Iñigo
Ximena@karmapulse.com
Director Operaciones
Andres Mesa
andres@karmapulse.com
AGRADECIMIENTOS
erickl@monobinario.comadriana@advernativa.com
Adriana Peña Johansson
Coordinadora general del Proyecto
de detección de anomalías en
redes sociales
Fundadora Advernativa un consultora
de negocios para medios, en Los
Ángeles California. Adriana es
estratega de marketing y negocios,
pionera en medios digitales. Con más
de 20 años de liderazgo en marketing
digital y publicidad. Ha dirigido con
éxito iniciativas de medios digitales en
América Latina y Estados Unidos.
Miembro activo del Interactive Media
Group de la Academia de Artes y
Ciencias de la Televisión en Los
Ángeles, y participando en el jurado
que evalúa a los nominados para los
premios Interactive EMMY desde 2013.
Miembro de la junta directiva de
SembraMedia, una asociación sin fines
de lucro dedicada a apoyar a los
empresarios de medios digitales en
América Latina, los Estados Unidos y
España.
Fue miembro fundador de la
Asociación Mexicana de Internet
donde publico múltiples estudios
sobre hábitos de Internet, comercio
electrónico y banca en línea.
Trainer for U.S. State Department
Media Tech Camp y frecuente speaker
en foros de Mercadotecnia y Medios
en Estados Unidos y Latinoamérica
adriana@advernativa.com
Erick Kelly
Coordinación de Tecnología de
Minería de Datos
Líder en Latinoamérica de Tecnología
Minería de datos en redes sociales.
Fundador Monobinario. Con 30 años de
experiencia en TI como programador, Eric
fue pionero en México en desarrollar
herramientas de escucha en redes
sociales, iniciando su primera plataforma
con este fin en 2007.
Ha seguido la evolución de las
plataformas, siendo invitado
contantemente por principales
compañías del mundo a probar versiones
de programas betas de las APIs de las
principales redes como Twitter, Facebook,
Instagram, YouTube y Foursquare.
Con un pie en el Espectro Autista y el otro
en el mundo espiritual (AspieShaman), su
innata capacidad de "pensar en
imágenes", la facilidad para detectar
cierto tipo de patrones y esa insaciable
necesidad de conocimiento lo hacen ideal
para el análisis y desarrollo de sistemas de
información.
Es también instructor, consultor,
diseñador de sistemas,
telecomunicaciones, multimedia, video
digital, presentaciones de negocios,
experto en plataforma Macintosh (Mac OS
7, 8, 9 y X), administrador y programador
en aplicaciones internet e intranet en
plataformas Unix, Linux, Mac OS X y
Darwin.
ericrkl@monobinario.com
PARTICIPANTES
EN ESTE
PROYECTO
PARTICIPANTES
EN ESTE
PROYECTO
Saúl Zamora Pérez
Analista Matemático Big Data
Matemático egresado de la Universidad
Nacional Autónoma de México con un
postgrado en Inteligencia de Negocios en
ITAM y otro en Minería de Datos en la
UNAM.
Es experto en administración, análisis y
visualización de datos, con dominio en
programación y uso de SQL, MYSQL,
Integración de Datos (ETL) Cubos OLAP
entre otros.
saul.zamora@gmail.com
Paola Monserrat Contreras Ortega
Análisis periodístico de conversaciones en
redes sociales
Periodista, editora web en Periódico
Imagen de Zacatecas
Egresada de la Licenciatura de
Comunicación de la Universidad de la
Vera-Cruz. Técnico Superior en Marketing
de Contenidos.
Coordinadora de equipos humanos para
la realización de proyectos televisivos;
productora multimedia para diferentes
áreas de la comunicación; generadora de
contenidos multimedia y analista online
de marcas.
contrerarasmonse2601@gmail.com
Guadalupe Isabel Medellín Beltrán
Coordinadora de análisis periodístico de
conversaciones en redes sociales.
Jefa del Área de Administración Web y Redes
Sociales de Periódico Imagen de Zacatecas.
Es comunicóloga y periodista por la
Universidad Norte de México, y tiene
experiencia en docencia y trabajo con
adolescentes.
Ha sido líder de equipos de trabajo con
enfoque administrativo, periodístico y de
análisis de contenidos.
Coordina equipos de trabajo para la
elaboración de trabajos periodísticos,
generación de contenido multimedia y
emprendimiento de proyectos informativos y
comerciales.
Fue una de las periodistas invitada al Tech
Camp U.S. State Department en la Ciudad de
México en 2017
isabelmedellinbeltran@gmail.com
Estudio Eleccion 2018 en Mexico
KarmaPulse
Botometer
Botometer que es una colaboración
entre Indiana University Network
Science Institute (IUNI) y el Center
for Complex Networks and Systems
Research (CNetS)
The Follower Factory, New York
Times
Identifying viral bots and cyborgs in
social media
Analyzing tweets and posts around
Trump, Russia, and the NFL using
information entropy, network
analysis, and community detection
algorithms
#ElectionWatch: Loves For Sale
In Brazil. Exposing a Brazilian network
which trades clicks for cash
https://medium.com/dfrlab/election
watch-loves-for-sale-in-brazil-
f8033427dbe0
Bots and Their Influence During the
Mexican Presidential Election – A
Network Science Perspective
“Sospechamos que las granjas de
Troll son muy comunes en México, ya
que los administradores de las
comunidades de medios sociales son
baratos y existe evidencia de que
esta práctica se usó en el pasado”
http://maven7us.com/bot-analysis/
REFERENCIAS Y
BIBLIOGRAFIA
How Trump Conquered Facebook—
Without Russian Ads
https://www.wired.com/story/how-
trump-conquered-facebookwithout-
russian-ads/
4 resources for fighting fake news
https://tiie.w3.uvm.edu/blog/fighting-
fake-news/#.W62kwhNKhTY
Online Human-Bot Interactions:
Detection, Estimation, and
Characterization Onur Varol,1,*
Emilio Ferrara,2 Clayton A. Davis,1
Filippo Menczer,1 Alessandro Flammini1
1Center for Complex Networks and
Systems Research, Indiana University,
Bloomington, US 2 Information
Sciences Institute, University of
Southern California, Marina del Rey, CA,
US
https://arxiv.org/pdf/1703.03107v2.pdf
Twitter suspended more than 70
million accounts in May and June, and
the pace has continued in July, The
Whashington Post
SparkToro™ is a new software company
from Moz founder, Rand Fishkin.
Fake Followers Audit
Colección de Flipboard sobre articulos
e investigaciones del tema
https://flipboard.com/@adrianapenajoha/fake-
news-and-brand-safety-12tgretuy

Más contenido relacionado

Similar a Bots and trolls in Mexican Elections 2018

Redes sociales y ciberperiodismo.el caso de la foto falsa de chávez en el país
Redes sociales y ciberperiodismo.el caso de la foto falsa de chávez en el paísRedes sociales y ciberperiodismo.el caso de la foto falsa de chávez en el país
Redes sociales y ciberperiodismo.el caso de la foto falsa de chávez en el país
laurapeal
 
Importancia de las redes sociales(facebook y twitter)
Importancia de las redes sociales(facebook y twitter)Importancia de las redes sociales(facebook y twitter)
Importancia de las redes sociales(facebook y twitter)
Diana Saucedo
 

Similar a Bots and trolls in Mexican Elections 2018 (20)

202306-Estudio Milei Mueve.pdf
202306-Estudio Milei Mueve.pdf202306-Estudio Milei Mueve.pdf
202306-Estudio Milei Mueve.pdf
 
Twitter Analysys: El Buen fin 2015
Twitter Analysys: El Buen fin 2015Twitter Analysys: El Buen fin 2015
Twitter Analysys: El Buen fin 2015
 
RED SOCIAL
RED SOCIALRED SOCIAL
RED SOCIAL
 
Gobiernos y Tendencias N° 8
Gobiernos y Tendencias N° 8Gobiernos y Tendencias N° 8
Gobiernos y Tendencias N° 8
 
Las elecciones presidenciales en Twitter, 2do WebinaliTIC
Las elecciones presidenciales en Twitter, 2do WebinaliTICLas elecciones presidenciales en Twitter, 2do WebinaliTIC
Las elecciones presidenciales en Twitter, 2do WebinaliTIC
 
Informe final
Informe finalInforme final
Informe final
 
80% de sentimiento negativo por Batakis en las redes
80% de sentimiento negativo por Batakis en las redes80% de sentimiento negativo por Batakis en las redes
80% de sentimiento negativo por Batakis en las redes
 
Análisis de la Política de Comunicación en Twitter de las Administraciones Pú...
Análisis de la Política de Comunicación en Twitter de las Administraciones Pú...Análisis de la Política de Comunicación en Twitter de las Administraciones Pú...
Análisis de la Política de Comunicación en Twitter de las Administraciones Pú...
 
Twitter En Mexico2010
Twitter En Mexico2010Twitter En Mexico2010
Twitter En Mexico2010
 
Diputados en Twitter: Influencia y Conversación
Diputados en Twitter: Influencia y ConversaciónDiputados en Twitter: Influencia y Conversación
Diputados en Twitter: Influencia y Conversación
 
Twiter para periodistas
Twiter para periodistasTwiter para periodistas
Twiter para periodistas
 
Saura, Reyes y Palos, 2018.pdf
Saura, Reyes y Palos, 2018.pdfSaura, Reyes y Palos, 2018.pdf
Saura, Reyes y Palos, 2018.pdf
 
La comunicación en las redes sociales como nuevo espacio de libertad, soberan...
La comunicación en las redes sociales como nuevo espacio de libertad, soberan...La comunicación en las redes sociales como nuevo espacio de libertad, soberan...
La comunicación en las redes sociales como nuevo espacio de libertad, soberan...
 
Rmc enero
Rmc eneroRmc enero
Rmc enero
 
Redes sociales y ciberperiodismo.el caso de la foto falsa de chávez en el país
Redes sociales y ciberperiodismo.el caso de la foto falsa de chávez en el paísRedes sociales y ciberperiodismo.el caso de la foto falsa de chávez en el país
Redes sociales y ciberperiodismo.el caso de la foto falsa de chávez en el país
 
Redes sociales y ciberperiodismo. El caso de la foto falsa de chávez en El p...
Redes sociales y ciberperiodismo. El caso de la foto falsa de chávez en El p...Redes sociales y ciberperiodismo. El caso de la foto falsa de chávez en El p...
Redes sociales y ciberperiodismo. El caso de la foto falsa de chávez en El p...
 
Importancia de las redes sociales(facebook y twitter)
Importancia de las redes sociales(facebook y twitter)Importancia de las redes sociales(facebook y twitter)
Importancia de las redes sociales(facebook y twitter)
 
Marketing en Twitter
Marketing en TwitterMarketing en Twitter
Marketing en Twitter
 
Twitter
TwitterTwitter
Twitter
 
Informe PRI
Informe PRIInforme PRI
Informe PRI
 

Más de Adriana Peña Johansson

Más de Adriana Peña Johansson (8)

Branded content and archetypes
Branded content and archetypesBranded content and archetypes
Branded content and archetypes
 
Hispanics and Language, Acculturation, Retro-Aculturion and Language
Hispanics and Language, Acculturation, Retro-Aculturion and LanguageHispanics and Language, Acculturation, Retro-Aculturion and Language
Hispanics and Language, Acculturation, Retro-Aculturion and Language
 
Travel purchasefunneldisruption ap2015
Travel purchasefunneldisruption ap2015Travel purchasefunneldisruption ap2015
Travel purchasefunneldisruption ap2015
 
Hispanic Voice in TV, Film, Video and Internet, Digital hollywood 2014
Hispanic Voice in TV, Film, Video and Internet�, Digital hollywood 2014Hispanic Voice in TV, Film, Video and Internet�, Digital hollywood 2014
Hispanic Voice in TV, Film, Video and Internet, Digital hollywood 2014
 
LatinCon: Future of Spanish Media in US 2014-AdrianaPeña
LatinCon: Future of Spanish Media in US 2014-AdrianaPeñaLatinCon: Future of Spanish Media in US 2014-AdrianaPeña
LatinCon: Future of Spanish Media in US 2014-AdrianaPeña
 
Digital Hollywood 2013 US Hispanics and Mobile
Digital Hollywood 2013 US Hispanics and MobileDigital Hollywood 2013 US Hispanics and Mobile
Digital Hollywood 2013 US Hispanics and Mobile
 
Digital Hollywood 2013: Content and US Hispanics
Digital Hollywood 2013: Content and US HispanicsDigital Hollywood 2013: Content and US Hispanics
Digital Hollywood 2013: Content and US Hispanics
 
Usmx2012 onlinetrends ap.pptx
Usmx2012 onlinetrends ap.pptxUsmx2012 onlinetrends ap.pptx
Usmx2012 onlinetrends ap.pptx
 

Bots and trolls in Mexican Elections 2018

  • 1.
  • 2. En 2018 un grupo de programadores, periodistas y estrategas digitales nos dimos a la tarea de encabezar una investigación de análisis de big data en redes sociales durante las elecciones en 2018 en México. El proyecto no tuvo fines de lucro, fue hecho con objetivo periodístico realizado gracias al apoyo de un mini grant recibido del TechCamp, iniciativa diplomática de capacitación en soluciones tecnológicas, que forma parte de la Oficina de Programas de Información Internacional en el Departamento de Estado de los Estados Unidos. Buscamos desarrollar un metodología para encontrar a las cuentas sospechosas de ser bots o trolls mercenarios parte de una red orquestada para amplificar cierto contenido y exponerlos a la opinión pública con la esperanza de que periodistas y ciudadanos tengan recursos para diferenciar entre un troll humano normal de un bot o troll mercenario, es decir cuentas operando de forma concertada para lograr inferir en la conversación electoral en México METODOLOGIA DETECCION DE BOTS EN LA ELECCIONES DE MEXICO
  • 3. Recopilamos más de 20 millones de datos buscando primero detectar los patrones normales de comportamiento entre los usuarios de Twitter y poder contrastarlos con aquellos que perecieran estar participando en amplificación anormal de la conversación electoral y comprobar si, por su actividad anómala, se trataba de cuentas no orgánicas; es decir: bots o milicias digitales de trolls. Este trabajo no tuvo la intención de verificar la veracidad de los contenidos en las conversaciones en redes sociales sobre el proceso electoral presidencial de México: no fue un esfuerzo encaminado a la comprobación de los hechos. Nuestro objetivos fueron: 1. Detectar los principales tópicos de carácter electoral que se convirtieron en tendencia y que mostraron indicios de ser creados o amplificados por cuentas irregulares. 2. Analizar las caracteristicas de dichas cuentas 3. Detectar la naturaleza de los trolls que atacan cuentas de medios, periodistas y figuras públicas durante este proceso electoral. 4. Crear un protocolo para identificar fácilmente bots o trolls mercenarios que estén amplificando de forma anormal la conversación en redes sociales. La metodología utilizada, la información elaborada con los datos recopilados y las conclusiones de este trabajo de investigación periodística son responsabilidad del equipo de voluntarios que integran este proyecto ADRIANA PEÑA JOHANSSON
  • 4. CRITERIOS PARA IDENTIFICAR A UN BOT O GRANJA DE MILICIAS DIGITALES DE TROLLES EN REDES SOCIALES En base a información previa de otros estudios seguimos algunos de siguientes criterios para buscar identificar las cuentas sospechosas * 1. Nombre de la cuenta: resalta la presencia de caracteres inusuales como @arturo162547751. 2. Relación de seguidores a cuentas que siguen: por ejemplo tener muy pocos seguidores y seguir a un gran número de cuentas. 3. Frecuencia de actividad: cuántas veces postea, a qué horas, las zonas horarias de actividad comparadas con el idioma o país de residencia que indica la cuenta, etc. 4. Trolls /Bots rastreadores: cuentas que siguen ciertos tópicos y twittean o retwitean cuando algo sobre ese tópico sucede. Al analizar el código se pueden encontrar claves como: cuando X pase entonces twittear Y. 5. Bot/Trolls amplificadores: siguen determinadas cuentas y cuando dicha presenta actividad, los bots o troll también postean algo. 6. Perfiles suplantados: usan imágenes de otras cuentas reales, así como nombres similares de cuentas activas o ya canceladas. 7. Nombres de cuentas pirata: tener un nombre de cuenta que imitan el de cuentas reales mediante pequeñas variaciones en el nombre de la cuenta gracias al uso de caracteres numéricos, una o dos letras diferentes, o guiones y puntos; por ejemplo @apenaj es la cuenta real y las cuentas piratas serian @_apenaj o @aPenaJ 8. Idioma: las cuentas han twitteado en diferentes idiomas* Puedes consultar la extensa bibliografía de estudios e investigaciones periodísticas al en la sección bibliografía
  • 5. ADVERNATIVA CRITERIOS PARA IDENTIFICAR GRANJAS DE TROLLES EN REDES SOCIALES Otro nivel de análisis para encontrar cuentas anómalas o cuentas creadas en granjas de milicias digitales de trolls es analizar clústers o familias de cuentas las cuales compartan las siguientes características: 1. Fueron creadas en las mismas fechas. 2. Su retwiiteo es inter-amplificador; es decir: se trata de cuentas que se relacionan entre si retwittándose una a la otra con casi de forma exclusiva o con frecuencia anormal. 3. Tienen patrones similares de twitts o retwiits alrededor de tópicos, posteando al mismo tiempo, con el mismo sentimiento o tono incluso mismas palabras o hashtags.
  • 6. 70 MILLONES DE DATOS Utilizamos dos plataformas de acopio de datos desarrolladas en México por expertos en programación de herramientas de análisis en redes sociales en español. Monobinario. plataforma desarrollada por el programador Erick Kelly, colaborador de este proyecto y KarmaPulse, la única plataforma de análisis en redes sociales con inteligencia artificial para revisar el sentimiento de las conversaciones en español. Recopilamos dos bases de datos, una de 22 millones de datos recabados entre el 20 de abril al 20 de julio 2018 y otra de 47 millones de datos del 1 de abril al 15 de julio de 2018 Recopilamos todas la informacion posteada en las cuentas publicas de Twitter y Facebook de los 5 candidatos a la presidencia, asi como todas las conversaciones que incluyeran nombres, siglas y apodos (incluidos los posibles errores de ortografía El universo de cuentas y topicos analizado incluyó a los partidos políticos así como las de sus principales colaboradores; organizaciones gubernamentales y no gubernamentales relacionadas con el proceso electoral y se dio de alta un número de cuentas de periodistas que tienen un importante número de seguidores Un equipo de periodistas definió los hechos noticiosos alrededor los candidatos y este proceso electoral que se convirtieron en tópicos y etiquetas usados en ambas redes sociales. Se creó un tesauro de palabras con todas sus variaciones para filtrar los datos recopilados y hacer un análisis más preciso de patrones de comportamiento en relación a cada tema. Se puso especial atención en aquellos que, por su naturaleza, pudieran ser idóneos para amplificaciones anómalas o propagandísticas; por ejemplo: “AMLO” y “Venezuela”, o Ricardo Anaya y “lavado de dinero”. 1.8 MILLONES DE CUENTAS EN TWITTER ADVERNATIVA
  • 7. 15%. RESUMEN DE HALLAZGOS Evidencia de patrones de comportamiento anormal en Twitter durante las elecciones presidenciales de México en 2018. 30%De la conversación sobre las elecciones mostro evidencia de no ser orgánica, es decir mostro patrones anormales De las cuentas que participaron activamente en redes sociales durante las elecciones en México mostraron alta probabilidad de ser anómalas
  • 8. RESUMEN DE HALLAZGOS Evidencia de patrones de comportamiento anormal en Twitter durante las elecciones presidenciales de México en 2018. cuentas sin seguidores twittearon intensamente sobre los candidatos AMLO y ANAYA 12,499 de esas cuentas fueron canceladas en agosto a un mes después de las elecciones.* 90% (* desconocemos si fue parte de la depuración mundial que hizo Twitter en 2018 de cuentas sospechosas) 38 % De las cuentas con menos de 10 seguidores que postearon sobre alguno de los dos candidatos fueron creadas en abril 2018 30% de las cuentas con menos de 10 seguidores que postearon sobre algún candidato dejaron de postear cualquier contenido después del 1 de Julio. Todas estas cuentas que analizamos con menos de 10 seguidores tenían en común el postear para alabar a los candidatos o criticar agresivamente algún aspecto político y el 90% solo postearon contenido político en relación a las elecciones. (ningún post de sus perros, sus gatos o el tráfico, o el clima)
  • 9. 1. Nombres: Una gran cantidad de cuentas con nombres con caracteres inusuales como @arturo162547751 2. Relacion Followers a numero de cuentas que siguen: Cuentas con una relación muy desbalanceada de seguidores a cuentas que siguen, encontramos 12,499 cuentas sin seguidores que twittearon activamente sobre los dos candidatos a la presidencia de México ALMO y ANAYA. El 90% de estas cuentas fueron eliminadas unos meses después por Twitter, sin embargo estuvieron activas desde varios meses antes de la elecciones. 3. Intensidad de posteo: Cuentas con intensidad de twitteo muy por encima a lo normal. Como la cuenta de @Jcjuarezyke2707 que retuiteo mas de 700 veces mas que la media de las cuentas normales y lo hizo solo para retwittear post del candidato Jaime Rodriguez (esta cuenta esta ya cancelda por Twitter) 4. Idioma: encontramos cuentas tuiteando en diferentes idiomas y diversos tópicos. Si bien el uso de comunicación bilingüe no hace una cuenta sospechosa si lo hace el hecho de que en un periodo de tiempo esa cuenta posteara en español sobre las elecciones Mexicanas y meses antes lo hiciera en ingles sobre otros temas totalmente ajenos a la política latinoamericana. 5. Sin fotografia en el perfil: 88% de las cuentas que detectamos con intensa actividad durante las elecciones y que no tenían ningún seguidor tampoco tenían un perfil con fotografía de una persona. 6. Fecha simultanea de creacion de la cuenta: La mayoría de las cuentas que identificamos presentaban comportamientos anormales y que retwittearon a favor de Andres Manuel Lopez Obrador o contra Ricardo Anaya o el PRI no tenían seguidores y fueron creadas en abril 2018 7. Monotematicas: Casi todas las cuentas amplificadoras de los temas politicos solo postearon mono tematicamente. Es decir solo postraron contenido sobre política y con una marcada postura a favor o en contra de algún candidato o partido 8. Grupos de Trolls, o milicias digitales amplificadores: Grupos de cuentas cuya una funcion pareciera haber sido re- twittearn intensamente algunos twits de cuentas con mas seguidores o influenciadores, como la cuenta IsmaelBombero (proAMLO), dicha cuenta fue cancelada por Twitter después de las elecciones Encontramos evidencia de cuentas que cumplían con los criterios de ser cuentas sospechosas de ser bots o granjas de trolls PATRONES DE CUENTAS CON COMPORTAMIENTO ANORMAL EN TWITTER DURANTE LAS ELECCIONES EN MEXICO ADVERNATIVA
  • 10. COMPORTAMIENTO NORMAL No podemos determinar qué es anormal si no sabemos qué es normal. Con base en investigaciones ya realizadas sobre cómo se comporta una cuenta normal que opina sobre procesos electorales en Latinoamérica, nos dimos a la tarea de establecer qué es un patrón normal tanto de la emisión de contenido original como de la relacionada con el contenido amplificado o retweeteado. Comportamiento normal en Twitter La frecuencia con al que las personas postean o re-postean contenido en redes sociales tiene que ver no solo con su estilo, edad u objetivo de uso de redes sociales, sino también con el tipo de evento o contenido del cual se postea. En este caso el universo analizado fueron solo Twitts y ReTwitts sobre temas electorales 70% ReTwitts El otro fueron amplificaciones de esos contenido o ReTwitts 30% Twitts Del contenido en Twitter sobre las elecciones fueron Twitts ADVERNATIVA
  • 11. Twitts 1.8 millones de cuentas postearon una media de 1 vez por mes Solo el 0.04% Twitteraron mas de 30 veces x mes ReTwitts El 81% de las 1,8 millones de cuentas analizadas ReTwittearon de 1-4 veces por mes Solo el 2.54% Retwittearon mas de 30 veces x mes La intensidad de posteo de contenido original, es decir de Twitts fue la mitad que la de ReTwitteo. La media de Twitteo original fue de 1 por mes y la media de ReTwitteo fue de 2 Esta baja intensidad de posteo coincide con indicadores publicados en otros estudios que apuntan a que hay más consumidores pasivos de contenido en redes sociales que productores de contenido
  • 12. COMPORTAMIENTO NORMAL Analizamos el universo de las 1.8 millones de cuentas que postearon contenido en Twitter sobre los temas electorales para buscar la relacion entre numero de seguidores y activadad. encontramos el 15% de cuentas que postearon algo durante los cuatro meses que racabamos informacion tenian cero seguidores. Solo el 2% de las cuentas tenian mas de 4000 seguidores, La media de seguidores de las cuentas que partciparon en la conversacion sobre las elecciones fue de 173. 17millones de seguidores 0 Seguidores ADVERNATIVA 173 Media de Seguidores que tienen los usuarios
  • 13. HIPER AMPLIFICADORES DE CONVERSACION EN TWITTER DURANTE LAS ELECCIONES Identificamos las 500 cuentas que retwittearon más frecuentemente durante los 4 meses que recopilamos información así como las 500 cuentas con mayor número de seguidores que twitearon o retwittearon sobre las elecciones. Detectamos también a los influenciadores de cada grupo de conversación analizado sobre cada uno de los cinco candidatos, los temas a favor o en contra de candidatos y temas neutros como “debate” o “elecciones 2018” así como los influenciadores de tópicos relacionados a posturas como “AMLO” y “Venezuela” o “Nunca el PRIAN”. Analizamos las cuentas que amplificaron intensamente las publicaciones de los periodistas como Carmen Aristegui, Carlos Loret de Mola, Joaquín López Dóriga y Paola Rojas, así los de la cuenta de periodismo de factchecking Verificado 2018 3%De las cuentas generaron el 50% de los ReTwitts sobre temas electorales. ADVERNATIVA Los híper amplificadores que incidieron en la conversación con su intensidad posteo generaron un total de 6.2 millones de retwitts. Estas cuentas no necesariamente coinciden con aquellos que tienen más seguidores
  • 14. LA CONVERSACION SOBRE LAS ELECCIONES FUE PROVOCADA POR UN NUMERO MUY REDUCIDO DE CUENTAS ADVERNATIVA 1.7%De las cuentas generaron el 50% de los Twitts con contenido original sobre temas electorales. 90 % Cuentas generaron 20% del contenido posteado 1.7 % Cuentas generaron 50% del contenido posteado7.3 % Cuentas generaron 30% del contenido posteado
  • 15. 1.- groyperproject 3164 2.- AdrianaT9735 2853 3.- alejandrinacar4 2827 4.- carmitamocas 2385 5.- lauritamo22 2365 5.- betz_zavala 2339 7.- BetitoHapo 2317 8.- Besamelculo1 2298 9.- MarianoBurnett 2182 10.- ursusnero 2123 1.- JoseLuisHS_ 52,838 2.- CARRODPER 8,396 3.- MX_en140 7,300 4.- FranLuva 7,064 5.- letymaldo 6,952 5.- ManuelVegaCln 6,740 7.- Nacion321 6,383 8.- NoticiasMVS 6,298 9.- ALASDELALMARB 6,254 10.- politicomx 5,862 TOP 10 TWITTEADORES SOBRE LAS ELECCIONES DE MEXICO Las dos cuentas que mas Twittearon y la que más Re Twittearon durante las elecciones ya no son cuentas activas. Solo 4 medios de comunicación destancan como hiper generadores de contenido en Twitter durante las elecciones
  • 16. . PATRONES DE LAS CUENTAS QUE TWITTEARON SOBRE ALGUNO DE LOS CANDIDATOS LIDERE EN LAS ENCUESTAS ADVERNATIVA Para limitar aún más el universo se prestó especial atención en las conversaciones orientadas a los candidatos presidenciales punteros en las encuestas: Ricardo Anaya Cortés y Andrés Manuel López Obrador (AMLO). El análisis de estas dos submuestras arrojó: 12,499 cuentas sin seguidores twittearon intensamente sobre alguno o ambos candidatos a la republica 286 mil retwittearon algo sobre AMLO 225 mil lo hicieron sobre Ricardo Anaya Estas muestras no fueron seleccionadas por incluir comentarios a favor o en contra de estos candidatos. Haciendo un muestro meses después de las elecciones encontramos a muchas de ellas fueron eliminadas por Twitter: en julio decenas de millones de cuentas fueron apagadas pues se consideraban sospechosas de ser automatizadas o falsas en el mundo Hemos preservado esta base datos con toda la la actividad de esas 12,499 para futuras investigaciones 50 cuentas de hiperinfluenciadores retwittearon sobre ANAYA y 85 lo hicieron sobre AMLO 15% de la cuentas que retwittearon sobre Anaya o AMLO tenían menos de 20 seguidores
  • 17. 3% 12,500 cuentas que postearon algo en relación a AMLO o ANAYA no tenían seguidores y aun así postearon intensamente PATRONES SOSPECHOSOS EN LAS CUENTAS QUE TWITTEARON SOBRE ALGUNO DE LOS CANDIDATOS LIDERE EN LAS ENCUESTAS ADVERNATIVA 90% de las cuentas en Twitter con cero seguidores que postearon algo sobre AMLO o ANAYA fueron creadas entre 2017 y 2018 de las cuentas con cero seguidores fueron creadas en el 2018 60% Dos meses después de las elecciones de México 2018 se verificó que: de las cuentas con cero seguidores que retwittearon sobre Ricardo Anaya fueron eliminadas 90% 70% que retwittearon sobre AMLO con cero seguidores ya no existen. de la cuentas con cero seguidores que retwittearon sobre AMLO habian posteado en otro idioma anteriormente
  • 18. Las cuentas más sospechosas de ser Bots o Trolls no fueron las que tenían más seguidores necesariamente, al contrario. Encontramos que fueron las cuentas con mucho menos seguidores de lo normal que postearon con mayor frecuencia a lo normal ENCONTRAMOS CUENTAS CON NUMERO DE SEGUIDORES MUY POR ABAJO DEL NORMAL PERO FRECUENCIA DE ACTIVIDAD ARRIBA DEL NORMAL 15% de las cuentas que participaron activamente en redes sociales tenían alta probabilidad de ser anómalas Así se empezó a considerar que las cuentas sospechosas de ser amplificadores anómalos no estaban necesariamente en el grupo de influenciadores principales. Había un comportamiento más anormal en las cuentas con un número de seguidores muy por debajo de la media y cuya actividad estaba por arriba de la media de dos retwitts. ADVERNATIVA
  • 19. Múltiples estudios apuntan a una serie de indicios de que una cuenta podría no ser orgánica. Quien mejor resume los criterios de cómo distinguir un bot o un troll mercenario podría ser el artículo The follower factory publicado por “The New York Times” que precisa ciertas características en algunos elementos de la cuenta Cabe reconocer que esta investigación tuvo recursos muy limitados para procesar los millones de datos que recopilamos, así que decidimos hacer minería de datos en las cuentas que mostraban patrones fuera de la norma. Es decir mucha actividad, pocos seguidores, o muchísimos seguidores Hicimos muestras de esos grupos y seguimos cuatro diferentes metodologías para detectar cuentas con los patrones que otros estudios han evidenciado como bots o trolls en otros países Bots automáticos o Trolles a sueldo 1. Nombre de la cuenta: 2. Relación de seguidores a cuentas que siguen 3. Frecuencia de actividad: 4. Trolls /Bots rastreadores: 5. Bot/Trolls amplificadores: 6. Perfiles suplantados: 7. Nombres de cuentas pirata: 8. Idioma: Granjas de Trolles 1. Fecha de creación similar 2. Retwiiteo inter-amplificador 3. Tienen patrones similares de twitts o retwiits COMBINACION DE MINERIA DE DATOS Y ANALISIS PERIODISTICO PARA ENCONTRAR EVIDENCIAS DE CUENTAS SOSPECHOSAS EN TWITTER Criterios para detectar ADVERNATIVA
  • 20. Método 1: Herramienta automatizada open source de detección de bots Manualmente se analizó cada una de las top 500 cuentas que Retwittearon mas durante los cuatro meses Revisamos cada una de esas cuentas con la herramienta Botometer, una colaboración entre Indiana University Network Science Institute (IUNI) y el Center for Complex Networks and Systems Research (CNetS). Esta herramienta califica mediante un algoritmo propietario la naturaleza de las cuentas en relación a la posibilidad de que sean bots, calificando con un ranking entre 0 y 5 el grado de comportamiento tipo bot que esa cuenta presenta: una calificación de 5 señala a un bot y una cuenta con ranking de O se da a una que no lo es. Botometer es un algoritmo de aprendizaje automático capacitado para clasificar una cuenta como bot o humano en base a decenas de miles de ejemplos etiquetados. . El API de Botometer, extrae unas 1,200 funciones para caracterizar el perfil, los amigos, la estructura de la red social, los patrones de actividad temporal, el idioma y el sentimiento de la cuenta. Las características son utilizadas por varios modelos de aprendizaje automático para calcular los puntajes del bot. De acuerdo a esta herramienta entre las top 500 cuentas en Twitter que retwittearon en todo el universo de 21 millones de twitts no detectamos ningún bot. Sin embargo varias de esas cuentas fueron posteriormente eliminadas de Twitter, por lo que consideramos que esta herramienta quizá no detecte Trolles humanos a sueldo. No nos fue posible establecer contacto con los creadores de dicha herramienta para exponerles el caso HERRAMIENTA AUTOMATIZADA OPEN SOURCE DE DETECCION DE BOTS
  • 21. HERRAMIENTA AUTOMATIZADA OPEN SOURCE DE DETECCION DE BOTS La herramienta Bootometer no califico como boots ninunga de las top 500 cuentas que mas Retwittearon, sin embargo varias de estas cuentas fueron eliminadas en meses posteriores a las elecciones
  • 22. ANALISIS MANUAL DE UNA MUESTRA EVIDENCIO COMPORTAMIENTOS SOSPECHOSOS EN LOS CLOSTERS DE CUENTAS CON POCOS SEGUIDORES Método 2: Análisis manual de una muestra Se procedió a analizar manualmente una muestra de 250 cuentas seleccionadas aleatoriamente de un universo de 1,000 cuentas que mostraron actividad con palabras claves definidas en el tesauro de filtros contra Anaya o pro AMLO, con menos de 10 seguidores. Los aspectos que se observaron con atención especial fueron: Fecha de creación Presencia de foto de perfil Temas de conversación Posteo de contenido original Intensidad de la actividad postelectoral (luego del 1 de julio) 40%De las cuentas que con 10 seguidores o menos que postearon contenido sobre algún candidato fueron creadas en Abril 2018. ADVERNATIVA Así se encontró un patrón que apuntaba a cuentas anómalas que fueron creadas entre enero y abril de 2018, carecían de foto de perfil, sólo habían emitido tweets sobre cuestiones electorales y su actividad luego del 1 de julio era casi nula.
  • 23. Encontramos patrones anormales en una muestra de 1,000 cuentas que retwittearon sobre AMLO o Anaya con pocos seguidores mostraron que: PATRON ANORMAL DE COMPORTAMIENTO EN CUENTAS CON 10 O MENOS SEGUIDORES Ejemplo de cuentas con menos de 10 seguidores que ya no están activas y que participaron a favor o en contra de Anaya y AMLO Porcentaje de cuentas con 10 o menos seguidores con patrones anormales
  • 24. Se revisó una muestra de las cuentas con menos de 100 seguidores y se encontró el mismo porcentaje de cuentas de reciente creación, un porcentaje mayor de cuentas que sí tenían fotografía de perfil y tuvieron actividad post electoral, además de la detección de un porcentaje mucho menor de cuentas no activas. A continuación se muestra un ejemplo del análisis cualitativo manual que se hizo en las cuentas con menos de 50 seguidores que participaron en la conversación a favor de AMLO o en contra de Ricardo Anaya. Los patrones de comportamiento daban indicios de que estas cuentas tenían una probabilidad altísima de ser trolls mercenarios: cuentas creadas expresamente con el propósito de amplificar tópicos a favor o en contra de algún candidato. PATRONES SOSPECHOSOS EN CUENTAS CON 100 O MENOS SEGUIDORES
  • 25. DETENCION DE GRANJAS DE TROLLS O MILICIAS DIGITALES DE CUENTAS INTERRELACIONADAS Realizamos minería de datos manual para la detección de granjas de cuentas de milicias de trolls o bots hiper amplificado de forma sospechosa la conversación en redes sociales sobre las elecciones Para encontrar evidencia de que estas cuentas formaban parte de granjas de trolls mercenarios o que eran bots que hiper amplificaran la conversación se procedió a realizar un análisis semi-manual de relacionamiento de las cuentas que identificamos con alta posibilidad de ser anómalas. Las cuentas que mayor número de anomalías presentaron, tanto en su perfil como en el comportamiento de su actividad, fueron analizadas aún más detenidamente. Se identificó qué cuentas seguían, qué cuentas retwitteaban y cómo se relacionaban entre ellas, encontrando comportamientos altamente sospechosos en estas cuentas con cero seguidores que retwittearon intensamente. 1. Cuentas que retwitteaban solo los posts de la cuenta de Twitter del candidato a la presidencia el Bronco. @JaimeRzNL 2. Casi todas las cuentas fueron creadas en el 2018 principalmente en los meses de abril y marzo 3. Una intensidad de actividad muy por encima de la media normal. Entre 13 y 1.4 retwitts diarios cuando la media mensual es de 2 retwitts por mes 4. Encontramos lo que parece ser una granja de cuentas con la única actividad de retwittear otra cuenta que ya fue cancelada en Twitter que apoyaba al PRD @IsmaelBombero 5. Cuentas retwitteadoras de temas en contra de Anaya y del PRI 6. Cuentas retwitteadoras de temas a favor de AMLO 7. Cuentas con nombres altamente sospechosos como TrnuYN0yYDODxkJ o LuisFra40303003
  • 26. Muestra de cuentas retwitteadoras o amplificadoras de otras cuentas DETENCION DE GRANJAS DE TROLLS O MILICIAS DIGITALES DE CUENTAS INTERRELACIONADAS Muestra de cuentas Retwitteadoras o amplificadoras de otras cuentas
  • 27. En este paso de la investigación se implementó un algoritmo desarrollado por KarmaPulse para las elecciones presidenciales de México en 2018 que pondera distintos criterios para asignar a cada mensaje una probabilidad de ser actividad inorgánica, o sea aquella que no proviene de ciudadanos reales. Dicho desarrollo toma en cuenta la cantidad de tuits emitidos por cada usuario dentro de la conversación, siendo un índice alto en esta medición un indicador de actividad inorgánica. Estas cuentas tienden a generar un elevado número de retwiits y no participar en intercambios con otros usuarios. Se inspecciona la procedencia de cada uno de los mensajes, encontrando que existen esfuerzos evidentes de automatizar la generación contenido desde aplicaciones que no suelen ser utilizados por ciudadanos comunes y corrientes. ANALISIS SEMANTICO Y MATEMATICO DE CUENTAS QUE TWITTEARON SOBRE LAS ELECCIONES Se encontró que el 30% de la conversación en Twitter durante las elecciones presidenciales en México en 2018 muestra patrones de comportamiento concordante con las características de conversaciones no orgánicas lo que equivale a un una probabilidad muy alta de ser generadas por bots o granjas de trolls o milicias digitales de trolls Otro criterio que se utiliza para determinar la veracidad de las cuentas es la diversidad temática que exhibe una cuenta participante: las cuentas de ciudadanos reales tienden a hablar sobre distintos tópicos que corresponden a los intereses reales de la persona, mientras que en las cuentas inorgánicas los temas suelen no variar y girar en un mismo asunto. El análisis del lenguaje determina si una cuenta muestra rasgos de automatización puesto que la connotación de los mensajes tiende a no cambiar a favor o en contra de alguno de los candidatos. También se encuentra que aquellas cuentas que utilizan construcciones sintácticas más básicas y poco elaboradas son las que tienden a ser inorgánicas. 30% Conversaciones no orgánicas
  • 28. Muestra de cuentas retwitteadoras o amplificadoras de otras cuentas ANALISIS SEMANTICO DE 47 MILLONES DE POSTS CON LA PLATAFORMA KARMAPULSE ADVERNATIVA 45% de las conversaciones en julio 2018 sobre temas electorales mostraron patrones de comportamiento semántico y matemático con indicios de ser anormales
  • 29. ADVERNATIVA CONCLUSIONES Nos encontramos ante un fenómeno mucho más complejo de lo que anticipamos Detectar anomalías en las conversaciones en redes sociales requiere de recursos tecnológicos y humanos sumamente robustos que muy pocas compañías tienen y mucho menos la comunidad periodística en México. . Las herramientas automatizadas de código abierto no fuero de utilidad para detectar bots en en esta investigación Sin embargo vía la minería de datos y el análisis matemático y periodístico mostramos evidencias claras de anomalías en la conversación en redes sociales. durante las elecciones en México en el 2018. Creemos que los resultados de esta investigación pueden aportar una metodología de criterios fácilmente observables para calificar como sospechosas ciertas cuentas que pudieran estar amplificando de forma anormal algún tópico.
  • 30. INVESTIGACIONES FUTURAS Consideramos que la base de datos de 21 millones de observación es un archivo histórico de lo que pasó en las redes sociales en México durante los comicios presidenciales de este año, por lo que se pone a disposición de instituciones, universidades u organismos con objeto de impacto social y transparencia periodística dicha información. Si está interesado en descargar esta base de 21 millones de datos, envíenos un e-mail a: Adriana Peña Johansson Erick Kelly MonoBinario Sistema de escucha y atención a clientes via redes sociales para minimizar crisis de relaciones publicar y maximizar la atención al cliente. Erick Kelly ericrkl@monobinario.com Agradecemos la contribución de las plataformas de Análisis de tendencias en Redes Sociales Karma Pulse Empresa de desarrollo mexicana que ayuda comprender la opinión pública y la evolución de los temas en la conversación social, con una fuerte especialización en sus algoritmos de inteligencia artificial que interpretan y conocen el idioma español de manera muy precisa. CEO y CoFounder Ximena Iñigo Ximena@karmapulse.com Director Operaciones Andres Mesa andres@karmapulse.com AGRADECIMIENTOS erickl@monobinario.comadriana@advernativa.com
  • 31. Adriana Peña Johansson Coordinadora general del Proyecto de detección de anomalías en redes sociales Fundadora Advernativa un consultora de negocios para medios, en Los Ángeles California. Adriana es estratega de marketing y negocios, pionera en medios digitales. Con más de 20 años de liderazgo en marketing digital y publicidad. Ha dirigido con éxito iniciativas de medios digitales en América Latina y Estados Unidos. Miembro activo del Interactive Media Group de la Academia de Artes y Ciencias de la Televisión en Los Ángeles, y participando en el jurado que evalúa a los nominados para los premios Interactive EMMY desde 2013. Miembro de la junta directiva de SembraMedia, una asociación sin fines de lucro dedicada a apoyar a los empresarios de medios digitales en América Latina, los Estados Unidos y España. Fue miembro fundador de la Asociación Mexicana de Internet donde publico múltiples estudios sobre hábitos de Internet, comercio electrónico y banca en línea. Trainer for U.S. State Department Media Tech Camp y frecuente speaker en foros de Mercadotecnia y Medios en Estados Unidos y Latinoamérica adriana@advernativa.com Erick Kelly Coordinación de Tecnología de Minería de Datos Líder en Latinoamérica de Tecnología Minería de datos en redes sociales. Fundador Monobinario. Con 30 años de experiencia en TI como programador, Eric fue pionero en México en desarrollar herramientas de escucha en redes sociales, iniciando su primera plataforma con este fin en 2007. Ha seguido la evolución de las plataformas, siendo invitado contantemente por principales compañías del mundo a probar versiones de programas betas de las APIs de las principales redes como Twitter, Facebook, Instagram, YouTube y Foursquare. Con un pie en el Espectro Autista y el otro en el mundo espiritual (AspieShaman), su innata capacidad de "pensar en imágenes", la facilidad para detectar cierto tipo de patrones y esa insaciable necesidad de conocimiento lo hacen ideal para el análisis y desarrollo de sistemas de información. Es también instructor, consultor, diseñador de sistemas, telecomunicaciones, multimedia, video digital, presentaciones de negocios, experto en plataforma Macintosh (Mac OS 7, 8, 9 y X), administrador y programador en aplicaciones internet e intranet en plataformas Unix, Linux, Mac OS X y Darwin. ericrkl@monobinario.com PARTICIPANTES EN ESTE PROYECTO
  • 32. PARTICIPANTES EN ESTE PROYECTO Saúl Zamora Pérez Analista Matemático Big Data Matemático egresado de la Universidad Nacional Autónoma de México con un postgrado en Inteligencia de Negocios en ITAM y otro en Minería de Datos en la UNAM. Es experto en administración, análisis y visualización de datos, con dominio en programación y uso de SQL, MYSQL, Integración de Datos (ETL) Cubos OLAP entre otros. saul.zamora@gmail.com Paola Monserrat Contreras Ortega Análisis periodístico de conversaciones en redes sociales Periodista, editora web en Periódico Imagen de Zacatecas Egresada de la Licenciatura de Comunicación de la Universidad de la Vera-Cruz. Técnico Superior en Marketing de Contenidos. Coordinadora de equipos humanos para la realización de proyectos televisivos; productora multimedia para diferentes áreas de la comunicación; generadora de contenidos multimedia y analista online de marcas. contrerarasmonse2601@gmail.com Guadalupe Isabel Medellín Beltrán Coordinadora de análisis periodístico de conversaciones en redes sociales. Jefa del Área de Administración Web y Redes Sociales de Periódico Imagen de Zacatecas. Es comunicóloga y periodista por la Universidad Norte de México, y tiene experiencia en docencia y trabajo con adolescentes. Ha sido líder de equipos de trabajo con enfoque administrativo, periodístico y de análisis de contenidos. Coordina equipos de trabajo para la elaboración de trabajos periodísticos, generación de contenido multimedia y emprendimiento de proyectos informativos y comerciales. Fue una de las periodistas invitada al Tech Camp U.S. State Department en la Ciudad de México en 2017 isabelmedellinbeltran@gmail.com
  • 33. Estudio Eleccion 2018 en Mexico KarmaPulse Botometer Botometer que es una colaboración entre Indiana University Network Science Institute (IUNI) y el Center for Complex Networks and Systems Research (CNetS) The Follower Factory, New York Times Identifying viral bots and cyborgs in social media Analyzing tweets and posts around Trump, Russia, and the NFL using information entropy, network analysis, and community detection algorithms #ElectionWatch: Loves For Sale In Brazil. Exposing a Brazilian network which trades clicks for cash https://medium.com/dfrlab/election watch-loves-for-sale-in-brazil- f8033427dbe0 Bots and Their Influence During the Mexican Presidential Election – A Network Science Perspective “Sospechamos que las granjas de Troll son muy comunes en México, ya que los administradores de las comunidades de medios sociales son baratos y existe evidencia de que esta práctica se usó en el pasado” http://maven7us.com/bot-analysis/ REFERENCIAS Y BIBLIOGRAFIA How Trump Conquered Facebook— Without Russian Ads https://www.wired.com/story/how- trump-conquered-facebookwithout- russian-ads/ 4 resources for fighting fake news https://tiie.w3.uvm.edu/blog/fighting- fake-news/#.W62kwhNKhTY Online Human-Bot Interactions: Detection, Estimation, and Characterization Onur Varol,1,* Emilio Ferrara,2 Clayton A. Davis,1 Filippo Menczer,1 Alessandro Flammini1 1Center for Complex Networks and Systems Research, Indiana University, Bloomington, US 2 Information Sciences Institute, University of Southern California, Marina del Rey, CA, US https://arxiv.org/pdf/1703.03107v2.pdf Twitter suspended more than 70 million accounts in May and June, and the pace has continued in July, The Whashington Post SparkToro™ is a new software company from Moz founder, Rand Fishkin. Fake Followers Audit Colección de Flipboard sobre articulos e investigaciones del tema https://flipboard.com/@adrianapenajoha/fake- news-and-brand-safety-12tgretuy