Este documento presenta un resumen de tres oraciones sobre el análisis de redes sociales en Twitter para detectar falsedades. Explica que el análisis de redes sociales puede ser una herramienta para desenmascarar falsedades en Twitter mediante el estudio de la propagación de la información a través del tiempo y de las conexiones entre usuarios, y que el análisis de las relaciones entre usuarios puede clasificar perfiles con precisión revelando estructuras internas.
1. Social Network Analysis: una
herramienta para desenmascarar
falsedades en Twitter
Mariluz Congosto (@congosto)
11/04/2019
2. Los españoles y los mundos virtuales
Fuente: CIS, POSTELECTORAL ELECCIONES GENERALES 2016 VARIABLES SOCIODEMOGRÁFICAS
http://datos.cis.es/pdf/Es3145sd_A.pdf
Sobre el 67,8% que accedió a Internet en los últimos tres meses
91,2
87,7
80
68,3
55,3
46,8
51,9
38
23,3
17,1 15,2
10,6
54,5
29,9
17,3 10,3
7,1
5,10
20
40
60
80
100
18-24 25-34 35-44 45-54 55-64 65 o más
Usuarios según edad
Facebook Twitter
Instagram Ninguna
Otras_redes_sociales LinkedIn
11/042019
3. Entorno de Twitter: Penetración social
Fuente: CIS, POSTELECTORAL ELECCIONES GENERALES 2016 VARIABLES SOCIODEMOGRÁFICAS
http://datos.cis.es/pdf/Es3145sd_A.pdf
Sobre el 67,8% que accedió a Internet en los últimos tres meses
2016
91,2
87,7
80
68,3
55,3
46,851,9
38
23,3
17,1 15,2 10,6
0
10
20
30
40
50
60
70
80
90
100
18-24 25-34 35-44 45-54 55-64 65 o más
Usuarios según edad
Facebook Twitter
11/042019
26,1%
5. Twitter de lo local a lo global
5
#HT RT
TT
TV Prensa
11/042019
6. Entorno de Twitter
Los mensajes son públicos
Sus usuarios son más sensibles a los temas
sociales que en otros medios on-line
(Bernal 2013)
Es un medio utilizado para la política
Es una fuente para conocer la opinión pública
(Congosto 2014)
11/042019
15. Del bot 1.0 al bot 2.0
• Del bot automático que tuiteaba en horario
continuo y a ráfagas sin disimular su
automatismo, al bot que simula ser una
persona (perfiles falsos, cyborgs o Sybils )
• La comercialización de servicios de
“perfiles falsos” tras los que hay personas,
lo que dificulta su detección. Hay dinero
para innovar y mutar
11/042019
16. El negocio de los falsos perfiles
https://www.nytimes.com/interactive/2018/01/27/technology/social-media-bots.html
11/042019
24. Máquina Virtual
Los datos están compartidos con la máquina anfitrión
Contraseña: cambiala
https://www.dropbox.com/s/j0p26bmgmct3vll/como_instalar_VM_taller_datos_twitter.pdf?dl=0
11/042019
25. Entorno de trabajo Webscraping
https://github.com/congosto/GetOldTweets-python
Carpeta
compartida
11/042019
26. Abrir script y usar opciones
La carpeta
que hemos
creado
11/042019
27. Entorno de trabajo API
https://github.com/congosto/t-hoarder_kit
Carpeta
compartida
11/042019
28. Datos de contexto
App para acceder -> taller_datos.key
Usuario: cada uno el suyo
Experimento: directorio donde se dejarán los datos
Se introduce al principio y todos las peticiones utilizarán ese contexto
11/042019
30. Crear un token de usuario para
autentificar
Copiar
Pegar copiar
11/042019
31. Información de usuarios
• Abrir el editor pluma
• Escribir la lista de usuarios,
uno por línea
• Guardarlo en el directorio del
experimento
• Ponerle al fichero extensión txt
11/042019
34. Obtener relaciones
Con teoría de grafos, que modela:
• Individuos como nodos
• Relaciones como aristas
Un grafo es una abstracción que
representa una red, donde:
• Un conjunto de nodos o vértices está
conectado mediante aristas o enlaces
11/042019
35. Obtener relaciones
Relaciones declaradas
A BA sigue a B
A es seguido por B
A y B se siguen
mutuamente
Relaciones dinámicas
A retuitea a B
A es retuiteado
por B
A y B se retuitean
mutuamente
A B
A B
A B
A B
A B
11/042019
38. Limitaciones de la API
La frecuencia importa: el efecto meseta
API streaming
http://t-hoarder.com/7DElDebateDecisivo/
#7DEldebateDecisivo
API REST
11/042019
39. Limitaciones
El tiempo importa Ahora
Streaming API
REST API (search)
REST API (3500 últimos tuits)
Genip
Histórico 1 semana
11/042019
42. Tableau Public: Timelines y
distribución de variables
Uso Personalización
Orientado a publicación en Web
Pero válido para publicaciones
estáticas
11/042019
43. Componentes de Tableau Public
11/042019
Menú
Gráfica
Tipos
De
gráficaDatos Ajustes
Filtros
Similar a las tablas dinámicas de Excel, pero mejor visualización
47. Gephi: análisis de grafos
11/042019
- Calcula los parámetros globales
de la red y de los nodos
- Permite filtrar nodos o conexiones
- Calcula la modularidad
(comunidades)
- Da forma con distintos layouts
- Modela los nodos en tamaño y
color según unos atributos
- Renderiza el grafo generando
salida en pdf, png y svg
74. Resumen
11/042019
1. Las redes sociales son una fuente imperfecta pero
continua de información
2. Podemos estudiar la propagación tanto desde el punto de
vista temporal como de red
3. Las relaciones nos definen mejor que los contenidos.
Somos endogámicos y difundimos lo que estamos de
acuerdo. Con el análisis de red se pueden clasificar a los
perfiles con bastante precisión
4. El ruido en Twitter está creciendo y sofisticándose. Esto
perturba el estudio de las propagaciones, pero también es
posible determinar patrones que lo identifiquen mediante
el análisis de red