El documento describe una investigación sobre la monitorización de redes sociales y la desinformación en Europa. El proyecto busca desarrollar una plataforma híbrida que utilice técnicas deterministas e inteligencia artificial para clasificar y analizar contenidos en redes, detectar bots y medir la viralidad. El objetivo final es ayudar a verificar la información y combatir la desinformación.
3. Desinformación, bots, injerencias y conspiración
In 2021, research from the UK Safer Internet
Centre explored how ‘Half of young people
encounter misleading content online on a
daily basis’. Alongside this, the research also
found that ‘48% of young people are seeing
misleading content every day, with more
than one in 10 seeing it more than six times
a day – often leaving them feeling annoyed,
upset, sad, angry, attacked or scared’
https://www.robert-schuman.eu/en/european-issues/0524-europe-and-disinformation
En España no estamos seguros de
distinguir la información falsa,
confiamos (no mucho) en los
medios, y consideramos que esto es
un problema que puede repercutir en
la democracia.
5. 5
Estrategia en Europa: “The 2022 Code of Practice on Disinformation”
8
Strengthened Monitoring framework
Transparency centre and Task-force
Empowering the fact-checking
community
Empowering researchers
Demonetisation: cutting financial
incentives for purveyors of disinformation
Transparency of political advertising
Ensuring the integrity of services
Empowering users
Fuente: https://digital-strategy.ec.europa.eu/en/policies/code-practice-disinformation
Prevención de problemas de ciber-seguridad y “safety”.
6. 6
LLMs e IA generativa
Fuente: https://arxiv.org/abs/2304.13712
1
7. 7
Desafíos
Ser capaz de capturar recursos (textos) de forma
continua publicados en redes sociales (Twitter y Telegram).
Monitorización de redes sociales
Clasificación de acuerdo a categorías estáticas (ontología de
dominio) y dinámicas (universo del discurso).
Análisis y clasificación de texto
Ser capaz de detectar cuentas que se comporten como
bots: quién, con quién y qué.
Ser capaz de anticipar posibles contenidos virales.
Detección de posibles bots y viralidad
Cuantificación y visualización
Ser capaz de archivar contenidos para la argumentación
necesaria para Verifica RTVE.
Archivado
01
02
03
04
05
Ser capaz de mostrar información relevante y simplificada
sobre los contenidos procesado.
9. Visión del proceso de verificación
Configuración alertas 01
Análisis: clasificación y detección 02
Panel de mando
03
Chequeo 04
Verificación Cuentas específicas
Contenidos
Expansión de consulta
Categorización de texto
Detección de bots y viralidad
Ontologías
Visualización e integración de
contenidos
Gestión de alertas
Archivado y
argumentación
UC3M
IVERES
Monitorizar
Objetivo
Redes
sociales
Cuenta
Palabra
Concep-
to …
Verificador
Alerta
Archivo
Visuali-
zación
…
Configurar
Visualizar
Panel de mando
Recursos
Archivar
…
Bots
Persona
Viralidad
Qué
Quién
10. Proceso general y arquitectura
… …
Analysis
Bots y
Viralización
Adquisición de datos
Escalabilidad
Datos
Presentación
NLU
Métricas
sociales
Archivado
ArangoDB
2
11. 11
Base de conocimiento (estática)
Taxonomía
Agrupación y clasificación
semántica de términos.
Vocabulario controlado
Terminología (palabras) de los dominios
objetivos (salud, política y deportes).
Patrones
Estructuras gramáticas esperadas para
la clasificación de texto.
Inferencia y razonamiento
Reglas para la inferencia de nuevos hechos
o clasificaciones.
12. 12
Desde textos a un grafo de conocimiento
Entrada
Recurso de
redes sociales
Sintaxis a
semántica
Ontología
Conceptos y
relaciones
Grafo de
conocimiento
Textos
Patrones
Clasificación y
cuantificación
Salud
Política
Deportes
13. Ejemplo de utilización 13
plandemia cacuna inocular Censurar Sociedad
Vocabulario
Moderna Pfizer
Vacunas
Vacunas Salud
Patrones
Económica Social
Política
Razonamiento Patrón encaja
Taxonomía
Formalización “No me he vacunado…”
Si
El a en
con de
Plandemia Cacuna
* <<Vacunas>>
Salud
*
14. Detección de bots y viralidad 14
Naturaleza
Peligrosidad
Bots
(persona o software)
maliciosos
Bots
(persona o software)
“buenos”
Baja
Alta
Persona
Personas
maliciosas
Función de veracidad del perfil
12 métricas
Quién
Interacciones (relaciones)
6 métricas
Con
quién
Contenidos y redifusiones
(qué pública) 7 métricas
Qué
Clasificación con TwiBot-22 y BERT
Infección
Objetivo
3
21. Enfoque técnico híbrido: determinismo + AI4Good 21
Principios
• Reutilización
• Arquitectura de software extensible y escalable
• Enfoque determinista vs no determinista
• Orientación al usuario
Uso de
ontologías
LLMs sí*
Detección
de la
Viralidad
Detección de
bots
Integración
tecnológica
Tecnología
en
evolución
4
4
22. 22
Visión sobre IA
El poder de la IA a través de LLMs
IA generativa en todos los sitios: muy potente
para ayudar a los usuarios y a los bots, pero
también se necesita asegurar la calidad,
explicabilidad y trazabilidad de los resultados
(determinismo→IA confiable, legislación)
Aplicación innovadora para verificación
Existen muchas técnicas, tecnologías y herramientas, se
integran algunas, pero también se está generando
conocimiento y nuevos enfoques (híbrido). No se
puede ir siempre al paso que marquen las grandes
tecnológicas.
5