SlideShare una empresa de Scribd logo
1 de 109
Descargar para leer sin conexión
ARAGÓN OPEN SOCIAL DATA
Técnicas de análisis de datos de
redes sociales
Alberto Alcolea
alberto.alcolea@kampal.com
http://kampal.com
   
Física + estadística + redes complejas + supercomputación = Kampal
   
VIVIMOSVIVIMOS
CONECTADOSCONECTADOS
A INTERNETA INTERNET
   
> 750 millones de usuarios únicos
   
> 750 millones de usuarios únicos
> 500 terabytes de datos al día
   
> 750 millones de usuarios únicos
> 500 millones de usuarios únicos
> 500 terabytes de datos al día
   
> 750 millones de usuarios únicos
> 500 millones de usuarios únicos
> 340 millones de tweets al dia
> 500 terabytes de datos al día
   
Redes sociales
“Una red social es una estructura social compuesta
por un conjunto de actores (tales como individuos u
organizaciones) que están relacionados de acuerdo a
algún criterio (relación profesional, amistad,
parentesco, etc.)”
   
¿Para qué sirven las redes sociales?
• Mantener contacto con amigos
• Buscar trabajo
• Buscar pareja
• Vender productos
• Promocionar empresas
• Recomendaciones
• Transporte
   
EL PODER DE LAS REDES
•Los individuos organizados como grupo
•Capacidad para organizar grupos enormes
•Reputación online
•Propagación de la información e inmediatez de la misma
   
   
   
Datos sociales → valor para empresas
   
La información social es un caos
   
Datos Ambiguos
DeseStructurados
Sin formato
No siguen ontologías
ARAGÓN OPEN SOCIAL DATA
API WEB
Escucha de los datos
Abierta
Datos estructurados
Datos históricos
Facilita la reutilización de los datos
Análisis en tiempo real
Visualización
Extraer valor de los datos
Informes a medida
   
19 fuentes
   
Dos estrategias de escucha
Mensajes geoposicionados
dentro de Aragón
Mensajes que hablan de las
tendencias de Aragón
   
   
20 mensajes válidos por minuto
Más de 14 Millones de mensajes válidos
Más de 64 Millones de mensajes recogidos
Desde el 1 de enero de 2014
   
Análisis en tiempo real
Suscripciones por correo electrónico
   
Análisis en tiempo real
   
Términos: palabras o conjunto de palabras que
deben contener los mensajes a analizar
Filtro por fecha: desde / hasta
Dejar en blanco para analizar todo el contenido
Filtro por comarca:
Se puede seleccionar una comarca o elegir “TODO
ARAGÓN”
   
   
Ejemplo buscando los términos:
“pilares” y “pilarica”
en todo aragón sin filtrar por fechas
   
Términos: “PILARES” y “PILARICA”
Parámetros de la consulta
Tipo de contenidoFuente de los datos
Resumen general
   
Términos: “PILARES” y “PILARICA”
Top 50
Top 20
   
Términos: “PILARES” y “PILARICA”
   
Términos: “PILARES” y “Fiestas del pilar”
entre el 1 de septiembre y el 30 de octubre de 2015
   
Términos: “desbordamiento” y “riada”
   
Términos: “desbordamiento” y “riada”
entre el 1 de febrero y el 30 de abril de 2015
   
Término a término
Total (suma)
   
Términos: “PILARES” y “Fiestas del pilar”
entre el 1 de septiembre y el 30 de octubre de 2015
Autor Fuente Fecha de publicación Ver el mensaje origina en el sitio web donde fue publicado
   
Geoposicionamiento
   
La mayoría de redes sociales GEOPOSICIONAN SU
CONTENIDO
   
   
   
   
Aragón
   
Normalizado por n.º de habitantes
   
Aragón
N.º mín. de mensajes enviados desde un punto
N.º máx. de mensajes enviados desde un punto
N.º de mensajes geoposicionados encontrados
Normalizar por n.º de habitantes
   
Podemos extraer valor de la geoposición de los
mensajes
   
Términos: “desbordamiento” y “riada” entre el 1
de febrero y el 30 de abril de 2015
   
Términos: “desbordamiento” y “riada” entre el 1
de febrero y el 30 de abril de 2015
   
Términos: “desbordamiento” y “riada” entre el 1
de febrero y el 30 de abril de 2015
   
Análisis de
sentimientos
   
Procesar automáticamente lenguaje natural
para identificar y extraer información acerca
de la actitud del autor a la hora de escribir el
mensaje
   
Las redes sociales son utilizadas como UN medio
de expresión de SENTIMIENTOS
   
Aprendizaje automático
¿Cómo una máquina puede analizar los
sentimientos?
Entrenando un sistema automático con mensajes para que
sea capaz de clasificarlos satisfactoriamente
Calcula la probabilidad de que una palabra sea positiva o
negativa
   
¿Cómo una máquina puede analizar los
sentimientos?
Varias estrategias: (ninguna fiable al 100%, precisión del 65-70%)
●
Análisis manual
●
Partir de una bolsa de palabras clasificadas por humanos y
deducir el sentimiento del resto de palabras de la oración.
●
Analizar automáticamente si una oración es positiva o
negativa, por ejemplo, comprobando emoticonos.
●
Si una oración tiene un emoticono deducir el sentimiento
del resto de palabras de la oración.
   
¿Cómo una máquina puede analizar los
sentimientos?
Varias estrategias: (ninguna fiable al 100%, precisión del 65-70%)
●
Análisis manual
●
Partir de una bolsa de palabras clasificadas por humanos y
deducir el sentimiento del resto de palabras de la oración.
●
Analizar automáticamente si una oración es positiva o
negativa, por ejemplo, comprobando emoticonos.
●
Si una oración tiene un emoticono deducir el sentimiento
del resto de palabras de la oración.
   
¿Cómo una máquina puede analizar los
sentimientos?
Análisis basado en emoticonos:
Emoticonos “positivos”: :) :D =D :]
Emoticonos “negativos”: :( :[
   
Ejemplo con Tweets comentando una serie de TV
   
ME GUSTAA!!! qué bien,de las mejores series :D
Ya, pero que mi Fabio no muera tampoco :(((((
¿Cómo una máquina puede analizar los
sentimientos?
   
¿Cómo una máquina puede analizar los
sentimientos?
ME GUSTAA!!! qué bien,de las mejores series :D
Ya, pero que mi Fabio no muera tampoco :(((((
   
¿Cómo una máquina puede analizar los
sentimientos?
ME GUSTAA!!! que bien,de las mejores series :D
Ya, pero que mi Fabio no muera tampoco :(((((
Mensaje positivo
Mensaje (muy) negativo
   
¿Cómo una máquina puede analizar los
sentimientos?
ME GUSTAA!!! qué bien de las mejores series :D
Ya pero que mi Fabio no muera tampoco :(((((
Mensaje positivo
Mensaje (muy) negativo
pron verbo adv nombreadjprep detdet
Análisis léxico
adv conj det nombre adv verbo advconj
   
¿Cómo una máquina puede analizar los
sentimientos?
gusta →
bien →
mejores →
series →
Puntuamos
ya →
Fabio →
no →
muera →
tampoco →
   
¿Cómo una máquina puede analizar los
sentimientos?
Aplicamos probabilidades
   
¿Cómo una máquina puede analizar los
sentimientos?
gusta Prob pos = 100%→
bien Prob pos = 100%→
mejores Prob pos = 100%→
series Prob pos = 100%→
Puntuamos
ya Prob pos = 0%→
Fabio Prob pos = 0%→
no Prob pos = 0%→
muera Prob pos = 0%→
tampoco Prob pos = 0%→
Nota: la probabilidad de que una palabra sea positiva es la inversa de la probabilidad de que sea negativa
   
¿Cómo una máquina puede analizar los
sentimientos?
Añadimos nuevos tweets al análisis
   
¿Cómo una máquina puede analizar los
sentimientos?
Que tampoco muera Carmen. Me gusta. :D
El resto de mis series están a la espera :(
Mensaje positivo
Mensaje negativo
conj adv nombre verbopronverb
Análisis léxico
det nombre detnombre verboconj prep nombre
¡Antes eran negativas!
¡Antes era positiva!
   
¿Cómo una máquina puede analizar los
sentimientos?
Entrenamiento con 4600 tweets con emoticonos
gusta 75%→
bien 92%→
mejores 83%→
series 56%→
ya 52%→
Fabio 49%→
no 60%→
muera 74%→
tampoco 75%→
Probabilidad positiva Probabilidad negativa
   
¿Cómo una máquina puede analizar los
sentimientos?
Normalizado:
Polaridad = prob. positivo – prob. negativo
1: más positivo-1: más negativo 0: neutro
   
¿Cómo una máquina puede analizar los
sentimientos?
ME GUSTAA!!! qué bien,de las mejores series :D
Ya, pero que mi Fabio no muera tampoco :(((((
Polaridad: 0,94
97% prob. positiva
Polaridad: -0,99
99% prob. negativa
   
¿Cómo una máquina puede analizar los
sentimientos?
Me gusta esta serie
Polaridad: 0,88
94% prob. positiva
¡Que ya no muera nadie!
Polaridad: -0,99
99% prob. negativa
   
Tres términos: “clase”, “sentimientos” y “open data”
   
Términos: “riada” y “inundación” entre el 1 de febrero
y el 30 de abril de 2015
   
Términos: “pilares” y “fiestas del pilar” entre el 1 de
septiembre y el 30 de octubre de 2015
   
Términos: “desprendimiento” entre el 19 de marzo y el
21 de marzo de 2016
   
Sistemas
Complejos
   
En el contexto de la teoría de redes, una red
compleja se refiere a una red (grafo) que posee
cierta propiedades estadísticas y topológicas
no triviales que no ocurren en redes simples
Ejemplo de redes con tales características en
la naturaleza son las redes sociales, las redes
neuronales...
   
Grafo:
- Conjunto de nodos
- Unidos por enlaces
   
¿Qué relaciones se pueden
analizar en una red social?:
- ¿Quién es amigo de quién?
- ¿Quién menciona a quién?
- ¿Quién usa un hashtags?
- ¿Quién retweetea a quién?
- ¿Quién vive cerca de quién?
- ¿Quién …?
   
¿Qué relaciones se pueden
analizar en una red social?:
- ¿Quién es amigo de quién?
- ¿Quién menciona a quién?
- ¿Quién usa un hashtags?
- ¿Quién retweetea a quién?
- ¿Quién vive cerca de quién?
- ¿Quién …?
   
Emisor Mensaje
@pepe No me gusta como ha quedado, @maria
@maria Hola @javier, me ha parecido muy interesante
@javier Gracias @maria, todo ha sido gracias a @ana
@ana @marta, deberías ver lo que han hecho @javier y @pepe
@pepe @maria ahora esta mejor
   
@javier
@maria
@marta
@pepe
@ana
   
Propiedades de las redes
complejas:
- Distribuciones de grado
- Estructuras comunitarias
...
   
Distribución de grado:
Número de enlaces “que entran”
a un nodo
1
2
2
0
1
   
@javier
@maria
@marta
@pepe
@ana
   
@javier
@maria
@marta
@pepe
@ana
1
2
1
1
1
Simplificamos enlaces:
1
1
   
@javier
@maria
@marta
@pepe
@ana
El grosor de un enlace depende del número de menciones de un usuario a otro
1
2
1
1
1
1
1
   
El grado (de entrada) de un nodo depende del número de los enlaces dirigidos a él
1
@javier
@maria
@marta
@pepe
@ana
1
2
1
1
1
1
1
3
2
1
1
   
El tamaño de un nodo es proporcional a su grado
1
@javier
@maria@pepe
1
2
1
1
1
1
1
3
2
1
1
@Ana
@Marta
   
Posición: los nodos “gravitan” alrededor de los nodos de mayor tamaño
1
@javier
@maria
@pepe
1
2
1
1
1
1
1
3
2
1
1
@Ana
@Marta
   
Estructuras comunitarias:
Aquellos grupos especialmente
afines en su interior, que forman
algo diferenciado del resto.
   
Emisor Mensaje
@pepe No me gusta como ha quedado, @maria
@maria Hola @javier, me ha parecido muy interesante
@javier Gracias @maria, todo ha sido gracias a @ana
@ana @marta, deberías ver lo que han hecho @javier y @pepe
@pepe @maria ahora esta mejor
A @marta sólo la menciona @ana y no participa con nadie más → comunidad
   
Cada color corresponde a una comunidad
1
@javier
@maria
@pepe
1
2
1
1
1
1
1
3
2
1
1
@Ana
@Marta
   
Buscando “open data”
   
   
Algunas propiedades que
podemos observar:
¿Cuántas de las personas relacionadas con un individuo se
relacionan entre sí?
Ninguna Todos están relacionados
   
Algunas propiedades que
podemos observar:
¿Es una red jerarquizada? ¿Todos se relacionan con el mismo
número de personas?
Red jerarquizada
Cada uno tiene distinto
número de relaciones
Red no jerarquizada
Todos tienen el mismo
número de relaciones
   
Algunas propiedades que
podemos observar:
¿Cuál es la cohexión de la red? ¿Está la red dividida en grupos que
se pueden separar fácilmente?
No pueden separarse Pueden separarse
   
Buscando “cincormazada”
   
Buscando “cincormazada”
Federación asociaciones
de barrios
Turismo
Ocio nocturno
Políticos y medios de
comunicación
Organismos oficiales y
medios de comunicación
   
Buscando “calanda”
Organismos oficiales
Prensa y medios
Turismo
Meteorología
Red mucho más conexa y menos jerárquica
Es más complicado determinar donde acaba
una comunidad y dónde empieza otra.
   
   
Hasta 10 suscripciones.
Cada una:
- Hasta 10 términos
- Filtro por comarca
   
   
   
   
   
También podemos suscribirnos desde una búsqueda
   
   
   
   
¡Gracias!
Alberto Alcolea
alberto.alcolea@kampal.com
http://kampal.com
http://opendata.aragon.es

Más contenido relacionado

Similar a Análisis Redes Sociales Aragón

METODOS DE BUSQUEDA
METODOS DE BUSQUEDAMETODOS DE BUSQUEDA
METODOS DE BUSQUEDA6734770
 
métodos de búsqueda
métodos de búsquedamétodos de búsqueda
métodos de búsqueda6734770
 
Búsqueda y selección de información
Búsqueda y selección de informaciónBúsqueda y selección de información
Búsqueda y selección de informaciónyanzvb
 
Teller No.2
Teller No.2Teller No.2
Teller No.2Juan1697
 
Exprime tu Comunidad de Twitter con SocialBro
Exprime tu Comunidad de Twitter con SocialBroExprime tu Comunidad de Twitter con SocialBro
Exprime tu Comunidad de Twitter con SocialBroLeticia Polese
 
Redes sociales, su personalidad y cómo hacer un buen uso de ellas
Redes sociales, su personalidad y cómo hacer un buen uso de ellasRedes sociales, su personalidad y cómo hacer un buen uso de ellas
Redes sociales, su personalidad y cómo hacer un buen uso de ellasFabian Vera
 
Revista ContactForum No. 56 Edición Noviembre - Diciembre, Personalidades de ...
Revista ContactForum No. 56 Edición Noviembre - Diciembre, Personalidades de ...Revista ContactForum No. 56 Edición Noviembre - Diciembre, Personalidades de ...
Revista ContactForum No. 56 Edición Noviembre - Diciembre, Personalidades de ...SICREA Autofinanciamiento NISSAN
 
Estrategias de búsquedadhtic (2)
Estrategias de búsquedadhtic (2)Estrategias de búsquedadhtic (2)
Estrategias de búsquedadhtic (2)kathymonxo
 
Uso de Redes Sociales en la Administración
Uso de Redes Sociales en la AdministraciónUso de Redes Sociales en la Administración
Uso de Redes Sociales en la AdministraciónCristina Juesas
 
Importancia de una buena búsqueda internet.
Importancia de una buena búsqueda internet.Importancia de una buena búsqueda internet.
Importancia de una buena búsqueda internet.vale241
 
Como generar valor en blogs
Como generar valor en blogsComo generar valor en blogs
Como generar valor en blogsEsther Vargas
 
Ruta de Formación - Nivel 2 Sesión 3
Ruta de Formación - Nivel 2 Sesión 3Ruta de Formación - Nivel 2 Sesión 3
Ruta de Formación - Nivel 2 Sesión 3Plan Teso
 

Similar a Análisis Redes Sociales Aragón (20)

Adopción tecnológica mam@ digital
Adopción tecnológica mam@ digitalAdopción tecnológica mam@ digital
Adopción tecnológica mam@ digital
 
Educomputing & personal branding
Educomputing & personal brandingEducomputing & personal branding
Educomputing & personal branding
 
Introduccion al Marketing Digital
Introduccion al Marketing DigitalIntroduccion al Marketing Digital
Introduccion al Marketing Digital
 
Computación social en la educación
Computación social en la educaciónComputación social en la educación
Computación social en la educación
 
METODOS DE BUSQUEDA
METODOS DE BUSQUEDAMETODOS DE BUSQUEDA
METODOS DE BUSQUEDA
 
métodos de búsqueda
métodos de búsquedamétodos de búsqueda
métodos de búsqueda
 
Social Bro
Social BroSocial Bro
Social Bro
 
Curso Twitter
Curso TwitterCurso Twitter
Curso Twitter
 
Búsqueda y selección_de_información3
Búsqueda y selección_de_información3Búsqueda y selección_de_información3
Búsqueda y selección_de_información3
 
Búsqueda y selección de información
Búsqueda y selección de informaciónBúsqueda y selección de información
Búsqueda y selección de información
 
Teller No.2
Teller No.2Teller No.2
Teller No.2
 
Social media advanced
Social media advancedSocial media advanced
Social media advanced
 
Exprime tu Comunidad de Twitter con SocialBro
Exprime tu Comunidad de Twitter con SocialBroExprime tu Comunidad de Twitter con SocialBro
Exprime tu Comunidad de Twitter con SocialBro
 
Redes sociales, su personalidad y cómo hacer un buen uso de ellas
Redes sociales, su personalidad y cómo hacer un buen uso de ellasRedes sociales, su personalidad y cómo hacer un buen uso de ellas
Redes sociales, su personalidad y cómo hacer un buen uso de ellas
 
Revista ContactForum No. 56 Edición Noviembre - Diciembre, Personalidades de ...
Revista ContactForum No. 56 Edición Noviembre - Diciembre, Personalidades de ...Revista ContactForum No. 56 Edición Noviembre - Diciembre, Personalidades de ...
Revista ContactForum No. 56 Edición Noviembre - Diciembre, Personalidades de ...
 
Estrategias de búsquedadhtic (2)
Estrategias de búsquedadhtic (2)Estrategias de búsquedadhtic (2)
Estrategias de búsquedadhtic (2)
 
Uso de Redes Sociales en la Administración
Uso de Redes Sociales en la AdministraciónUso de Redes Sociales en la Administración
Uso de Redes Sociales en la Administración
 
Importancia de una buena búsqueda internet.
Importancia de una buena búsqueda internet.Importancia de una buena búsqueda internet.
Importancia de una buena búsqueda internet.
 
Como generar valor en blogs
Como generar valor en blogsComo generar valor en blogs
Como generar valor en blogs
 
Ruta de Formación - Nivel 2 Sesión 3
Ruta de Formación - Nivel 2 Sesión 3Ruta de Formación - Nivel 2 Sesión 3
Ruta de Formación - Nivel 2 Sesión 3
 

Último

trabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdftrabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdfIsabellaMontaomurill
 
Trabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíaTrabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíassuserf18419
 
9egb-lengua y Literatura.pdf_texto del estudiante
9egb-lengua y Literatura.pdf_texto del estudiante9egb-lengua y Literatura.pdf_texto del estudiante
9egb-lengua y Literatura.pdf_texto del estudianteAndreaHuertas24
 
Proyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptxProyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptx241521559
 
Presentación guía sencilla en Microsoft Excel.pptx
Presentación guía sencilla en Microsoft Excel.pptxPresentación guía sencilla en Microsoft Excel.pptx
Presentación guía sencilla en Microsoft Excel.pptxLolaBunny11
 
pruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNITpruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNITMaricarmen Sánchez Ruiz
 
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE  DE TECNOLOGIA E INFORMATICA PRIMARIACLASE  DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIAWilbisVega
 
guía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Josephguía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan JosephBRAYANJOSEPHPEREZGOM
 
International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)GDGSucre
 
EPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveEPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveFagnerLisboa3
 
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricGlobal Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricKeyla Dolores Méndez
 
Redes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdfRedes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdfsoporteupcology
 
KELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento ProtégelesKELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento ProtégelesFundación YOD YOD
 
Herramientas de corte de alta velocidad.pptx
Herramientas de corte de alta velocidad.pptxHerramientas de corte de alta velocidad.pptx
Herramientas de corte de alta velocidad.pptxRogerPrieto3
 
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...silviayucra2
 

Último (15)

trabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdftrabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdf
 
Trabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíaTrabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnología
 
9egb-lengua y Literatura.pdf_texto del estudiante
9egb-lengua y Literatura.pdf_texto del estudiante9egb-lengua y Literatura.pdf_texto del estudiante
9egb-lengua y Literatura.pdf_texto del estudiante
 
Proyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptxProyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptx
 
Presentación guía sencilla en Microsoft Excel.pptx
Presentación guía sencilla en Microsoft Excel.pptxPresentación guía sencilla en Microsoft Excel.pptx
Presentación guía sencilla en Microsoft Excel.pptx
 
pruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNITpruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNIT
 
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE  DE TECNOLOGIA E INFORMATICA PRIMARIACLASE  DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIA
 
guía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Josephguía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Joseph
 
International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)
 
EPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveEPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial Uninove
 
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricGlobal Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
 
Redes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdfRedes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdf
 
KELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento ProtégelesKELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento Protégeles
 
Herramientas de corte de alta velocidad.pptx
Herramientas de corte de alta velocidad.pptxHerramientas de corte de alta velocidad.pptx
Herramientas de corte de alta velocidad.pptx
 
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
 

Análisis Redes Sociales Aragón

  • 1. ARAGÓN OPEN SOCIAL DATA Técnicas de análisis de datos de redes sociales Alberto Alcolea alberto.alcolea@kampal.com http://kampal.com
  • 2.     Física + estadística + redes complejas + supercomputación = Kampal
  • 4.     > 750 millones de usuarios únicos
  • 5.     > 750 millones de usuarios únicos > 500 terabytes de datos al día
  • 6.     > 750 millones de usuarios únicos > 500 millones de usuarios únicos > 500 terabytes de datos al día
  • 7.     > 750 millones de usuarios únicos > 500 millones de usuarios únicos > 340 millones de tweets al dia > 500 terabytes de datos al día
  • 8.     Redes sociales “Una red social es una estructura social compuesta por un conjunto de actores (tales como individuos u organizaciones) que están relacionados de acuerdo a algún criterio (relación profesional, amistad, parentesco, etc.)”
  • 9.     ¿Para qué sirven las redes sociales? • Mantener contacto con amigos • Buscar trabajo • Buscar pareja • Vender productos • Promocionar empresas • Recomendaciones • Transporte
  • 10.     EL PODER DE LAS REDES •Los individuos organizados como grupo •Capacidad para organizar grupos enormes •Reputación online •Propagación de la información e inmediatez de la misma
  • 11.    
  • 12.    
  • 13.
  • 14.     Datos sociales → valor para empresas
  • 15.     La información social es un caos
  • 16.     Datos Ambiguos DeseStructurados Sin formato No siguen ontologías
  • 17.
  • 18. ARAGÓN OPEN SOCIAL DATA API WEB Escucha de los datos Abierta Datos estructurados Datos históricos Facilita la reutilización de los datos Análisis en tiempo real Visualización Extraer valor de los datos Informes a medida
  • 20.     Dos estrategias de escucha Mensajes geoposicionados dentro de Aragón Mensajes que hablan de las tendencias de Aragón
  • 21.    
  • 22.     20 mensajes válidos por minuto Más de 14 Millones de mensajes válidos Más de 64 Millones de mensajes recogidos Desde el 1 de enero de 2014
  • 23.     Análisis en tiempo real Suscripciones por correo electrónico
  • 24.     Análisis en tiempo real
  • 25.     Términos: palabras o conjunto de palabras que deben contener los mensajes a analizar Filtro por fecha: desde / hasta Dejar en blanco para analizar todo el contenido Filtro por comarca: Se puede seleccionar una comarca o elegir “TODO ARAGÓN”
  • 26.    
  • 27.     Ejemplo buscando los términos: “pilares” y “pilarica” en todo aragón sin filtrar por fechas
  • 28.     Términos: “PILARES” y “PILARICA” Parámetros de la consulta Tipo de contenidoFuente de los datos Resumen general
  • 29.     Términos: “PILARES” y “PILARICA” Top 50 Top 20
  • 30.     Términos: “PILARES” y “PILARICA”
  • 31.     Términos: “PILARES” y “Fiestas del pilar” entre el 1 de septiembre y el 30 de octubre de 2015
  • 33.     Términos: “desbordamiento” y “riada” entre el 1 de febrero y el 30 de abril de 2015
  • 34.     Término a término Total (suma)
  • 35.     Términos: “PILARES” y “Fiestas del pilar” entre el 1 de septiembre y el 30 de octubre de 2015 Autor Fuente Fecha de publicación Ver el mensaje origina en el sitio web donde fue publicado
  • 37.     La mayoría de redes sociales GEOPOSICIONAN SU CONTENIDO
  • 38.    
  • 39.    
  • 40.    
  • 42.     Normalizado por n.º de habitantes
  • 43.     Aragón N.º mín. de mensajes enviados desde un punto N.º máx. de mensajes enviados desde un punto N.º de mensajes geoposicionados encontrados Normalizar por n.º de habitantes
  • 44.     Podemos extraer valor de la geoposición de los mensajes
  • 45.     Términos: “desbordamiento” y “riada” entre el 1 de febrero y el 30 de abril de 2015
  • 46.     Términos: “desbordamiento” y “riada” entre el 1 de febrero y el 30 de abril de 2015
  • 47.     Términos: “desbordamiento” y “riada” entre el 1 de febrero y el 30 de abril de 2015
  • 49.     Procesar automáticamente lenguaje natural para identificar y extraer información acerca de la actitud del autor a la hora de escribir el mensaje
  • 50.     Las redes sociales son utilizadas como UN medio de expresión de SENTIMIENTOS
  • 51.     Aprendizaje automático ¿Cómo una máquina puede analizar los sentimientos? Entrenando un sistema automático con mensajes para que sea capaz de clasificarlos satisfactoriamente Calcula la probabilidad de que una palabra sea positiva o negativa
  • 52.     ¿Cómo una máquina puede analizar los sentimientos? Varias estrategias: (ninguna fiable al 100%, precisión del 65-70%) ● Análisis manual ● Partir de una bolsa de palabras clasificadas por humanos y deducir el sentimiento del resto de palabras de la oración. ● Analizar automáticamente si una oración es positiva o negativa, por ejemplo, comprobando emoticonos. ● Si una oración tiene un emoticono deducir el sentimiento del resto de palabras de la oración.
  • 53.     ¿Cómo una máquina puede analizar los sentimientos? Varias estrategias: (ninguna fiable al 100%, precisión del 65-70%) ● Análisis manual ● Partir de una bolsa de palabras clasificadas por humanos y deducir el sentimiento del resto de palabras de la oración. ● Analizar automáticamente si una oración es positiva o negativa, por ejemplo, comprobando emoticonos. ● Si una oración tiene un emoticono deducir el sentimiento del resto de palabras de la oración.
  • 54.     ¿Cómo una máquina puede analizar los sentimientos? Análisis basado en emoticonos: Emoticonos “positivos”: :) :D =D :] Emoticonos “negativos”: :( :[
  • 55.     Ejemplo con Tweets comentando una serie de TV
  • 56.     ME GUSTAA!!! qué bien,de las mejores series :D Ya, pero que mi Fabio no muera tampoco :((((( ¿Cómo una máquina puede analizar los sentimientos?
  • 57.     ¿Cómo una máquina puede analizar los sentimientos? ME GUSTAA!!! qué bien,de las mejores series :D Ya, pero que mi Fabio no muera tampoco :(((((
  • 58.     ¿Cómo una máquina puede analizar los sentimientos? ME GUSTAA!!! que bien,de las mejores series :D Ya, pero que mi Fabio no muera tampoco :((((( Mensaje positivo Mensaje (muy) negativo
  • 59.     ¿Cómo una máquina puede analizar los sentimientos? ME GUSTAA!!! qué bien de las mejores series :D Ya pero que mi Fabio no muera tampoco :((((( Mensaje positivo Mensaje (muy) negativo pron verbo adv nombreadjprep detdet Análisis léxico adv conj det nombre adv verbo advconj
  • 60.     ¿Cómo una máquina puede analizar los sentimientos? gusta → bien → mejores → series → Puntuamos ya → Fabio → no → muera → tampoco →
  • 61.     ¿Cómo una máquina puede analizar los sentimientos? Aplicamos probabilidades
  • 62.     ¿Cómo una máquina puede analizar los sentimientos? gusta Prob pos = 100%→ bien Prob pos = 100%→ mejores Prob pos = 100%→ series Prob pos = 100%→ Puntuamos ya Prob pos = 0%→ Fabio Prob pos = 0%→ no Prob pos = 0%→ muera Prob pos = 0%→ tampoco Prob pos = 0%→ Nota: la probabilidad de que una palabra sea positiva es la inversa de la probabilidad de que sea negativa
  • 63.     ¿Cómo una máquina puede analizar los sentimientos? Añadimos nuevos tweets al análisis
  • 64.     ¿Cómo una máquina puede analizar los sentimientos? Que tampoco muera Carmen. Me gusta. :D El resto de mis series están a la espera :( Mensaje positivo Mensaje negativo conj adv nombre verbopronverb Análisis léxico det nombre detnombre verboconj prep nombre ¡Antes eran negativas! ¡Antes era positiva!
  • 65.     ¿Cómo una máquina puede analizar los sentimientos? Entrenamiento con 4600 tweets con emoticonos gusta 75%→ bien 92%→ mejores 83%→ series 56%→ ya 52%→ Fabio 49%→ no 60%→ muera 74%→ tampoco 75%→ Probabilidad positiva Probabilidad negativa
  • 66.     ¿Cómo una máquina puede analizar los sentimientos? Normalizado: Polaridad = prob. positivo – prob. negativo 1: más positivo-1: más negativo 0: neutro
  • 67.     ¿Cómo una máquina puede analizar los sentimientos? ME GUSTAA!!! qué bien,de las mejores series :D Ya, pero que mi Fabio no muera tampoco :((((( Polaridad: 0,94 97% prob. positiva Polaridad: -0,99 99% prob. negativa
  • 68.     ¿Cómo una máquina puede analizar los sentimientos? Me gusta esta serie Polaridad: 0,88 94% prob. positiva ¡Que ya no muera nadie! Polaridad: -0,99 99% prob. negativa
  • 69.     Tres términos: “clase”, “sentimientos” y “open data”
  • 70.     Términos: “riada” y “inundación” entre el 1 de febrero y el 30 de abril de 2015
  • 71.     Términos: “pilares” y “fiestas del pilar” entre el 1 de septiembre y el 30 de octubre de 2015
  • 72.     Términos: “desprendimiento” entre el 19 de marzo y el 21 de marzo de 2016
  • 74.     En el contexto de la teoría de redes, una red compleja se refiere a una red (grafo) que posee cierta propiedades estadísticas y topológicas no triviales que no ocurren en redes simples Ejemplo de redes con tales características en la naturaleza son las redes sociales, las redes neuronales...
  • 75.     Grafo: - Conjunto de nodos - Unidos por enlaces
  • 76.     ¿Qué relaciones se pueden analizar en una red social?: - ¿Quién es amigo de quién? - ¿Quién menciona a quién? - ¿Quién usa un hashtags? - ¿Quién retweetea a quién? - ¿Quién vive cerca de quién? - ¿Quién …?
  • 77.     ¿Qué relaciones se pueden analizar en una red social?: - ¿Quién es amigo de quién? - ¿Quién menciona a quién? - ¿Quién usa un hashtags? - ¿Quién retweetea a quién? - ¿Quién vive cerca de quién? - ¿Quién …?
  • 78.     Emisor Mensaje @pepe No me gusta como ha quedado, @maria @maria Hola @javier, me ha parecido muy interesante @javier Gracias @maria, todo ha sido gracias a @ana @ana @marta, deberías ver lo que han hecho @javier y @pepe @pepe @maria ahora esta mejor
  • 80.     Propiedades de las redes complejas: - Distribuciones de grado - Estructuras comunitarias ...
  • 81.     Distribución de grado: Número de enlaces “que entran” a un nodo 1 2 2 0 1
  • 84.     @javier @maria @marta @pepe @ana El grosor de un enlace depende del número de menciones de un usuario a otro 1 2 1 1 1 1 1
  • 85.     El grado (de entrada) de un nodo depende del número de los enlaces dirigidos a él 1 @javier @maria @marta @pepe @ana 1 2 1 1 1 1 1 3 2 1 1
  • 86.     El tamaño de un nodo es proporcional a su grado 1 @javier @maria@pepe 1 2 1 1 1 1 1 3 2 1 1 @Ana @Marta
  • 87.     Posición: los nodos “gravitan” alrededor de los nodos de mayor tamaño 1 @javier @maria @pepe 1 2 1 1 1 1 1 3 2 1 1 @Ana @Marta
  • 88.     Estructuras comunitarias: Aquellos grupos especialmente afines en su interior, que forman algo diferenciado del resto.
  • 89.     Emisor Mensaje @pepe No me gusta como ha quedado, @maria @maria Hola @javier, me ha parecido muy interesante @javier Gracias @maria, todo ha sido gracias a @ana @ana @marta, deberías ver lo que han hecho @javier y @pepe @pepe @maria ahora esta mejor A @marta sólo la menciona @ana y no participa con nadie más → comunidad
  • 90.     Cada color corresponde a una comunidad 1 @javier @maria @pepe 1 2 1 1 1 1 1 3 2 1 1 @Ana @Marta
  • 92.    
  • 93.     Algunas propiedades que podemos observar: ¿Cuántas de las personas relacionadas con un individuo se relacionan entre sí? Ninguna Todos están relacionados
  • 94.     Algunas propiedades que podemos observar: ¿Es una red jerarquizada? ¿Todos se relacionan con el mismo número de personas? Red jerarquizada Cada uno tiene distinto número de relaciones Red no jerarquizada Todos tienen el mismo número de relaciones
  • 95.     Algunas propiedades que podemos observar: ¿Cuál es la cohexión de la red? ¿Está la red dividida en grupos que se pueden separar fácilmente? No pueden separarse Pueden separarse
  • 97.     Buscando “cincormazada” Federación asociaciones de barrios Turismo Ocio nocturno Políticos y medios de comunicación Organismos oficiales y medios de comunicación
  • 98.     Buscando “calanda” Organismos oficiales Prensa y medios Turismo Meteorología Red mucho más conexa y menos jerárquica Es más complicado determinar donde acaba una comunidad y dónde empieza otra.
  • 99.    
  • 100.     Hasta 10 suscripciones. Cada una: - Hasta 10 términos - Filtro por comarca
  • 101.    
  • 102.    
  • 103.    
  • 104.    
  • 105.     También podemos suscribirnos desde una búsqueda
  • 106.    
  • 107.    
  • 108.