SlideShare una empresa de Scribd logo
Dime qué tuiteas y te diré quién eres
Ernesto Mislej - @fetnelio
ernesto@7puentes.com

Buenos Aires, 1 de Noviembre de 2013
Dime qué tuiteas y te diré quién eres
Abstract
Nuestra actividad en las redes sociales dice mucho más de lo que somos de lo que creemos.
Qué tuiteamos, a qué hora, a quién seguimos y quién nos sigue, cuál es el programa de TV que
ocurre mientras tuiteamos, usamos o no hashtags, le respondemos a otros usuarios famosos,
entre otras; son acciones objetivas y medibles, que alimentan modelos de inferencia para
construir perfiles de usuario y de comunidades. Qué cosas decimos, qué dicen de nosotros.
Cómo mantener la privacidad en el mundo virtual actual.

1
Un astrónomo, un físico y
un matemático estaban
viajando en tren por
Escocia cuando uno dice
“una oveja negra…”

2
El caso del submarinista
calcinado
Se cuenta que alguien, tras un gran incendio forestal,
encuentra un cuerpo quemado y, al acercarse, descubre
que tiene puesto un equipo de buceo, traje de neopreno,
mascarilla y botellas de oxígeno y pies de rana…

3
La lógica forense

4
5
6
El razonamiento lógico:
El esquema deductivo
Regla general: "Todos las monedas de la bolsa negra son falsas".
Caso: "Estas monedas provienden de la bolsa negra".
Resultado: "Estas monedas son falsas".
La deducción mantiene la verdad.

7
El razonamiento lógico:
El esquema inductivo
Regla general: "Estas monedas provienen de la bolsa negra".
Caso: "Estas monedas son falsas".
Resultado: "Todas las monedas de la bolsa negra son falsas".
A partir de unas observaciones
se construyen reglas más generales
que pueden llevar a resultados falsos

8
El razonamiento lógico:
El esquema abductivo
Regla general: "Todas las monedas de la bolsa negra son falsas".
Caso: "Estas monedas son falsas".
Resultado: "Estas monedas provienen de la bolsa negra".
Un razonamiento abductivo ofrece
una hipótesis que lo explica.
Esa conjetura busca ser, a primera vista,
la mejor explicación, o la más probable.

9
¿Es posible inducir características de usuario a partir de
su comportamiento en las redes sociales?

10
You Are Where You Tweet: A Content-Based Approach to
Geo-locating Twitter Users
Yi Zhu, 2010

Un modelo para estimar la ubicación de los usuarios de Twitter utilizando el contenido de los
tweets. Se utilizan palabras clave que identifican las ciudades. 100 tweets son suficientes
para validar la ubicación.
11
Palabras clave locales en los Tweets

12
Inferring gender of movie reviewers: exploiting writing
style, content and metadata
Otterbacher, 2010
El trabajo utilizó los comentarios realizados por usuarios de IMDb.
El modelo de detección de género se basa en métricas de estilo
del lenguaje y feedback social; y es independiente de la longitud
de la crítica.
En contraposición de otros dominios, como la literatura o textos
científicos, el modelo de discriminación de género del aficionado
de películas alcanzó un 73.7% de certeza.
13
An Exploration of Observable Features
Related to Blogger Age
Burger & Henderson, 2006
El modelo predictor de edad utilizó, además del texto de los
posts, indicadores cuantitativos como:
1. 
2. 
3. 
4. 
5. 

La hora y día de la semana de publicación
La cantidad de Links e imágenes
La cantidad de seguidores
La cantidad y tipo de comentarios
Los intereses

14
“How Old Do You Think I Am?”: A Study of Language and
Age in Twitter
Nguyen, Gravel, Trieschnigg, Meder, 2013
Las variables que cambian según la edad:
1.  TODO EN MAYUSCULAS: HAHA, LOL
2.  Prolongación alfabética: niiiiiice vs. nice
3.  Intensificadores: so, really & awful
4.  Referencias personales: I, me, mine, my, myself
5.  Conversaciones, RE,
6.  RT, likes, #hashtags

15
Democrats, Republicans and Starbucks Afficionados:
User Classification in Twitter + A Machine Learning
Approach to Twitter User Classiffication
Pennacchiotti, Popescu, 2011
El modelo general de profile toma en cuenta:
1.  perfil del usuario,
2.  comportamiento en mensajes,
3.  contenido de los mensajes,
4.  estructura de la red social (seguidores/
seguidos)

Los resultados del trabajo:
1.  Political Affiliation. precision (0.989) &
recall (~0.872)
2.  Starbucks precision (0.763) & recall
(0.759)
3.  Etnia: precision (0.878) & recall (0.799)

16
Our Twitter Profiles, Our Selves: Predicting Personality
with Twitter
Quercia, Kosinski, Stillwell, Crowcroft, 2011
The Big Five Personality Test – OCEAN

17
¿Qué define a una red social?
Las características escenciales de una red social son:
1.  Las entidades que participan de la red son típicamente personas.
2.  Las relaciones entre esas entidades toman referencia a una relación de la vida real como
amigos, familiares, colegas.
3.  Existe la noción de nonrandomness or locality
Esa condición es compleja de formalizar, pero la idea intuitiva es que los nodos tienden a
formar clusters o comunidades; esto es si la entidad A está relacionada con B y con C,
luego la probabilidad que B y C estén relacionados es mayor que el promedio.

18
Detección de comunidades en grafos
Fortunato, 2010
Los grafos sociales no son regulares como las
lattices. Tampoco son random, donde la distribución
de ejes es uniforme en todos los nodos.
Los grafos sociales están estructurados en
comunidades revelando un alto nivel de orden y
organización.
El grado nodal tiene una distribución de power law,
esto es muchos nodos con pocos ejes conviven con
muy pocos con alto grado..
19
Detecting communities by label propagation
Raghavan et al, 2007
Cada nodo está asociado con una etiqueta con un número entero.
1.  Al inicio cada vértice tiene una etiqueta distinta.
2.  Luego, se itera, cada vértice x actualiza su etiqueta reemplazándola por la etiqueta más
popular entre sus vecinos. Si hay más de una etiqueta con el mismo número de vecinos, se
escoje alguna aleatoriamente.
Luego de varias iteraciones, la misma etiqueta tiende a ser asociada a todos los
miembros de la comunidad.
3.  Todos los vértices con la misma etiqueta pertenecen a la misma comunidad.
Para asegurar que la fase de propagación termine, Raghavan et al propone el uso de una
actualización “asincrónica”.
20
Modelos de propagación de mensajes y comunidades
Leskovec, 2006
Existen numerosos modelos de propagación de mensajes en redes sociales.
Los siguientes 2 son los más populares:
1.  Basado en saturación. Cada nodo tiene un umbral definido. Un nodo cambia su estado
cuando la suma de sus vecinos supera el umbral.
2.  Modelo de Cascada. En cada ocasión que un vecino cambia su estado, el nodo puede
cambiar su estado bajo una probabilidad dada.

21
Dios los cría y
el viento los amontona…
22
The Gaydar Project
MIT, 2009
El estudio demostró que es posible determinar –de manera
muy precisa- la orientación sexual del usuario, analizando la
información expuesta por su red de contactos.
El modelo observa sólo la información pública de los vínculos
(no la información del usuario, sino el de tus vínculos).
Y eso funciona aunque seas muy reservado que no publicás
nada, ni fotos, ni likes a fotos de Lady Gaga, ni nada.

23
Romantic Partnerships and the Dispersion of Social Ties:
A Network Analysis of Relationship Status on Facebook
Backstrom, Kleinberg, 2013

¿Es posible reconocer el amor sólo viendo la estructura del grafo social?
¿Cuánto dura el amor?

24
Private traits and attributes are predictable from digital
records of human behavior
Kosinskia, Stillwella, Graepel, 2013
El modelo usa los likes de los usuarios para alimentar un
modelo de inferencia. Se trabajó con 58000 voluntarios que
proveyeron sus likes y datos demográficos e intereses.
Para categorías dicotómicas tiene los siguientes resultados:
• African Americans vs. Caucasian 95%
• Género 93%
• Hombres homo/heterosexual 88%
• Demócratas vs. republicanos 85%
• Cristianos vs. Islam 82%
25
No Country for Old Members: User Lifecycle and
Linguistic Change in Online Communities
Leskovec, 2013

26
7puentes.com
+54 11 4202 5487
Alem 1303 - Banfield, Buenos Aires, Argentina

Ernesto Mislej - @fetnelio
ernesto@7puentes.com

Más contenido relacionado

Destacado

Innovación en Big Data
Innovación en Big DataInnovación en Big Data
Innovación en Big Data
Ernesto Mislej
 
Tópicos de Big Data - Introducción
Tópicos de Big Data - IntroducciónTópicos de Big Data - Introducción
Tópicos de Big Data - Introducción
Ernesto Mislej
 
Curso de Nivelación de Algoritmos - Clase 2
Curso de Nivelación de Algoritmos - Clase 2Curso de Nivelación de Algoritmos - Clase 2
Curso de Nivelación de Algoritmos - Clase 2Ernesto Mislej
 
Curso de Nivelación de Algoritmos - Clase 3
Curso de Nivelación de Algoritmos - Clase 3Curso de Nivelación de Algoritmos - Clase 3
Curso de Nivelación de Algoritmos - Clase 3Ernesto Mislej
 
Curso de Nivelación de Algoritmos - Clase 4
Curso de Nivelación de Algoritmos - Clase 4Curso de Nivelación de Algoritmos - Clase 4
Curso de Nivelación de Algoritmos - Clase 4Ernesto Mislej
 
Curso de Nivelación de Algoritmos - Clase 5
Curso de Nivelación de Algoritmos - Clase 5Curso de Nivelación de Algoritmos - Clase 5
Curso de Nivelación de Algoritmos - Clase 5Ernesto Mislej
 
Curso de Nivelación de Algoritmos - Clase 1
Curso de Nivelación de Algoritmos - Clase 1Curso de Nivelación de Algoritmos - Clase 1
Curso de Nivelación de Algoritmos - Clase 1Ernesto Mislej
 
Recommender Systems! @ASAI 2011
Recommender Systems! @ASAI 2011Recommender Systems! @ASAI 2011
Recommender Systems! @ASAI 2011Ernesto Mislej
 
Análisis Inteligente de Textos
Análisis Inteligente de TextosAnálisis Inteligente de Textos
Análisis Inteligente de TextosErnesto Mislej
 

Destacado (10)

Innovación en Big Data
Innovación en Big DataInnovación en Big Data
Innovación en Big Data
 
Tópicos de Big Data - Introducción
Tópicos de Big Data - IntroducciónTópicos de Big Data - Introducción
Tópicos de Big Data - Introducción
 
Curso de Nivelación de Algoritmos - Clase 2
Curso de Nivelación de Algoritmos - Clase 2Curso de Nivelación de Algoritmos - Clase 2
Curso de Nivelación de Algoritmos - Clase 2
 
Curso de Nivelación de Algoritmos - Clase 3
Curso de Nivelación de Algoritmos - Clase 3Curso de Nivelación de Algoritmos - Clase 3
Curso de Nivelación de Algoritmos - Clase 3
 
Curso de Nivelación de Algoritmos - Clase 4
Curso de Nivelación de Algoritmos - Clase 4Curso de Nivelación de Algoritmos - Clase 4
Curso de Nivelación de Algoritmos - Clase 4
 
Data Mining
Data MiningData Mining
Data Mining
 
Curso de Nivelación de Algoritmos - Clase 5
Curso de Nivelación de Algoritmos - Clase 5Curso de Nivelación de Algoritmos - Clase 5
Curso de Nivelación de Algoritmos - Clase 5
 
Curso de Nivelación de Algoritmos - Clase 1
Curso de Nivelación de Algoritmos - Clase 1Curso de Nivelación de Algoritmos - Clase 1
Curso de Nivelación de Algoritmos - Clase 1
 
Recommender Systems! @ASAI 2011
Recommender Systems! @ASAI 2011Recommender Systems! @ASAI 2011
Recommender Systems! @ASAI 2011
 
Análisis Inteligente de Textos
Análisis Inteligente de TextosAnálisis Inteligente de Textos
Análisis Inteligente de Textos
 

Similar a Dime qué tuiteas y te diré quién eres. DataFest 2013

Redes sociales
Redes socialesRedes sociales
Redes sociales
Marcelo Lake
 
Redes sociales
Redes socialesRedes sociales
Redes sociales
Alexis Buenaño
 
Presentación Análisis de Redes Sociales conferencia en INACAP
Presentación Análisis de Redes Sociales conferencia en INACAPPresentación Análisis de Redes Sociales conferencia en INACAP
Presentación Análisis de Redes Sociales conferencia en INACAPARSChile
 
Redes sociales
Redes socialesRedes sociales
Redes sociales
zer07
 
Redes sociales
Redes socialesRedes sociales
Redes sociales
LuzRinconi
 
EXAMEN DE COMPUTACIÓN DE ROBERTO DAVILA
EXAMEN DE COMPUTACIÓN DE ROBERTO DAVILAEXAMEN DE COMPUTACIÓN DE ROBERTO DAVILA
EXAMEN DE COMPUTACIÓN DE ROBERTO DAVILA
Roberto Davila
 
Las redes sociales
Las redes socialesLas redes sociales
Las redes sociales
jeffer12_1997
 
7. redes sociales
7. redes sociales7. redes sociales
7. redes sociales
myrcavalber
 
Redes sociales
Redes socialesRedes sociales
Redes socialesERYNG17
 
Redes sociales
Redes socialesRedes sociales
Redes sociales
ERYNG17
 
Redes sociales
Redes socialesRedes sociales
Redes socialesERYNG17
 
redes sociales.ppt-1.pdf
redes sociales.ppt-1.pdfredes sociales.ppt-1.pdf
redes sociales.ppt-1.pdf
JhoelJaramilloCalle
 
Redes sociales internet avanzado
Redes sociales internet avanzadoRedes sociales internet avanzado
Redes sociales internet avanzadoKatheriin Gonzalez
 
Prueba redes
Prueba redesPrueba redes
Tablas
TablasTablas
Tablas
JOSUE MONTES
 
Tablas
TablasTablas
Tablas
JOSUE MONTES
 

Similar a Dime qué tuiteas y te diré quién eres. DataFest 2013 (20)

Redes sociales
Redes socialesRedes sociales
Redes sociales
 
Historias de las redes
Historias de las redesHistorias de las redes
Historias de las redes
 
Redes sociales
Redes socialesRedes sociales
Redes sociales
 
Presentación Análisis de Redes Sociales conferencia en INACAP
Presentación Análisis de Redes Sociales conferencia en INACAPPresentación Análisis de Redes Sociales conferencia en INACAP
Presentación Análisis de Redes Sociales conferencia en INACAP
 
Redes sociales
Redes socialesRedes sociales
Redes sociales
 
Redes sociales
Redes socialesRedes sociales
Redes sociales
 
EXAMEN DE COMPUTACIÓN DE ROBERTO DAVILA
EXAMEN DE COMPUTACIÓN DE ROBERTO DAVILAEXAMEN DE COMPUTACIÓN DE ROBERTO DAVILA
EXAMEN DE COMPUTACIÓN DE ROBERTO DAVILA
 
Las redes sociales
Las redes socialesLas redes sociales
Las redes sociales
 
1 tablas
1 tablas1 tablas
1 tablas
 
7. redes sociales
7. redes sociales7. redes sociales
7. redes sociales
 
Redes sociales
Redes socialesRedes sociales
Redes sociales
 
Redes sociales
Redes socialesRedes sociales
Redes sociales
 
Redes sociales
Redes socialesRedes sociales
Redes sociales
 
Redes
RedesRedes
Redes
 
redes sociales.ppt-1.pdf
redes sociales.ppt-1.pdfredes sociales.ppt-1.pdf
redes sociales.ppt-1.pdf
 
Redes sociales internet avanzado
Redes sociales internet avanzadoRedes sociales internet avanzado
Redes sociales internet avanzado
 
Redes sociales
Redes socialesRedes sociales
Redes sociales
 
Prueba redes
Prueba redesPrueba redes
Prueba redes
 
Tablas
TablasTablas
Tablas
 
Tablas
TablasTablas
Tablas
 

Último

Desarrollo de Habilidades de Pensamiento.docx (3).pdf
Desarrollo de Habilidades de Pensamiento.docx (3).pdfDesarrollo de Habilidades de Pensamiento.docx (3).pdf
Desarrollo de Habilidades de Pensamiento.docx (3).pdf
AlejandraCasallas7
 
TECLADO ERGONÓMICO Y PANTALLAS TACTILES - GESTIÓN INTEGRAL EDUCATIVA
TECLADO ERGONÓMICO Y PANTALLAS TACTILES - GESTIÓN INTEGRAL EDUCATIVATECLADO ERGONÓMICO Y PANTALLAS TACTILES - GESTIÓN INTEGRAL EDUCATIVA
TECLADO ERGONÓMICO Y PANTALLAS TACTILES - GESTIÓN INTEGRAL EDUCATIVA
LilibethEstupian
 
INFORME DE LAS FICHAS.docx.pdf LICEO DEPARTAMENTAL
INFORME DE LAS FICHAS.docx.pdf LICEO DEPARTAMENTALINFORME DE LAS FICHAS.docx.pdf LICEO DEPARTAMENTAL
INFORME DE LAS FICHAS.docx.pdf LICEO DEPARTAMENTAL
CrystalRomero18
 
3Redu: Responsabilidad, Resiliencia y Respeto
3Redu: Responsabilidad, Resiliencia y Respeto3Redu: Responsabilidad, Resiliencia y Respeto
3Redu: Responsabilidad, Resiliencia y Respeto
cdraco
 
Ventajas y desventajas de la desinfección con cloro
Ventajas y desventajas de la desinfección con cloroVentajas y desventajas de la desinfección con cloro
Ventajas y desventajas de la desinfección con cloro
durangense277
 
Desarrollo de habilidades de pensamiento (2).pdf
Desarrollo de habilidades de pensamiento (2).pdfDesarrollo de habilidades de pensamiento (2).pdf
Desarrollo de habilidades de pensamiento (2).pdf
samuelvideos
 
Posnarrativas en la era de la IA generativa
Posnarrativas en la era de la IA generativaPosnarrativas en la era de la IA generativa
Posnarrativas en la era de la IA generativa
Fernando Villares
 
(PROYECTO) Límites entre el Arte, los Medios de Comunicación y la Informática
(PROYECTO) Límites entre el Arte, los Medios de Comunicación y la Informática(PROYECTO) Límites entre el Arte, los Medios de Comunicación y la Informática
(PROYECTO) Límites entre el Arte, los Medios de Comunicación y la Informática
vazquezgarciajesusma
 
Estructuras básicas_ conceptos básicos de programación.pdf
Estructuras básicas_  conceptos básicos de programación.pdfEstructuras básicas_  conceptos básicos de programación.pdf
Estructuras básicas_ conceptos básicos de programación.pdf
ItsSofi
 
Conceptos Básicos de Programación. Tecnología
Conceptos Básicos de Programación. TecnologíaConceptos Básicos de Programación. Tecnología
Conceptos Básicos de Programación. Tecnología
coloradxmaria
 
Actividad Conceptos básicos de programación.pdf
Actividad Conceptos básicos de programación.pdfActividad Conceptos básicos de programación.pdf
Actividad Conceptos básicos de programación.pdf
NajwaNimri1
 
Desarrollo de Habilidades de Pensamiento.
Desarrollo de Habilidades de Pensamiento.Desarrollo de Habilidades de Pensamiento.
Desarrollo de Habilidades de Pensamiento.
AlejandraCasallas7
 
absorcion de gases y practicas de laboratorios
absorcion de gases y practicas de laboratoriosabsorcion de gases y practicas de laboratorios
absorcion de gases y practicas de laboratorios
JuanAlvarez413513
 
SISTESIS RETO4 Grupo4 co-creadores .ppsx
SISTESIS RETO4 Grupo4 co-creadores .ppsxSISTESIS RETO4 Grupo4 co-creadores .ppsx
SISTESIS RETO4 Grupo4 co-creadores .ppsx
tamarita881
 
modelosdeteclados-230114024527-aa2c9553.pptx
modelosdeteclados-230114024527-aa2c9553.pptxmodelosdeteclados-230114024527-aa2c9553.pptx
modelosdeteclados-230114024527-aa2c9553.pptx
evelinglilibethpeafi
 
trabajo de tecnologia, segundo periodo 9-6f
trabajo de tecnologia, segundo periodo 9-6ftrabajo de tecnologia, segundo periodo 9-6f
trabajo de tecnologia, segundo periodo 9-6f
zoecaicedosalazar
 
maestria-motores-combustion-interna-alternativos (1).pdf
maestria-motores-combustion-interna-alternativos (1).pdfmaestria-motores-combustion-interna-alternativos (1).pdf
maestria-motores-combustion-interna-alternativos (1).pdf
JimmyTejadaSalizar
 
ACTIVIDAD 2P de Tecnología, 10-7, 2024..
ACTIVIDAD 2P de Tecnología, 10-7, 2024..ACTIVIDAD 2P de Tecnología, 10-7, 2024..
ACTIVIDAD 2P de Tecnología, 10-7, 2024..
IsabelQuintero36
 
EduFlex, una educación accesible para quienes no entienden en clases
EduFlex, una educación accesible para quienes no entienden en clasesEduFlex, una educación accesible para quienes no entienden en clases
EduFlex, una educación accesible para quienes no entienden en clases
PABLOCESARGARZONBENI
 
Semana 10_MATRIZ IPER_UPN_ADM_03.06.2024
Semana 10_MATRIZ IPER_UPN_ADM_03.06.2024Semana 10_MATRIZ IPER_UPN_ADM_03.06.2024
Semana 10_MATRIZ IPER_UPN_ADM_03.06.2024
CesarPazosQuispe
 

Último (20)

Desarrollo de Habilidades de Pensamiento.docx (3).pdf
Desarrollo de Habilidades de Pensamiento.docx (3).pdfDesarrollo de Habilidades de Pensamiento.docx (3).pdf
Desarrollo de Habilidades de Pensamiento.docx (3).pdf
 
TECLADO ERGONÓMICO Y PANTALLAS TACTILES - GESTIÓN INTEGRAL EDUCATIVA
TECLADO ERGONÓMICO Y PANTALLAS TACTILES - GESTIÓN INTEGRAL EDUCATIVATECLADO ERGONÓMICO Y PANTALLAS TACTILES - GESTIÓN INTEGRAL EDUCATIVA
TECLADO ERGONÓMICO Y PANTALLAS TACTILES - GESTIÓN INTEGRAL EDUCATIVA
 
INFORME DE LAS FICHAS.docx.pdf LICEO DEPARTAMENTAL
INFORME DE LAS FICHAS.docx.pdf LICEO DEPARTAMENTALINFORME DE LAS FICHAS.docx.pdf LICEO DEPARTAMENTAL
INFORME DE LAS FICHAS.docx.pdf LICEO DEPARTAMENTAL
 
3Redu: Responsabilidad, Resiliencia y Respeto
3Redu: Responsabilidad, Resiliencia y Respeto3Redu: Responsabilidad, Resiliencia y Respeto
3Redu: Responsabilidad, Resiliencia y Respeto
 
Ventajas y desventajas de la desinfección con cloro
Ventajas y desventajas de la desinfección con cloroVentajas y desventajas de la desinfección con cloro
Ventajas y desventajas de la desinfección con cloro
 
Desarrollo de habilidades de pensamiento (2).pdf
Desarrollo de habilidades de pensamiento (2).pdfDesarrollo de habilidades de pensamiento (2).pdf
Desarrollo de habilidades de pensamiento (2).pdf
 
Posnarrativas en la era de la IA generativa
Posnarrativas en la era de la IA generativaPosnarrativas en la era de la IA generativa
Posnarrativas en la era de la IA generativa
 
(PROYECTO) Límites entre el Arte, los Medios de Comunicación y la Informática
(PROYECTO) Límites entre el Arte, los Medios de Comunicación y la Informática(PROYECTO) Límites entre el Arte, los Medios de Comunicación y la Informática
(PROYECTO) Límites entre el Arte, los Medios de Comunicación y la Informática
 
Estructuras básicas_ conceptos básicos de programación.pdf
Estructuras básicas_  conceptos básicos de programación.pdfEstructuras básicas_  conceptos básicos de programación.pdf
Estructuras básicas_ conceptos básicos de programación.pdf
 
Conceptos Básicos de Programación. Tecnología
Conceptos Básicos de Programación. TecnologíaConceptos Básicos de Programación. Tecnología
Conceptos Básicos de Programación. Tecnología
 
Actividad Conceptos básicos de programación.pdf
Actividad Conceptos básicos de programación.pdfActividad Conceptos básicos de programación.pdf
Actividad Conceptos básicos de programación.pdf
 
Desarrollo de Habilidades de Pensamiento.
Desarrollo de Habilidades de Pensamiento.Desarrollo de Habilidades de Pensamiento.
Desarrollo de Habilidades de Pensamiento.
 
absorcion de gases y practicas de laboratorios
absorcion de gases y practicas de laboratoriosabsorcion de gases y practicas de laboratorios
absorcion de gases y practicas de laboratorios
 
SISTESIS RETO4 Grupo4 co-creadores .ppsx
SISTESIS RETO4 Grupo4 co-creadores .ppsxSISTESIS RETO4 Grupo4 co-creadores .ppsx
SISTESIS RETO4 Grupo4 co-creadores .ppsx
 
modelosdeteclados-230114024527-aa2c9553.pptx
modelosdeteclados-230114024527-aa2c9553.pptxmodelosdeteclados-230114024527-aa2c9553.pptx
modelosdeteclados-230114024527-aa2c9553.pptx
 
trabajo de tecnologia, segundo periodo 9-6f
trabajo de tecnologia, segundo periodo 9-6ftrabajo de tecnologia, segundo periodo 9-6f
trabajo de tecnologia, segundo periodo 9-6f
 
maestria-motores-combustion-interna-alternativos (1).pdf
maestria-motores-combustion-interna-alternativos (1).pdfmaestria-motores-combustion-interna-alternativos (1).pdf
maestria-motores-combustion-interna-alternativos (1).pdf
 
ACTIVIDAD 2P de Tecnología, 10-7, 2024..
ACTIVIDAD 2P de Tecnología, 10-7, 2024..ACTIVIDAD 2P de Tecnología, 10-7, 2024..
ACTIVIDAD 2P de Tecnología, 10-7, 2024..
 
EduFlex, una educación accesible para quienes no entienden en clases
EduFlex, una educación accesible para quienes no entienden en clasesEduFlex, una educación accesible para quienes no entienden en clases
EduFlex, una educación accesible para quienes no entienden en clases
 
Semana 10_MATRIZ IPER_UPN_ADM_03.06.2024
Semana 10_MATRIZ IPER_UPN_ADM_03.06.2024Semana 10_MATRIZ IPER_UPN_ADM_03.06.2024
Semana 10_MATRIZ IPER_UPN_ADM_03.06.2024
 

Dime qué tuiteas y te diré quién eres. DataFest 2013

  • 1. Dime qué tuiteas y te diré quién eres Ernesto Mislej - @fetnelio ernesto@7puentes.com Buenos Aires, 1 de Noviembre de 2013
  • 2. Dime qué tuiteas y te diré quién eres Abstract Nuestra actividad en las redes sociales dice mucho más de lo que somos de lo que creemos. Qué tuiteamos, a qué hora, a quién seguimos y quién nos sigue, cuál es el programa de TV que ocurre mientras tuiteamos, usamos o no hashtags, le respondemos a otros usuarios famosos, entre otras; son acciones objetivas y medibles, que alimentan modelos de inferencia para construir perfiles de usuario y de comunidades. Qué cosas decimos, qué dicen de nosotros. Cómo mantener la privacidad en el mundo virtual actual. 1
  • 3. Un astrónomo, un físico y un matemático estaban viajando en tren por Escocia cuando uno dice “una oveja negra…” 2
  • 4. El caso del submarinista calcinado Se cuenta que alguien, tras un gran incendio forestal, encuentra un cuerpo quemado y, al acercarse, descubre que tiene puesto un equipo de buceo, traje de neopreno, mascarilla y botellas de oxígeno y pies de rana… 3
  • 6. 5
  • 7. 6
  • 8. El razonamiento lógico: El esquema deductivo Regla general: "Todos las monedas de la bolsa negra son falsas". Caso: "Estas monedas provienden de la bolsa negra". Resultado: "Estas monedas son falsas". La deducción mantiene la verdad. 7
  • 9. El razonamiento lógico: El esquema inductivo Regla general: "Estas monedas provienen de la bolsa negra". Caso: "Estas monedas son falsas". Resultado: "Todas las monedas de la bolsa negra son falsas". A partir de unas observaciones se construyen reglas más generales que pueden llevar a resultados falsos 8
  • 10. El razonamiento lógico: El esquema abductivo Regla general: "Todas las monedas de la bolsa negra son falsas". Caso: "Estas monedas son falsas". Resultado: "Estas monedas provienen de la bolsa negra". Un razonamiento abductivo ofrece una hipótesis que lo explica. Esa conjetura busca ser, a primera vista, la mejor explicación, o la más probable. 9
  • 11. ¿Es posible inducir características de usuario a partir de su comportamiento en las redes sociales? 10
  • 12. You Are Where You Tweet: A Content-Based Approach to Geo-locating Twitter Users Yi Zhu, 2010 Un modelo para estimar la ubicación de los usuarios de Twitter utilizando el contenido de los tweets. Se utilizan palabras clave que identifican las ciudades. 100 tweets son suficientes para validar la ubicación. 11
  • 13. Palabras clave locales en los Tweets 12
  • 14. Inferring gender of movie reviewers: exploiting writing style, content and metadata Otterbacher, 2010 El trabajo utilizó los comentarios realizados por usuarios de IMDb. El modelo de detección de género se basa en métricas de estilo del lenguaje y feedback social; y es independiente de la longitud de la crítica. En contraposición de otros dominios, como la literatura o textos científicos, el modelo de discriminación de género del aficionado de películas alcanzó un 73.7% de certeza. 13
  • 15. An Exploration of Observable Features Related to Blogger Age Burger & Henderson, 2006 El modelo predictor de edad utilizó, además del texto de los posts, indicadores cuantitativos como: 1.  2.  3.  4.  5.  La hora y día de la semana de publicación La cantidad de Links e imágenes La cantidad de seguidores La cantidad y tipo de comentarios Los intereses 14
  • 16. “How Old Do You Think I Am?”: A Study of Language and Age in Twitter Nguyen, Gravel, Trieschnigg, Meder, 2013 Las variables que cambian según la edad: 1.  TODO EN MAYUSCULAS: HAHA, LOL 2.  Prolongación alfabética: niiiiiice vs. nice 3.  Intensificadores: so, really & awful 4.  Referencias personales: I, me, mine, my, myself 5.  Conversaciones, RE, 6.  RT, likes, #hashtags 15
  • 17. Democrats, Republicans and Starbucks Afficionados: User Classification in Twitter + A Machine Learning Approach to Twitter User Classiffication Pennacchiotti, Popescu, 2011 El modelo general de profile toma en cuenta: 1.  perfil del usuario, 2.  comportamiento en mensajes, 3.  contenido de los mensajes, 4.  estructura de la red social (seguidores/ seguidos) Los resultados del trabajo: 1.  Political Affiliation. precision (0.989) & recall (~0.872) 2.  Starbucks precision (0.763) & recall (0.759) 3.  Etnia: precision (0.878) & recall (0.799) 16
  • 18. Our Twitter Profiles, Our Selves: Predicting Personality with Twitter Quercia, Kosinski, Stillwell, Crowcroft, 2011 The Big Five Personality Test – OCEAN 17
  • 19. ¿Qué define a una red social? Las características escenciales de una red social son: 1.  Las entidades que participan de la red son típicamente personas. 2.  Las relaciones entre esas entidades toman referencia a una relación de la vida real como amigos, familiares, colegas. 3.  Existe la noción de nonrandomness or locality Esa condición es compleja de formalizar, pero la idea intuitiva es que los nodos tienden a formar clusters o comunidades; esto es si la entidad A está relacionada con B y con C, luego la probabilidad que B y C estén relacionados es mayor que el promedio. 18
  • 20. Detección de comunidades en grafos Fortunato, 2010 Los grafos sociales no son regulares como las lattices. Tampoco son random, donde la distribución de ejes es uniforme en todos los nodos. Los grafos sociales están estructurados en comunidades revelando un alto nivel de orden y organización. El grado nodal tiene una distribución de power law, esto es muchos nodos con pocos ejes conviven con muy pocos con alto grado.. 19
  • 21. Detecting communities by label propagation Raghavan et al, 2007 Cada nodo está asociado con una etiqueta con un número entero. 1.  Al inicio cada vértice tiene una etiqueta distinta. 2.  Luego, se itera, cada vértice x actualiza su etiqueta reemplazándola por la etiqueta más popular entre sus vecinos. Si hay más de una etiqueta con el mismo número de vecinos, se escoje alguna aleatoriamente. Luego de varias iteraciones, la misma etiqueta tiende a ser asociada a todos los miembros de la comunidad. 3.  Todos los vértices con la misma etiqueta pertenecen a la misma comunidad. Para asegurar que la fase de propagación termine, Raghavan et al propone el uso de una actualización “asincrónica”. 20
  • 22. Modelos de propagación de mensajes y comunidades Leskovec, 2006 Existen numerosos modelos de propagación de mensajes en redes sociales. Los siguientes 2 son los más populares: 1.  Basado en saturación. Cada nodo tiene un umbral definido. Un nodo cambia su estado cuando la suma de sus vecinos supera el umbral. 2.  Modelo de Cascada. En cada ocasión que un vecino cambia su estado, el nodo puede cambiar su estado bajo una probabilidad dada. 21
  • 23. Dios los cría y el viento los amontona… 22
  • 24. The Gaydar Project MIT, 2009 El estudio demostró que es posible determinar –de manera muy precisa- la orientación sexual del usuario, analizando la información expuesta por su red de contactos. El modelo observa sólo la información pública de los vínculos (no la información del usuario, sino el de tus vínculos). Y eso funciona aunque seas muy reservado que no publicás nada, ni fotos, ni likes a fotos de Lady Gaga, ni nada. 23
  • 25. Romantic Partnerships and the Dispersion of Social Ties: A Network Analysis of Relationship Status on Facebook Backstrom, Kleinberg, 2013 ¿Es posible reconocer el amor sólo viendo la estructura del grafo social? ¿Cuánto dura el amor? 24
  • 26. Private traits and attributes are predictable from digital records of human behavior Kosinskia, Stillwella, Graepel, 2013 El modelo usa los likes de los usuarios para alimentar un modelo de inferencia. Se trabajó con 58000 voluntarios que proveyeron sus likes y datos demográficos e intereses. Para categorías dicotómicas tiene los siguientes resultados: • African Americans vs. Caucasian 95% • Género 93% • Hombres homo/heterosexual 88% • Demócratas vs. republicanos 85% • Cristianos vs. Islam 82% 25
  • 27. No Country for Old Members: User Lifecycle and Linguistic Change in Online Communities Leskovec, 2013 26
  • 28. 7puentes.com +54 11 4202 5487 Alem 1303 - Banfield, Buenos Aires, Argentina Ernesto Mislej - @fetnelio ernesto@7puentes.com

Notas del editor

  1. Un astrónomo, un físicoy un matemáticoqueestabanviajando en un trenporEscociavieronpor la ventanillaunaovejanegra en medio de un campo. "Quéinteresante" dijo el astrónomo, "todaslasovejasescocesas son negras". Al oírlo, el físicorespondió. "¡No !, algunasovejasescocesas son negras". Al oír lo quedecían, el matemáticodijo con cara de reproche "En Escocia hay al menos un campo quecontiene al menosunaoveja, quetiene al menos un lado negro".
  2. * A partir de lo observadointentamosexplicarlascausas.
  3. Géneroylocalización. Idioma. El 26% tiene ciudad, pero el 80%remitelocalización.Cuando. Heatmap. Frecuencia/Resencia, 3 democrats tend to usethe expression ‘health care’ more than republicans
  4. . We then show a way of accurately predicting a user’s personality simply based on three counts publicly available on profiles: following, followers, and listed counts.Listeners and Popular.Highly-read.Influentials.M5′ algorithm, On the[1,5]scorescale,themaximumRMSEis0.88
  5. Tiestrength informally refers to the ‘closeness’ of a friendship;A fundamental question connected to our understanding ofstrong ties is to identify the most important individuals in aperson’s social network neighborhood using the underlyingnetwork structure.Modelo vivo. : the numbers in the table give the precision at the first position — the fraction of instances in which the user ranked first by the measure is in fact the true partner. Averaged over all instances, re- cursive dispersion performs approximately twice as well as the standard notion of embeddedness, and also better overall than measures based on profile viewing and presence in the same photo.The performance of different measures for identifying spousesMachine Learning
  6. The analysis presented is based on a dataset of over 58,000 volunteers who provided their Facebook Likes, detailed demographic profiles, and the results of several psychomet- ric tests. The proposed model uses dimensionality reduction for preprocessing the Likes data, which are then entered into logistic/ linear regression to predict individual psychodemographic profiles from Likes. The model correctly discriminates between homosexual and heterosexual men in 88% of cases, African Americans and Caucasian Americans in 95% of cases, and between Democrat and Republican in 85% of cases. For the personality trait “Openness,” prediction accuracy is close to the test–retest accuracy of a standard personality test. We give examples of associations between attri- butes and Likes and discuss implications for online personalization and privacy.
  7. Figure 3: Examples of user-level language change: (a) Percent- age of posts containing first person singular pronouns; (b) Per- centage of reviews using specialized beer vocabulary (retention, carbonation, lacing, etc.). The first 100 posts of all users that contributed at least 100 posts over their lifespan are considered (so each user is represented exactly once in every bin). Results for BeerAdvocate are shown here; same trends hold for Rate- Beer. Throughout this paper, error bars indicate standard er- ror estimated by bootstrap resampling [18].Figure 6: Lifecycle: Distance from the language of the community at each life-stage, calculated as the cross-entropy of each post according to the snapshot language models of the post’s month (0% is birth, 100% is death). Lower values mean “closer to the community”. (a) BeerAdvocate; (b) RateBeer.