El análisis de sentimientos de textos en las redes sociales se ha convertido en un área de investigación cada vez más relevante debido a la influencia que las opiniones expresadas tienen en potenciales usuarios. De acuerdo con una clasificación conceptual de sentimientos y basándonos en un corpus de diversos dominios comerciales, hemos trabajado en la confección de reglas que permitan la clasificación de dichos textos según el sentimiento expresado con respecto a una marca, empresa o producto.
Social TV, más allá de la audiencia. Participación y relaciones
Análisis de Sentimientos en un Corpus de Redes Sociales
1. ANÁLISIS DE SENTIMIENTOS
EN UN CORPUS DE REDES
SOCIALES
GUADALUPE AGUADO-DE-CEA [1]
M. AUXILIADORA BARRIOS [2]
M. SOCORRO BERNARDOS [1]
INÉS CAMPANELLA [3]
ELENA MONTIEL-PONSODA [1]
VÍCTOR RODRIGUEZ [1]
ÓSCAR MUÑOZ [3]
Universidad Politécnica de Madrid [1]
Universidad Complutense de Madrid [2]
Havas Media [3]
2. Indice
• Marco de trabajo y objetivos
• Antecedentes
• Corpus
• Metodología seguida
• Recursos utilizados
• Algunos ejemplos
• Resultados y Comentarios
• Conclusiones y trabajo futuro
AESLA 2013 2
3. Marco de trabajo y objetivos
Cada día tiene mayor importancia conocer el
sentimiento que despiertan las marcas y los
productos que se lanzan al mercado
Conocer sentimiento mayoritario que
inspira una ENTIDAD en la web
AESLA 2013 3
4. Antecedentes
• Estudios sobre sentimientos
• Desde enfoques cognitivistas (Arnold 1960)
• Appraisal theory (Martin y White, 2005)
• Modelos computables en IA. (Ortony et al. 1988)
• Mayor impulso en s. XXI (Pang et al. 2002)
• Sentimiento: “reacción humana detectable, esto es,
rastreable e identificable con una valencia concreta”
(Clore et al. 1987)
AESLA 2013 4
9. Recursos
Previos al proyecto
• Propios
• BADELE: BD léxica con información de +3300 sustantivos
del español (Bernardos y Barrios 2008, Barrios 2010)
• Sustantivos clasificados como sentimientos
• Colocaciones de sustantivos de sentimiento
• FFLL según Teoría Sentido-Texto (Melcuk 1996)
• Caliope: Herramienta para gestionar corpus y glosario
• Incorporación de corpus de Havas
• Concordancias de términos en corpus
• Ajenos
• Freeling: Anotador morfo-sintáctico automático
AESLA 2013 9
11. Verbos en colocaciones de sentimientos
• Ejemplo para odio Lema FL Valor
odio FinFunc0 desaparecer
odio Func1 emanar
anidar (en
odio Func1
algo/alguien)
odio Func1 palpitar (en alguien)
odio Func1 latir (en alguien)
odio Func1 embargar (a algn)
odio IncepFunc0 nacer
odio IncepPredMinus disminuir
odio IncepPredPlus aumentar
odio Manif mostrar
odio Oper1 sentir
odio Oper1 tener
v. Ejemplo a partir de i
odio Real1-M ocultar
TENER#V ODIO#NC [SP] _ENTITY_
-> LH - 1 odio Real1-M disimular
AESLA 2013
12. Ocurrencias de odio en Calíope
Boceto de expresiones en las
que aparece la entidad
• Odio hacer trámites
con/para ent
•Cada día odio más ent
•(cómo) Odio a (el/la) ent
•Ent está creando (mucho)
odio
•Mi odio a ent
•Lo que más odio de/en ent
•Lo que más odio (en este
mundo) es ent
AESLA 2013
13. Ejemplos
Insatisfacción
exasperante lentitud de un Fabia Skoda
Áldi Nó me gusto el Nuevo citroen-C4 :_ es Orrible,
jajjaja NO tenemos los mismoss Gustos en autos ajajaj
Temor
Vivir sin saber cuando va a fallar el
citroen,esta semana 500€ por caja fusibles
Odio
#honda #toyota #nissan #subaru
las 4 marcas mas cabronas.
Concha de tu madre toyota . je
AESLA 2013
14. Ejemplos
Insatisfacción
exasperante lentitud de un Fabia Skoda
Áldi Nó me gusto el Nuevo citroen-C4 :_ es Orrible,
jajjaja NO tenemos los mismoss Gustos en autos ajajaj
Temor
Vivir sin saber cuando va a fallar el
citroen,esta semana 500€ por caja fusibles
Odio
#honda #toyota #nissan #subaru
las 4 marcas mas cabronas.
Concha de tu madre toyota . je
AESLA 2013
17. Resultados
• Tras primera evaluación -> El corpus aumentó
con nuevos dominios
• Odio y temor las menos frecuentes
• ≈ 400 reglas en la actualidad
1ª Eval 2ª eval 3ª Eval 4ª Eval 5ª Eval
ODIO 50,00% 45,00% 37,21% 39,18% 39,66%
TRISTEZA 0,00% 33,33% 34,21% 30,95% 34,48%
TEMOR 5,56% 28,16% 25,00% 26,56%
INSATISFACCION 82,61% 78,24% 85,32% 85,11% 84,71%
SATISFACCION 77,78% 68,08% 77,41% 77,16% 79,63%
CONFIANZA 33,87% 60,61% 60,40% 49,02%
FELICIDAD 42,86% 79,17% 80,00% 70,18%
AMOR 34,55% 75,34% 74,01% 75,11%
Overall 75,38% 60,70% 69,60% 68,95% 68,82%
Cambios en reglas SI SI SI NO SI
Adición nuevas menciones SI SI SI SI NO
AESLA 2013 17
18. A modo de conclusión
Principal inconveniente
• Las reglas equiparan con pocas expresiones en resto del corpus
• Para incrementar cobertura/equiparación (en proceso):
• Aumentar número de reglas:
• Crear reglas reordenando las expresiones consideradas
• Tu/mi/… amor es (por) (la/…) ent
[D] AMOR#NC SER#V /2/ _ENTITY_ –> LH +1
• (La/…) ent es tu/mi/… amor
_ENTITY_ SER#V [D] AMOR#NC –> LH +1
• Crear reglas a partir de las ocurrencias de adjetivos y verbos
con la entidad, y de otros sustantivos de sentimiento
• Crear reglas más abstractas/generales
AESLA 2013
19. A modo de conclusión (2)
• + 80% del corpus no expresa sentimiento
• Ojo, debido a la actualización de precios tras el cambio de
política de subvención de terminales de Vodafone, los
mismos aún están sometidos a cierta variación, de hecho,
desde la última actualización se confirma una bajada de
hasta 90€ en modelos y tarifas seleccionadas
• Las acciones de Vodafone subieron cerca de un 2% tras la
presentación de los resultados
• Del 20% que expresa sentimiento, este es negativo
un 70%
AESLA 2013
20. Líneas futuras
1. Disminuir limitaciones
• El sistema considera individualmente cada oración donde
aparece la entidad
Contexto
«Me he comprado un SKODA. Es la mejor decisión que he tomado»
Dominio
Un coche rápido Un torero rápido
AESLA 2013
21. Líneas futuras
2. Explorar otras estrategias para la clasificación
• Usando información lingüística
• Representación y almacenamiento
• lógica, marcos, …, BBDD, ontologías, …
Compatibilidad y • Sin usar información lingüística
complementariedad
• Aprendizaje automático
de alternativas
• Soluciones estadísticas, redes de
neuronas, …
Estudio comparativo
• Individualmente
• Combinándolas
AESLA 2013 21
22. Líneas futuras
3. Análisis lingüísticos, de mercadotecnia, sociológicos, …
• Tipo de lenguaje empleado, combinaciones de palabras, …
• Relación entre sentimiento e intención de compra, …
¿Se traducen los sentimientos
realmente en intención de
compra? ¿Cuáles?
¿Cómo descontar el impacto de
Community Managers profesionales?
AESLA 2013
23. Muchas gracias por su atención
Thank you for your attention
AESLA 2013 23
Notas del editor
Reformulación en base a: Shaver, P; J. Schwartz; D. Kirson; and C. O'Connor (1987), “Emotion Knowledge: Further Exploration of a Prototype Approach”, Journal of Personality and Social Psychology , 52(6), 1061-1086 y Richins, M. (1997) Measuring Emotions in the Consumption Experience Journal of Consumer Research 24, 127-146. Nota: a nivel empírico, las emociones secundarias (derivadas de las emociones del primer set de emociones básicas) serán anotadas/clasificadas según la emoción básica predominante.