Presentación ASAI 2013 - Análisis de Sentimientos sobre un Corpus en Español - 42 JAIIO

Análisis de Sentimientos sobre un
Corpus en Español
Experimentación con un Caso de Estudio
Luciana Dubiau
ldubiau@fi.uba.ar
Juan M Ale
ale@acm.org
Facultad de Ingenier´ıa
Universidad de Buenos Aires
ASAI 2013 - 42 JAIIO

Introducción
Análisis de Sentimientos
• También llamado Extracción de Opiniones, Miner´ıa de
Opiniones, Miner´ıa de Sentimientos o Análisis Subjetivo.
• Definición Estudio computacional de opiniones,
sentimientos y emociones expresadas en textos (Pang and
Lee, 2008).
• Objetivo Determinar la actitud de un escritor ante
determinados productos, situaciones, personas u
organizaciones.
• Componentes de Opinión (Liu, 2010)
• Target: objeto de opinión.
• Features: aspectos o atributos que generan opinión.
• Holder: quien expresa la opinión.
• Orientación Semántica: positiva, negativa, neutra.
• Tiempo: momento en que se expresa la opinión.

Introducción
Ejemplo: Cr´ıtica sobre Restaurante
“Me gusta mucho este restaurante. La comida es fresca y se nota que hay
rotación continua. El ambiente es bastante ruidoso pero los mozos son
muy amables y los precios muy accesibles.”
• Target: restaurante
• Features: comida, ambiente, mozos, precios
• Polaridad de la opinión:
• me gusta mucho este restaurante
• comida fresca
• ambiente bastante ruidoso
• mozos muy amables
• precios muy accesibles
• Polaridad general del documento: positiva
• Holder: autor del comentario
• Tiempo: fecha del comentario

Introducción
¿Qué tipo de información puede
obtenerse?
• Polaridad de sentimientos en cr´ıticas sobre
arte, productos, servicios o personas
• Nivel de fidelización de clientes
• Opinión pública sobre situaciones de interés
social
• Popularidad de representantes pol´ıticos y
predicción sobre resultados de elecciones
• Tendencias de mercado
Ejemplos de Aplicaciones
• http://sentione.pl/
• http://www.sentiment140.com/
• http://socialmention.com/
• http://www.tweetfeel.com/
• http://7puentes.com/en/products/ventura/

Introducción
Tareas de Análisis de Sentimientos
• Clasificación Binaria: polaridad general del documento
positiva o negativa
• Clasificación en Múltiples Categor´ıas: grado de polaridad
del documento en una escala.
• Clasificación de Aspectos: identificación de aspectos
mencionados en el texto y emociones asociadas.
Ejemplo:
• Comida: positiva
• Ambiente: negativa
• Servicio: positiva
En este trabajo nos enfocaremos en clasificación binaria a nivel
de documento.

Resumen
¿En qué consiste este trabajo?
• Investigación, evaluación y comparación experimental de
técnicas de PLN para análisis de información subjetiva en
idioma español.
• Se implementó una herramienta de análisis de sentimientos
que provee métricas sobre performance de modelos de
clasificación en función distintos parámetros de entrada.
• Como corpus de datos se utilizó un sitio de cr´ıtica
gastronómica.
Principales contribuciones
• Proveer un análisis de performance de técnicas de
clasificación subjetiva de textos en función de distintos
parámetros para el idioma español.
• Aportar el corpus construido como un recurso lingü´ıstico.

Técnicas de Clasificación
Técnicas de Machine Learning - Aprendizaje Supervisado
• Na¨ıve Bayes
Se basa en el teorema de Bayes y en la premisa de independencia de los
atributos para obtener la probabilidad de que un documento pertenezca a
una clase.
P(Ci|D) ∝ P(Ci)
n
k=1 P(fk|Ci)
• Modelos de Máxima Entrop´ıa (MaxEnt)
Los documentos son descriptos a partir de una lista de atributos, siendo
cada uno una restricción del modelo. El método se basa en seleccionar la
distribución de probabilidad que satisfaga todas las restricciones del modelo
y maximice la entrop´ıa.
P(c|x) =
exp( N
i=0 wcifi)
c ∈C exp( N
i=0 wc ifi)

Técnicas de Machine Learning - Aprendizaje Supervisado
• Support Vector Machines (SVM)
El entrenamiento consiste en encontrar un
hiperplano que separe los vectores de atributos que
representan los documentos siendo esta separación
la más grande posible.
Support Vectors: definen los márgenes de la
máxima separación entre las clases.
f(x) = sign( i αixi · x + b)
• Árboles de Decisión
El entrenamiento consiste en la construcción de un
árbol de decisión de múltiples caminos en el que
para cada nodo se busca el atributo que provee
mayor ganancia de información para la clase
→ Reglas de Decisión
contiene(‘excelente’)
contiene(‘comida’)
contiene(‘malo’)
POS
0.6
NEG
0.8
si no
contiene(‘fria’)
POS
0.6
NEG
0.7
si no
si no
POS
0.9
si no

Clasificación No Supervisada o Semi-Supervisada
• Algoritmo de Turney
1 Se extraen los bigramas del documento que cumplen con
determinados patrones de opinión.
2 Se calcula la distancia semántica de estos bigramas a los
términos “poor” y “excellent”:
SO(phrase) = log2[hits(phrase NEAR “excellent”)hits(“poor”)
hits(phrase NEAR “poor”)hits(“excellent”) ]
3 Si SO > 0 → positivo , sino → negativo

Técnicas de Preprocesamiento de Texto
Preprocesamientos con los que experimentamos en este trabajo:
• Tokenización
Separación de oraciones, palabras y signos de puntuación.
• Stemming
Se reemplazan los términos por su ra´ız o stem eliminando terminaciones.
Ejemplo: stem(“recomendable”) = stem(“recomendamos”) =
stem(“recomendar”) = “recomend”
• Lematización
Se reemplazan los términos por su lema que es la representación de todas las
formas flexionadas de la palabra.
Ejemplo: lema(“pésimo”) = malo, lema(“buen´ısimo”) = bueno,
lema(“empieza”) = empezar.
• Eliminación de stopwords “de”, “la”, “el”, “que”, etc.
• Eliminación de signos de puntuación, caracteres especiales y caracteres
repetidos más de N veces.
• Filtrado de Palabras por m´ınimo de longitud.
• Transformación a minúscula.
• Tratamiento de Negaciones
Se agrega el prefijo “NOT ” a los términos que siguen a una negación hasta
el siguiente signo de puntuación.

Implementación y Herramientas
Se desarrolló una herramienta en lenguaje Python para
clasificación automática de textos según polaridad de
sentimientos que se ejecuta en función de los siguientes
parámetros:
• Algoritmos de clasificación: Na¨ıve Bayes, MaxEnt, SVM,
Decision Trees y adaptación del algoritmo de Turney.
• Tamaño de Corpus
• Tipos de atributos extra´ıdos:
• Presencia de Unigramas
• Frecuencia de Unigramas
• Presencia de Bigramas
• Presencia de Unigramas + Bigramas
• Presencia de Adjetivos
• Preprocesamientos de Texto

Herramientas Externas
Seleccionadas en base a la precisión de los resultados y velocidad de convergencia.
• Na¨ıve Bayes
→ NLTK
http://nltk.org
• Cálculo de pesos en modelos de Máxima Entrop´ıa
→ megam
http://www.umiacs.umd.edu/~hal/megam/
• SVM y Decision Trees (CART)
→ sci-kit learn
http://scikit-learn.org/
• Lematización, Stemming y POS Tagging
→ Freeling
http://nlp.lsi.upc.edu/freeling/

Adaptación del Algoritmo de Turney al Idioma Español
• El operador NEAR se definió como la ocurrencia conjunta
de los términos en la misma oración.
• Patrones de opinión:
Primera Palabra Segunda Palabra Tercera Palabra
(No Extra´ıda)
Adjetivo Nombre Cualquiera
Nombre Adjetivo No Nombre
Adverbio Adjetivo No Nombre
Adverbio Verbo Cualquiera
Verbo Adverbio Cualquiera
• Términos utilizados para representar polaridad:
• Positivos: excelente, excelentes, bueno/a, buenos/as,
buenisimo/a, buenisimos/as, rico/a, ricos/as, espectacular,
genial.
• Negativos: mal, malo/a, malos/as, feo/a, feos/as, horrible,
horribles, pesimo/a, pesimos/as, desastre, mediocre.

Caso de Estudio
Gu´ıa ´Oleo
http://guiaoleo.com
• Sitio de cr´ıtica
gastron´omica
• Los usuarios
emiten opiniones
sobre restaurantes
en las categor´ıas:
comida, ambiente
y servicio
asignando
puntajes:
1 → malo / regular
2 → bueno
3 → muy bueno
4 → excelente

Caso de Estudio
Construcción del Corpus
1 Se extrajeron los comentarios del sitio en estudio junto
con el puntaje asignado por el usuario.
2 Se etiquetó el set de datos a partir del siguiente
criterio:
• Suma de puntos ≥ 10 → POSITIVO
• 1 punto en la categor´ıa “comida” (la más relevante)
o 2 puntos en esta categor´ıa y 1 punto en el resto
→ NEGATIVO
• El resto de los comentarios se descartaron
3 El dataset final incluye un total de 34808 comentarios
positivos y 16912 negativos.

Experimentación
Experiencias Realizadas
• Mejora de performance aplicando preprocesamientos de texto.
• Performance de clasificadores en función de distintos parámetros.
Parámetros Generales
• Tamaño de Corpus entre 500 y 22000 documentos
• Corpus Balanceado
• 5-fold cross validation para métodos supervisados.
• Criterio para la extracción de features:
• Unigramas → frecuencia mayor a 10.
• Adjetivos y Bigramas → frecuencia mayor a 4.
• Máximo de 3000 atributos.
Métricas
Accuracy =
tp+tn
tp+fp+tn+fn
; Precision =
tp
tp+fp
; Recall =
tp
tp+fn
; F1 = 2P R
P +R
Por ser un corpus balanceado analizamos la performance en base a la accuracy sin
perder información de alguna de las clases.

Experimentación
Efectividad de Preprocesadores: Tamaño máximo de Corpus,
Unigramas como Features y Algoritmo Na¨ıve Bayes
Preproceso Accuracy Mejora (%)
NP (Sin Preproceso) 0.868
SW (Eliminación de stopwords) 0.895 3.11%
NEG (Tratamiento de negaciones) 0.875 0.81%
WL (Filtrado de palabras de menos de 3 caracteres) 0.883 1.73%
DC (Eliminación de caracteres repetidos más de 2 veces) 0.867 -0.12%
STEM (Stemming) 0.861 -0.81%
LC (Transformación de capitalizaciones) 0.868 0.00%
PUNCT (Eliminación de signos de puntuación) 0.871 0.35%
SC (Transformación de caracteres especiales) 0.869 0.12%
LEMMA (Lematización) 0.867 -0.12%
Combinación 1: SW + NEG 0.905 4.26%
Combinación 2: SW + NEG + WL 0.911 4.95%
Combinación 3: SW + NEG + WL + PUNCT 0.914 5.3%
Combinación 4: SW + NEG + WL + PUNCT + SC 0.918 5.76%
Combinación 5: SW + NEG + WL + PUNCT + SC + LC 0.924 6.45%
Combinación 6: SW + NEG + WL + PUNCT + SC + LC +
LEMMA
0.92 5.99%
DC
0.924 6.45%
STEM
0.918 5.76%

Experimentación
Efectividad de PreprocesadoresSW
NEG
WL
DC
STEM
LC
PUNCT
SC
LEMMA
COMB1COMB2COMB3COMB4COMB5COMB6COMB7COMB8
−2
0
2
4
6
8
3.11%
0.81%
1.73%
−0.12%
−0.81%
0%
0.35%
0.12%
−0.12%
4.26%
4.95%
5.3%
5.76%
6.45%
5.99%
6.45%
5.76%
MejoradeAccuracy(%)
Análisis de Resultados
• Hay preprocesamientos
que aplicados en forma
aislada no representan
una mejora pero s´ı lo
hacen en combinación
con otros
(transformación a
minúscula).
• Contrario a lo que
ocurre en tareas de IR,
realizar stemming o
lematización sobre el
texto empeora los
resultados.
• La mejora que
representa la
combinación de
preprocesos resulta
mayor que la suma de
las mejoras individuales.

Experimentación
Efectividad de Clasificadores Supervisados por Algoritmo
0 5000 10000 15000 20000
0.75
0.8
0.85
0.9
0.95
Tamaño del Corpus
Accuracy
(a) Presencia de Unigramas
0 5000 10000 15000 20000
0.75
0.8
0.85
0.9
0.95
Tamaño del Corpus
(b) Frecuencia de Unigramas
0 5000 10000 15000 20000
0.6
0.7
0.8
0.9
Tamaño del Corpus
(c) Bigramas
0 5000 10000 15000 20000
0.75
0.8
0.85
0.9
0.95
Tamaño del Corpus
Accuracy
(d) Unigramas + Bigramas
0 5000 10000 15000 20000
0.8
0.85
0.9
Tamaño del Corpus
(d) Adjetivos
Na¨ıve Bayes
MaxEnt
SVM
Decision Trees

Experimentación
Efectividad de Clasificadores Supervisados por Atributo
0 5000 10000 15000 20000
0.7
0.8
0.9
Tamaño del Corpus
Accuracy
(a) Na¨ıve Bayes (NLTK)
0 5000 10000 15000 20000
0.7
0.8
0.9
Tamaño del Corpus
(b) MaxEnt (megam)
0 5000 10000 15000 20000
0.7
0.8
0.9
Tamaño del Corpus
Accuracy
(c) SVM (sci-kit learn)
0 5000 10000 15000 20000
0.6
0.7
0.8
0.9
Tamaño del Corpus
(d) Decision Trees (sci-kit learn)
Presencia de Unigramas
Frecuencia de Unigramas
Presencia de Bigramas
Presencia de Unigramas y Bigramas
Presencia de Adjetivos

Experimentación
Comparación de Clasificadores Supervisados y No Supervisados
para Máximo Tamaño de Corpus
Na¨ıve Bayes MaxEnt SVM DecisionTrees Turney
0.6
0.7
0.8
0.9
1
0.92
0.94
0.94
0.88
0.92
0.94
0.95
0.88
0.88
0.84
0.86
0.8
0.94
0.95
0.95
0.88
0.91
0.88
0.9
0.85
0.84
Accuracy
Presencia de Unigramas Frecuencia de Unigramas Presencia de Bigramas
Presencia de Unigramas y Bigramas Presencia de Adjetivos Patrones de Opinión

Experimentación
Efectividad de Clasificadores - Análisis de Resultados
• Na¨ıve Bayes arroja los mejores resultados para corpus pequeños pero su
performance decrece levemente para los tamaños de corpus más grandes.
• MaxEnt y SVM mejoran su performance a medida que crece el tamaño de
corpus y alcanzan la máxima performance de la experiencia.
• Como ya se conoce la performance de Decision Trees es notablemente peor
que la obtenida con los otros modelos.
• Para todos los clasificadores supervisados los mejores resultados se
obtienen utilizando como atributos la combinación de presencia de
unigramas y bigramas.
• Utilizar adjetivos como atributos arroja resultados considerablemente
peores que utilizando todos los unigramas.
• Al igual que para el idioma inglés (Pang and Lee, 2002) considerar
frecuencia de unigramas como atributos no representa una mejora notable
con respecto a presencia.
• El algoritmo de Turney arroja muy buenos resultados comparables a los
obtenidos para métodos supervisados usando bigramas como atributos
considerando que no requiere un corpus etiquetado para el entrenamiento.

Conclusiones y Trabajo Futuro
Conclusiones
• Analizamos el impacto en la performance de los clasificadores
ante la variación de parámetros de entrada para un corpus en
español.
• Hallamos que aplicar preprocesamientos influye
considerablemente en los resultados.
• Alcanzamos la máxima precisión utilizando MaxEnt y SVM para
corpus grandes y Na¨ıve Bayes para corpus más pequeños.
• Mostramos que Turney también resulta una opción adecuada
para el idioma español cuando no se tiene un corpus etiquetado y
puede refinarse para un dominio espec´ıfico.
Próximos Pasos
• Evaluar la performance de los modelos en estudio cuando se
entrena con el corpus propuesto y se clasifica otro dominio.
• Realizar experiencias para corpus desbalanceados.
• Proponer otros preprocesamientos y tipos de atributos que
permitan mejorar los resultados y generalizar los clasificadores.

¿Preguntas?
“There’s no right,
there’s no wrong,
there’s only popular opinion.”
(Twelve Monkeys, 2005)

Presentación ASAI 2013 - Análisis de Sentimientos sobre un Corpus en Español - 42 JAIIO

Recomendados

Recomendados

Más contenido relacionado

Similar a Presentación ASAI 2013 - Análisis de Sentimientos sobre un Corpus en Español - 42 JAIIO

Similar a Presentación ASAI 2013 - Análisis de Sentimientos sobre un Corpus en Español - 42 JAIIO (20)

Último

Último (20)

Presentación ASAI 2013 - Análisis de Sentimientos sobre un Corpus en Español - 42 JAIIO