Conferencia Anual de Data Mining
       y Modelos Analíticos


   Análisis Sentimental: Aplicación en
encuestas de Satisfacción con Text Mining


                 Lima - Perú
                    2012
¿Que es el Text Mining?

Las encuestas de opinión se han incrementado en la web y los resultados se pueden mostrar en
tiempo real.




•   El boom de las aplicaciones que dan soporte a ventas, servicio al cliente o las de call center
    permiten el registro de grandes cantidades de texto en sus sistemas.
•   Se estima que 62 Mil millones de emails son enviados cada día.
•   Paginas de busqueda generan cada vez más información. Suficiente para publicar millones de
    libros.
•   Blogs y Wikis creados por individuos, grupos y profesionales se ha incrementado
    exponencialmente.
Aplicaciones




              Patrones

             Conexiones

             Tendencias
Documentos
Similitud con el proceso de Data Mining


     Data Mining




     Text Mining
Proceso de Análisis
Aplicación: Encuestas de Satisfacción

          Análisis de encuestas de Opinión




Cliente                            Preguntas Cerradas
                                   Preguntas Abiertas
Comentarios

                     Comentario                                             Percepción

o “Que capaciten mas a la señorita de la ventanilla ( 4 ) es totalmente
  déspota e indiferente”

o “Evaluar a su personal, todos no están en la capacidad de atención
  al cliente”

o “Por lo pronto sigan el mismo servicio que emplean”

o “Me voy satisfecho de la atención siempre fue rápida las
  soluciones”

o “Deben implementar otro stand donde sacar ticket debido a que
  solo cuenta con 1 y es incomodo”

o “Con total conformidad”
Tokenización

“Evaluar a su personal, todos no están en la capacidad de atención al
                               cliente”



                               Evaluar

                                  a

                                 su

                               personal

                                todos

                                 no

                                estan

                                 en
                                  la
                              capacidad
                                 de
                               atencion
                                  al
                               cliente
Filtrar

 Evaluar     Evaluar
   a           a
   su          su
personal    personal
                         Evaluar
 todos       todos
                        personal
   no          no
                         todos
  estan       estan
                           no
   en          en
                          estan
   la          la
            capacidad   capacidad
capacidad
               de       atencion
   de
            atencion     cliente
atencion
   al          al

 cliente     cliente
Stemming

Lexema:                   Es el elemento que contiene la significación de la palabra.
                          Tradicionalmente se le ha llamado raíz.


       Palabra          Lexema             Morfemas              Prefijo        Sufijo        Incremento

                                     género       número                                   
      literarios          liter        o              s                          ari               
     memorias           memori         a              s                                            
      señorita           señor         a                                          it               
    desesperanza         esper                                    des           anza               

    subdesarrollo       desarroll      o                        sub y des                          

     periodismo          period        o                                         ism               
     esclavitud          esclav                                                 itud               
      guerrilla          guerr         a                                          ill              
     inteligencia        intelig       a                                        enci               

    quemadura            quem          a                                         ur              ad
Stemming




 Evaluar    Evalua

personal    Person

 todos       Tod

   no         no

  estan       Est

capacidad   Capacid
atencion    Atenc
 cliente    Client
Transformación en la matriz de Datos




Evalua
            NumDoc   Evalua   Person   Tod   no   Est   Capacid   Atenc   Client
Person
              1        1        1       1    1    1       1        1        1
 Tod          2        0        1       0    1    0       1        0        1
  no          3        0        1       1    0    1       0        1        1

  Est

Capacid
                           • Dicotomico
Atenc
                           • Frecuencia
Client
                           • Porcentaje
Clasificación


                                               Satisfecho
                                   f(x)




       Documentos                             Insatisfecho



Técnicas

o Arboles de Decisión
o Maquinas de Soporte Vectorial (SVM)
o Regresión Logistica
o Naïve Bayes
Regresión Logística
Regresión Logística

 Variable            Peso
 bien                       0.336
 sig_asi                    0.320
 muy_buen                   0.319
 muy_buen_atencion          0.313
 tod_ok                     0.304    Comentarios positivos
 conform                    0.271
 tod_bien                   0.242
 segu                       0.181
 es_ok                      0.161


mas_espaci                  -0.322
personal                    -0.343
local                       -0.374
mas_ventanill               -0.384   Comentarios Negativos
mas_personal                -0.507
buen_atencion               -0.610
Regresión Logística




Insatisfechos   Satisfecho
SVM




Insatisfechos   Satisfecho
Análisis en la Web
Página Web       HTML
Análisis en la Web

                                                               HTML


C Mikel Erentxun en Lima: la noche más emotiva del año llegó con pisco sour El español realizó un acertado repaso a sus 25
años de carrera en un íntimo show de lujo y tomó varias copas del licor nacional a lo largo de su recital Sábado 02 de julio de
2011 - 01:46 pm Redacción online Aquel, el otrora pop star de voz rota y sonido austero e intimista. El ente transgresor que
asoma tímido, pero encuentra su lugar en el escenario y se hace un narrador voraz, oportuno y descarnado. El espíritu todavía
vigente del mejor momento Duncan Dhu; o quien mejor lleva esta marca soberbia. Desde un guiño a lo ineludible entre los 10
discos que grabó junto a su agrupación ochentera al pack más ambicioso entre sus ocho producciones en solitario, Mikel
Erentxun coronó, anoche en Scencia de La Molina, un show categórico, otra raya en el corazón. Para ver a Mikel nunca es tarde.
En agosto del 2000 fue el artista que cerró de manera notable las fechas del Gran Estelar de la Feria del Hogar. Entonces, se le
asociaba muchísimo más a su pasado en Duncan Dhu que a su trabajo como solista. Tenía tres placas por demás destacables y
al Perú llegó con la cuarta, “Te dejas ver” , bajo el brazo. Un compilado de temas que hacían exacta combustión con la garúa que
caía sobre el recinto de San Miguel, para efectos de nostalgia y evocación. Ayer, un auditorio repleto, quizás la mayoría de los
mismos que once años atrás también esperábamos que salga a escena, coreaba el…




                          Patrones                         Clasificación                         Tendencias
Reflexiones
El virtuoso ciclo de la Minería de Datos


                                 Transformar los Datos
                                 En información accionable
                                 usando técnicas de MD




    Identificar                                                            Actuar
                                                                 Con la información disponible
Las oportunidades de negocio,
donde el análisis de los datos
puede proporcionar valor.




                                    Medir los resultados
                                     Sobre los esfuerzos, para
                                     completar el ciclo de
                                     aprendizaje.
Consultas


Realiza una Consulta




   www.dataminingperu.com

¿Que es el Text Mining?

  • 1.
    Conferencia Anual deData Mining y Modelos Analíticos Análisis Sentimental: Aplicación en encuestas de Satisfacción con Text Mining Lima - Perú 2012
  • 2.
    ¿Que es elText Mining? Las encuestas de opinión se han incrementado en la web y los resultados se pueden mostrar en tiempo real. • El boom de las aplicaciones que dan soporte a ventas, servicio al cliente o las de call center permiten el registro de grandes cantidades de texto en sus sistemas. • Se estima que 62 Mil millones de emails son enviados cada día. • Paginas de busqueda generan cada vez más información. Suficiente para publicar millones de libros. • Blogs y Wikis creados por individuos, grupos y profesionales se ha incrementado exponencialmente.
  • 3.
    Aplicaciones Patrones Conexiones Tendencias Documentos
  • 4.
    Similitud con elproceso de Data Mining Data Mining Text Mining
  • 5.
  • 6.
    Aplicación: Encuestas deSatisfacción Análisis de encuestas de Opinión Cliente  Preguntas Cerradas  Preguntas Abiertas
  • 7.
    Comentarios Comentario Percepción o “Que capaciten mas a la señorita de la ventanilla ( 4 ) es totalmente déspota e indiferente” o “Evaluar a su personal, todos no están en la capacidad de atención al cliente” o “Por lo pronto sigan el mismo servicio que emplean” o “Me voy satisfecho de la atención siempre fue rápida las soluciones” o “Deben implementar otro stand donde sacar ticket debido a que solo cuenta con 1 y es incomodo” o “Con total conformidad”
  • 8.
    Tokenización “Evaluar a supersonal, todos no están en la capacidad de atención al cliente” Evaluar a su personal todos no estan en la capacidad de atencion al cliente
  • 9.
    Filtrar Evaluar Evaluar a a su su personal personal Evaluar todos todos personal no no todos estan estan no en en estan la la capacidad capacidad capacidad de atencion de atencion cliente atencion al al cliente cliente
  • 10.
    Stemming Lexema: Es el elemento que contiene la significación de la palabra. Tradicionalmente se le ha llamado raíz. Palabra Lexema Morfemas Prefijo Sufijo Incremento     género número       literarios liter o s   ari   memorias memori a s       señorita señor a     it   desesperanza esper     des anza   subdesarrollo desarroll o   sub y des     periodismo period o     ism   esclavitud esclav       itud   guerrilla guerr a     ill   inteligencia intelig a     enci   quemadura quem a     ur ad
  • 11.
    Stemming Evaluar Evalua personal Person todos Tod no no estan Est capacidad Capacid atencion Atenc cliente Client
  • 12.
    Transformación en lamatriz de Datos Evalua NumDoc Evalua Person Tod no Est Capacid Atenc Client Person 1 1 1 1 1 1 1 1 1 Tod 2 0 1 0 1 0 1 0 1 no 3 0 1 1 0 1 0 1 1 Est Capacid • Dicotomico Atenc • Frecuencia Client • Porcentaje
  • 13.
    Clasificación Satisfecho f(x) Documentos Insatisfecho Técnicas o Arboles de Decisión o Maquinas de Soporte Vectorial (SVM) o Regresión Logistica o Naïve Bayes
  • 14.
  • 15.
    Regresión Logística Variable Peso bien 0.336 sig_asi 0.320 muy_buen 0.319 muy_buen_atencion 0.313 tod_ok 0.304 Comentarios positivos conform 0.271 tod_bien 0.242 segu 0.181 es_ok 0.161 mas_espaci -0.322 personal -0.343 local -0.374 mas_ventanill -0.384 Comentarios Negativos mas_personal -0.507 buen_atencion -0.610
  • 16.
  • 17.
  • 18.
    Análisis en laWeb Página Web HTML
  • 19.
    Análisis en laWeb HTML C Mikel Erentxun en Lima: la noche más emotiva del año llegó con pisco sour El español realizó un acertado repaso a sus 25 años de carrera en un íntimo show de lujo y tomó varias copas del licor nacional a lo largo de su recital Sábado 02 de julio de 2011 - 01:46 pm Redacción online Aquel, el otrora pop star de voz rota y sonido austero e intimista. El ente transgresor que asoma tímido, pero encuentra su lugar en el escenario y se hace un narrador voraz, oportuno y descarnado. El espíritu todavía vigente del mejor momento Duncan Dhu; o quien mejor lleva esta marca soberbia. Desde un guiño a lo ineludible entre los 10 discos que grabó junto a su agrupación ochentera al pack más ambicioso entre sus ocho producciones en solitario, Mikel Erentxun coronó, anoche en Scencia de La Molina, un show categórico, otra raya en el corazón. Para ver a Mikel nunca es tarde. En agosto del 2000 fue el artista que cerró de manera notable las fechas del Gran Estelar de la Feria del Hogar. Entonces, se le asociaba muchísimo más a su pasado en Duncan Dhu que a su trabajo como solista. Tenía tres placas por demás destacables y al Perú llegó con la cuarta, “Te dejas ver” , bajo el brazo. Un compilado de temas que hacían exacta combustión con la garúa que caía sobre el recinto de San Miguel, para efectos de nostalgia y evocación. Ayer, un auditorio repleto, quizás la mayoría de los mismos que once años atrás también esperábamos que salga a escena, coreaba el… Patrones Clasificación Tendencias
  • 20.
  • 21.
    El virtuoso ciclode la Minería de Datos Transformar los Datos En información accionable usando técnicas de MD Identificar Actuar Con la información disponible Las oportunidades de negocio, donde el análisis de los datos puede proporcionar valor. Medir los resultados Sobre los esfuerzos, para completar el ciclo de aprendizaje.
  • 22.
    Consultas Realiza una Consulta www.dataminingperu.com