La minería de textos y otras herramientas permiten extraer más información de las preguntas abiertas. Estas herramientas incluyen nubes de etiquetas para visualizar datos, análisis estadísticos para comparar grupos, y medir el grado de implicación en los comentarios. Juntas, estas técnicas pueden identificar diferencias en las opiniones, aspectos populares y preocupaciones sobre un tema.
clase de Mercados financieros - lectura importante
Cómo sacar más información de preguntas abiertas
1. TE AY U D A M O S A INVESTIGAR…
MINERÍA DE TEXTOS. ¿CÓMO PODEMOS SACAR MÁS
INFORMACIÓN DE LAS PREGUNTAS ABIERTAS?
A L T E R A N A L I S I S
2. La forma tradicional de explotación de las preguntas abiertas…
Las preguntas abiertas condicionan menos a los entrevistados, evita respuestas
convencionales o demasiado convenidas y dejan traslucir mejor las opiniones
reales, a veces mediante respuestas complejas e incluso contradictorias.
Además, las respuestas abiertas proporcionan información sobre la forma de
expresarse y el vocabulario de los entrevistados.
Para poder tratar de forma Forma tradicional de trabajo:
estadística los datos obtenidos, la
forma tradicional de explotar las Se establece un plan de códigos
preguntas abiertas pasa por la Se hace un primer análisis de las respuestas para buscar aquellos
codificación manual de las elementos (códigos) que se repiten de forma asidua
respuestas.
Eso siempre supone una cierta
Codificación de las respuestas
pérdida de información (forma
de expresarse, términos Se buscan esos códigos comunes a lo largo de todas las respuestas
obtenidas
concretos empleados, etc…)
que puede resultar relevante en
el caso de abordar temas de Tabulación y análisis de los resultados
cierta complejidad. Se realiza una tabulación de los resultados que nos permita saber
cuántas veces ha sido mencionado cada código.
3. La forma tradicional de explotación de las preguntas abiertas…
Los resultados obtenidos se suelen presentar en forma de tabla o gráfico en los que
no aparecen los literales empleados por los entrevistados sino los códigos que los
agrupan. Veamos un ejemplo en forma de tabla:
Aspectos que más gustan del concepto % La tabla obtenida nos muestra
Bebida sana / contiene fibra natural y frutas ........ 50 que el contenido en fibras y
Fibra / aporta fibra ............................................... 16
frutas y su efecto sobre la salud
Sano / Más sano que otras bebidas ................... 14
Fruta / Tiene zumo de futas ................................. 11
han sido los aspectos que más
Fruta y fibra ........................................................... 11 han interesado.
Buena para la dieta ............................................. 10 El envase, también ha
El envase ..................................................................... 27
El envase ...............................................................
despertado interés.
18
La forma / el tamaño ........................................... 5 Sin embargo, el sabor y la
El color ................................................................... 3 naturalidad de la nueva bebida
Sabor ........................................................................... 13
han tenido menos impacto.
Buen sabor ............................................................ 7
Sabor a frutos rojos ............................................... 4
Producto natural ........................................................
Sin colorantes artificiales ......................................
12
5
…pero, ¿eso es todo lo
Sin aditivos ............................................................. 5 que podemos obtener de
Natural ...................................................................
No sabores artificiales ..........................................
4
3
este tipo de preguntas?
4. ¿Cómo podemos sacar más partido a la información de las preguntas
abiertas?
En los últimos años, han aparecido dos herramientas que nos permiten
sacarle más partido a la información recogida en este tipo de
preguntas:
• Permite presentar los datos de una
1. Tag Cloud forma mucho más visual
• Nuevas herramientas estadísticas que
2. Minería de permiten optimizar la información
textos obtenida
Veamos cada una de ellas con mayor detalle:
5. ¿Cómo podemos usar la tecnología de tag cloud?
Las tag clouds son representaciones visuales de las palabras que conforman un texto, en
donde el tamaño es mayor para las palabras que aparecen con más frecuencia.
Uno de sus usos principales es la visualización de las etiquetas de un sitio web, de modo
que los temas más frecuentes en el sitio se muestren con mayor prominencia. Las etiquetas
son solo palabras y por lo general suelen estar en orden alfabético.
La tag cloud de las respuestas obtenidas en la pregunta abierta de la tabla anterior podría
ser la siguiente:
Podemos ver de una forma muy visual que las mayores menciones se centran en la
incorporación de frutas y fibra y la consiguiente imagen de refresco saludable y la botella.
6. ¿Cómo podemos usar la tecnología de tag cloud?
Las tag cloud no suponen una gran ayuda en el análisis de la información obtenida; sin
embargo, se trata de una forma muy visual de presentar la información obtenida. Por ese
motivo, creemos que su punto fuerte es como herramienta de ayuda en la presentación de
resultados.
Sin embargo, hay que tener en cuenta que presentan dos limitaciones que conviene tener
en cuenta:
• Se suele emplear a nivel de palabras y no de frases. Eso supone que perdemos el
concepto de contexto en el que aparecen las palabras.
• No permiten hacer agrupaciones temáticas (por ejemplo: unir todas las expresiones
que tengan que ver con el concepto de sano: sano, saludable, ingredientes naturales,
etc…)
De todas formas, se está trabajando en algunas líneas de investigación (tag cluster, tag
maps, tag SOM, etc…) que pueden ayudar a solventar estos problemas y aumentar el
potencial de esta herramienta.
7. ¿Cómo nos puede ayudar la minería de textos?
La minería de textos o análisis de datos textuales consiste en aplicar métodos
estadísticos, en especial el análisis de correspondencias, a tablas específicas,
creadas a partir de los datos textuales. Estos métodos se completan con métodos
propios del dominio textual como los glosarios de palabras, las concordancias y la
selección del vocabulario más específico de cada texto, para así proveer una
herramienta comparativa de los mismos.
El principio fundamental en esta perspectiva es el análisis a través de la
comparación. Se busca comparar entre sí el discurso de los individuos que han
contestado a una encuesta o preguntas pautadas en entrevistas personales, o de
grupos de individuos con características comunes. Por ejemplo: el lenguaje de los
hombres con el de las mujeres, el lenguaje de los jóvenes con el de los mayores.
Un objetivo importante es conectar las repuestas abiertas con toda la información
proporcionada por las respuestas cerradas o variables categóricas relativas a
características contextuales de los individuos.
8. ¿Cómo nos puede ayudar la minería de textos?
De forma muy resumida, la minería de textos se realiza en dos fases sucesivas:
• los textos de las preguntas abiertas se tratan de
acuerdo a una serie de pautas establecidas (corrección
1. Procesamiento de errores ortográficos, eliminación de las diferencias
de la de género y número, etc…) con el objetivos de
información convertirlos en unas tablas que nos permitan
establecer las diferencias que existen entre los distintos
grupos
• Se emplean métodos estadísticos avanzados (análisis
2. Análisis de la factorial de correspondencias, análisis de similitudes y
información diferencias, etc…) para poder descubrir cuáles son las
verdaderas diferencias entre los distintos grupos
analizados.
9. ¿Cómo nos puede ayudar la minería de textos?
Tras aplicar la minería de textos a la pregunta que nos ha servido de ejemplo,
podríamos obtener dos gráficos similares a estos
Aspectos que MÁS GUSTAN del concepto según su intención de comprarlo
La marca
El sabor
Ayuda para la vida
moderna
No interesados en
No Color
comprarlo Frutos rojos
Más sana que otras
Duda Sin edulcorantes
Botella
Natural Dudosos
Diseño de la botella
Sin aditivos Buen sabor
Frutas
Sin aromas artificiales
Combinación de Sin
frutas y fibras colorantes artificiales
Aporta fibra a la dieta
Sana Novedad
Si Fibras
Interesados en
comprarlo
Botella diferente
Refrescante
10. ¿Cómo nos puede ayudar la minería de textos?
Aspectos que NO GUSTAN del concepto según su intención de comprarlo
Tamaño pequeño
No es sano
Precio
Interesados en No aporta fibra
comprarlo Si
La fibra
La marca No interesados en
No
Necesitan probarlo comprarlo
Más sabores Mal sabor
Tiene burbujas
Mal sabor de
la fibra Envase
Para niños Ya existe
Dudosos
El sabor
Duda
Sabor de la fibra
Nombre poco atractivo
11. ¿Cómo nos puede ayudar la minería de textos?
Analizando las diferencias de discurso entre los tres grupos analizados podemos ver
que:
• La comunicación del nuevo producto debería centrarse en tres ejes:
• La combinación de frutas y fibra que lo convierte en una bebida sana y
saludable.
• No tener ni edulcorantes, colorantes o aromas artificiales que refuerza
esa imagen de saludable.
• La novedad que todo ello supone en el mercado.
• Además, hay que tener en cuenta que:
• Uno de los posibles frenos a la compra son las dudas sobre el sabor que
tendrá.
• Otro freno a la compra reside en las dudas sobre el aporte real de fibra
a la dieta.
• Existe también un problema con el nombre del producto que está
presente hasta en los más proclives a la compra.
Como vemos, la minería de textos nos ha permitido profundizar en el análisis de la
información y obtener unos insights claves para ayudarnos en la posible
comercialización del producto.
12. …pero, ¿podemos obtener aún más información?
En algunos casos, podemos emplear una técnica importada de los pretest
publicitarios para poder obtener mayor información de las preguntas abiertas.
Para poder llevarlo a cabo es necesario:
• Pedirle a los entrevistados que, tras responder a la pregunta abierta, nos
valore su propio comentario como:
Bastante Bastante
Muy positivo Neutro Muy negativo
positivo negativo
• +2 • +1 •0 • -1 • -2
• Posteriormente, realizar una labor de codificación de “valor añadido”
buscando identificar aquellos comentarios que supongan “implicación”
(positiva o negativa) con el concepto. Tras el concepto “implicación” lo que
se quiere analizar es la cantidad de entrevistados que han recibido un
impacto activo (positivo o negativo) y han sido capaces de elaborar un
discurso que va más allá de la repetición de alguno de los elementos del
concepto mostrado.
13. ¿De qué sirve que valoren sus propios comentarios?
Obtenemos una rica visión de:
• los aspectos que más atraen y, por tanto, que se pueden convertir en
interesantes verbatims para los creativos.
• los aspectos que menos están gustando y como podemos resolverlos
Aspectos muy positivos Aspectos muy negativos
Parece muy saludable y útil, al Parece como si quisieran hacernos
concentrar las cantidades de creer que realmente puedes
fruta y fibra que se indican sustituir una dieta equilibrada
Me tranquiliza la idea de estar existen demasiados productos
haciendo algo más por mi salud actualmente que pretenden
venderse con la idea de ser más
saludables y hasta ahora todos
lo que mas me gusta es poder me han defraudado
consumir las propiedades de una
comida sana, bebiendo
14. ¿De qué sirve que valoren sus propios comentarios?
También nos permite conocer en qué grandes ejes se concentran los comentarios
positivos y negativos
Comentarios positivos Comentarios negativos
Contenido en frutas y fibras 40 21 No se creen la salud 20 11
Salud 25 20 Mal sabor 18 10
Buen sabor 15 10 No es diferente 14 9
Botella 10 10 Botella 11 5
Muy positivos Bastante positivos Muy positivos Bastante positivos
15. ¿Qué nos aporta la codificación de la implicación?
En el caso de las preguntas abiertas de los test de concepto y/o producto, el
análisis del grado de implicación a través de las preguntas abiertas puede ser
considerado como un indicador del nivel de relevancia y/o interés que despierta
el concepto/producto testado.
Como el grado de implicación varía en función de la categoría de
producto, forma de realizar la entrevista, target de los estudios, etc… los datos
obtenidos en cada caso deben ser contrastados con los de las BB.DD.
Hay que tener en cuenta que la implicación con la idea mostrada puede ser
positiva o negativa. Por lo que, resulta interesante conocer que porcentaje de
cada una tiene el concepto/producto mostrado.
Además, puede resultar también sumamente útil saber qué elementos han sido
los que han generado mayor grado de implicación con la idea, porque pueden
ser utilizados como ejes de comunicación.
16. ¿Qué nos aporta la codificación de la implicación?
Grado de implicación del concepto testado: Tipo de implicación del concepto testado:
Comentarios negativos Comentarios positivos
Grado de implicación 19 % 25% 5% 3% 14% 22%
BB.DD. Concepto testado BB.DD. Concepto testado
Áreas que despiertan más implicación:
Vemos que se trata de un concepto
Contenido en frutas y fibras 10
con potencial ya que su grado de
implicación es superior a la media y con
Salud 5 una clara connotación positiva.
El aporte de frutas y fibras y su efecto
Buen sabor 4 sobre la salud son los aspectos que
mayor grado de implicación han
Botella 3
conseguido.
17. En definitiva…
En resumen:
• Las herramientas de tag cloud, nos permiten mostrar la información de una
forma mucho más visual y util en las presentaciones.
• La minería de datos, nos permite profundizar en el análisis de la información
y descubrir qué diferencias existen en el discurso de los distintos grupos
analizados.
• La valoración de la respuesta dada nos permite conocer qué aspectos son
los que mayor y menor interés despiertan y son una fuente de verbatims para
las agencias de comunicación.
• Analizar el grado de implicación nos permite saber si, más allá de la
respuesta a una pregunta cerrada, el concepto/producto testado despierta
interés. Además, nos ayuda a conocer qué elementos son los que están
generando esa implicación.
Todas estas herramientas que hemos mostrado nos permiten “ir más allá” en el
análisis y presentación de la información obtenida en las preguntas abiertas.