SlideShare una empresa de Scribd logo
1 de 28
Descargar para leer sin conexión
Aprende las bases de la recolección de datos online
Fundamentos de la recolección
de datos online
© netquest 2017
Introducción.  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  . 3
Internet ha cambiado la investigación de mercados. .  .  .  . 4
Fuentes para obtener muestras online.  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  . 6
Métodos de muestreo.  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  . 10
El muestreo por cuotas online efectivo .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  . 14
Planificar la recolección de datos online .  .  .  .  .  .  .  .  .  .  .  .  .  .  . 17
Encuestas eficaces para el trabajo de campo online
. .  .  .  . 19
Datos de calidad.  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  . 21
Privacidad.  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  . 24
Reporting y visualización.  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  . 26
Tabla de contenidos
Fundamentos de la recolección de datos online 3
La recolección de datos es la actividad que empieza una vez se han definido el objetivo y el diseño
de la investigación, y acaba cuando se dispone de los datos recogidos para proceder a su análisis.
En este contexto, «efectivo» significa encontrar el equilibrio entre costes, tiempo y calidad.
Este Ebook te puede interesar si te identificas con alguno de los siguientes perfiles:
1. Eres un profesional con experiencia en la investigación de mercados y llevas años
trabajando con metodologías convencionales para la recolección de datos, como las
entrevistas personales y las entrevistas por teléfono. Te ves obligado a investigar y aplicar
nuevas tecnologías para satisfacer las peticiones de tus clientes o ser más eficiente. Aunque
tengas experiencia en la recolección de datos online, este libro te ayudará a entender las
diferencias principales entre los distintos métodos y te permitirá decidir mejor a la hora de
elegir qué métodos aplicas y cuándo.
2. Eres joven y te dedicas profesionalmente a la investigación de mercados. La
investigación de mercados online ha sido tu elección natural desde que empezaste tu
andadura profesional, pero crees que hay una gran diferencia entre lo que te enseñaron
en clase y la vida real. Te preguntas cómo poner en práctica los conocimientos aprendidos
sobre muestreo probabilístico, los marcos muestrales y las cuotas en proyectos reales. O
quizás te apetece conocer las novedades que se han producido desde que acabaste tus
estudios.
3. Actualmente, estudias técnicas de investigación de mercados. Crees que el marco
teórico que estás aprendiendo dista enormemente de la recolección de datos real. Quieres
entender cómo emplear mejor los conceptos clásicos que aprendes en un mundo cada vez
más dominado por la tecnología, la flexibilidad y la velocidad.
4. No te dedicas profesionalmente a la investigación de mercados, pero en tu trabajo
tienes que recolectar datos online y quieres saber cómo hacerlo de forma rápida y eficaz.
Con este libro quiero tender un puente importante entre la teoría y la práctica de forma sencilla,
breve y directa. Este libro es tan solo una guía; en él no se tratan todos los temas con gran
profundidad, pero te ayudará a descubrir aquellas incógnitas que todavía no conoces. Encontrarás
más información en nuestro blog en www.netquest.com.
Por último, permíteme una observación final acerca del objetivo de este libro: las
recomendaciones del libro son aplicables a prácticamente todas las metodologías de recolección
de datos online cualitativas y cuantitativas, pero nos centraremos en las encuestas por tratarse de
la metodología de investigación de mercados más habitual.
Introducción
Este Ebook pretende ser una guía para implementar
una recolección de datos online eficaz para la
investigación de mercados.
Fundamentos de la recolección de datos online 4
Las nuevas tecnologías han creado un nuevo comportamiento del consumidor y la necesidad
de estudiar este nuevo comportamiento en su contexto. Paralelamente, las nuevas tecnologías
han dado lugar a nuevas formas de recolectar información sobre el comportamiento de los
consumidores. Desde el auge de Internet a mediados de los 90, la investigación de mercados se ha
volcado en la recolección de datos online.
Cada día son más las investigaciones que se realizan a través de dispositivos con conexión a
Internet. Además, los nuevos dispositivos nos permiten recolectar nuevos tipos de datos. ¿Qué
razones nos empujan a recolectar datos a través de Internet? ¿Qué ventajas nos aportan? ¿Hay
límites?
Internet ha cambiado la
investigación de mercados
Fundamentos de la recolección de datos online 5
Internet ha cambiado la investigación de mercados
La siguiente tabla recoge las ventajas y los inconvenientes de la recolección de datos online en
comparación con los métodos tradicionales.
Ventajas Inconvenientes
Costes
Menos costes debido a la ausencia
del entrevistador.
Parte de los costes ahorrados en el
entrevistador deben destinarse a
recompensar a los participantes.
Velocidad
Más rápida que los métodos offline.
Recolección de datos automatizada
y un grupo más grande de
encuestados potenciales.
L os proyectos más complejos
seguirán requiriendo más tiempo
de lo que cabría esperar si, por
ejemplo, el tamaño de la muestra es
muy grande, si es difícil acceder a la
población objetivo o si aplicamos un
muestreo por cuotas complejo (véase
más adelante).
Representatividad
En función del país, mejor
acceso a determinados grupos
sociodemográficos, como la gente
joven o las personas con estudios
superiores.
En muchos países, la población
online no representa la totalidad de
algunos grupos sociodemográficos,
como la gente mayor o las clases más
bajas.
Estímulos
En la recolección de datos online se
pueden utilizar todos los estímulos
imaginables: imágenes, vídeos, audios,
mapas interactivos, simuladores de
compra y cuestionarios conjuntos.
Este aspecto no presenta
inconvenientes. La modalidad
online es claramente mejor a nivel
de variedad de herramientas que
se pueden utilizar para recolectar la
información.
Calidad
Debido a la ausencia del
entrevistador, menos riesgo de
respuestas fraudulentas o sesgos
inducidos.
La calidad depende de los
entrevistados. Algunos riesgos son
la duplicación de participantes,
participantes fraudulentos o la falta
de atención.
Procesamiento de
datos
Se recoge, procesa y, dado el
caso, visualiza en tiempo real y
simultáneamente la información
procedente de varios encuestados. Es
fácil y rápido.
Algunos métodos de recolección de
datos offline requieren consolidar y
procesar los datos antes de pasar al
reporting y la visualización. En estos
casos, no es posible aprovechar al
máximo la velocidad que caracteriza
la recolección de datos online.
VENTAJAS E INCONVENIENTES DE LA RECOLECCIÓN DE DATOS ONLINE
Fundamentos de la recolección de datos online 6
Todos los procesos de recolección de datos empiezan por
el muestreo, que es el método empleado para elegir un
subgrupo de individuos de un universo estadístico con el fin
de estimar las características de todo el universo.
Existen varios métodos de muestreo: algunos son más prácticos que otros, en función de los
objetivos que persigamos con nuestra investigación y el universo objetivo. Pero, antes de aplicar
cualquiera de estos métodos, pregúntate: ¿Dónde puedo encontrar participantes online para una
encuesta online?
Gran parte de los métodos de muestreo que te han enseñado no son aplicables a la mayoría de
proyectos de investigación, independientemente de si recoges datos online u offline: ¿Cuántas
veces en la vida podrás utilizar un muestreo probabilístico puro? Esto es especialmente importante
cuando utilizamos Internet.
Mi primer consejo: olvídate de cómo te gustaría alcanzar tu muestra, piensa en cómo puedes
alcanzarla y alinea tu enfoque con la realidad. El muestreo online presenta ciertos retos: la
población en Internet no está censada y no puedes interceptar a personas al azar para pedirles
que participen, como a pie de calle. Intenta entender cómo funciona Internet y encuentra la
solución que mejor se adapte a tu proyecto de recolección de datos online; no lo hagas al revés.
Este libro te ayudará a conseguirlo.
Actualmente, los investigadores profesionales emplean cuatro fuentes distintas para conseguir
participantes.
1. Paneles de acceso online
Los paneles de acceso online son comunidades online formadas por personas predispuestas a
participar en proyectos de investigación de mercados (encuestas, en su mayoría) a cambio de una
recompensa, como dinero, obsequios, donaciones o sorteos.
Los paneles de acceso online reclutan a sus miembros por distintas vías. Algunos son paneles
abiertos en los que los participantes se registran simplemente entrando en su página web. Se
capta la atención de los visitantes a través de campañas de publicidad públicas y se convierten en
nuevos miembros.
Otros paneles son cerrados y solo se puede acceder a ellos con una invitación personal enviada a
los miembros registrados en páginas web asociadas. Pueden parecerse a los paneles abiertos, pero
Fuentes para obtener
muestras online
Fundamentos de la recolección de datos online 7
Fuentes para obtener muestras online
no lo son, ya que no es posible acceder a un panel cerrado sin invitación.
Actualmente, los paneles de acceso online conforman la fuente principal de participantes en la
investigación de mercado profesional.
2. River sampling
El river sampling (muestreo en río) es un método inspirado en el funcionamiento de las encuestas
cara a cara, esto es, interceptando a personas en la calle. El river sampling intenta interceptar a las
personas online cuando navegan por Internet. ¿Cómo? Con anuncios en páginas web con mucho
tráfico como Google o Facebook. Sin embargo, en lugar de pedir a la gente que acceda a un panel
para participar en futuras encuestas, como sucede en un panel online, se les pide que participen
directamente en una sola encuesta online. A cambio, reciben una recompensa para premiar su
participación.
3. Paneles online probabilísticos
Es difícil crear un panel que sea totalmente representativo de la población reclutando a personas
online. En realidad, es imposible, principalmente por 2 razones: (1) en muchos países, una parte de
la población no utiliza Internet y (2) no hay un directorio que recoja todos los usuarios de Internet
a partir del cual se puedan elegir personas al azar. Tal y como veremos más adelante, estos límites
nos impiden utilizar el muestreo aleatorio.
Los paneles probabilísticos intentan superar estas dificultades reclutando a personas offline y
ofreciendo un dispositivo con conexión a Internet a aquellas que no utilizan Internet. De este
modo, es posible utilizar el método de muestreo probabilístico clásico para crear el panel online.
Una vez tenemos el panel, las muestras aleatorias que se extraen deberían ser muestras aleatorias
de todo el universo. Así, nos aseguramos de tener un panel representativo.
Por norma general, los paneles online probabilísticos son más pequeños y resultan más caros
que los paneles de acceso online y se suelen utilizar, fundamentalmente, para la investigación
académica.
4. Bases de datos de propiedad
Si disponemos de una base de datos con correos electrónicos o cualquier otra forma de
contactar a la gente por Internet cuando nos convenga, tenemos una buena oportunidad para la
recolección de datos online. En función del objetivo de la investigación, es probable que no sea
necesario representar a toda la población, sino únicamente a nuestro grupo objetivo, por ejemplo,
nuestros clientes o visitantes. La representatividad no siempre es un problema.
La tabla a continuación muestra las ventajas y los inconvenientes principales de las distintas
fuentes de datos.
Fundamentos de la recolección de datos online 8
Fuentes para obtener muestras online
Ventajas Inconvenientes
Online Access
Panel
• Flexibilidad: apto para todo tipo de
proyectos de recolección de datos.
• Estabilidad: permite predecir y
planificar con precisión el número
de participantes.
• Apto para estudios de seguimiento
en los que se debe llegar a la misma
población objetivo periódicamente.
• Coste moderado, incluso para los
targets difíciles de acceder (siempre
y cuando el panel se haya perfilado
correctamente).
• Permite implementar medidas
de calidad comparando la
participación de los individuos a lo
largo del tiempo.
• Los paneles no siempre están
disponibles en las zonas menos
pobladas.
• Representatividad limitada. El
muestreo por cuotas debe aplicarse
correctamente para superar esta
dificultad
River sampling
• Bajo coste.
• Apto para países con poca
población cuando no disponemos
de un panel de acceso online.
• Buena fuente de públicos online
frecuentes, como los adolescentes.
• Problemas de calidad: no es fácil
monitorizar a los participantes para
evitar identidades fraudulentas
o malas conductas durante la
participación.
• No apto para estudios de
seguimiento: los resultados de
la muestra son inestables en el
tiempo.
• Riesgo de obtener resultados
sesgados cuando se invita a todos
los participantes desde la misma
página web.
VENTAJAS E INCONVENIENTES DE LAS FUENTES ONLINE DE PARTICIPANTES
Fundamentos de la recolección de datos online 9
Fuentes para obtener muestras online
Paneles online
probabilísticos
• Buena representatividad. El
muestreo por cuotas no es tan
crítico como en los paneles de
acceso online.
• Alta estabilidad, se pueden predecir
los resultados de las muestras.
• Tamaño limitado.
• Costes elevados.
• No disponible en la mayoría de
países.
Bases de datos de
propiedad
• El menor coste posible porque
ya poseemos la fuente de
participantes.
• Dependiendo de cómo definamos
la población objetivo y perfilemos
a los participantes en nuestra base
de datos se puede implementar el
muestreo probabilístico.
• Los resultados se pueden
complementar con la información
ya disponible (es decir, los
resultados de las encuestas a
clientes se pueden comparar con
los ingresos o la segmentación de
clientes)
• No siempre disponemos de bases
de datos de propiedad para
solucionar nuestros problemas.
• Apto para recolectar información
de nuestros clientes, pero no de los
clientes de nuestros competidores.
Fundamentos de la recolección de datos online 10
Una vez tenemos una visión clara de las fuentes principales
de participantes para nuestra encuesta, la decisión acerca
del método de muestreo es bastante clara: el método de
muestreo que aplicaremos depende enormemente del
número de participantes disponibles.
Los métodos de muestreo existentes se pueden dividir en 2 categorías: los métodos de muestreo
probabilístico y no probabilístico.
Métodos de muestreo probabilístico
Una muestra probabilística es una muestra en la que cada unidad del universo tiene una
probabilidad (superior a cero) de ser elegido en la muestra y dicha probabilidad se puede
determinar con precisión. Estas características permiten producir estimaciones no sesgadas de los
totales de población. El muestreo probabilístico requiere siempre un marco muestral, es decir, una
lista de todos los individuos de un universo que se pueden incluir en la muestra.
El muestreo aleatorio simple (M.A.S.) es la técnica de muestreo probabilística más habitual, ya
que se considera un estándar de oro: todos los métodos se pueden comparar con él. En el M.A.S.,
los individuos del universo tienen las mismas probabilidades de ser seleccionados. Esta condición
minimiza los sesgos y simplifica el análisis.
Otros métodos de muestreo probabilístico son:
Muestreo estratificado: si el universo presenta distintas categorías o estratos distintos, cada
estrato se puede investigar como subgrupo independiente. Este método (1) permite sacar
conclusiones sobre cada subgrupo y (2) nos ofrece unas estimaciones estadísticas más eficientes
que son, al menos, tan buenas como con el muestreo aleatorio simple y, con frecuencia, incluso
mejores. El muestreo estratificado funciona mejor si la varianza entre estratos es baja dentro de
cada estrato pero elevada entre estratos distintos, de modo que el tamaño de la muestra se pueda
adaptar a cada estrato.
Muestro por conglomerados: cuando la población se puede dividir en grupos o conglomerados
y cada conglomerado es parecido a los demás, podemos realizar el muestreo a partir de uno de
los conglomerados para representar a toda la población. Este planteamiento es práctico si un
menor número de conglomerados reduce los costes de la recolección de datos (por ejemplo, si
cada manzana en una ciudad conforma un conglomerado, podemos reducir costes enviando
entrevistadores a tan solo unas cuantas manzanas). También simplifica el marco muestral: en el
ejemplo anterior, necesitaremos un mapa de las manzanas en la ciudad en lugar de una lista de
Métodos de muestreo
Fundamentos de la recolección de datos online 11
Métodos de muestreo
los individuos en la ciudad. El muestreo por conglomerados puede aumentar la varianza entre las
estimaciones muestrales, en especial, si los conglomerados no son homogéneos.
Muestreo sistemático: este método selecciona los individuos en períodos regulares a partir de
una lista ordenada de la población. Por ejemplo, elegimos a 1 visitante entre 50 en una tienda
para entrevistarle. Este método puede igualar o incluso mejorar los resultados obtenidos con el
muestreo aleatorio simple, pero si hay una correlación entre la lista ordenada de candidatos, las
estimaciones resultantes pueden ser sesgadas.
Métodos de muestreo no probabilístico
En pocas palabras, el muestreo no probabilístico es cualquier método de muestreo que no
cumpla los requisitos del muestreo probabilístico, ya sea porque, a veces, no se puede llegar a
algunos individuos de la población objetivo, ya sea porque desconocemos la probabilidad de
inclusión. Aunque muchos lo hacen, no se debe hacer una estimación de errores con los métodos
de muestreo no probabilístico. Las encuestas telefónicas por marcado aleatorio y las entrevistas
personales en zonas urbanas con una amplia concentración de pisada son algunos ejemplos de
métodos de muestreo no probabilísticos.
Lo cierto es que en la investigación de mercados, el 99 % de la recolección de datos utiliza
muestreos no probabilísticos. Por lo tanto, si has valorado una estimación de errores junto con el
resultado de la encuesta (el llamado margen de error y nivel de confianza), has hecho un mal uso
disfrazado del método de muestreo.
Por suerte, esto no significa que el muestreo no probabilístico no sirva para nada. No es perfecto,
no contempla la estimación de errores de medición y puede ser un método ligeramente o incluso
bastante sesgado, pero la información siempre es valiosa en tanto que sepamos cómo se ha
recogido y que, a pesar de sus limitaciones, nos sirve para alcanzar nuestros objetivos.
El muestreo por cuotas es el método de muestreo no probabilístico más habitual. En el muestreo
por cuotas, la población se divide en grupos mutuamente excluyentes conforme a variables de
segmentación como la edad, el sexo o la región. Definimos la distribución de la muestra objetivo
por segmentos de modo que se corresponda con la población objetivo. Así, por ejemplo, si la
población objetivo es un 50 % de hombres y un 50 % de mujeres, una muestra de 1.000 individuos
debe ser equivalente a este reparto: 500 hombres y 500 mujeres.
Una vez definido el tamaño de cada segmento o cuota, elegimos una muestra no aleatoria y
entrevistamos a los individuos hasta alcanzar el objetivo de cada cuota. Esto significa que una
vez he alcanzado los 500 varones, si el siguiente individuo en la muestra es un hombre, tenemos
que descartarlo. Los individuos descartados se denominan «quota fulls». En este sentido, el
muestreo por cuotas se parece al muestreo estratificado, pero en lugar de incluir a los individuos
aleatoriamente en cada segmento, de la muestra no aleatoria cabe esperar que sea lo más
representativa posible llenando las cuotas objetivo por segmento.
Fundamentos de la recolección de datos online 12
Métodos de muestreo
Otros métodos de muestreo no probabilístico son:
Muestreo por bola de nieve: este método empieza identificando un pequeño grupo de
encuestados iniciales dentro de la población objetivo. Los encuestados iniciales se utilizan para
reclutar a más encuestados dentro de la población objetivo. Es un buen método para las muestras
de difícil acceso.
Muestreo por conveniencia: este nombre se utiliza habitualmente para describir cualquier otro
método que persiga obtener fácilmente una muestra no probabilística. Los individuos se registran
voluntariamente en un formulario web. Los seguidores de Facebook son un ejemplo de este tipo
de muestras. No podemos calcular hasta qué punto las muestras representan a nuestro universo
pero son una muestra y, por lo tanto, pueden servirnos para recolectar datos.
Métodos de muestreo aptos para la recolección de datos online.
Tal y como hemos explicado anteriormente, los métodos de muestreo más adecuados para la
recolección de datos dependen de la fuente de participantes que utilicemos.
Si extraemos muestras a partir de un panel de acceso online, la única opción realista es el
muestreo por cuotas. Los paneles de acceso online no son representativos de toda la población,
pero si están bien diseñados, deberían proporcionarnos todo tipo de encuestados. Para
asegurarnos de que extraemos una muestra representativa del panel, debemos fijar las cuotas
correctas. El siguiente capítulo aprenderemos a fijar las cuotas para la recolección de datos online.
Esto también es aplicable al river sampling. En este caso, las cuotas son aún más importantes
debido a la varianza limitada de los participantes.
Pero las cosas son distintas cuando trabajamos con un panel online basado en la probabilidad,
porque se supone que este tipo de paneles conforman una muestra aleatoria/representativa
del universo. En teoría podríamos confiar en esto para extraer muestras aleatorias del panel. Sin
embargo, debemos recordar que un panel online probabilístico sigue siendo una comunidad de
personas encuestadas periódicamente a cambio de algo. Algunos miembros del panel pueden
responder más activamente que otros a las invitaciones. El nivel de actividad puede variar en
función de la edad, el sexo u otros factores sociodemográficos, de manera que, al final, la muestra
del panel puede ser sesgada. El muestreo por cuotas es nuestro mejor aliado para evitar estos
retos.
Fundamentos de la recolección de datos online 13
Métodos de muestreo
Por último, si tenemos acceso a una base de datos de propiedad, podremos utilizar varios
métodos de muestreo. Por ejemplo, pensemos en una lista exhaustiva de clientes de una empresa:
si queremos investigar este target específico, la lista es un marco muestral, de modo que podemos
aplicar métodos de muestreo probabilístico como el muestreo aleatorio simple o el muestreo
sistemático. Obviamente, también podemos recurrir al muestreo no probabilístico.
A veces, la base de datos de propiedad puede conformar un marco muestral o no, dependiendo
de cómo definamos nuestra población objetivo. Por ejemplo, supongamos que tenemos una
lista de clientes y clientes potenciales suscritos al boletín de noticias de una empresa. ¿Es este el
marco muestral? Si definimos nuestra población objetivo como «personas interesadas en recibir
información periódica de mi empresa», entonces sí. Si nuestra población objetivo es «cualquier
cliente real y potencial», entonces no. En el segundo caso, el muestreo por cuotas es siempre una
opción, pero cuando trabajamos con bases de datos internas, a veces es mejor aplicar el muestreo
aleatorio a toda la base de datos y analizar los resultados por segmentos, ya que no hay un coste
creciente por respuesta.
Fundamentos de la recolección de datos online 14
El muestreo por cuotas es el método de muestreo por defecto
para recolectar datos online.
Cuando encargamos un proyecto de recolección de datos online a un panel online, nos
preguntarán cómo queremos utilizar las cuotas. A continuación encontrarás las mejores prácticas
y recomendaciones para fijar cuotas y asegurarte así de realizar una recolección de datos online
efectiva.
1. Fija cuotas para variables que (1) sean imprescindibles para tu proyecto y/o (2)
cuya distribución difiera claramente de tu población objetivo y la población de
Internet.
Las cuotas pretenden subsanar la posible falta de representatividad debido a las divergencias
entre nuestra fuente de datos y la población objetivo. Si hemos utiliza el muestreo por cuotas para
recolectar datos offline, deberíamos plantearnos si nos conviene reutilizar las mismas cuotas con
las mismas variables sociodemográficas. Aunque normalmente fijemos las cuotas por sexo, edad y
región, es probable que para la recolección de datos online no nos sirvan.
Veamos algunos ejemplos sobre cómo enfocar las cuotas para el muestreo online:
• En general, la edad es un factor clave en prácticamente todos los países. Los jóvenes
son más propicios a utilizar Internet que las personas mayores, salvo en los países más
desarrollados, como Noruega o Suecia, que registran una penetración de Internet del 95 %
aproximadamente.
• A pesar de que en la mayoría de países el uso de Internet no difiere demasiado entre
hombres y mujeres, cuando extraemos muestras de paneles de acceso online tenemos que
utilizar cuotas por sexo. Esto se debe a que los paneles tienen que ser lo suficientemente
grandes para satisfacer las necesidades de los compradores investigados y se suele investigar
más a las mujeres que a los hombres porque se asume que las mujeres toman más
decisiones de compra relacionadas con el hogar. Si no fijamos cuotas por sexo, es probable
que recibamos más respuestas de mujeres.
• En países menos desarrollados en América Latina, Asia y África, la clase social es un
factor decisivo. El uso de Internet varía enormemente entre clases sociales. Además, las
clases sociales más bajas tienen un comportamiento totalmente distinto al de las clases
medias y altas. En países desarrollados, esto no suele ser tan importante, así que podemos
ahorrarnos este control de cuotas.
El muestreo por cuotas
online efectivo
Fundamentos de la recolección de datos online 15
El muestreo por cuotas online efectivo
2. Menos es más: utilizar el número mínimo de cuotas.
Las cuotas hacen que el proceso de recolección de datos sea más complejo, afectan al timing del
proyecto e inciden en los costes de la recolección de datos. Se trata de un problema inherente al
muestreo por cuotas, pero que cobra importancia cuando recogemos información online.
Pensemos en las grandes diferencias entre la recolección de datos online y offline. Si hemos
definido una cuota por sexo en una encuesta presencial, una vez hemos alcanzado nuestro
objetivo de varones dejamos de interceptar a hombres en la calle. Y es fácil, ¡porque sabemos
diferenciar entre hombres y mujeres a simple vista!
En cambio, el proceso online es totalmente distinto: enviamos una serie de invitaciones por correo
electrónico a los candidatos y esperamos a que la gente reciba los correos, los abran, accedan
a la encuesta online y completen su participación. Cuando alcanzamos un target de hombres,
no podemos impedir que más candidatos varones accedan a la encuesta porque no podemos
eliminar las invitaciones enviadas por correo electrónico una vez recibidas. Tendremos que
descartar las participaciones que exceden nuestra cuota, ya que carecen de valor para nosotros y,
además, suponen un coste para el panel de acceso online.
Cuanto más complejas sean las cuotas, más costes y tiempo necesitaremos para llevar a cabo la
recolección de datos online. El gráfico siguiente muestra el número aproximado de personas que
tenemos que añadir al tamaño de la muestra debido al exceso de cuota para una muestra con
un tamaño de 1.000 y cuotas uniformes. Según este gráfico, fijar una cuota con un tamaño=2
(dividiendo el tamaño objetivo de 1.000 en dos grupos objetivo de 500 individuos) implica
tener un 2,5 % de encuestados más. Para una cuota con un tamaño=8 (8 grupos objetivo de 125
individuos), la muestra tiene que ser un 13,1 % más grande. Por último, si dividimos el tamaño
objetivo en 100 cuotas, tendremos que doblar el tamaño de la muestra (+96,6 %).
Fundamentos de la recolección de datos online 16
El muestreo por cuotas online efectivo
3. Decide si quieres o no que las cuotas sean convergentes o divergentes.
Hablamos de cuotas divergentes cuando los objetivos de cada cuota se definen de forma
independiente. Por ejemplo, para una muestra con un tamaño de 1.000 encuestados,
necesitaremos 500 (50 %) hombres y 500 (50 %) mujeres, y 500 (50 %) jóvenes y 500 (50 %)
personas mayores. De este modo, asumes el riesgo de que acabes con 500 jóvenes varones y 500
mujeres mayores. Este resultado es perfectamente compatible con tu definición de cuota, ¿pero te
gusta realmente esta distribución?
Para evitar este efecto, utilizaremos cuotas convergentes. Esto significa definir un tamaño objetivo
para cada combinación de variables: 250 (50 % x 50 %) hombres jóvenes, 250 (50 % x 50 %)
mujeres jóvenes, 250 (50 % x 50 %) hombres mayores y 250 (50 % x 50 %) mujeres mayores.
¿Utilizamos cuotas convergentes o divergentes para recolectar datos online? Pues depende de
nuestras prioridades. En teoría, las cuotas divergentes deberían simplificar la recolección de datos.
La definición de una cuota convergente siempre se corresponde a la definición equivalente de
cuota divergente, pero no al revés. Podemos comprobar este hecho fácilmente con el ejemplo
anterior.
En definitiva: las cuotas divergentes son, en principio, más económicas y rápidas, pero no
siempre es así. Siguiendo con el ejemplo anterior, si el panel de acceso online está claramente
distorsionado en favor de los jóvenes y los hombres, es probable que cuando tengamos 500
encuestas, la mayoría de ellas sean de hombres jóvenes. Esto significa que las 500 encuestas
restantes tendrán que proceder de nuestro target de difícil acceso: mujeres mayores. A veces es
mejor tener cuotas convergentes porque nos ofrecen un progreso equilibrado simultáneamente
en todos los targets.
¿Qué podemos hacer para superar este reto? Nuestro consejo es que (1) apuestes por cuotas
divergentes solo si el panel de acceso online presenta una distribución equilibrada entre los
targets (por ejemplo, en lugar de tener una distribución por sexo de 50 %-50 %, tiene un 45 %-55
% pero no 30 %-70 %) y (2) utiliza siempre cuotas convergentes si quieres analizar subtargets en
profundidad (por ejemplo, si quieres analizar las diferencias entre hombres mayores y mujeres
mayores).
Fundamentos de la recolección de datos online 17
La velocidad es una ventaja clara de la recolección de datos
online.
Es mucho más rápido enviar miles de invitaciones por correo electrónico y permitir que los
participantes realicen las encuestas de forma simultánea que llamar a la gente desde un call center
o interceptar al público en la calle para hacer encuestas.
Los campos de trabajo online suelen tardar entre 2 y 5 días, en función del tamaño de la muestra,
la población objetivo y, desde luego, el panel de acceso online que utilicemos. En principio, la
recolección de datos online se puede hacer en menos de dos días. Para ello, tendremos que invitar
a más candidatos para que participen en el mismo período de tiempo. Sin embargo, quizás no sea
buena idea para nuestros datos.
¿Quién tiene más probabilidades de participar en encuestas online si hay un período de tiempo
limitado para ello? La respuesta es usuarios asiduos de Internet, adictos a los smartphones o
empleados de oficina. Con frecuencia, la representatividad de las fuentes de participantes es un
tema que preocupa seriamente a los investigadores. Sin embargo, se infravaloran los efectos de un
proceso de recolección de datos inadecuado.
El gráfico siguiente, elaborado con datos de los 6 paneles Netquest más grandes, nos ayuda a
entender los efectos de limitar el tiempo de participación.
Planificar la recolección
de datos online
Fundamentos de la recolección de datos online 18
Planificar la recolección de datos online
La participación en encuestas online se reduce con el tiempo. El 11 % de las participaciones se
producen en la primera hora y el 22 %, en un plazo de 3 horas. Pero si cerramos nuestro trabajo
de campo a las 3 horas, perderemos el 78 % de las participaciones, por lo que nuestra muestra
resultará más cara. Y lo que es aún peor: no sabremos si los participantes que no han podido
participar son distintos a los que sí han participado, distorsionando así la muestra.
En conclusión, la recolección de datos online es más rápida que la recolección de datos offline,
y puede ser todavía más rápida, pero a expensas del sesgo de la muestra y de incurrir en unos
costes mayores.
Fundamentos de la recolección de datos online 19
Si tienes experiencia en la investigación de mercados
cuantitativa, probablemente ya conozcas los fundamentos del
diseño de cuestionarios.
Los aspectos básicos que hay que tener en mente son los mismos para la recolección de
datos online y offline. El diseño de encuestas es un tema demasiado amplio para verlo aquí
en profundidad, pero a modo de recordatorio, los pasos para hacer un buen trabajo son los
siguientes:
1. Establece el objetivo del cuestionario: ¿Cuál es la finalidad de la investigación?
2. Fija las preguntas que se van a hacer.
3. Elige el tipo de pregunta más adecuado entre las distintas opciones (preguntas abiertas o
cerradas, respuesta única o múltiple, preguntas de clasificación, preguntas de puntuación,
etc.).
4. Especifica los términos más adecuados para cada pregunta según la población objetivo.
5. Crea la secuencia de preguntas y el diseño del cuestionario de forma lógica para el
participante.
Las mejores prácticas para diseñar cuestionarios offline efectivos también son aplicables online:
• Sé conciso, breve y claro. Evita las frases complejas.
• Evita preguntar dos cosas distintas en una misma pregunta.
• Evita las preguntas negativas que puedan confundir a los participantes.
• Pide respuestas precisas.
• Si utilizas preguntas cerradas, asegúrate de dar todas las respuestas posibles (plantéate
incluir la opción «Otros»).
• Evita las preguntas tendenciosas.
Sin embargo, hay una serie de recomendaciones para las encuestas online.
1. Utiliza páginas múltiples en lugar de desplazamientos infinitos.
2. Pregunta una sola cosa cada vez y limita el cuestionario a una pregunta por página. No
permitas que el encuestado navegue por la página y decida en qué orden responde a cada
pregunta.
3. La entrevista debe tener una longitud moderada. La regla de oro son 20 minutos como
máximo y 5 minutos si los encuestados utilizan dispositivos móviles.
Encuestas eficaces para el
trabajo de campo online
Fundamentos de la recolección de datos online 20
Encuestas eficaces para el trabajo de campo online
4. Utiliza encuestas online responsivas que se adapten correctamente a los distintos tamaños
de pantallas (ordenador, tableta, móvil).
5. Emplea un lenguaje específico. Los participantes online leen en diagonal para buscar
palabras y mensajes clave.
6. Incluye imágenes e iconos cuando puedas, ya que mejorarás la experiencia de usuario de
los participantes.
7. Insertar vídeos en una encuesta es una funcionalidad específica de las encuestas online y
que marca la diferencia respecto a las encuestas offline. Aprovéchala (por ejemplo, pruebas
creativas o comerciales), pero ten en cuenta que la participación se verá reducida por varios
factores: la compatibilidad de los vídeos con navegadores no actualizados, ancho de banda
limitado en los teléfonos móviles y, en algunos casos, las personas que no quieren subir el
volumen de los dispositivos (por ejemplo, si están en el transporte público).
8. Cumple los estándares de Internet y olvídate de reinventar la rueda. La gente espera que,
al pulsar un botón de radio, los demás botones de radio cercanos aparezcan como no
seleccionados. Todos los elementos de una página web (casillas de verificación, cuadros de
inserción de texto, botones para enviar, texto subrayado...) deben actuar tal y como la gente
espera.
9. Evita las baterías de preguntas. De hecho, la investigación ha puesto de manifiesto que
las ventajas potenciales de agrupar preguntas en una escala de respuestas compartida
(menor tiempo de respuesta y más correlación entre elementos) no compensa los
inconvenientes (una peor experiencia del participante, una mayor tasa de abandono y
menos diferenciación entre respuestas)(*).
10. Aprovecha las oportunidades que te ofrece la tecnología: simuladores de compra,
cuestionarios online conjuntos, entradas de voz, reconocimiento facial, rastreo ocular, etc.
Actualmente, disponemos de un amplio abanico de opciones nuevas y prometedores para
recolectar datos online.
(*)Melanie Revilla, Carlos Ochoa. Telematics and Informatics, abril 2016. “An experiment comparing
grids and item-by-item formats in web surveys completed through PCs and smartphones”
Fundamentos de la recolección de datos online 21
Si estás pensando en utilizar la recolección de datos online
por primera vez, o incluso si la has empleado varias veces,
debes plantearte la pregunta siguiente: ¿Hasta qué punto se
puede comparar la calidad de los datos online y los datos
offline?
Hay argumentos en contra de la calidad de los datos recogidos online, pero, al mismo tiempo,
hay muchos otros en favor. De hecho, existen múltiples formas de controlar la calidad de los
datos recogidos online que nos permiten superar los principales inconvenientes y aprovechar las
virtudes de esta metodología al mismo tiempo.
Datos de calidad
Ventajas Inconvenientes
• Ausencia de sesgos del entrevistador: las
respuestas no se ven distorsionadas por las
diferencias del estilo social y la personalidad
de los entrevistadores o la forma de presentar
determinadas preguntas.
• Mayor fiabilidad ante preguntas sensibles
(preferencias políticas, estado de salud,
religión...) debido al anonimato del encuestado
(**)
• Ausencia de errores de transcripción. Los
participantes envían sus preguntas de forma
digital y directa en el cuestionario.
• Fácil recolección de metadatos para evaluar
la calidad, permitiéndonos así aplicar medidas
de corrección. Casi todos los softwares de
encuestas profesionales recogen datos como el
tiempo de participación, el tiempo por pregunta
o el número de interrupciones del cuestionario.
• Es difícil controlar estrictamente quién participa
(por ejemplo, en encuestas prfundamentos
observamos visualmente la edad aproximada y el
sexo de los participantes, pero en Internet no es
posible).
• Mayor riesgo de querer satisfacer debido
a la ausencia del entrevistador y el uso de
recompensas. La voluntad de satisfacer es una
estrategia a la que recurren los encuestados para
responder a preguntas con el mínimo esfuerzo.
(***)
• La comparabilidad se puede ver afectada por la
gran diversidad de dispositivos que utilizan los
participantes: navegadores distintos, versiones
de los navegadores, dispositivos, tamaño de las
pantallas...
• Cuando se recompensa la participación, el
comportamiento del participante se puede ver
afectado. Por ejemplo, un panel que ofrece solo un
tipo de recompensa a cambio de la participación
puede sobrerepresentar una población objetivo
en concreto, o si el panel solo recompensa a los
participantes que forman parte de la población
objetivo (esto es, los que pasan las preguntas de
filtro), la gente se puede ver tentada a mentir.
VENTAJAS E INCONVENIENTES DE LA RECOLECCIÓN DE DATOS EN TÉRMINOS DE CALIDAD
(**) http://web.comhem.se/u22779327/16/k16docs081211.pdf
(***) http://www.businessdictionary.com/definition/satisficing.html
Fundamentos de la recolección de datos online 22
Datos de calidad
Si nos fijamos en el resumen anterior, es obvio que la recolección de datos online tiene ventajas
e inconvenientes. En este sentido, es parecida a cualquier otra metodología. Sin embargo, la
recolección de datos online tiene una ventaja esencial respecto a otras opciones: la mayoría de
inconvenientes se pueden minimizar (o incluso eliminar) seleccionando una fuente de datos fiable
y aplicando los controles de calidad adecuados en el cuestionario online.
7 estrategias comunes para mejorar la calidad son:
1. Compara los datos de la encuesta con los datos del panel para detectar identidades
fraudulentas. Por ejemplo, cuando se pregunta la edad y el sexo, es fácil validar la respuesta
del panelista si esta persona se ha unido al panel.
2. Pon a prueba la atención que los panelistas prestan a la encuesta comparando las
respuestas dentro de la encuesta para evaluarlas. Puedes hacer la misma pregunta dos
veces (de forma ligeramente distinta) y en un momento distinto en el mismo cuestionario.
3. Aplica una Comprobación de manipulación de las instrucciones (IMC, por sus siglas en
inglés) si la duración de la encuesta es larga (>15 minutos). Las IMCs son preguntas cuyo
objetivo es verificar que el participante haya prestado atención al cuestionario, del tipo «Si
estás leyendo esta pregunta, selecciona la tercera opción».
4. Recompensa a las personas por participar y no a cambio de corresponderse con los
requisitos de la población objetivo que quieres encuestar. Si solo pagamos a los que
responden «sí» a la pregunta de filtro (por ejemplo, «¿Utilizas este producto?» «¿Conoces
esta marca?») estaremos incitando a la gente a mentir en la próxima encuesta que les
enviemos.
5. Fija un tiempo mínimo necesario para realizar la encuesta y descarta a los participantes que
acaben antes. Se trata de una forma fácil de detectar a participantes que responden sin
prestar atención.
6. Comprueba las respuestas a preguntas abiertas para identificar respuestas inválidas (como
«---», «aaaaa») y elimina la participación integral de estos participantes, no solo la respuesta.
Si alguien responde así a una pregunta abierta, es probable que esta persona haya
respondido inadecuadamente a toda la encuesta.
7. Recoge tantos metadatos (datos relacionados con cómo y cuándo se recoge la información)
como puedas; te ayudará a identificar problemas. En las encuestas online es muy sencillo.
Por ejemplo, algunos encuestados pueden haber tenido problemas para ver una pregunta
en un navegador concreto. Si recopilamos estos metadatos tendrás más probabilidades de
entender el problema.
Si te estás planteando utilizar un panel de acceso online, merece la pena entender la información
siguiente para asegurarte de que eliges al adecuado para tu proyecto:
1. ¿Cómo se captan los nuevos miembros del panel? ¿Es un panel abierto o cerrado? ¿Dónde
se capta? ¿Recompensan el registro de los panelistas para eliminar la autoselección?
Fundamentos de la recolección de datos online 23
Datos de calidad
2. ¿Cómo recompensa el panel la participación? ¿Recompensan todas las participaciones o
solo las que acaban en una encuesta válida? Los paneles que solo pagan las encuestas
válidas tienen más probabilidades de recibir respuestas fraudulentas cuando se investigan
poblaciones objetivo de difícil acceso.
3. ¿Cuántas encuestas realizan los panelistas al mes? Algunos paneles envían entre una y dos
encuestas al día a los panelistas y los profesionalizan.
4. ¿Cuál es el tamaño real basándonos en el número máximo de resultados del panel? Este
número es fundamental porque nos da mucha información del panel. Salvo que el panel
se encuentre en fase de creación, cuando una empresa de paneles genera un volumen
importante de actividad con un panel pequeño probablemente estaremos ante una
empresa de river sampling y no un panel de verdad. Para asegurarte, pregunta cuál es el
número máximo de resultados, esto es, el tamaño máximo de la muestra que nos puede
ofrecer el panel en una encuesta de una toma. Esta respuesta nos aporta una información
más valiosa que preguntar por el tamaño del panel porque muchas empresas cuentan
como panelistas a personas que se han registrado hace mucho tiempo pero que no
participan activamente.
5. ¿El panel cuenta con una certificación con una norma de calidad como ISO26362? Las
normas ISO nos dan la seguridad de que el panel ha sido auditado y que quiere compartir
la información anterior con transparencia.
Fundamentos de la recolección de datos online 24
La privacidad se está convirtiendo en una de las principales
preocupaciones de los usuarios de Internet.
La investigación de mercados online se ve directamente afectada por este fenómeno porque, al
fin y al cabo, los investigadores recopilan información de las personas, y los participantes pueden
considerar algunos de los datos recopilados como altamente sensibles.
Como investigadores, esta es una cuestión importante. Los investigadores están obligados a
trabajar conforme al código de conducta del sector (las pautas ESOMAR) y deben cumplir todas
las obligaciones legales aplicables en el lugar donde recopilamos la información.
Deberíamos seguir la recomendación anterior por dos razones, fundamentalmente:
• Es nuestro deber como profesionales de la investigación de mercados. Tenemos que tender
una relación de confianza con la población si queremos preservar nuestra profesión.
• Nuestros datos se pueden ver seriamente perjudicados si no damos seguridad a los
participantes, ya que solo participarán aquellos que no se preocupen por las cuestiones de
privacidad o, aún peor, nos darán información falsa.
Si vas a recolectar datos online, no olvides las recomendaciones siguientes:
1. Ofrece acceso a la política de privacidad, un documento en el que informamos de nuestra
política a la hora de recolectar y difundir información de los participantes. Si utilizas un
panel de acceso online, esto es responsabilidad del panel.
2. Comunícate de forma transparente con los panelistas durante toda su actividad: si recopilas
información especialmente sensible, con la política de privacidad no es suficiente. Incluye
mensajes claros en lugares clave de la encuesta.
3. Los casos siguientes son casos especiales que requieren un tratamiento distinto: incluir/
recolectar cookies de terceros, recolectar información de navegación, pedir datos de
geolocalización, pedir las direcciones de correo postal o electrónico y números de teléfono.
4. Cumple las obligaciones legales del país en el que recopilas la información, no solo en tu
país de origen. Las obligaciones legales pueden variar enormemente entre países.
5. Ten en cuenta las diferencias entre países a nivel de privacidad. Por ejemplo, en Estados
Unidos y Europa es habitual preguntar por los ingresos del hogar, la entidad bancaria
y el número de hijos, pero en América Latina, estas preguntas se pueden considerar
inadecuadas por el riesgo de secuestro.
Por último, para ayudarte a evaluar hasta qué punto la gente está dispuesta a participar en
proyectos de recolección de datos no convencionales (algunos de ellos estrechamente vinculados
a la privacidad), los resultados de una encuesta experimental realizada en el panel de Netquest dio
los resultados siguientes:
Privacidad
Fundamentos de la recolección de datos online 25
Privacidad
Probar un producto en casa
Enviar fotos haciendo actividades concretas
Escanear códigos de barras de productos
Enviar la posición GPS
Grabar el rostro para medir las emociones viendo un vídeo
Instalar un medidor para hacer un seguimiento de la
información de navegación en el smartphone
Instalar un medidor para hacer un seguimiento de la
información de navegación en el ordenador
ACTIVIDAD DISTINTA A ENCUESTAS VOLUNTAD DE PARTICIPAR
72,4 %
54,9 %
51,8 %
20,0 %
17,4 %
17,0 %
15,8 %
Fundamentos de la recolección de datos online 26
El reporting no forma parte del proceso de recolección de
datos, así como tampoco la visualización (comunicación visual
de los datos). Ambas actividades conforman el punto de
partida del análisis de los resultados.
Sin embargo, la investigación online ha cambiado ligeramente el panorama: los datos se recogen
en tiempo real y los clientes quieren ver los resultados también en tiempo real. Esto implica que
las empresas de investigación de mercados ofrezcan dashboards online, herramientas de reporting
«hazlo tú mismo» e infográficos predefinidos que se llenan de datos tan pronto como se reciben.
Por descontado, estas soluciones extremadamente rápidas restringen el toque humano; el gran
valor que aporta un analista experto que profundiza en los datos para encontrar resultados
sorprendentes no es compatible con los resultados en tiempo real. Pero la velocidad es el mantra
de las empresas modernas y, como investigadores, no deberíamos ir a contracorriente.
Esto no significa que los análisis de resultados individualizados y exhaustivos carezcan de valor,
sino que debemos saber elegir entre ambos planteamientos en función del cliente y el problema
que se investiga, o combinarlos cuando fuere necesario. Por ejemplo, los clientes online (esto es,
de las páginas web de comercio online) están muy acostumbrados a trabajar con datos, de modo
que se sienten cómodos con un dashboard online, mientras que es probable que los clientes más
tradicionales no quieran prescindir de las recomendaciones personalizadas.
La mayoría de soluciones de software que se utilizan para recolectar datos online incluyen alguna
función de reporting online. Más allá de estos informes básicos, hay soluciones especializadas que
permiten implementar el reporting y la visualización avanzados. A modo de ejemplo, se enumeran
algunas de ellas a continuación:
• Dapresy (www.dapresy.com) ofrece herramientas de visualización de datos y herramientas
de inteligencia empresarial que permiten a los investigadores procesar, analizar y crear
dashboards basados en infográficos.
• Tableau (www.tableau.com) ayuda a los investigadores a ver y entender los datos. Permite
conectar con casi todas las bases de datos, ofrece la función de arrastrar y soltar para crear
visualizaciones y compartir con un solo clic.
• Qlik (www.qlik.com) ofrece plataformas intuitivas para la visualización de datos a medida,
aplicaciones de análisis guiados, análisis integrados y reporting.
Reporting y visualización
Fundamentos de la recolección de datos online 27
Reporting y visualización
• Microsoft BI (powerbi.microsoft.com) es un conjunto de herramientas de análisis
empresarial para analizar datos y compartir información. MBI permite hacer un seguimiento
de nuestra actividad y recibir respuestas rápidamente con unos dashboards muy completos
disponibles en todos los dispositivos.
• IBM Cognos (www-03.ibm.com/software/products/en/cognos-analytics) es una plataforma
BI para empresas para la detección de datos ordenada y el reporting gestionado que
automatiza la creación de informes y dashboards de modo que los usuarios puedan
hacerlo por sí mismos.
• Microstrategy (www.microstrategy.com) ofrece funciones de reporting para empresas y
detección de datos para la productividad móvil y la telemetría en tiempo real, y pone a
disposición de las empresas un amplio abanico de posibilidades para transformar sus datos
en inteligencia del mundo real.
Contacto
EE.UU. & Canadá
americas@netquest.com
Portugal
portugal@netquest.com
España
iberia@netquest.com
Europa & Asia
rfqinternational@netquest.com
Colombia
colombia@netquest.com
Brasil
atendimento@netquest.com
Cono Sur
cs.sales@netquest.com
México
latamnorte@netquest.com
netquest.com

Más contenido relacionado

Similar a ebook_online_data_collection_ES.pdf

Investigación de mercados y empresa comercial
Investigación de mercados y empresa comercialInvestigación de mercados y empresa comercial
Investigación de mercados y empresa comercialRoberto Gil-Saura
 
Tecnologia y Recoleccion de Datos Primarios
Tecnologia y Recoleccion de Datos PrimariosTecnologia y Recoleccion de Datos Primarios
Tecnologia y Recoleccion de Datos PrimariosCristian Castro Sanchez
 
Investigación digital en mexico retos y oportunidades
Investigación digital en mexico retos y oportunidadesInvestigación digital en mexico retos y oportunidades
Investigación digital en mexico retos y oportunidadesJavier Cervantes
 
Proyecto informatica y conver pfd
Proyecto informatica y conver pfdProyecto informatica y conver pfd
Proyecto informatica y conver pfdAnthonyJimenez53
 
Estrategia para la Apertura de Datos
Estrategia para la Apertura de DatosEstrategia para la Apertura de Datos
Estrategia para la Apertura de DatosSocialTIC
 
UXSpain Taller Encuestas Online
UXSpain Taller Encuestas OnlineUXSpain Taller Encuestas Online
UXSpain Taller Encuestas OnlineXavier Colomes
 
27. sistema de informacion de marketing sim
27. sistema de informacion de marketing sim27. sistema de informacion de marketing sim
27. sistema de informacion de marketing simAlexAlanGuajllireCal
 
#9 INVESTIGACION: RECOPILACION DE DATOS.
#9 INVESTIGACION: RECOPILACION DE DATOS.#9 INVESTIGACION: RECOPILACION DE DATOS.
#9 INVESTIGACION: RECOPILACION DE DATOS.Evelyn Vega Siancas
 
Analítica web & CRO webinar.pptx.pdf
Analítica web & CRO webinar.pptx.pdfAnalítica web & CRO webinar.pptx.pdf
Analítica web & CRO webinar.pptx.pdfVWO
 
S8 enrique arellano_informe
S8 enrique arellano_informeS8 enrique arellano_informe
S8 enrique arellano_informeAres01
 
Sistema de apoyo para la toma de decisiones
Sistema de apoyo para la toma de decisionesSistema de apoyo para la toma de decisiones
Sistema de apoyo para la toma de decisionestomywald
 
Informe Las dos caras de la publicidad en Internet
Informe Las dos caras de la publicidad en InternetInforme Las dos caras de la publicidad en Internet
Informe Las dos caras de la publicidad en InternetRafa Diaz
 
Deber 5 "Encuestas en Internet"
Deber 5 "Encuestas en Internet"Deber 5 "Encuestas en Internet"
Deber 5 "Encuestas en Internet"GabrielaCaicedo
 
Civic 2.0 Curso de capacitación Módulo 2. Conceptos básicos de investigación ...
Civic 2.0 Curso de capacitación Módulo 2. Conceptos básicos de investigación ...Civic 2.0 Curso de capacitación Módulo 2. Conceptos básicos de investigación ...
Civic 2.0 Curso de capacitación Módulo 2. Conceptos básicos de investigación ...Smart Chicago Collaborative
 

Similar a ebook_online_data_collection_ES.pdf (20)

Investigación de mercados y empresa comercial
Investigación de mercados y empresa comercialInvestigación de mercados y empresa comercial
Investigación de mercados y empresa comercial
 
Tecnologia y Recoleccion de Datos Primarios
Tecnologia y Recoleccion de Datos PrimariosTecnologia y Recoleccion de Datos Primarios
Tecnologia y Recoleccion de Datos Primarios
 
Investigación digital en mexico retos y oportunidades
Investigación digital en mexico retos y oportunidadesInvestigación digital en mexico retos y oportunidades
Investigación digital en mexico retos y oportunidades
 
Cuestionario 9
Cuestionario 9Cuestionario 9
Cuestionario 9
 
Proyecto informatica y conver pfd
Proyecto informatica y conver pfdProyecto informatica y conver pfd
Proyecto informatica y conver pfd
 
Estrategia para la Apertura de Datos
Estrategia para la Apertura de DatosEstrategia para la Apertura de Datos
Estrategia para la Apertura de Datos
 
9. recopilacion de datos
9. recopilacion de datos9. recopilacion de datos
9. recopilacion de datos
 
UXSpain Taller Encuestas Online
UXSpain Taller Encuestas OnlineUXSpain Taller Encuestas Online
UXSpain Taller Encuestas Online
 
27. sistema de informacion de marketing sim
27. sistema de informacion de marketing sim27. sistema de informacion de marketing sim
27. sistema de informacion de marketing sim
 
Analítica web: Métricas clave para entender a nuestros usuarios
Analítica web: Métricas clave para entender a nuestros usuariosAnalítica web: Métricas clave para entender a nuestros usuarios
Analítica web: Métricas clave para entender a nuestros usuarios
 
#9 INVESTIGACION: RECOPILACION DE DATOS.
#9 INVESTIGACION: RECOPILACION DE DATOS.#9 INVESTIGACION: RECOPILACION DE DATOS.
#9 INVESTIGACION: RECOPILACION DE DATOS.
 
Analítica web & CRO webinar.pptx.pdf
Analítica web & CRO webinar.pptx.pdfAnalítica web & CRO webinar.pptx.pdf
Analítica web & CRO webinar.pptx.pdf
 
S8 enrique arellano_informe
S8 enrique arellano_informeS8 enrique arellano_informe
S8 enrique arellano_informe
 
Sistema de apoyo para la toma de decisiones
Sistema de apoyo para la toma de decisionesSistema de apoyo para la toma de decisiones
Sistema de apoyo para la toma de decisiones
 
Informe Las dos caras de la publicidad en Internet
Informe Las dos caras de la publicidad en InternetInforme Las dos caras de la publicidad en Internet
Informe Las dos caras de la publicidad en Internet
 
Deber 5 "Encuestas en Internet"
Deber 5 "Encuestas en Internet"Deber 5 "Encuestas en Internet"
Deber 5 "Encuestas en Internet"
 
Informe final
Informe finalInforme final
Informe final
 
Informe final
Informe finalInforme final
Informe final
 
Informe final
Informe finalInforme final
Informe final
 
Civic 2.0 Curso de capacitación Módulo 2. Conceptos básicos de investigación ...
Civic 2.0 Curso de capacitación Módulo 2. Conceptos básicos de investigación ...Civic 2.0 Curso de capacitación Módulo 2. Conceptos básicos de investigación ...
Civic 2.0 Curso de capacitación Módulo 2. Conceptos básicos de investigación ...
 

ebook_online_data_collection_ES.pdf

  • 1. Aprende las bases de la recolección de datos online Fundamentos de la recolección de datos online © netquest 2017
  • 2. Introducción. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 Internet ha cambiado la investigación de mercados. . . . . 4 Fuentes para obtener muestras online. . . . . . . . . . . . . . . . . 6 Métodos de muestreo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 El muestreo por cuotas online efectivo . . . . . . . . . . . . . . . . 14 Planificar la recolección de datos online . . . . . . . . . . . . . . . 17 Encuestas eficaces para el trabajo de campo online . . . . . 19 Datos de calidad. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 Privacidad. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 Reporting y visualización. . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 Tabla de contenidos
  • 3. Fundamentos de la recolección de datos online 3 La recolección de datos es la actividad que empieza una vez se han definido el objetivo y el diseño de la investigación, y acaba cuando se dispone de los datos recogidos para proceder a su análisis. En este contexto, «efectivo» significa encontrar el equilibrio entre costes, tiempo y calidad. Este Ebook te puede interesar si te identificas con alguno de los siguientes perfiles: 1. Eres un profesional con experiencia en la investigación de mercados y llevas años trabajando con metodologías convencionales para la recolección de datos, como las entrevistas personales y las entrevistas por teléfono. Te ves obligado a investigar y aplicar nuevas tecnologías para satisfacer las peticiones de tus clientes o ser más eficiente. Aunque tengas experiencia en la recolección de datos online, este libro te ayudará a entender las diferencias principales entre los distintos métodos y te permitirá decidir mejor a la hora de elegir qué métodos aplicas y cuándo. 2. Eres joven y te dedicas profesionalmente a la investigación de mercados. La investigación de mercados online ha sido tu elección natural desde que empezaste tu andadura profesional, pero crees que hay una gran diferencia entre lo que te enseñaron en clase y la vida real. Te preguntas cómo poner en práctica los conocimientos aprendidos sobre muestreo probabilístico, los marcos muestrales y las cuotas en proyectos reales. O quizás te apetece conocer las novedades que se han producido desde que acabaste tus estudios. 3. Actualmente, estudias técnicas de investigación de mercados. Crees que el marco teórico que estás aprendiendo dista enormemente de la recolección de datos real. Quieres entender cómo emplear mejor los conceptos clásicos que aprendes en un mundo cada vez más dominado por la tecnología, la flexibilidad y la velocidad. 4. No te dedicas profesionalmente a la investigación de mercados, pero en tu trabajo tienes que recolectar datos online y quieres saber cómo hacerlo de forma rápida y eficaz. Con este libro quiero tender un puente importante entre la teoría y la práctica de forma sencilla, breve y directa. Este libro es tan solo una guía; en él no se tratan todos los temas con gran profundidad, pero te ayudará a descubrir aquellas incógnitas que todavía no conoces. Encontrarás más información en nuestro blog en www.netquest.com. Por último, permíteme una observación final acerca del objetivo de este libro: las recomendaciones del libro son aplicables a prácticamente todas las metodologías de recolección de datos online cualitativas y cuantitativas, pero nos centraremos en las encuestas por tratarse de la metodología de investigación de mercados más habitual. Introducción Este Ebook pretende ser una guía para implementar una recolección de datos online eficaz para la investigación de mercados.
  • 4. Fundamentos de la recolección de datos online 4 Las nuevas tecnologías han creado un nuevo comportamiento del consumidor y la necesidad de estudiar este nuevo comportamiento en su contexto. Paralelamente, las nuevas tecnologías han dado lugar a nuevas formas de recolectar información sobre el comportamiento de los consumidores. Desde el auge de Internet a mediados de los 90, la investigación de mercados se ha volcado en la recolección de datos online. Cada día son más las investigaciones que se realizan a través de dispositivos con conexión a Internet. Además, los nuevos dispositivos nos permiten recolectar nuevos tipos de datos. ¿Qué razones nos empujan a recolectar datos a través de Internet? ¿Qué ventajas nos aportan? ¿Hay límites? Internet ha cambiado la investigación de mercados
  • 5. Fundamentos de la recolección de datos online 5 Internet ha cambiado la investigación de mercados La siguiente tabla recoge las ventajas y los inconvenientes de la recolección de datos online en comparación con los métodos tradicionales. Ventajas Inconvenientes Costes Menos costes debido a la ausencia del entrevistador. Parte de los costes ahorrados en el entrevistador deben destinarse a recompensar a los participantes. Velocidad Más rápida que los métodos offline. Recolección de datos automatizada y un grupo más grande de encuestados potenciales. L os proyectos más complejos seguirán requiriendo más tiempo de lo que cabría esperar si, por ejemplo, el tamaño de la muestra es muy grande, si es difícil acceder a la población objetivo o si aplicamos un muestreo por cuotas complejo (véase más adelante). Representatividad En función del país, mejor acceso a determinados grupos sociodemográficos, como la gente joven o las personas con estudios superiores. En muchos países, la población online no representa la totalidad de algunos grupos sociodemográficos, como la gente mayor o las clases más bajas. Estímulos En la recolección de datos online se pueden utilizar todos los estímulos imaginables: imágenes, vídeos, audios, mapas interactivos, simuladores de compra y cuestionarios conjuntos. Este aspecto no presenta inconvenientes. La modalidad online es claramente mejor a nivel de variedad de herramientas que se pueden utilizar para recolectar la información. Calidad Debido a la ausencia del entrevistador, menos riesgo de respuestas fraudulentas o sesgos inducidos. La calidad depende de los entrevistados. Algunos riesgos son la duplicación de participantes, participantes fraudulentos o la falta de atención. Procesamiento de datos Se recoge, procesa y, dado el caso, visualiza en tiempo real y simultáneamente la información procedente de varios encuestados. Es fácil y rápido. Algunos métodos de recolección de datos offline requieren consolidar y procesar los datos antes de pasar al reporting y la visualización. En estos casos, no es posible aprovechar al máximo la velocidad que caracteriza la recolección de datos online. VENTAJAS E INCONVENIENTES DE LA RECOLECCIÓN DE DATOS ONLINE
  • 6. Fundamentos de la recolección de datos online 6 Todos los procesos de recolección de datos empiezan por el muestreo, que es el método empleado para elegir un subgrupo de individuos de un universo estadístico con el fin de estimar las características de todo el universo. Existen varios métodos de muestreo: algunos son más prácticos que otros, en función de los objetivos que persigamos con nuestra investigación y el universo objetivo. Pero, antes de aplicar cualquiera de estos métodos, pregúntate: ¿Dónde puedo encontrar participantes online para una encuesta online? Gran parte de los métodos de muestreo que te han enseñado no son aplicables a la mayoría de proyectos de investigación, independientemente de si recoges datos online u offline: ¿Cuántas veces en la vida podrás utilizar un muestreo probabilístico puro? Esto es especialmente importante cuando utilizamos Internet. Mi primer consejo: olvídate de cómo te gustaría alcanzar tu muestra, piensa en cómo puedes alcanzarla y alinea tu enfoque con la realidad. El muestreo online presenta ciertos retos: la población en Internet no está censada y no puedes interceptar a personas al azar para pedirles que participen, como a pie de calle. Intenta entender cómo funciona Internet y encuentra la solución que mejor se adapte a tu proyecto de recolección de datos online; no lo hagas al revés. Este libro te ayudará a conseguirlo. Actualmente, los investigadores profesionales emplean cuatro fuentes distintas para conseguir participantes. 1. Paneles de acceso online Los paneles de acceso online son comunidades online formadas por personas predispuestas a participar en proyectos de investigación de mercados (encuestas, en su mayoría) a cambio de una recompensa, como dinero, obsequios, donaciones o sorteos. Los paneles de acceso online reclutan a sus miembros por distintas vías. Algunos son paneles abiertos en los que los participantes se registran simplemente entrando en su página web. Se capta la atención de los visitantes a través de campañas de publicidad públicas y se convierten en nuevos miembros. Otros paneles son cerrados y solo se puede acceder a ellos con una invitación personal enviada a los miembros registrados en páginas web asociadas. Pueden parecerse a los paneles abiertos, pero Fuentes para obtener muestras online
  • 7. Fundamentos de la recolección de datos online 7 Fuentes para obtener muestras online no lo son, ya que no es posible acceder a un panel cerrado sin invitación. Actualmente, los paneles de acceso online conforman la fuente principal de participantes en la investigación de mercado profesional. 2. River sampling El river sampling (muestreo en río) es un método inspirado en el funcionamiento de las encuestas cara a cara, esto es, interceptando a personas en la calle. El river sampling intenta interceptar a las personas online cuando navegan por Internet. ¿Cómo? Con anuncios en páginas web con mucho tráfico como Google o Facebook. Sin embargo, en lugar de pedir a la gente que acceda a un panel para participar en futuras encuestas, como sucede en un panel online, se les pide que participen directamente en una sola encuesta online. A cambio, reciben una recompensa para premiar su participación. 3. Paneles online probabilísticos Es difícil crear un panel que sea totalmente representativo de la población reclutando a personas online. En realidad, es imposible, principalmente por 2 razones: (1) en muchos países, una parte de la población no utiliza Internet y (2) no hay un directorio que recoja todos los usuarios de Internet a partir del cual se puedan elegir personas al azar. Tal y como veremos más adelante, estos límites nos impiden utilizar el muestreo aleatorio. Los paneles probabilísticos intentan superar estas dificultades reclutando a personas offline y ofreciendo un dispositivo con conexión a Internet a aquellas que no utilizan Internet. De este modo, es posible utilizar el método de muestreo probabilístico clásico para crear el panel online. Una vez tenemos el panel, las muestras aleatorias que se extraen deberían ser muestras aleatorias de todo el universo. Así, nos aseguramos de tener un panel representativo. Por norma general, los paneles online probabilísticos son más pequeños y resultan más caros que los paneles de acceso online y se suelen utilizar, fundamentalmente, para la investigación académica. 4. Bases de datos de propiedad Si disponemos de una base de datos con correos electrónicos o cualquier otra forma de contactar a la gente por Internet cuando nos convenga, tenemos una buena oportunidad para la recolección de datos online. En función del objetivo de la investigación, es probable que no sea necesario representar a toda la población, sino únicamente a nuestro grupo objetivo, por ejemplo, nuestros clientes o visitantes. La representatividad no siempre es un problema. La tabla a continuación muestra las ventajas y los inconvenientes principales de las distintas fuentes de datos.
  • 8. Fundamentos de la recolección de datos online 8 Fuentes para obtener muestras online Ventajas Inconvenientes Online Access Panel • Flexibilidad: apto para todo tipo de proyectos de recolección de datos. • Estabilidad: permite predecir y planificar con precisión el número de participantes. • Apto para estudios de seguimiento en los que se debe llegar a la misma población objetivo periódicamente. • Coste moderado, incluso para los targets difíciles de acceder (siempre y cuando el panel se haya perfilado correctamente). • Permite implementar medidas de calidad comparando la participación de los individuos a lo largo del tiempo. • Los paneles no siempre están disponibles en las zonas menos pobladas. • Representatividad limitada. El muestreo por cuotas debe aplicarse correctamente para superar esta dificultad River sampling • Bajo coste. • Apto para países con poca población cuando no disponemos de un panel de acceso online. • Buena fuente de públicos online frecuentes, como los adolescentes. • Problemas de calidad: no es fácil monitorizar a los participantes para evitar identidades fraudulentas o malas conductas durante la participación. • No apto para estudios de seguimiento: los resultados de la muestra son inestables en el tiempo. • Riesgo de obtener resultados sesgados cuando se invita a todos los participantes desde la misma página web. VENTAJAS E INCONVENIENTES DE LAS FUENTES ONLINE DE PARTICIPANTES
  • 9. Fundamentos de la recolección de datos online 9 Fuentes para obtener muestras online Paneles online probabilísticos • Buena representatividad. El muestreo por cuotas no es tan crítico como en los paneles de acceso online. • Alta estabilidad, se pueden predecir los resultados de las muestras. • Tamaño limitado. • Costes elevados. • No disponible en la mayoría de países. Bases de datos de propiedad • El menor coste posible porque ya poseemos la fuente de participantes. • Dependiendo de cómo definamos la población objetivo y perfilemos a los participantes en nuestra base de datos se puede implementar el muestreo probabilístico. • Los resultados se pueden complementar con la información ya disponible (es decir, los resultados de las encuestas a clientes se pueden comparar con los ingresos o la segmentación de clientes) • No siempre disponemos de bases de datos de propiedad para solucionar nuestros problemas. • Apto para recolectar información de nuestros clientes, pero no de los clientes de nuestros competidores.
  • 10. Fundamentos de la recolección de datos online 10 Una vez tenemos una visión clara de las fuentes principales de participantes para nuestra encuesta, la decisión acerca del método de muestreo es bastante clara: el método de muestreo que aplicaremos depende enormemente del número de participantes disponibles. Los métodos de muestreo existentes se pueden dividir en 2 categorías: los métodos de muestreo probabilístico y no probabilístico. Métodos de muestreo probabilístico Una muestra probabilística es una muestra en la que cada unidad del universo tiene una probabilidad (superior a cero) de ser elegido en la muestra y dicha probabilidad se puede determinar con precisión. Estas características permiten producir estimaciones no sesgadas de los totales de población. El muestreo probabilístico requiere siempre un marco muestral, es decir, una lista de todos los individuos de un universo que se pueden incluir en la muestra. El muestreo aleatorio simple (M.A.S.) es la técnica de muestreo probabilística más habitual, ya que se considera un estándar de oro: todos los métodos se pueden comparar con él. En el M.A.S., los individuos del universo tienen las mismas probabilidades de ser seleccionados. Esta condición minimiza los sesgos y simplifica el análisis. Otros métodos de muestreo probabilístico son: Muestreo estratificado: si el universo presenta distintas categorías o estratos distintos, cada estrato se puede investigar como subgrupo independiente. Este método (1) permite sacar conclusiones sobre cada subgrupo y (2) nos ofrece unas estimaciones estadísticas más eficientes que son, al menos, tan buenas como con el muestreo aleatorio simple y, con frecuencia, incluso mejores. El muestreo estratificado funciona mejor si la varianza entre estratos es baja dentro de cada estrato pero elevada entre estratos distintos, de modo que el tamaño de la muestra se pueda adaptar a cada estrato. Muestro por conglomerados: cuando la población se puede dividir en grupos o conglomerados y cada conglomerado es parecido a los demás, podemos realizar el muestreo a partir de uno de los conglomerados para representar a toda la población. Este planteamiento es práctico si un menor número de conglomerados reduce los costes de la recolección de datos (por ejemplo, si cada manzana en una ciudad conforma un conglomerado, podemos reducir costes enviando entrevistadores a tan solo unas cuantas manzanas). También simplifica el marco muestral: en el ejemplo anterior, necesitaremos un mapa de las manzanas en la ciudad en lugar de una lista de Métodos de muestreo
  • 11. Fundamentos de la recolección de datos online 11 Métodos de muestreo los individuos en la ciudad. El muestreo por conglomerados puede aumentar la varianza entre las estimaciones muestrales, en especial, si los conglomerados no son homogéneos. Muestreo sistemático: este método selecciona los individuos en períodos regulares a partir de una lista ordenada de la población. Por ejemplo, elegimos a 1 visitante entre 50 en una tienda para entrevistarle. Este método puede igualar o incluso mejorar los resultados obtenidos con el muestreo aleatorio simple, pero si hay una correlación entre la lista ordenada de candidatos, las estimaciones resultantes pueden ser sesgadas. Métodos de muestreo no probabilístico En pocas palabras, el muestreo no probabilístico es cualquier método de muestreo que no cumpla los requisitos del muestreo probabilístico, ya sea porque, a veces, no se puede llegar a algunos individuos de la población objetivo, ya sea porque desconocemos la probabilidad de inclusión. Aunque muchos lo hacen, no se debe hacer una estimación de errores con los métodos de muestreo no probabilístico. Las encuestas telefónicas por marcado aleatorio y las entrevistas personales en zonas urbanas con una amplia concentración de pisada son algunos ejemplos de métodos de muestreo no probabilísticos. Lo cierto es que en la investigación de mercados, el 99 % de la recolección de datos utiliza muestreos no probabilísticos. Por lo tanto, si has valorado una estimación de errores junto con el resultado de la encuesta (el llamado margen de error y nivel de confianza), has hecho un mal uso disfrazado del método de muestreo. Por suerte, esto no significa que el muestreo no probabilístico no sirva para nada. No es perfecto, no contempla la estimación de errores de medición y puede ser un método ligeramente o incluso bastante sesgado, pero la información siempre es valiosa en tanto que sepamos cómo se ha recogido y que, a pesar de sus limitaciones, nos sirve para alcanzar nuestros objetivos. El muestreo por cuotas es el método de muestreo no probabilístico más habitual. En el muestreo por cuotas, la población se divide en grupos mutuamente excluyentes conforme a variables de segmentación como la edad, el sexo o la región. Definimos la distribución de la muestra objetivo por segmentos de modo que se corresponda con la población objetivo. Así, por ejemplo, si la población objetivo es un 50 % de hombres y un 50 % de mujeres, una muestra de 1.000 individuos debe ser equivalente a este reparto: 500 hombres y 500 mujeres. Una vez definido el tamaño de cada segmento o cuota, elegimos una muestra no aleatoria y entrevistamos a los individuos hasta alcanzar el objetivo de cada cuota. Esto significa que una vez he alcanzado los 500 varones, si el siguiente individuo en la muestra es un hombre, tenemos que descartarlo. Los individuos descartados se denominan «quota fulls». En este sentido, el muestreo por cuotas se parece al muestreo estratificado, pero en lugar de incluir a los individuos aleatoriamente en cada segmento, de la muestra no aleatoria cabe esperar que sea lo más representativa posible llenando las cuotas objetivo por segmento.
  • 12. Fundamentos de la recolección de datos online 12 Métodos de muestreo Otros métodos de muestreo no probabilístico son: Muestreo por bola de nieve: este método empieza identificando un pequeño grupo de encuestados iniciales dentro de la población objetivo. Los encuestados iniciales se utilizan para reclutar a más encuestados dentro de la población objetivo. Es un buen método para las muestras de difícil acceso. Muestreo por conveniencia: este nombre se utiliza habitualmente para describir cualquier otro método que persiga obtener fácilmente una muestra no probabilística. Los individuos se registran voluntariamente en un formulario web. Los seguidores de Facebook son un ejemplo de este tipo de muestras. No podemos calcular hasta qué punto las muestras representan a nuestro universo pero son una muestra y, por lo tanto, pueden servirnos para recolectar datos. Métodos de muestreo aptos para la recolección de datos online. Tal y como hemos explicado anteriormente, los métodos de muestreo más adecuados para la recolección de datos dependen de la fuente de participantes que utilicemos. Si extraemos muestras a partir de un panel de acceso online, la única opción realista es el muestreo por cuotas. Los paneles de acceso online no son representativos de toda la población, pero si están bien diseñados, deberían proporcionarnos todo tipo de encuestados. Para asegurarnos de que extraemos una muestra representativa del panel, debemos fijar las cuotas correctas. El siguiente capítulo aprenderemos a fijar las cuotas para la recolección de datos online. Esto también es aplicable al river sampling. En este caso, las cuotas son aún más importantes debido a la varianza limitada de los participantes. Pero las cosas son distintas cuando trabajamos con un panel online basado en la probabilidad, porque se supone que este tipo de paneles conforman una muestra aleatoria/representativa del universo. En teoría podríamos confiar en esto para extraer muestras aleatorias del panel. Sin embargo, debemos recordar que un panel online probabilístico sigue siendo una comunidad de personas encuestadas periódicamente a cambio de algo. Algunos miembros del panel pueden responder más activamente que otros a las invitaciones. El nivel de actividad puede variar en función de la edad, el sexo u otros factores sociodemográficos, de manera que, al final, la muestra del panel puede ser sesgada. El muestreo por cuotas es nuestro mejor aliado para evitar estos retos.
  • 13. Fundamentos de la recolección de datos online 13 Métodos de muestreo Por último, si tenemos acceso a una base de datos de propiedad, podremos utilizar varios métodos de muestreo. Por ejemplo, pensemos en una lista exhaustiva de clientes de una empresa: si queremos investigar este target específico, la lista es un marco muestral, de modo que podemos aplicar métodos de muestreo probabilístico como el muestreo aleatorio simple o el muestreo sistemático. Obviamente, también podemos recurrir al muestreo no probabilístico. A veces, la base de datos de propiedad puede conformar un marco muestral o no, dependiendo de cómo definamos nuestra población objetivo. Por ejemplo, supongamos que tenemos una lista de clientes y clientes potenciales suscritos al boletín de noticias de una empresa. ¿Es este el marco muestral? Si definimos nuestra población objetivo como «personas interesadas en recibir información periódica de mi empresa», entonces sí. Si nuestra población objetivo es «cualquier cliente real y potencial», entonces no. En el segundo caso, el muestreo por cuotas es siempre una opción, pero cuando trabajamos con bases de datos internas, a veces es mejor aplicar el muestreo aleatorio a toda la base de datos y analizar los resultados por segmentos, ya que no hay un coste creciente por respuesta.
  • 14. Fundamentos de la recolección de datos online 14 El muestreo por cuotas es el método de muestreo por defecto para recolectar datos online. Cuando encargamos un proyecto de recolección de datos online a un panel online, nos preguntarán cómo queremos utilizar las cuotas. A continuación encontrarás las mejores prácticas y recomendaciones para fijar cuotas y asegurarte así de realizar una recolección de datos online efectiva. 1. Fija cuotas para variables que (1) sean imprescindibles para tu proyecto y/o (2) cuya distribución difiera claramente de tu población objetivo y la población de Internet. Las cuotas pretenden subsanar la posible falta de representatividad debido a las divergencias entre nuestra fuente de datos y la población objetivo. Si hemos utiliza el muestreo por cuotas para recolectar datos offline, deberíamos plantearnos si nos conviene reutilizar las mismas cuotas con las mismas variables sociodemográficas. Aunque normalmente fijemos las cuotas por sexo, edad y región, es probable que para la recolección de datos online no nos sirvan. Veamos algunos ejemplos sobre cómo enfocar las cuotas para el muestreo online: • En general, la edad es un factor clave en prácticamente todos los países. Los jóvenes son más propicios a utilizar Internet que las personas mayores, salvo en los países más desarrollados, como Noruega o Suecia, que registran una penetración de Internet del 95 % aproximadamente. • A pesar de que en la mayoría de países el uso de Internet no difiere demasiado entre hombres y mujeres, cuando extraemos muestras de paneles de acceso online tenemos que utilizar cuotas por sexo. Esto se debe a que los paneles tienen que ser lo suficientemente grandes para satisfacer las necesidades de los compradores investigados y se suele investigar más a las mujeres que a los hombres porque se asume que las mujeres toman más decisiones de compra relacionadas con el hogar. Si no fijamos cuotas por sexo, es probable que recibamos más respuestas de mujeres. • En países menos desarrollados en América Latina, Asia y África, la clase social es un factor decisivo. El uso de Internet varía enormemente entre clases sociales. Además, las clases sociales más bajas tienen un comportamiento totalmente distinto al de las clases medias y altas. En países desarrollados, esto no suele ser tan importante, así que podemos ahorrarnos este control de cuotas. El muestreo por cuotas online efectivo
  • 15. Fundamentos de la recolección de datos online 15 El muestreo por cuotas online efectivo 2. Menos es más: utilizar el número mínimo de cuotas. Las cuotas hacen que el proceso de recolección de datos sea más complejo, afectan al timing del proyecto e inciden en los costes de la recolección de datos. Se trata de un problema inherente al muestreo por cuotas, pero que cobra importancia cuando recogemos información online. Pensemos en las grandes diferencias entre la recolección de datos online y offline. Si hemos definido una cuota por sexo en una encuesta presencial, una vez hemos alcanzado nuestro objetivo de varones dejamos de interceptar a hombres en la calle. Y es fácil, ¡porque sabemos diferenciar entre hombres y mujeres a simple vista! En cambio, el proceso online es totalmente distinto: enviamos una serie de invitaciones por correo electrónico a los candidatos y esperamos a que la gente reciba los correos, los abran, accedan a la encuesta online y completen su participación. Cuando alcanzamos un target de hombres, no podemos impedir que más candidatos varones accedan a la encuesta porque no podemos eliminar las invitaciones enviadas por correo electrónico una vez recibidas. Tendremos que descartar las participaciones que exceden nuestra cuota, ya que carecen de valor para nosotros y, además, suponen un coste para el panel de acceso online. Cuanto más complejas sean las cuotas, más costes y tiempo necesitaremos para llevar a cabo la recolección de datos online. El gráfico siguiente muestra el número aproximado de personas que tenemos que añadir al tamaño de la muestra debido al exceso de cuota para una muestra con un tamaño de 1.000 y cuotas uniformes. Según este gráfico, fijar una cuota con un tamaño=2 (dividiendo el tamaño objetivo de 1.000 en dos grupos objetivo de 500 individuos) implica tener un 2,5 % de encuestados más. Para una cuota con un tamaño=8 (8 grupos objetivo de 125 individuos), la muestra tiene que ser un 13,1 % más grande. Por último, si dividimos el tamaño objetivo en 100 cuotas, tendremos que doblar el tamaño de la muestra (+96,6 %).
  • 16. Fundamentos de la recolección de datos online 16 El muestreo por cuotas online efectivo 3. Decide si quieres o no que las cuotas sean convergentes o divergentes. Hablamos de cuotas divergentes cuando los objetivos de cada cuota se definen de forma independiente. Por ejemplo, para una muestra con un tamaño de 1.000 encuestados, necesitaremos 500 (50 %) hombres y 500 (50 %) mujeres, y 500 (50 %) jóvenes y 500 (50 %) personas mayores. De este modo, asumes el riesgo de que acabes con 500 jóvenes varones y 500 mujeres mayores. Este resultado es perfectamente compatible con tu definición de cuota, ¿pero te gusta realmente esta distribución? Para evitar este efecto, utilizaremos cuotas convergentes. Esto significa definir un tamaño objetivo para cada combinación de variables: 250 (50 % x 50 %) hombres jóvenes, 250 (50 % x 50 %) mujeres jóvenes, 250 (50 % x 50 %) hombres mayores y 250 (50 % x 50 %) mujeres mayores. ¿Utilizamos cuotas convergentes o divergentes para recolectar datos online? Pues depende de nuestras prioridades. En teoría, las cuotas divergentes deberían simplificar la recolección de datos. La definición de una cuota convergente siempre se corresponde a la definición equivalente de cuota divergente, pero no al revés. Podemos comprobar este hecho fácilmente con el ejemplo anterior. En definitiva: las cuotas divergentes son, en principio, más económicas y rápidas, pero no siempre es así. Siguiendo con el ejemplo anterior, si el panel de acceso online está claramente distorsionado en favor de los jóvenes y los hombres, es probable que cuando tengamos 500 encuestas, la mayoría de ellas sean de hombres jóvenes. Esto significa que las 500 encuestas restantes tendrán que proceder de nuestro target de difícil acceso: mujeres mayores. A veces es mejor tener cuotas convergentes porque nos ofrecen un progreso equilibrado simultáneamente en todos los targets. ¿Qué podemos hacer para superar este reto? Nuestro consejo es que (1) apuestes por cuotas divergentes solo si el panel de acceso online presenta una distribución equilibrada entre los targets (por ejemplo, en lugar de tener una distribución por sexo de 50 %-50 %, tiene un 45 %-55 % pero no 30 %-70 %) y (2) utiliza siempre cuotas convergentes si quieres analizar subtargets en profundidad (por ejemplo, si quieres analizar las diferencias entre hombres mayores y mujeres mayores).
  • 17. Fundamentos de la recolección de datos online 17 La velocidad es una ventaja clara de la recolección de datos online. Es mucho más rápido enviar miles de invitaciones por correo electrónico y permitir que los participantes realicen las encuestas de forma simultánea que llamar a la gente desde un call center o interceptar al público en la calle para hacer encuestas. Los campos de trabajo online suelen tardar entre 2 y 5 días, en función del tamaño de la muestra, la población objetivo y, desde luego, el panel de acceso online que utilicemos. En principio, la recolección de datos online se puede hacer en menos de dos días. Para ello, tendremos que invitar a más candidatos para que participen en el mismo período de tiempo. Sin embargo, quizás no sea buena idea para nuestros datos. ¿Quién tiene más probabilidades de participar en encuestas online si hay un período de tiempo limitado para ello? La respuesta es usuarios asiduos de Internet, adictos a los smartphones o empleados de oficina. Con frecuencia, la representatividad de las fuentes de participantes es un tema que preocupa seriamente a los investigadores. Sin embargo, se infravaloran los efectos de un proceso de recolección de datos inadecuado. El gráfico siguiente, elaborado con datos de los 6 paneles Netquest más grandes, nos ayuda a entender los efectos de limitar el tiempo de participación. Planificar la recolección de datos online
  • 18. Fundamentos de la recolección de datos online 18 Planificar la recolección de datos online La participación en encuestas online se reduce con el tiempo. El 11 % de las participaciones se producen en la primera hora y el 22 %, en un plazo de 3 horas. Pero si cerramos nuestro trabajo de campo a las 3 horas, perderemos el 78 % de las participaciones, por lo que nuestra muestra resultará más cara. Y lo que es aún peor: no sabremos si los participantes que no han podido participar son distintos a los que sí han participado, distorsionando así la muestra. En conclusión, la recolección de datos online es más rápida que la recolección de datos offline, y puede ser todavía más rápida, pero a expensas del sesgo de la muestra y de incurrir en unos costes mayores.
  • 19. Fundamentos de la recolección de datos online 19 Si tienes experiencia en la investigación de mercados cuantitativa, probablemente ya conozcas los fundamentos del diseño de cuestionarios. Los aspectos básicos que hay que tener en mente son los mismos para la recolección de datos online y offline. El diseño de encuestas es un tema demasiado amplio para verlo aquí en profundidad, pero a modo de recordatorio, los pasos para hacer un buen trabajo son los siguientes: 1. Establece el objetivo del cuestionario: ¿Cuál es la finalidad de la investigación? 2. Fija las preguntas que se van a hacer. 3. Elige el tipo de pregunta más adecuado entre las distintas opciones (preguntas abiertas o cerradas, respuesta única o múltiple, preguntas de clasificación, preguntas de puntuación, etc.). 4. Especifica los términos más adecuados para cada pregunta según la población objetivo. 5. Crea la secuencia de preguntas y el diseño del cuestionario de forma lógica para el participante. Las mejores prácticas para diseñar cuestionarios offline efectivos también son aplicables online: • Sé conciso, breve y claro. Evita las frases complejas. • Evita preguntar dos cosas distintas en una misma pregunta. • Evita las preguntas negativas que puedan confundir a los participantes. • Pide respuestas precisas. • Si utilizas preguntas cerradas, asegúrate de dar todas las respuestas posibles (plantéate incluir la opción «Otros»). • Evita las preguntas tendenciosas. Sin embargo, hay una serie de recomendaciones para las encuestas online. 1. Utiliza páginas múltiples en lugar de desplazamientos infinitos. 2. Pregunta una sola cosa cada vez y limita el cuestionario a una pregunta por página. No permitas que el encuestado navegue por la página y decida en qué orden responde a cada pregunta. 3. La entrevista debe tener una longitud moderada. La regla de oro son 20 minutos como máximo y 5 minutos si los encuestados utilizan dispositivos móviles. Encuestas eficaces para el trabajo de campo online
  • 20. Fundamentos de la recolección de datos online 20 Encuestas eficaces para el trabajo de campo online 4. Utiliza encuestas online responsivas que se adapten correctamente a los distintos tamaños de pantallas (ordenador, tableta, móvil). 5. Emplea un lenguaje específico. Los participantes online leen en diagonal para buscar palabras y mensajes clave. 6. Incluye imágenes e iconos cuando puedas, ya que mejorarás la experiencia de usuario de los participantes. 7. Insertar vídeos en una encuesta es una funcionalidad específica de las encuestas online y que marca la diferencia respecto a las encuestas offline. Aprovéchala (por ejemplo, pruebas creativas o comerciales), pero ten en cuenta que la participación se verá reducida por varios factores: la compatibilidad de los vídeos con navegadores no actualizados, ancho de banda limitado en los teléfonos móviles y, en algunos casos, las personas que no quieren subir el volumen de los dispositivos (por ejemplo, si están en el transporte público). 8. Cumple los estándares de Internet y olvídate de reinventar la rueda. La gente espera que, al pulsar un botón de radio, los demás botones de radio cercanos aparezcan como no seleccionados. Todos los elementos de una página web (casillas de verificación, cuadros de inserción de texto, botones para enviar, texto subrayado...) deben actuar tal y como la gente espera. 9. Evita las baterías de preguntas. De hecho, la investigación ha puesto de manifiesto que las ventajas potenciales de agrupar preguntas en una escala de respuestas compartida (menor tiempo de respuesta y más correlación entre elementos) no compensa los inconvenientes (una peor experiencia del participante, una mayor tasa de abandono y menos diferenciación entre respuestas)(*). 10. Aprovecha las oportunidades que te ofrece la tecnología: simuladores de compra, cuestionarios online conjuntos, entradas de voz, reconocimiento facial, rastreo ocular, etc. Actualmente, disponemos de un amplio abanico de opciones nuevas y prometedores para recolectar datos online. (*)Melanie Revilla, Carlos Ochoa. Telematics and Informatics, abril 2016. “An experiment comparing grids and item-by-item formats in web surveys completed through PCs and smartphones”
  • 21. Fundamentos de la recolección de datos online 21 Si estás pensando en utilizar la recolección de datos online por primera vez, o incluso si la has empleado varias veces, debes plantearte la pregunta siguiente: ¿Hasta qué punto se puede comparar la calidad de los datos online y los datos offline? Hay argumentos en contra de la calidad de los datos recogidos online, pero, al mismo tiempo, hay muchos otros en favor. De hecho, existen múltiples formas de controlar la calidad de los datos recogidos online que nos permiten superar los principales inconvenientes y aprovechar las virtudes de esta metodología al mismo tiempo. Datos de calidad Ventajas Inconvenientes • Ausencia de sesgos del entrevistador: las respuestas no se ven distorsionadas por las diferencias del estilo social y la personalidad de los entrevistadores o la forma de presentar determinadas preguntas. • Mayor fiabilidad ante preguntas sensibles (preferencias políticas, estado de salud, religión...) debido al anonimato del encuestado (**) • Ausencia de errores de transcripción. Los participantes envían sus preguntas de forma digital y directa en el cuestionario. • Fácil recolección de metadatos para evaluar la calidad, permitiéndonos así aplicar medidas de corrección. Casi todos los softwares de encuestas profesionales recogen datos como el tiempo de participación, el tiempo por pregunta o el número de interrupciones del cuestionario. • Es difícil controlar estrictamente quién participa (por ejemplo, en encuestas prfundamentos observamos visualmente la edad aproximada y el sexo de los participantes, pero en Internet no es posible). • Mayor riesgo de querer satisfacer debido a la ausencia del entrevistador y el uso de recompensas. La voluntad de satisfacer es una estrategia a la que recurren los encuestados para responder a preguntas con el mínimo esfuerzo. (***) • La comparabilidad se puede ver afectada por la gran diversidad de dispositivos que utilizan los participantes: navegadores distintos, versiones de los navegadores, dispositivos, tamaño de las pantallas... • Cuando se recompensa la participación, el comportamiento del participante se puede ver afectado. Por ejemplo, un panel que ofrece solo un tipo de recompensa a cambio de la participación puede sobrerepresentar una población objetivo en concreto, o si el panel solo recompensa a los participantes que forman parte de la población objetivo (esto es, los que pasan las preguntas de filtro), la gente se puede ver tentada a mentir. VENTAJAS E INCONVENIENTES DE LA RECOLECCIÓN DE DATOS EN TÉRMINOS DE CALIDAD (**) http://web.comhem.se/u22779327/16/k16docs081211.pdf (***) http://www.businessdictionary.com/definition/satisficing.html
  • 22. Fundamentos de la recolección de datos online 22 Datos de calidad Si nos fijamos en el resumen anterior, es obvio que la recolección de datos online tiene ventajas e inconvenientes. En este sentido, es parecida a cualquier otra metodología. Sin embargo, la recolección de datos online tiene una ventaja esencial respecto a otras opciones: la mayoría de inconvenientes se pueden minimizar (o incluso eliminar) seleccionando una fuente de datos fiable y aplicando los controles de calidad adecuados en el cuestionario online. 7 estrategias comunes para mejorar la calidad son: 1. Compara los datos de la encuesta con los datos del panel para detectar identidades fraudulentas. Por ejemplo, cuando se pregunta la edad y el sexo, es fácil validar la respuesta del panelista si esta persona se ha unido al panel. 2. Pon a prueba la atención que los panelistas prestan a la encuesta comparando las respuestas dentro de la encuesta para evaluarlas. Puedes hacer la misma pregunta dos veces (de forma ligeramente distinta) y en un momento distinto en el mismo cuestionario. 3. Aplica una Comprobación de manipulación de las instrucciones (IMC, por sus siglas en inglés) si la duración de la encuesta es larga (>15 minutos). Las IMCs son preguntas cuyo objetivo es verificar que el participante haya prestado atención al cuestionario, del tipo «Si estás leyendo esta pregunta, selecciona la tercera opción». 4. Recompensa a las personas por participar y no a cambio de corresponderse con los requisitos de la población objetivo que quieres encuestar. Si solo pagamos a los que responden «sí» a la pregunta de filtro (por ejemplo, «¿Utilizas este producto?» «¿Conoces esta marca?») estaremos incitando a la gente a mentir en la próxima encuesta que les enviemos. 5. Fija un tiempo mínimo necesario para realizar la encuesta y descarta a los participantes que acaben antes. Se trata de una forma fácil de detectar a participantes que responden sin prestar atención. 6. Comprueba las respuestas a preguntas abiertas para identificar respuestas inválidas (como «---», «aaaaa») y elimina la participación integral de estos participantes, no solo la respuesta. Si alguien responde así a una pregunta abierta, es probable que esta persona haya respondido inadecuadamente a toda la encuesta. 7. Recoge tantos metadatos (datos relacionados con cómo y cuándo se recoge la información) como puedas; te ayudará a identificar problemas. En las encuestas online es muy sencillo. Por ejemplo, algunos encuestados pueden haber tenido problemas para ver una pregunta en un navegador concreto. Si recopilamos estos metadatos tendrás más probabilidades de entender el problema. Si te estás planteando utilizar un panel de acceso online, merece la pena entender la información siguiente para asegurarte de que eliges al adecuado para tu proyecto: 1. ¿Cómo se captan los nuevos miembros del panel? ¿Es un panel abierto o cerrado? ¿Dónde se capta? ¿Recompensan el registro de los panelistas para eliminar la autoselección?
  • 23. Fundamentos de la recolección de datos online 23 Datos de calidad 2. ¿Cómo recompensa el panel la participación? ¿Recompensan todas las participaciones o solo las que acaban en una encuesta válida? Los paneles que solo pagan las encuestas válidas tienen más probabilidades de recibir respuestas fraudulentas cuando se investigan poblaciones objetivo de difícil acceso. 3. ¿Cuántas encuestas realizan los panelistas al mes? Algunos paneles envían entre una y dos encuestas al día a los panelistas y los profesionalizan. 4. ¿Cuál es el tamaño real basándonos en el número máximo de resultados del panel? Este número es fundamental porque nos da mucha información del panel. Salvo que el panel se encuentre en fase de creación, cuando una empresa de paneles genera un volumen importante de actividad con un panel pequeño probablemente estaremos ante una empresa de river sampling y no un panel de verdad. Para asegurarte, pregunta cuál es el número máximo de resultados, esto es, el tamaño máximo de la muestra que nos puede ofrecer el panel en una encuesta de una toma. Esta respuesta nos aporta una información más valiosa que preguntar por el tamaño del panel porque muchas empresas cuentan como panelistas a personas que se han registrado hace mucho tiempo pero que no participan activamente. 5. ¿El panel cuenta con una certificación con una norma de calidad como ISO26362? Las normas ISO nos dan la seguridad de que el panel ha sido auditado y que quiere compartir la información anterior con transparencia.
  • 24. Fundamentos de la recolección de datos online 24 La privacidad se está convirtiendo en una de las principales preocupaciones de los usuarios de Internet. La investigación de mercados online se ve directamente afectada por este fenómeno porque, al fin y al cabo, los investigadores recopilan información de las personas, y los participantes pueden considerar algunos de los datos recopilados como altamente sensibles. Como investigadores, esta es una cuestión importante. Los investigadores están obligados a trabajar conforme al código de conducta del sector (las pautas ESOMAR) y deben cumplir todas las obligaciones legales aplicables en el lugar donde recopilamos la información. Deberíamos seguir la recomendación anterior por dos razones, fundamentalmente: • Es nuestro deber como profesionales de la investigación de mercados. Tenemos que tender una relación de confianza con la población si queremos preservar nuestra profesión. • Nuestros datos se pueden ver seriamente perjudicados si no damos seguridad a los participantes, ya que solo participarán aquellos que no se preocupen por las cuestiones de privacidad o, aún peor, nos darán información falsa. Si vas a recolectar datos online, no olvides las recomendaciones siguientes: 1. Ofrece acceso a la política de privacidad, un documento en el que informamos de nuestra política a la hora de recolectar y difundir información de los participantes. Si utilizas un panel de acceso online, esto es responsabilidad del panel. 2. Comunícate de forma transparente con los panelistas durante toda su actividad: si recopilas información especialmente sensible, con la política de privacidad no es suficiente. Incluye mensajes claros en lugares clave de la encuesta. 3. Los casos siguientes son casos especiales que requieren un tratamiento distinto: incluir/ recolectar cookies de terceros, recolectar información de navegación, pedir datos de geolocalización, pedir las direcciones de correo postal o electrónico y números de teléfono. 4. Cumple las obligaciones legales del país en el que recopilas la información, no solo en tu país de origen. Las obligaciones legales pueden variar enormemente entre países. 5. Ten en cuenta las diferencias entre países a nivel de privacidad. Por ejemplo, en Estados Unidos y Europa es habitual preguntar por los ingresos del hogar, la entidad bancaria y el número de hijos, pero en América Latina, estas preguntas se pueden considerar inadecuadas por el riesgo de secuestro. Por último, para ayudarte a evaluar hasta qué punto la gente está dispuesta a participar en proyectos de recolección de datos no convencionales (algunos de ellos estrechamente vinculados a la privacidad), los resultados de una encuesta experimental realizada en el panel de Netquest dio los resultados siguientes: Privacidad
  • 25. Fundamentos de la recolección de datos online 25 Privacidad Probar un producto en casa Enviar fotos haciendo actividades concretas Escanear códigos de barras de productos Enviar la posición GPS Grabar el rostro para medir las emociones viendo un vídeo Instalar un medidor para hacer un seguimiento de la información de navegación en el smartphone Instalar un medidor para hacer un seguimiento de la información de navegación en el ordenador ACTIVIDAD DISTINTA A ENCUESTAS VOLUNTAD DE PARTICIPAR 72,4 % 54,9 % 51,8 % 20,0 % 17,4 % 17,0 % 15,8 %
  • 26. Fundamentos de la recolección de datos online 26 El reporting no forma parte del proceso de recolección de datos, así como tampoco la visualización (comunicación visual de los datos). Ambas actividades conforman el punto de partida del análisis de los resultados. Sin embargo, la investigación online ha cambiado ligeramente el panorama: los datos se recogen en tiempo real y los clientes quieren ver los resultados también en tiempo real. Esto implica que las empresas de investigación de mercados ofrezcan dashboards online, herramientas de reporting «hazlo tú mismo» e infográficos predefinidos que se llenan de datos tan pronto como se reciben. Por descontado, estas soluciones extremadamente rápidas restringen el toque humano; el gran valor que aporta un analista experto que profundiza en los datos para encontrar resultados sorprendentes no es compatible con los resultados en tiempo real. Pero la velocidad es el mantra de las empresas modernas y, como investigadores, no deberíamos ir a contracorriente. Esto no significa que los análisis de resultados individualizados y exhaustivos carezcan de valor, sino que debemos saber elegir entre ambos planteamientos en función del cliente y el problema que se investiga, o combinarlos cuando fuere necesario. Por ejemplo, los clientes online (esto es, de las páginas web de comercio online) están muy acostumbrados a trabajar con datos, de modo que se sienten cómodos con un dashboard online, mientras que es probable que los clientes más tradicionales no quieran prescindir de las recomendaciones personalizadas. La mayoría de soluciones de software que se utilizan para recolectar datos online incluyen alguna función de reporting online. Más allá de estos informes básicos, hay soluciones especializadas que permiten implementar el reporting y la visualización avanzados. A modo de ejemplo, se enumeran algunas de ellas a continuación: • Dapresy (www.dapresy.com) ofrece herramientas de visualización de datos y herramientas de inteligencia empresarial que permiten a los investigadores procesar, analizar y crear dashboards basados en infográficos. • Tableau (www.tableau.com) ayuda a los investigadores a ver y entender los datos. Permite conectar con casi todas las bases de datos, ofrece la función de arrastrar y soltar para crear visualizaciones y compartir con un solo clic. • Qlik (www.qlik.com) ofrece plataformas intuitivas para la visualización de datos a medida, aplicaciones de análisis guiados, análisis integrados y reporting. Reporting y visualización
  • 27. Fundamentos de la recolección de datos online 27 Reporting y visualización • Microsoft BI (powerbi.microsoft.com) es un conjunto de herramientas de análisis empresarial para analizar datos y compartir información. MBI permite hacer un seguimiento de nuestra actividad y recibir respuestas rápidamente con unos dashboards muy completos disponibles en todos los dispositivos. • IBM Cognos (www-03.ibm.com/software/products/en/cognos-analytics) es una plataforma BI para empresas para la detección de datos ordenada y el reporting gestionado que automatiza la creación de informes y dashboards de modo que los usuarios puedan hacerlo por sí mismos. • Microstrategy (www.microstrategy.com) ofrece funciones de reporting para empresas y detección de datos para la productividad móvil y la telemetría en tiempo real, y pone a disposición de las empresas un amplio abanico de posibilidades para transformar sus datos en inteligencia del mundo real.
  • 28. Contacto EE.UU. & Canadá americas@netquest.com Portugal portugal@netquest.com España iberia@netquest.com Europa & Asia rfqinternational@netquest.com Colombia colombia@netquest.com Brasil atendimento@netquest.com Cono Sur cs.sales@netquest.com México latamnorte@netquest.com netquest.com