3. 3
Introducción
Esta Unidad presenta al estudiante las distintas técnicas e instrumentos que serán utilizados
para el análisis de los datos obtenidos una vez concluidas las etapas de colección y
procesamiento de datos de la investigación de mercados. Se trata de una de las más
importantes tareas realizadas en el proceso de investigación.
Estructura de contenidos
Unidad 9: Análisis de Datos
9.1 Definición
9.2 Técnicas e Instrumentos para el Análisis de los Datos
Mapa Conceptual
HERRAMIENTAS PARA EL ANÁLISIS ESTADÍSTICO DE LOS DATOS DE UNA INVESTIGACIÓN:
• Estadística descriptiva para las variables, tomadas individualmente.
• Puntuaciones “Z”.
• Razones y tasas.
• Cálculos y razonamientos de estadística inferencial.
• Pruebas paramétricas.
• Pruebas no paramétricas.
• Análisis multivariados.
4. 4
Unidad 9: Análisis de Datos
9.1 Definición
El investigador, nos explica Prieto Herrera (2013), debe hacer uso de la lógica para entender
los datos recopilados sobre el tema objeto de estudio. El análisis depende del tipo de
información requerida, del diseño de la investigación y de la calidad de los datos obtenidos;
puede ir desde un promedio aritmético, pasando por una distribución de frecuencias, hasta
una regresión múltiple.
Cuando se van a examinar de forma crítica los datos se deben ordenar en categorías
significativas (revisión, codificación y tabulación), determinar las diferencias claves entre
categorías, explicar el porqué de ellas y hacer las recomendaciones pertinentes.
La revisión y codificación son funciones básicas, porque la primera se hace necesaria para
eliminar errores en los datos iniciales, lo cual se puede hacer en el terreno de campo o en
la gerencia del proyecto, y la segunda agrupa los datos en las categorías correspondientes,
facilitando la tabulación. La revisión debe hacerse con colores diferentes a los usados por
los entrevistadores en primera instancia para distinguir entre los datos originales y los datos
revisados.
La tabulación consiste en contar el número de aspectos, características, datos, etcétera, que
se insertan dentro de las categorías definidas por el investigador. Esta puede hacerse
manual, mecánica o electrónica, dependiendo de la magnitud de los datos (Investigación de
mercados, p. 124).
9.2 Técnicas e instrumentos para el análisis de los datos
El análisis de datos, nos explica Plazas Rojas (2011), como actividad generadora de
información para coadyuvar en la toma de decisiones gerenciales, debería seguir en todas
las ocasiones unas etapas secuenciales. La primera consiste en realizar un análisis
univariado tomando cada una de las variables de forma aislada, independiente. Luego se
debe proceder a efectuar un análisis bivariado, es decir estudiar dos variables
simultáneamente, de tal manera que se halle y comprenda la relación existente entre
cualquier par de variables relevantes. Por último, el análisis se enfoca en estudiar la relación
existente entre más de dos variables vistas simultáneamente; es lo que se conoce como
análisis multivariado de datos. En cada una de las tres etapas es preciso realizar tanto el
análisis descriptivo como el análisis inferencial (Investigación de mercados: un enfoque
gerencial, p. 136).
5. 5
Análisis descriptivo
En general, desarrolla Dos Santos (2017), los estudios descriptivos nos dan una visión, una
foto, en la que describen un panorama. Sin embargo, no son capaces de determinar los
factores causales. Pero nos permiten desarrollar nuevas vías de investigación, formular
nuevas hipótesis. Se usan para describir la naturaleza de los datos. Usamos tabulaciones y
estadísticos como la media, varianza, error estándar, coeficiente de variación, rango,
asimetría, curtosis, percentiles, etc.
Para el procesamiento de los datos obtenidos, nuestro autor propone el uso del programa
SPSS (Statistical Package for the Social Sciences) (SPSS, Inc.) para la tabulación, tratamiento
y análisis de los datos. Es un programa de pago, pero su alternativa de libre distribución
PSPP es un reemplazo válido para la realización del trabajo. Otros programas como Stata,
R o JMP también son válidos para la tarea.
Al abrir el programa se encuentran comúnmente dos opciones: abrir una base de datos o
bien comenzar una base de datos desde cero. Como es la primera vez que usaremos el SPSS
comenzaremos creando una base de datos nueva. Tienen dos ventanas (ventana de datos
y ventana de resultados), en la ventana de datos tienen dos visores: vista de datos y vista
de variables. Debemos comenzar creando las variables en la vista de variables. Al comenzar
a redactar las variables deberán de establecer el tipo de medida, nótese que SPSS no
considera el tipo intervalo. Se recomienda que adjudiquen valores en caso de ser una
variable nominal en la columna valores.
Figura 1: Introducción de variables (fuente: Investigación de mercados: manual universitario, p.
138).
Al introducir los nombres de las variables ya podrán introducir los valores en la vista de
datos. Tengan en cuenta que las filas representan casos y las columnas variables. Desde el
menú archivo pueden importar, guardar, y abrir bases datos desde multitud de plataformas,
por ejemplo, Excel. En este sentido, se asemeja a la mayoría de programas.
Medidas de tendencia central
Una medida de tendencia central es un coeficiente que intenta describir un conjunto de
datos mediante la identificación de la posición central dentro de ese conjunto de datos. Las
tres medidas más comunes de la tendencia central son la media, la mediana y la moda.
6. 6
Una distribución de frecuencias muestra de forma ordenada los valores de una variable y
cuantas veces se repite (frecuencia). La opción distribución de frecuencias permite calcular
los estadísticos más populares, como los de tendencia central, permite construir gráficos
como histogramas, gráficos de barra, etc.
Figura 2: Ventana de frecuencias (menú analizar – estadísticos descriptivos). Desde esta ventana se
pueden obtener los estadísticos estudiados (fuente: Investigación de mercados: manual
universitario, p.139).
Medidas de variación
La variabilidad se refiere a la distensión de las puntuaciones entre sí. Un conjunto de datos
tiene una alta variabilidad cuando contiene valores que son considerablemente más altos y
bajos que el valor medio. Puede ocurrir que dos conjuntos de datos sean similares en su
localización central, pero puedan diferir en su variabilidad. Por lo tanto, la medida de la
tendencia central y la medida de variación son necesarias para describir la naturaleza de los
datos correctamente. Existen tres medidas de variación que se utilizan con frecuencia, el
rango, la varianza, y la desviación típica o estándar.
Medidas de forma
• La asimetría indica el grado de simetría de los datos. Si la curva es simétrica, al cortar por
la mitad, la imagen parece reflejada en un espejo. Si la curva no es simétrica, se dice que
está sesgada. Si la asimetría es positiva, el lado superior de la curva estará inclinado hacia
la izquierda y viceversa. Cuando la curva está positivamente sesgada, la mediana es mayor
que la moda, mientras que, en la curva negativamente sesgada, la mediana es menor que
la moda. El error estándar de asimetría puede usarse para probar su significación. Al probar
la significación de la asimetría, se utiliza el estadístico Z que sigue una distribución normal.
El valor crítico de Z es 1,96 (para una prueba de dos colas con un nivel del 5%). Por lo tanto,
si el valor calculado de Z es menor a -1,96, podemos interpretar que la población está
sesgada negativamente. Por otro lado, si se calcula Z> +1,96, se puede concluir que la
población está positivamente sesgada.
7. 7
• La curtosis indica cómo están distribuidos los datos alrededor de la media. Para una
distribución normal, el valor de curtosis es cero. Una curtosis positiva (leptocúrtica) indica
que las observaciones se agrupan más en torno a su valor medio (colas más largas en
comparación con la distribución normal). Una curtosis negativa (platicúrtica) indica que las
observaciones se distribuyen más alrededor de la media, mayor varianza (colas más cortas).
En otras palabras, si el valor de curtosis es significativo y positivo (leptocúrtica), significa
menos variabilidad en el conjunto de datos o podemos decir que los datos son más
homogéneos. Por otro lado, la curtosis negativa (platicúrtica) indica que hay más
variabilidad en el conjunto de datos o podemos concluir que los datos son más
heterogéneos. Además, si la curtosis es 0, la curva se clasifica como mesocúrtica, es
equivalente a la curva normal. Si el valor de Z calculado es menor a -1,96, entonces la
población tiene curtosis negativa, platicúrtica. Por otro lado, si el valor de Z calculado es
mayor a 2, entonces es leptocúrtica.
Figura 3: Formas de concentración (fuente: Investigación de mercados: un enfoque gerencial, p.
145)
Podemos dibujar las curvas de normalidad en el SPSS en el menú gráficos, generador de
gráficos, seleccionando la opción gráficos de barras y posteriormente pulsando sobre
mostrar la curva normal (Investigación de mercados: manual universitario, pp. 137-142).
.
8. 8
Figura 4: SPSS Normalidad (fuente: Investigación de mercados: manual universitario, p.142).
Análisis inferencial o interpretativo
El análisis inferencial o interpretativo, explica Plazas Rojas (2011), le otorga al investigador
la capacidad de efectuar juicios sobre la totalidad de la población, con base en los resultados
generados por una muestra probabilística particular. La inferencia estadística comprende
todos los métodos con los cuales se pueden llevar a cabo generalizaciones acerca de una
población. Abarca dos áreas principales: estimación de parámetros y pruebas de hipótesis.
La estimación de parámetros trata sobre las posibilidades que se tienen a nivel de
estadísticas, para que, al usarlas el investigador o usuario de la investigación, se pueda
aproximar al valor real del parámetro. La idea es que se utiliza el estadístico “proporción en
la muestra” para estimar el parámetro “proporción en la población”.
Por otra parte, las pruebas de hipótesis constituyen la otra área importante de la inferencia
estadística. Un gerente de mercadeo podría tener la necesidad de decidir, con base en datos
muestrales, si existe alguna diferencia entre los clientes de dos ciudades diferentes,
respecto a la imagen percibida de su producto; o también podría estar interesado en
recabar datos apropiados que le permitan decidir si el ciclo de vida del hogar y el gasto en
comunicaciones son variables o características independientes entre sí. En ambos casos el
9. 9
gerente de mercadeo postula o conjetura algo acerca de alguna situación, o de forma más
técnica, el gerente de mercadeo expresa una hipótesis estadística.
Una hipótesis estadística es una afirmación o conjetura respecto de una o más poblaciones.
Los procedimientos de pruebas de hipótesis involucran el concepto de hipótesis nula, Ho,
la cual contiene la suposición sobre el parámetro que se quiere evaluar. La decisión final en
una prueba de hipótesis consistirá en rechazar o no Ho y ante esto, existe la posibilidad de
tomar una decisión correcta o incorrecta (Investigación de mercados: un enfoque gerencial,
p. 136-148).
Glosario
Hipótesis: es una declaración que realizan los investigadores cuando especulan
sobre el resultado de una investigación.
Matriz de datos: es un modo de ordenar los datos de manera que sea
particularmente visible la estructura tripartita de los datos.
Medición de las variables: son las escalas nominales, ordinal, de intervalo y de razón.
Se utilizan para ayudar en la clasificación de las variables.
Variable nominal: cuando sus valores representan categorías que no obedecen a una
clasificación intrínseca.
Variable por intervalos: una escala de medición es de intervalo si los datos tienen las
propiedades de los datos ordinales y los intervalos entre observaciones se expresan
en términos de una unidad de medición fija. Los datos de intervalo tienen que ser
numéricos.