2. Técnicas de obtención de
información
TÉCNICAS CUANTITATIVAS
Realizan un análisis estadístico de una serie de variables
a partir de una muestra representativa o parte del
colectivo estudiado para generalizar las conclusiones
obtenidas a la población total.
Plan de muestreo:
Definición de la población a estudiar (ámbito geográfico y
temporal).
Delimitación de la unidad muestral.
Determinación del tamaño de la muestra.
Procedimiento de muestreo (selección de unidades
muestrales).
2
3. 3
Concepto de universo.
“Universo se precisa como un conjunto finito o
infinito de personas u objetos que presentan
características comunes”.
“Una población es un conjunto de elementos que
presentan una característica común"14
El universo es la totalidad de personas físicas o
morales que nos interesan para fines de la
investigación de mercados.
Ejemplos: fumadores del DF., estudiantes de la
UPIICSA.
4. 4
Características del universo.
“Ubicación geográfica. Se debe tener bien definido el territorio que abarcará el
universo, puede ser una colonia, una delegación, un estado de la república, un país,
etc.
Unidad muestral. Se definen las características que deben reunir las personas que
forman parte del universo. “
“Ubicación geográfica. Se entenderá como unidad geográfica el lugar donde vive la
gente y que tiene características similares en cuanto a forma de gobierno, cultura,
religión, costumbres, etc., de tal forma que podemos definir unidades geográficas de
diferentes tamaños como son:
Región.-Se define como el territorio que forma una unidad al tener caracteres
comunes, como el clima, la topografía, la etnia, etc.(La región Lacandona).
Municipio.-Puede definirse como una asociación natural formada por los habitantes
que viven en territorio cercano, gobernados por un Ayuntamiento, dentro de un
municipio puede existir mas de una región de acuerdo a características de tipo
psicográfico.
Estado.- Se define como un territorio en régimen federal, que tiene una forma de
gobierno propio y pertenece a un país.
País.-Se define como un territorio, considerado como unidad geográfica y cultural.
Unidad muestral. Unidad seleccionada de la población para la aplicación de la
técnica de investigación. Puede ser un elemento poblacional único o un conjunto de
elementos.”
5. 5
Por los conceptos anteriores se dice que en una Investigación de Mercados se deben
establecer las características del universo y especificar la unidad muestral y ubicación
geográfica.
Unidad Muestral. Se refiere a las características que debe de reunir cada unas de las
personas que integran el universo.
Unidad geográfica. Se refiere al domicilio que deben de tener las personas que
integran el universo.”
7. 7
Concepto de muestra y sus características.
“El tamaño de la muestra depende de los siguientes elementos:
La amplitud del universo, si es o no infinito.
El nivel de confianza adoptado.
El error de estimación.
La desviación típica, o de la proporción que se encuentran en el universo las
características estudiadas.
La ausencia de distorsión.”6
“La muestra en sentido genérico, es una parte del universo, que reúne todas las condiciones
o características de la población, de manera que sea lo más pequeña posible, pero sin perder
exactitud. “ 9
Se concluye que la muestra es parte del universo que debe ser representativa y suficiente.
Características:
Representativa. Que debe contener todas las características del universo.
Suficiente. Debe ser una parte pequeña pero con el número de elementos necesarios que
permiten contener todas las características del universo.
8. 8
Determinación del tamaño de la muestra.
“* Cálculo de la muestra para una población infinita:
Para un nivel de confianza del 99%
n = 9pq
Para un nivel de confianza del 95 %
n = 4pq
s2
s2 Donde:
n = número buscado de elementos de la muestra.
s = error de estimación permitido.
p = probabilidad de que se realice el evento.
q = probabilidad de que no se realice el evento
9. 9
* Calculo de la muestra para una población finita.
Para un nivel de confianza del 99%
n = 9pqN
s2(n-1)+9pq
Para un nivel de confianza del 95 %
n = 4pqN
s2 ( n-1)+4pq
Donde:
N = número de elementos del universo
n = número buscado de elementos de la muestra.
s = error de estimación permitido.
p = probabilidad de que se realice
q = probabilidad de que no se realice.
10. 10
“El tamaño de la muestra juega un papel importante para determinar la probabilidad
de error así como en la precisión de la estimación. Una vez que se ha seleccionado el
nivel de confianza, dos factores importantes influyen en el tamaño muestral:
La varianza de la población2
2
El tamaño del error tolerable que el investigador está dispuesto a aceptar.
Mientras que el primer factor está más allá del control del investigador ( no hay nada que
se pueda hacer sobre la varianza de la población), sí es posible limitar el tamaño del error.
El tamaño del error que un investigador puede tolerar depende de qué tan crítico es el
trabajo. Algunas tareas extremadamente delicadas requieren resultados exactos: los
procedimientos médicos vitales de los cuales dependen vidas humanas, o la producción de
piezas de una máquina que debe cumplir medidas precisas, pueden tolerar sólo un
pequeño error. En otros casos, los errores más grandes pueden tener consecuencias menos
graves.
11. 11
Tamaño de la muestra para estimar
Vale la pena recordar que Z puede expresarse como
n
x
Z
Esto puede reescribirse algebraicamente como
2
22
)(
x
Z
n
en donde la diferencia entre la media muestral y la media poblacional (
(
)x es el error
12. 12
El valor de Z depende del nivel de confianza requerido. Esto deja por determinar sólo 2
2
sea desconocida, puede estimarse mediante la desviación estándar muestral (s), utilizando una muestra
piloto de cualquier tamaño razonable (
para calcular el tamaño muestral apropiado. En caso de que la
n 30)
La varianza calculada de esta muestra preliminar puede entonces utilizarse en la fórmula
Por lo antes mencionado se define que:
Población Finita. Menor a 100,000 elementos.
Población Infinita. Mayor a 100,000 elementos
Infinito = M = x2pq
e2
Finito = M = x2Npq
e2 (N-1)+x2pq
x = Representa el grado de confiabilidad
1 x = 65% el valor de x = 0.98
2 x = 95% el valor de x = 1.96
3 x = 99% el valor de x = 2.94
Investigación de Mercados
Donde:
N = Número de elementos que conforman el universo.
p = Probabilidad a favor.
q = Probabilidad en contra.
e = margen de error ( en investigación de mercados es 1 – 6 % )
13. Procedimientos de Muestreo
PROBABILÍSTICOS: se conoce la probabilidad de que un
elemento de la población integre la muestra.
Muestreo aleatorio simple: los elementos se seleccionan
al azar partiendo de una lista numerada de la población.
Muestreo sistemático: los elementos se seleccionan
mediante un intervalo fijo, tomando el primer elemento
al azar y aplicando el coeficiente de elevación.
Muestreo estratificado: se divide la población en grupos
homogéneos (estratos). El reparto de la muestra en los
estratos se denomina afijación y cada elemento se elige
por muestreo aleatorio simple o sistemático.13
n
N
elevacióndeecoeficient
N
n
muestreodefracción
14. Determinación del tamaño de la muestra
POBLACIÓN INFINITA (más de 100.000 elementos)
MEDIAS:
PROPORCIONES:
n: tamaño de la muestra.
N: tamaño de la población.
S: cuasidesviación típica.
P: porcentaje de la población que posee una característica de interés.
Q: complementario de P. Q=(1-P)
k: constante que depende del nivel de confianza prefijado.
e: error absoluto. 14
n
S
K=e
e
SK=n 2
22
;
n
QP
K=e
e
QPK=n 2
2
;
15. Determinación del tamaño de la muestra
POBLACIÓN FINITA (menos de 100.000 elementos)
MEDIAS:
PROPORCIONES:
ESTIMACIÓN DE TOTALES (poblaciones infinitas y finitas)
15
n
S
N
n-N
K=e
SK+Ne
SKN
=n
2
222
22
;
;
QPK+1)-(Ne
NQPK=n 22
2
n
QP
1-N
n-N
K=e
n
S
n)-(NNK=e
SKN+e
SKN=n
2
222
222
;
16. Procedimientos de Muestreo
Muestreo estratificado:
AFIJACIÓN SIMPLE:
n: muestra
ni: estrato i en muestra
AFIJACIÓN PROPORCIONAL:
N: población
Ni: estrato i en población
AFIJACIÓN OPTIMA O NO PROPORCIONAL
Si: desviación típica del estrato i
16
i
n
=nn=...=n=n ii21 ;
N
nN=n
N
n
=
N
n
=...=
N
n
=...=
N
n i
i
i
i
2
2
1
1
;
NN+...+N+Nn=n+...+n+n i21i21 ;
SN+...+SN
n
=
SN
n
=...=
SN
n
=
SN
n
ii11ii
i
22
2
11
1
SN+...+SN
n
SN=n
ii11
iii
17. Procedimientos de Muestreo
Muestreo por conglomerados: se divide la población en
grupos heterogéneos (conglomerados) que no van a
estar todos representados. La elección de las unidades
se realiza por etapas sucesivas en cada grupo y se
eligen todas las pertenecientes al último conglomerado.
17
Ciudad
Calle
Edificio
Barrios
18. Procedimientos de Muestreo
SEMIPROBABILÍSTICOS: incorpora algún aspecto probabilístico
pero no se mantienen en todo el proceso.
Muestreo por rutas aleatorias (random route): los elementos
se seleccionan en una ruta comenzando desde un punto
elegido al azar dentro de un área geográfica: edificio,
escalera, planta, puerta y miembro de la unidad familiar
(tablas de números aleatorios).
18
Unidad
seleccionada
19. Procedimientos de Muestreo
NO PROBABILÍSTICOS: no se puede calcular el error
muestral, reducen considerablemente los costes del
estudio.
Muestreo de conveniencia: el investigador selecciona
los elementos de la muestra según su comodidad.
Muestreo por juicios: el investigador selecciona los
elementos según su juicio, incluyendo aquellos que
considera relevantes.
Muestreo por cuotas: la población se divide en grupos
según las características que el investigador considere
relevantes. El entrevistador debe cumplir la cuota
fijada.
Muestreo en bola de nieve: se elige un grupo inicial de
personas que tengan características de interés y cada
una de ellas identifica otras con los mismos elementos.19
26. 26
EJERCICIOS:
a) Proponga 3 ejemplos de población, muestra y elemento
b) Calcule el tamaño de la muestra para una población de 500 con un
error de muestreo del 5% y nivel de confianza del 95%.
c) Calcule el tamaño de la muestra para una población de 500 con un
error de muestreo del 5% y nivel de confianza del 99%.
d) Calcule el tamaño de la muestra para una población de 500 con un
error de muestreo del 9% y nivel de confianza del 95%.
e) Calcule el tamaño de la muestra para una población de 500 con un
error de muestreo del 9% y nivel de confianza del 99%.
30. Técnicas de análisis de datos
La técnica de análisis se elige en función de los objetivos de la
investigación, el número de variables y su medición.
ESCALAS DE MEDICIÓN:
Nominal: asignación de un número a cada categoría
Sexo: hombre (1), mujer (2)
Ordinal: existe un orden entre categorías
Estudios: sin estudios (1), primarios (2), superiores (3)
Intervalo: existe un orden y la misma distancia entre
categorías, el punto cero existe. Grados de temperatura,
valoración del servicio en un hotel (-2, -1, 0, +1, +2)
Razón o proporción: similar al intervalo pero el punto cero o de
origen indica ausencia. Edad en años, número anual de
kilómetros recorridos, etc.
30
31. Técnicas de análisis de datos
Según el número de variables y la escala de medición
existen tres tipos de técnicas: univariables, bivariables y
multivariables.
TÉCNICAS UNIVARIABLES
Se analiza cada variable de forma aislada. Descriptiva
(medidas resumen), Inferencial (extrapola a la población).
31
ESCALA DE MEDICIÓN DE LA VARIABLETÉCNICAS
UNIVARIABLES Nominal Ordinal Intervalo y Razón
Estadística
descriptiva
Moda
Frecuencias y
porcentajes
Mediana
Cuartiles
Rango intercuartil
Media, mediana, moda
Desviación típica
Varianza
Coef. de variación
Estadística
inferencial
Prueba chi-cuadrado
Prueba binomial
Prueba Komolgorov-
Smirnov
Prueba z (n 30)
Prueba t (n < 30)
32. Técnicas de análisis de datos
TÉCNICAS BIVARIABLES
Establece relación o asociación entre dos variables y
mide su intensidad.
Relaciones descriptivas de asociación (sexo y
categoría de comprador)
Relaciones causales (causa-efecto),
experimentación.
Las más utilizadas en Marketing son X2 y el análisis de
la varianza.
32
33. Técnicas de análisis de datos
TÉCNICAS BIVARIABLES
ESCALA DE MEDICIÓN DE LAS VARIABLES
Nominal Ordinal Nominal u Ordinal (agrupación)
Razón o Intervalo
(dependiente)
Intervalo y Razón
Estadística
descriptiva
Tablas de
contingencia.
Coeficientes de
asociación: Phi, V
de Cramer,
Lambda.
Tablas de contingencia
y de correlación.
Coef. correlación de
rangos de Spearman.
Coeficiente Tau.
Coeficiente Gamma.
Medias por grupos
Desviación típica.
Coeficiente eta.
Coeficiente de correlación
lineal.
Tablas de correlación.
Regresión simple.
Estadística
Inferencial
Muestras
independientes
Prueba Chi-
cuadrado.
Prueba Chi-cuadrado. Análisis de la varianza.
Prueba de Mann-Whitney.
Prueba de Komolgorov-Smirnov.
Prueba de Kruskal-Wallis
Test de la Mediana.
Prueba t sobre coeficiente de
regresión.
Prueba z de diferencia de
medias.
Prueba t de diferencia de
medias
Muestras
relacionadas
Prueba de
McNemar.
Test de Cochran.
Test de Wilcoxon y de
los signos.
Test de Friedman.
33
34. Técnicas de análisis de datos
TÉCNICAS MULTIVARIABLES
Análisis simultáneo de más de dos variables.
Dependencia: analizan una o más variables dependientes a
través dos o más variables independientes, para explicar un
fenómeno y/o realizar un análisis como base de una
predicción.
Técnicas: regresión múltiple, análisis de varianza y conjunto.
Interdependencia: estudian la interrelación entre todas las
variables como un conjunto. Su objetivo puede ser
organizar los datos reduciendo su dimensionalidad y
haciéndolos más manejables para el investigador u ofrecer
una mayor compresión global de su estructura subyacente.
Técnicas: métodos factoriales, análisis cluster, escalamiento
multidimensional métrico y no métrico 34
35. Técnicas de análisis de datos
VARIABLES DEPENDIENTES
VARIABLES
INDEPENDIENTES
Una variable dependiente Más de una variable dependiente
Métrica No métrica Métrica No métrica
Nominal Ordinal
De intervalo Regresión
Múltiple.
Modelos de
ecuaciones
estructurales
Análisis
discriminante.
CHAID.
Regresión logística
y logística
multinomial.
Modelos Probit.
Transformación
en nominal.
Regresión ordinal.
Correlación
canónica.
Modelos de
ecuaciones
estructurales.
Correlación canónica
con variables ficticias.
Nominales Análisis de la
varianza.
Regresión
múltiple con
variables
ficticias.
AID.
Análisis
discriminante con
variables ficticias.
Modelos log-
lineales.
Regresión logística
y multinomial.
CHAID.
Análisis conjunto. Correlación
canónica con
variables ficticias.
Análisis
multivariado de la
varianza.
Correlación canónica
con variables ficticias.
35
TÉCNICAS MULTIVARIABLES DE DEPENDENCIA