Este documento describe los conceptos básicos del muestreo. Explica que el muestreo es el proceso de seleccionar una muestra representativa de una población para estudiarla. Define población como el conjunto total de unidades y muestra como la selección de unidades que representan las características de la población. También cubre los tipos de muestreo probabilístico y no probabilístico, y describe brevemente el muestreo aleatorio simple y sistemático.
1. MUESTREOMUESTREO
PARTE 1:PARTE 1:
GENERALIDADESGENERALIDADES
Una vez definido el problema a investigar,
formulados los objetivos y delimitadas las
variables se hace necesario determinar los
elementos o individuos con quienes se va a
llevar a cabo el estudio o investigación.
2. MUESTREO
Procedimiento por el cual se extraese extrae, de un conjunto
de unidades que constituyen el objeto de estudio
( población), un número de casos reducido (muestra)
elegidos con criterios tales que permitan la
generalización a toda la población de los resultados
obtenidos al estudiar la muestra.
3. CONCEPTOS INICIALES
Población: Conjunto de unidades de las que se desea
obtener cierta información.
Unidades: Personas, Familias, Viviendas, Escuelas,
Organizaciones, Artículos de Prensa
Muestra: Selección de unas unidades concretas de la
población que representen la característica que se
quiere medir.
4. RAZONES DE MUESTREO
Disminución de costos ( tiempo, personal, material)
Al disminuir el número de casos disminuyen
también los errores asociados a la manipulación de
los datos.
Puede confiarse en la generalización de los
resultados si se ha tenido cuidado al seleccionar la
muestra.
5. CRITERIOS IMPORTANTES
PARA LA SELECCIÓN DE LA
MUESTRA
Salvo en poblaciones muy pequeñas y accesibles nunca
se observan a todas las unidades de la población.
Se debe diseñar una muestra que constituya una
representación a pequeña escala de la población a la
que pertenece.
Cualquier diseño muestral comienza con la búsqueda
de la información que ayude a la identificación de las
características de la población bajo estudio.
6. CONDICIONES QUE DEBE
CUMPLIR UNA “BUENA” MUESTRA
Que comprendan parte de la población y no la totalidad
de ésta. ( salvo en los casos antes explicados en la lámina 5)
Aunque el sentido común pareciera indicar que
poblaciones más grandes deben producir muestras
mayores, esto no es siempre cierto ya que:
El tamaño de la población NO es el único elemento que influye en el
tamaño de la muestra.
7. CONDICIONES QUE DEBE
CUMPLIR UNA “BUENA”
MUESTRALa ausencia de distorsión en la elección de los
elementos de la muestra.
Si esta elección presenta alguna anomalía, la muestra
resultará por este mismo hecho viciada.
Que sea representativa o reflejo fiel de la población, de
tal modo que reproduzca sus características básicas en
orden a la investigación.
8. CONDICIONES QUE DEBE CUMPLIR
UNA “BUENA” MUESTRA
Si hay sectores diferenciados en la población que se
supone ofrecen características especiales la muestra
también deberá comprenderlos en la misma
proporción.
9. TAMAÑO DE LA MUESTRA
Es el número de unidades a incluir en la muestra.
Existen varios factores que influyen en el:
Tiempo y recursos disponibles
Modalidad de Muestreo
Tipo de Análisis Previsto
Varianza o heterogeneidad de la población
Margen de Error máximo admisible
Nivel de confianza de la estimación muestral
10. MODALIDAD DE MUESTREO
SELECCIONADA
La selección de las modalidades de muestreo
( probabilísticos y no probabilísticos) se halla
determinada por la confluencia de varios factores: los
objetivos, los recursos, la accesibilidad de la población y
el tiempo.
Los diseños no probabilísticos demandan un tamaño
muestral menor.
11. TIPOS DE MUESTREOS
PROBABILÍSTICOSPROBABILÍSTICOS NO PROBABILISTICOSNO PROBABILISTICOS
•
Todas las unidades tienen igual
probabilidad de participar en
la muestra.
•
La elección de cada unidad
muestral es independiente de las
demás
•
Se puede calcular el error muestral
•
Cada unidad NO tiene igual
probabilidad de participar en
la muestra.
•
No se puede calcular el error
muestral
•
Alto riesgo de invalidez
producido por la introducción de
sesgos
12. USOS DE CADA TIPO DE MUESTREO
Muestreo Probabilísticos
Estimación de
Parámetros
Comprobación de
Hipótesis
Muestreos No
Probabilísticos
Estudios Pilotos
Estudios Cualitativos
Investigaciones en
poblaciones de difícil
registro o localización
( Ej. Marginales,
prostitutas, enfermos de
VIH, etc…)
13. EJEMPLO: ¿MUESTREO
PROBABILÍSTICO?
Se realiza un muestreo entre los alumnos que van a
clases de la Materia Metodología, eligiéndolos al
azar a la entrada del salón.
Este diseño es NO probabilístico porque aquellos queEste diseño es NO probabilístico porque aquellos que
no van a clases NO PUEDEN ser elegidosno van a clases NO PUEDEN ser elegidos
14. EJEMPLO: ¿MUESTREO
PROBABILÍSTICO?
Se utiliza la lista de propietarios de líneas
telefónicas para elegir a aquellos que serán
encuestados.
Este diseño es NO Probabilístico porque aquellos queEste diseño es NO Probabilístico porque aquellos que
no tienen teléfono NO PUEDEN ser elegidosno tienen teléfono NO PUEDEN ser elegidos
15. EJEMPLO: ¿MUESTREO
PROBABILÍSTICO?
Un investigador toma muestras del carbón extraído
de una mina, tomando al azar trozos de carbón de la
parte superior de cada carro.
Este diseño es NO probabilísticoEste diseño es NO probabilístico
porque solo se toma carbónporque solo se toma carbón
de la parte superiorde la parte superior
16. FACTORES QUE INFLUYEN EN EL
TAMAÑO DE LA MUESTRA :TIPO DE
ANÁLISIS DE DATOS PREVISTO
La técnica de análisis influye en el tamaño de la
muestra:
Comparación de Medias
Estimación de Proporciones ( parámetros)
Análisis Univariables
Análisis Multivariables
17. HETEROGENEIDAD POBLACIONAL
Cuanto mas heterogénea sea la población mayor será su
varianza poblacional lo que implicará mayores tamaños
muestrales.
Cuando se desconoce el valor de la varianza poblacional
se recurre al supuesto mas desfavorable, asumiendo
una varianza poblacional igual a 0,5.
0,5 significa que una unidad seleccionada tiene 50 % de
posibilidades de pertenecer o no a un grupo específico
dentro de la población
20. ERROR ALEATORIO
El error aleatorio no se suele ajustar a ninguna regla o
norma , varían en cada caso , en su sentido y magnitud,
y por ello tiende a anularse cuando se trata de un
número elevado de casos.
Los errores aleatorios se comenten, por ejemplo, cuando un
encuestado elige erróneamente una casilla queriendo
hacerlo en otra, cuando un encuestador marca
erróneamente un dato, etc.
21. ERRORES SISTEMÁTICOS
Un error sistemático es aquel que se produce de igual modo (
sentido y proporción) en todas las mediciones que se
realizan sobre un parámetro de la muestra
Contrario al error aleatorio, NO se anula en muestras
grandes.
22. ERRORES SISTEMÁTICOS.
EJEMPLOS
Las tendencias subjetivas conscientes o inconscientes
del investigador.
Sustituciones, según criterio propio del investigador, de
unidades de la muestra que habían sido elegidas al
azar.
Insuficiente observación del conjunto de la población
que influye en una deficiente definición de sus
características.
23. ERROR MUESTRAL
Cuando se extrae una muestra de una población es
frecuente que los resultados obtenidos de la muestra no
sean exactamente los valores reales de la población.
El error de muestreo ocurre al estudiar una muestra en
lugar de la población total.
La diferencia entre el valor del parámetro de una
población y el obtenido de una muestra recibe el nombre
de error muestral. ( y que no puede ser asociado a otro tipo de
explicación, es decir no es error aleatorio o sistemático)
24. ERROR MUESTRAL
Por muy perfecta que sea la muestra siempre habrá
grado de divergencia entre los parámetros estimados
usándola y los de la verdadera población.
En el cálculo del error intervienen:
Tamaño de la muestra
Varianza poblacional
Nivel de confianza
Tipo de muestreo
25. ESTIMACIÓN DEL ERROR
Cuando variable bajo estudio es una media. (solo
válido para variables numéricas)
Donde:
Z: grado de confianza de la estimación
s: desviación típica muestral de la variable analizada
n: tamaño de la muestra
1-f: Factor de corrección para poblaciones finitas. f= n/N
fze −= 1
n
s
26. EL ERROR MUESTRAL ES
MAYOR EN LA MEDIDA QUE:
Crece el grado de confianza que el investigador
quiere dar a su estimación del parámetro medido
mediante la muestra
Es más elevada sea la variabilidad de la variable
estudiada.
Es menor el tamaño de la muestra.
27. ESTIMACIÓN DEL ERROR
Cuando la variable bajo estudio es una proporción
(ej, variables nominales u ordinales con pocas
categorías)
Donde:
Z: grado de confianza de la estimación
p: proporción de la muestra para la categoría a examinar
q: 1-p
n: tamaño de la muestra
1-f: Factor de corrección para poblaciones finitas. f= n/N
f
n
pq
ze −
−
= 1
1
29. MARGEN DE CONFIANZA EN LA
ESTIMACIÓN
Expresa el grado de probabilidad que el investigador
tiene en que su estimación se ajuste a la realidad.
Los valores comúnmente utilizados son 95, 99, 99,9%
30. CORRECCIONES PARA
POBLACIONES FINITAS
Cuando el tamaño de la muestra es mayor del 5 %
del tamaño de la población se debe utilizar el
factor de corrección.
Si por el contrario N>>n, f tiene a 0 y el factor de
corrección ( 1-f) tienen a 1.
31. MARGEN DE ERROR ADMISIBLE
Los incrementos en el tamaño de la muestra repercuten
en una mayor precisión y por consiguiente en menor
error muestral.
El error muestral interviene en el cálculo del tamaño de
la muestra solo si el diseño es probabilístico.
En el muestreo probabilístico el investigador fija el
error máximo admisible a priori y sobre esa base realiza
el cálculo del tamaño de la muestra.
32. CÁLCULO DEL TAMAÑO DE LA
MUESTRA *
2
=
e
zs
n 2
2
1
e
pqz
nn =−≅
Para comparaciones de
media
Para estimación de
proporciones
* Para poblaciones infinitas (donde N>> n )
34. EJEMPLO DEL CÁLCULO DEL
TAMAÑO DE LA MUESTRA
(POBLACIÓN INFINITA)Estimando qué proporción de sujetos poseen una
característica al nivel de confianza del 99.7% (Z=3) y un
error de admitido del 2%, será:
EL TAMAÑO DE LA POBLACIÓN NO FUE TOMADO
EN CUENTA!!!
POR QUÉ P y Q valen 50 % ?
5625
2
50503
2
2
==
xx
n
35. CÁLCULO DEL TAMAÑO DE LA
MUESTRA PARA POBLACIONES
FINITAS. (F=N/N>0,05)Ej. El número óptimo para un
estudio de 60.000 personas
estableciendo un nivel de
confianza de 95.5%(z=2), y el
margen de error en el 3%, sería
4 * 50 * 50 * 60.000
n = ---------------------------------
9 (60.000-1) + 4 * 50 * 50
n= 1091
pqZNe
pqNZ
n 22
2
)1( +−
=
36. TAMAÑO DE LA MUESTRA
Fuente: Metodología y Técnicas de Investigación Social. Piergiorgio Corbetta
38. RECORDANDO: TIPOS DE MUESTREOS
PROBABILÍSTICOSPROBABILÍSTICOS NO PROBABILISTICOSNO PROBABILISTICOS
•
Todas las unidades tienen igual
probabilidad de participar en
la muestra.
•
La elección de cada unidad
muestral es independiente de las
demás
•
Se puede calcular el error muestral
•
Cada unidad NO tiene igual
probabilidad de participar en
la muestra.
•
No se puede calcular el error
muestral
•
Alto riesgo de invalidez
producido por la introducción de
sesgos
40. MUESTREOS PROBABILÍSTICOS:
SIMPLE
Se realiza utilizando alguna fuente de elección
aleatoria.
Supone que cada miembro de la población tiene
elemento que lo identifica ( ej. Un número
identificador) y mediante el cual puede ser elegido si
“sale” sorteado.
La afirmación anterior implica que hay que tener un
listado completo de TODOS los miembros de la
población
41. MUESTREOS PROBABILÍSTICOS: SIMPLE
Ventajas
Facilidad en los cálculos
estadísticos
Elevada probabilidad de
lograr “equivalencia” entre
las características de la
muestra y las
correspondientes a la
población
Desventajas
Cada que cada miembro de
la población tiene que ser
identificado
Complicado en poblaciones
grandes
Alto costo
42. MUESTREOS PROBABILÍSTICOS:
MUESTREO ALEATORIO
SISTEMÁTICO Similar al muestro simple salvo que:
1. Solo la primera unidad de la muestra se elige al azar siempre
que el número seleccionado sea mayor que el coeficiente de
elevación.
Coeficiente de Elevación = N/ n
Donde
N: Tamaño de la población
n : Tamaño de la muestra
1. Los restantes elementos de la muestra se hayan sumando,
sucesivamente el coeficiente de elevación.
43. MUESTREOS PROBABILÍSTICOS:
MUESTREO ALEATORIO
ESTRATIFICADOPresupone el conocimiento de las características de las
unidades que forman la población para poder dividirla
en grupos ( estratos)
Se eligen los miembros de la muestra en cada estrato
creado siguiendo algún tipo de muestreo de los vistos
anteriormente.
44. EJ. MUESTREO PROBABILÍSTICO
POR ESTRATOS
Estrato Primario
Se seleccionan ALEATORIAMENTE ni profesores de cada una de las escuelas seleccionadas .
Ej.
2 de la escuela primaria 1 y 2 de la escuela primaria 2.
45. MUESTREOS PROBABILÍSTICOS:
MUESTREO ALEATORIO
ESTRATIFICADO CONT…
El objetivo de este tipo de muestreo es garantizar la
representatividad equitativa de los estratos ( que
implica representación equitativa de las características
de la población).
Se logra si:
Son máximas las diferencias entre los estratos
Son mínimas las diferencias entre los miembros de un mismo
estrato.
Los criterios de división de la población en estratos se hallen
relacionadas con los objetivos de la investigación.
46. MUESTREOS PROBABILÍSTICOS:
MUESTREO ALEATORIO
ESTRATIFICADO CONT…
• Los tamaños de cada estrato pueden ser:
Los mismos ( Afiliación simple)
Proporcional al peso relativo ( tamaño) del estrato dentro de
la población (Proporcional)
En función de la heterogeneidad de cada estrato ( Óptima)
50. EJEMPLO DE MUESTREO POR
ESTRATOS. AFILIACIÓN ÓPTIMA
33600210016
101400260039
85500190045
=
=
=
x
x
x
Paso 1 : Multiplicar el porcentaje de la población correspondiente al estrato por la
varianza del estrato
Paso 2: Se suman todos los valores obtenidos en el paso 1 (85500+101400+33600=220500)
Paso 3: Se calcula a proporción de cada valor obtenido en el paso 1 dentro del paso 2.
152,0220500/33600Pr
460,0220500/101400Pr
388,0220500/85500Pr
3
2
1
==
==
==
estrato
estrato
estrato
oporción
oporción
oporción
Paso 4 : Se calcula el tamaño de la muestra de cada estrato multiplicando
su proporción por el tamaño de la muestra global ( 2500)
∑ =
=
=
=
2500380,1150,970
3802500152,0
11502500460,0
9702500388,0
x
x
x
51. VENTAJAS Y DESVENTAJAS DEL
MUESTREO ALEATORIO
ESTRATIFICADO
1. No es necesario
disponer de la lista de
toda la población sino
de las subpoblaciones
de orden superior
extraídas ( por ej. las
escuelas primarias y
secundarias)
2. Existe una
considerable reducción
de costos
Puede ocurrir que los
miembros de una
unidad superior se
parezcan, reduciendo
la representatividad
de otros en la muestra
final.
Ventajas Desventajas
52. MUESTREO ALEATORIO POR
CONGLOMERADOS
La unidad muestral es un grupo de elementos de la
población que forman una unidad, a la que llamamos
conglomerado.
A diferencia de un estrato, un conglomerado es una
unidad de elementos que contienen representantes de
toda la población
55. VENTAJAS DEL MUESTREO POR
CONGLOMERADOS
Es ventajoso, desde el punto de vista de costos, si se
pueden agrupar los miembros de la población por
conglomerados, en los cuales el criterio de agrupación
no sea la variable que se estudia.
No es preciso tener un listado de toda la población, sino
de las unidades ( conglomerados) por los que se
agruparán.
58. MUESTRO POR CUOTAS
La población debe ser dividida en estratos
definidos por variables cuya distribución dentro
de la población sea conocida.
Se procede a calcular el tamaño de cada estrato
siguiendo el mismo procedimiento que si fuese un
muestreo probabilístico estratificado.
( proporcional)
59. MUESTRO POR CUOTAS
A diferencia del M. Probabilístico Estratificado el
entrevistador es libre para escoger a quienes
forman parte de cada estrato. (CUOTA)
60. MUESTREO POR CUOTAS
Resulta más
económico que los
muestreos
probabilísticos .
Fácil de ejecutar el
trabajo de campo
No precisa el listado
de la población
Supone mayor error muestral
que los diseños
probabilísticos.
No existe un método válido
para calcular el error.
Dificultas para el control del
trabajo de campo.
Limitaciones en la
representatividad de la
muestra para las
características no
especificadas en los controles
de cuotas.
Ventajas Desventajas
61. MUESTREO DE BOLA DE NIEVE
Este modelo es particularmente útil cuando se
muestrean poblaciones cuyos componentes, por
motivos morales, ideológicos, legales o políticos
tienen a ocultar su identidad.
A partir de unos pocos individuos el entrevistador,
con ayuda de los primeros, va “ conociendo” a
nuevos miembros de la muestra.
62. MUESTREO BOLA DE NIEVE
El riesgo fundamental está asociado a la selección
inadecuada de los primeros miembros de la
muestra y de quienes dependerá el resto.
También es posible que ocurran distorsiones si no
se tiene en cuenta criterios muy específicos para
la selección de la muestra.
64. ERRORES DE COBERTURA
¿ Como se puede hacer un muestreo probabilístico
si las unidades no son conocidas?
¿Cómo localizar a todos los posibles miembros de
la población?
Si se busca investigar sobre franjas particulares
de la población el problema se hace más difícil de
manejar
65. ERROR DE COBERTURA
Se produce cuando no son incluidos determinados
elementos de la población objeto de estudio en el
proceso de selección muestral .
La falta de cobertura impide la cooperación de un
número de unidades muestrales, puesto que
determinados individuos no pueden ser
seleccionados en la muestra, dificultando con ello la
capacidad de inferencia de los hallazgos de la
investigación.
66. ERROR DE COBERTURA
Este error produce una subestimación en los
resultados, cuya amplitud depende de las
características de las unidades omitidas
67. PROBLEMAS DE REPRESENTATIVIDAD
Si no se ha logrado representatividad en una o varias
variables, el investigador tiene 3 opciones:
a) Trabajar con la muestra no representativa y contar con
ese límite
b) Redefinir la población. Por ejemplo: no hablar de
enfermos de SIDA sino de enfermos de SIDA que son
atendidos en el HULA.
c) Modificar deliberadamente la muestra para que
represente el comportamiento de la variable bajo estudio.
70. EJEMPLOS DE ERRORES DE NO
RESPUESTA
El entrevistado puede no contestar una pregunta
por falta de conocimiento sobre esa cuestión, por
considerarla muy entrometida al invadir el ámbito
de su privacidad, porque la considera irrelevante
para los objetivos del estudio, etc.
El entrevistador también contribuye a la no
respuesta parcial por el “olvido” a la hora de
recoger determinadas respuestas, o al tomarlas
equivocadamente.
Ejemplos tomados de : HEADY, P. (1995). «Calibrating Measurement Error in the 1991 Census». Survey
Methods Centre Newsletter, vol. 15, nº 2, p. 3-7.
71. EJEMPLOS DE ERRORES DE NO
RESPUESTA
Por último, el cuestionario genera no respuestas
por problemas en la redacción de las preguntas, y
por la utilización de preguntas «filtro» para que
un grupo de preguntas no sean respondidas por
determinados entrevistados que cumplen (o no
cumplen) una serie de requisitos.