Este documento trata sobre los métodos y distribución de muestreo. Explica que el muestreo se utiliza para inferir características de una población mediante una muestra representativa. Describe diferentes métodos de muestreo como el aleatorio simple, estratificado y por conglomerados. También explica cómo calcular intervalos de confianza para la media y proporción de una población, y cómo determinar el tamaño apropiado de una muestra.
2. Muestreo
El muestreo es una herramienta para inferir algo
respecto de una población mediante la selección de
una muestra de esa población.
3. Objetivos
Porqué utilizar una muestra.
Métodos para seleccionar una muestra.
Diseñar una distribución de muestreo para la media
de la muestra.
Teorema del límite central.
Calcular los intervalos de confianza para la media y
la proporción.
Determinar el tamaño de la muestra para el número
de atributos y de variables.
4. Porqué utilizar una muestra
1. Costo.
2. Los resultados de una muestra son
significativamente representativos de la población.
3. Tiempo.
4. En ocasiones es necesario preservar la población
(estudiarla la destruiría).
5. Imposibilidad de acceder a todos los sujetos de la
población.
6. Probabilísticas
Muestreo aleatorio simple.
Todos los elementos de la población tienen la misma
probabilidad de ser parte de la muestra.
Para seleccionarlos se emplea, por ejemplo, una tabla de
números aleatorios.
Muestreo aleatorio sistemático.
Igual que la anterior, pero se seleccionan siguiendo un
“sistema”, por ejemplo: teniendo la lista de sujetos, seleccionar
el primero al azar y, a partir de éste, cada n-ésimo.
7. Muestreo aleatorio estratificado.
Igual que el aleatorio (por eso el nombre), pero, para
seleccionar la muestra , se agrupa la población de acuerdo a
alguna característica (el sexo, por ejemplo) y se determina el
porcentaje que cada grupo (llamado “estrato”) tiene en la
población. Luego, se selecciona la muestra considerando tal
proporción de cada estrato.
8. Muestreo por conglomerados.
Es aplicar el muestreo aleatorio a una población, usualmente
muy numerosa y dispersa, que se puede agrupar en “unidades
primarias”. Por ejemplo, las colonias en una sección electoral).
Entonces, se seleccionan aleatoriamente estas unidades
primarias y luego, dentro de estas unidades primarias, se
seleccionan los sujetos de su muestra.
10. Diseñar una distribución de muestreo para la
media de la muestra
Error de muestreo
Diferencia entre el estadístico y el parámetro.
11. Distribución muestral de las medias de las muestras
Distribución de probabilidad de todas las medias
posibles de las muestras de un tamaño de muestra
dado.
12. Ejercicio
P. 233 (7-3)
Encuentre la media de la población.
Encuentre la media de todas las medias de la
muestras.
13. Teorema del límite central
Si en cualquier población se seleccionan muestras de
un tamaño específico, la distribución muestral de las
medias de la muestra es aproximadamente una
distribución normal. Esta aproximación mejora con
muestras de mayor tamaño.
14. Calcular los intervalos de confianza para la media y la
proporción
Estimador puntual.
Valor que se calcula a partir de la información de la muestra y se utiliza para
estimar el parámetro de la población.
Es decir, no se cuenta con los datos de la población. Se cuenta con los datos
de algún estudio previo o con estimaciones basadas en datos históricos.
Éstos datos (la media y la desviación estándar, por ejemplo) se considerarán
como los parámetros.
15. Intervalo de confianza
Rango de valores que se construye a partir de datos
de la muestra de modo que el parámetro ocurre
dentro de dicho rango con una probabilidad
específica. La probabilidad específica se conoce como
nivel de confianza.
16. Aplicación del teorema del límite central
Para muestras razonablemente grandes, es posible
decir que:
95% de las medias de las muestras seleccionadas de una
población están a 1.96 desviaciones estándar de la media de la
población (µ).
99% de la s medias de las muestras estarán dentro de 2.58
desviaciones estándar de la media de la población.
17. El error estándar de la media de la muestra
Es la desviación estándar de la distribución muestral de las
medias de las muestras.
Como generalmente no se conoce la desviación estándar de
la población, se utiliza s.
Cuando el tamaño de la muestra es > 30, generalmente se
acepta que el teorema del límite central asegurará una
distribución normal de las medias de las muestras.
n
20. Intervalo de confianza para una proporción de la población
Proporción de la población.
Es la probabilidad clásica de un evento, dado un experimento
que no considera toda la población; por lo tanto, es un
estimador puntual.
n
PP
zP
)1(
23. Factor de corrección de una población finita
Cuando la población tiene un límite superior fijo, no es infinita, sino finita.
Entonces, se hacen los siguientes ajustes a los errores estándar de las medias de
la muestra y la proporción:
1
N
nN
n
1
)1(
N
nN
n
PP
P
Error estándar de
las medias de la
muestra
Error estándar de las
proporciones de la
muestra
Nota: Si la relación n/N < 0.05, se ignora el factor de corrección.
24. Determinar el tamaño de la muestra para el número de
atributos y de variables
El tamaño de una muestra depende de tres factores:
1. El nivel de confianza que se desea.
2. El margen de error que puede tolerar el investigador.
3. La variabilidad en la población que se estudia.
25. Nivel de confianza
Un nivel de confianza de 90% corresponde a un valor z de ± 1.65.
Un nivel de confianza de 95% corresponde a un valor z de ± 1.96.
Un nivel de confianza de 99% corresponde a un valor z de ± 2.58.
Mientras más alto sea el nivel de confianza,
mayor será el tamaño de la muestra.
26. Margen de error
El error máximo permisible es la cantidad que se suma o se
resta de la media de la muestra, para determinar los
extremos del intervalo de confianza.
Es la mitad de la amplitud del intervalo de confianza
correspondiente.
Un error permisible pequeño requerirá una muestra grande
y un error permisible grande, permitirá una muestra
menor.
27. La desviación estándar de la población
Si se tiene una dispersión amplia, se requiere una muestra
grande, y si la población está concentrada, se requiere una
muestra más pequeña.
Tres formas de obtener la desviación estándar:
1. Enfoque del estudio comparativo.
Obtener un estudio previo, propio o ajeno, pero confiable.
2. Enfoque de aproximación basada en el rango.
La desviación estándar es, aproximadamente, una sexta parte del rango.
3. Enfoque del estudio piloto.
Realice un estudio cuantitativo, descriptivo previo y estime la desviación
estándar.
28. Tamaño de la muestra para estimar una media
2
E
sz
n