2. Distribuciones de muestreo fundamentales y descripciones de datos
Muestreo aleatorio
En ocasiones en que no es posible o conveniente realizar un censo (analizar a todos los elementos de
una población), se selecciona una muestra, entendiendo por tal una parte representativa de la
población. El muestreo es por lo tanto una herramienta de la investigación científica, cuya función
básica es determinar que parte de una población debe examinarse, con la finalidad de hacer
inferencias sobre dicha población.
Poblaciones y muestras
Una población consta de la totalidad de las observaciones en las que estamos
interesados.
Una muestra es un subconjunto de una población.
3. Algunos estadísticos importantes
Cualquier función de las variables aleatorias que forman una muestra aleatoria se llama estadístico.
Medidas de localización de una muestra: la media, la mediana y la moda
muestrales
a) Media muestral:
Medidas de localización de una muestra: la media, la mediana y la moda
muestrales
b) Mediana muestral:
4. c) La moda muestral es el valor que ocurre con mayor frecuencia en la muestra.
Ejercicio
Conjunto ficticio de datos que representan el gasto en miles de pesos de una familia
colombiana. 12,15,18,20,22,25,28,30,35
Calcule: a) la media; b) la mediana y c) la moda
5. Las medidas de variabilidad de una muestra: la varianza, la desviación estándar y
el rango de la muestra
a) La varianza muestral:
6. Puntajes máximos por etnias: https://www.datos.gov.co/Educaci-n/RESULTADOS-ICFES-POR-ETNIAS-PUNTAJE-
MAXIMO-/k6cf-r49y
Calcule: a) la media; b) la varianza y c) la desviación estándar
7. Distribuciones muestrales
El campo de la inferencia estadística trata básicamente con generalizaciones y predicciones.
Definición: La distribución de probabilidad de un estadístico se denomina distribución muestral.
La distribución muestral de un estadístico depende de la distribución de la población, del tamaño de las
muestras y del método de selección de las muestras.
Distribución muestral de medias
Teorema: Supongamos que la población en donde se hace el muestreo es finita de tamaño 𝑁.
a) Cuando el muestreo se hace con reemplazo, entonces,
• La media 𝜇𝑋 de la distribución muestral de X es igual a la media de la población en que se toma la
muestra, es decir, 𝜇𝑋 = 𝜇.
• La varianza 𝜎𝑋
2
de la distribución muestral es igual a la varianza de la población dividida por el tamaño de
la muestra, es decir, 𝜎𝑋
2
=
𝜎2
𝑛
.
8. b) Cuando el muestreo se hace sin reemplazo, entonces,
• La media 𝜇𝑋 de la distribución muestral de X es igual a la media de la población en que se toma la muestra, es decir,
𝜇𝑋 = 𝜇.
• La varianza 𝜎𝑋
2
de la distribución muestral es igual a 𝜎𝑋
2
=
𝜎2
𝑛
𝑁−𝑛
𝑁−1
.
Ejemplo Supongamos que se eligen muestras de tamaño 2 de una población de tamaño 3 con valores 0, 2 y 4.
(a) Si el muestreo se hace con reemplazo, entonces, verifique el teorema inciso a.
(b) Si el muestreo se hace sin reemplazo, entonces, verifique el teorema inciso b.
Muestra 𝑥 𝑥 − 𝜇 2
( 0 , 0) 0 4
( 0 , 2) 1 1
( 0 , 4) 2 0
( 2 , 0) 1 1
( 2 , 2) 2 0
( 2 , 4) 3 1
( 4 , 0) 2 0
( 4 , 2) 3 1
( 4 , 4) 4 4
𝜇 =
0 + 2 + 4
3
= 2
𝜎2
=
0 − 2 2 + 2 − 2 2 + 4 − 2 2
3
𝜎2 =
8
3
𝜇𝑋 = 𝜇 y 𝜎𝑋
2
=
𝜎2
𝑛
.
𝜇𝑋 =
0 + 1 + 2 + 1 + 2 + 3 + 2 + 3 + 4
9
𝜇𝑋 = 2 = 𝜇
𝜎𝑋
2
=
4 + 1 + 0 + 1 + 0 + 1 + ´0 + 1 + 4
9
𝜎𝑋
2
=
12
9
=
4
3
=
8/3
2
9. Ejemplo Supongamos que se eligen muestras de tamaño 2 de una población de tamaño 3 con valores 0, 2 y 4.
(a) Si el muestreo se hace con reemplazo, entonces, verifique el teorema 1.3.1a.
(b) Si el muestreo se hace sin reemplazo, entonces, verifique el teorema 1.3.1b.
Muestra 𝑥 𝑥 − 𝜇 2
( 0 , 2) 1 1
( 0 , 4) 2 0
( 2 , 0) 1 1
( 2 , 4) 3 1
( 4 , 0) 2 0
( 4 , 2) 3 1
𝜇 =
0 + 2 + 4
3
= 2
𝜎2
=
0 − 2 2
+ 2 − 2 2
+ 4 − 2 2
3
𝜎2 =
8
3
𝜇𝑋 = 𝜇 y 𝜎𝑋
2
=
𝜎2
𝑛
𝑁−𝑛
𝑁−1
.
𝜇𝑋 =
1 + 2 + 1 + 3 + 2 + 3
6
𝜇𝑋 =
12
6
= 2 = 𝜇
𝜎𝑋
2
=
1 + 0 + 1 + 1 + 0 + 1
6
𝜎𝑋
2
=
4
6
=
2
3
𝜎𝑋
2
=
8/3
2
3 − 2
3 − 1
=
4
3
1
2
=
2
3
10. Teorema: Cuando el muestreo se hace en una población infinita, entonces, sin importar si el muestreo es con o sin
reemplazo , se tiene que
• La media 𝜇𝑋 de la distribución muestral de X es igual a la media de la población en que se toma la muestra, es decir,
𝜇𝑋 = 𝜇.
• La varianza 𝜎𝑋
2
de la distribución muestral es igual a la varianza de la población dividida por el tamaño de la muestra,
es decir, 𝜎𝑋
2
=
𝜎2
𝑛
. (con la condición de que la población en que se toma la muestra tenga una varianza conocida)
𝝁𝑿 = 𝝁 Población finita Población infinita
Muestreo con reemplazo 𝜎𝑋
2
=
𝜎2
𝑛
𝜎𝑋
2
=
𝜎2
𝑛
Muestreo sin reemplazo 𝜎𝑋
2
=
𝜎2
𝑛
𝑁 − 𝑛
𝑁 − 1
𝜎𝑋
2
=
𝜎2
𝑛
Resumen
12. Ejercicios
Cinco mil personas se presentaron a un control de peso. El peso promedio fue 75 kilogramos y la desviación estándar 10. Si
de esta población de pesos se toman 300 muestras aleatorias de tamaño 40, encuentre:
(a) 𝜇𝑋 y 𝜎𝑋.
(b) el número aproximado de medias muestrales que caen entre 73 y 77 kilogramos.
(c) la cantidad aproximada de medias muestrales superiores a 72 kilogramos.
Solución:
(a) 𝜇𝑋 = 75 y 𝜎𝑋 =
𝜎2
𝑛
=
𝜎
𝑛
=
10
40
= 1,58
(b) 𝑃 73 < 𝑋 < 77 = 𝑃
73−75
1,58
< 𝑍 <
73−75
1,58
= 𝑃 −1,26 < 𝑍 < 1,26
𝑃(73<𝑋<77)=𝑃(𝑍<1,26)−𝑃(𝑍<−1,26)=0,8962−0,1038=0,7924
Por lo tanto el número aproximado de medias muestrales que caen entre 73 y 77 kilogramos será 300×0,7924≈238
(c) 𝑃 𝑋 > 72 = 1 − 𝑃 𝑋 ≤ 72 = 1 − 𝑃 𝑍 ≤
72−75
1,58
= 1 − 𝑃 𝑍 ≤ −1,89
𝑃 𝑋 > 72 = 1 − 0,0294 = 0,9706
Por lo tanto la cantidad aproximada de medias muestrales superiores a 72 kilogramos será 300 × 0,9706 ≈ 291
13. Ejercicio
La duración de ciertos componentes eléctricos producidos por una determinada empresa tiene una media de 1.200 horas y
una desviación estándar de 400 horas. La población sigue una distribución normal. Suponga que usted ha comprado 9
bombillas, que pueden ser consideradas como una muestra aleatoria de la producción de la empresa.
(a) ¿Cuál es la media de la media muestral de la duración de estos componentes eléctricos?
(b) ¿Cuál es la varianza de la media muestral?
(c) ¿Cuál es el error estándar de la media muestral?
(d) ¿Cuál es la probabilidad de que el tiempo medio de duración de tres componentes eléctricos sea de menos de 1.050
horas?
Solución:
Para este caso tenemos que n = 9 < 30, población normal con desviación estándar poblacional conocida
(a) 𝜇𝑋 = 1.200 (b) 𝜎𝑋
2
=
𝜎2
𝑛
=
4002
9
= 17.777,77 (c) 𝜎𝑋 = 𝜎𝑋
2
= 17.777.77 = 133,33
(d) 𝑃 𝑋 < 1.050 = 𝑃 𝑍 <
1.050−1.200
133,33
= 𝑃 𝑍 < −1,125 = 0,1303
14. Distribución muestral de la media muestral para muestras pequeñas
Si el muestreo se hace en una población normal con varianza desconocida y si las muestras
seleccionadas son de tamaño n < 30, entonces, la distribución muestral de la media muestral X es la t de
Student con n − 1 grados de libertad.
Este teorema implica que la variable aleatoria 𝑡 =
𝑋−𝜇𝑋
𝜎𝑋
tiene distribución t con n − 1 grados de libertad.
Donde 𝜇𝑋 es la media de la población y 𝜎𝑋 =
𝑠
𝑛
1. Suponga que de una población normal con media 20 se toma una muestra de tamaño 16. Si la
desviación estándar muestral es 4, encuentre la probabilidad de que la media muestral sea
estrictamente mayor que 21,753.
2. Una muestra aleatoria de seis autos de un determinado modelo consumen las siguientes cantidades
en kilómetros por litro:
18, 6 18, 4 19, 2 20, 8 19, 4 20, 5.
Determine la probabilidad de que el consumo de gasolina medio muestral de los automóviles de este
modelo sea menor que 17,6 kilómetros por litro, suponiendo que la distribución de la población es
normal con media 17.
Ejemplos
15. Ejemplo: Una muestra aleatoria de seis autos de un determinado modelo consumen las siguientes cantidades en
kilómetros por litro:
18, 6 18, 4 19, 2 20, 8 19, 4 20, 5.
Determine la probabilidad de que el consumo de gasolina medio muestral de los automóviles de este modelo sea
menor que 17,6 kilómetros por litro, suponiendo que la distribución de la población es normal con media 17.
Solución:
Media poblacional 𝜇 = 17. Poblacional normal con varianza desconocida
Media muestral 𝑥 = 𝑖=1
𝑛
𝑥𝑖
𝑛
=
116,9
6
= 19,4833
Desviación estándar muestral 𝑠 = 𝑖=1
𝑛
𝑥𝑖−𝑥 2
𝑛−1
=
4,8083
6−1
= 0,980
Grados de libertad 𝜈 = 𝑛 − 1 = 5
Media de la media muestral 𝜇𝑋 = 17
Error estándar de la media muestral 𝜎𝑋 =
𝑠
𝑛
=
0,980
6
≈ 0,40
𝑃 𝑋 ≤ 17,6 = 𝑃 𝑡5 ≤
17,6 − 17
0,40
= 𝑃 𝑡5 ≤ 1,5 = 1 − 𝑃 𝑡5 > 1,5 ≈ 1 − 0,10 = 0,9
16. Distribución muestral de una proporción muestral
Sea X el número de éxitos en una muestra binomial de n observaciones, donde la probabilidad de éxito es p. Entonces, la
proporción de éxitos en la muestra 𝑝 =
𝑋
𝑛
recibe el nombre de PROPORCIÓN MUESTRAL.
En la mayoría de las aplicaciones, el parámetro p será la proporción de individuos de una gran población que posean la
característica de interés.
Teorema Sea p la proporción de éxitos en una muestra aleatoria de n observaciones. Sea p la proporción de éxitos en la
población. Entonces, la distribución muestral de la proporción muestral 𝑝 tiene media 𝜇𝑝 = 𝑝 y varianza 𝜎𝑝
2
dada por
17.
18. (Teorema de De Moivre-Laplace) Sea 𝑝 la proporción de éxitos en una muestra aleatoria de n
observaciones. Si se cumple alguna de las dos condiciones siguientes:
• n ≥ 30 o
• np ≥ 5 y n(1 − p) ≥ 5,
entonces, la distribución muestral de la proporción muestral p se puede aproximar con una distribución normal.
Este teorema implica que la variable aleatoria 𝑍 =
𝑝−𝜇𝑝
𝜎𝑝
tiene distribución normal. Aquí, 𝜇𝑝 y varianza 𝜎𝑝 se calculan
de acuerdo al teorema anterior.
1. Se toma una muestra de 250 casas de una población de edificios antiguos para estimar la proporción de casas de
este tipo cuya instalación eléctrica resulta insegura. Supongamos que, de hecho, el 30% de todos los edificios de
esta población tienen una instalación insegura. Hallar la probabilidad de que la proporción de edificios de la
muestra con instalación insegura esté entre 0,25 y 0,35.
2. Hallar la probabilidad de que en 200 lanzamientos de una moneda no falsa, el número de caras esté
comprendido en el 40% y el 60%.
Ejemplos
21. 1. Los hombres y mujeres adultos radicados en una ciudad grande del norte de cierto país difieren en sus
opiniones sobre la promulgación de la pena de muerte para personas culpables de asesinato. Se cree
que el 12% de los hombres adultos están a favor de la pena de muerte, mientras que sólo el 10% de las
mujeres adultas lo están. Si se pregunta a dos muestras aleatorias, una de 150 hombres y otra de 100
mujeres, su opinión sobre la promulgación de la pena de muerte para personas culpables de asesinato,
determine la probabilidad de que el porcentaje de hombres a favor sea al menos 3% mayor que el de
mujeres.
Ejemplos
22. 2. Se cree que 0,16 de las industrias de un área metropolitana I son textiles. Se cree además que en un
área metropolitana II esta proporción es de 0,11. Si estas cifras son exactas, ¿cuál es la probabilidad de
que una muestra aleatoria simple de 200 industrias del ´área I y una muestra aleatoria simple
independiente de 225 industrias del área II arrojen una diferencia entre las proporciones muestrales
mayor o igual que 0,10?
Ejemplos
23. Distribución muestral de diferencia de medias
Primer caso: varianzas poblacionales conocidas o desconocidas y muestras grandes
1
24.
25.
26.
27. Segundo caso: varianzas poblacionales desconocidas, iguales y muestras pequeñas.
2
Varianza muestral combinada