Capítulo 7: Distribuciones muestrales
Recordemos:
Parámetro es una medida de resumen
numérica que se calcularía usando todas
las unidades de la población.
Es un número fijo.
Generalmente no lo conocemos.
Estadística es una medida de resumen
numérica que se calcula de las unidades
de la muestra.
El valor de la estadística se conoce
cuando tomamos una muestra,
pero varia de muestra en muestra
variación muestral
Inferencia estadística: es el proceso de
sacar conclusiones de la población
basados en la información de una muestra
de esa población.
Objetivos de la inferencia:
estimación de parámetros,
intervalos de confianza y
docimasia, test de hipótesis o pruebas
de significación estadística.
Distribuciones muestrales
Una estadística muestral proveniente de
una muestra aleatoria simple tiene un
patrón de comportamiento (predecible) en
repetidas muestras. Este patrón es
llamado la distribución muestral de la
estadística.
Si conocemos la distribución muestral
podemos hacer inferencia.
Las distribuciones muestrales adoptan
diferentes formas según las estadísticas
investigadas y las características de la
población estudiada.
7.1 Distribución muestral
de una
proporción muestral
La distribución muestral de la
proporción muestral es la distribución
de los valores de las proporciones
muestrales de todas las posibles muestras
del mismo tamaño n tomadas de la
misma población.
Suponga que estamos interesados
en conocer la proporción de mujeres en
Chile. Nuestro parámetro de interés
es:
Chileenhabitantesdenúmero
Chileenmujeresdenúmero
=P
La población es demasiado grande. Hacer un
censo sería demasiado caro. Decidimos
estimar el verdadero parámetro a partir de
una muestra.
La proporción muestral sería:
muestraladetamaño
muestralaenmujeresdenúmero
ˆ =p
Supongamos que sabemos que 5,0=P ¿Qué
pasa si tomamos una muestra tamaño 20=n ?
Muestra #1:
H M H H H M M M H H H M H M M H H M H M
Proporción de mujeres $p=9/20=0,45
Muestra #2:
M M H M H M M H H H H M H H M M M H M M
Proporción de mujeres $p=11/20=0,55
Muestra #3:
H H M M M H H M H M H M H M M H H M M H
Proporción de mujeres $p=10/20=0,50
En la práctica el investigador toma una
muestra. El conocimiento de la
distribución muestral nos servirá de base
teórica para hacer inferencia estadística.
Para conocer la distribución muestral de
una estadística deberíamos considerar
todas las posibles muestras de un tamaño
n, de una población.
En la práctica, podemos simular la
distribución muestral aproximada o
empírica, de la siguiente manera:
1. Seleccione "muchas" muestras
aleatorias de mismo tamaño de una
población.
2. En cada muestra calcule el estadístico
muestral
3. Determine la distribución muestral
aproximada
Recuerden que al analizar una
distribución nos interesa:
1. Forma (simétrica o sesgada)
2. Posición central - la media de una
distribución muestral nos dice si el
estadístico es un "buen" (insesgado)
estimador del parámetro o es sesgado.
3. Dispersión - nos da una idea del error
de muestreo.
¿cuál es la proporción de números
pares de la tabla de números aleatorios?
Usando tabla de números aleatorios.
Asumamos que el 50% de la población es
par, es decir 5,0=P
Vamos a tomar 50 muestras de tamaño
4=n de esta población.
Seleccionamos un punto de partida y
elegimos 4 números.
Supongamos que el punto de partida es Fila
20:
columna
fila
1 10480 15011 01536 02011 81647 91646 69179 14194 62590 36207 20969 995
2 22368 46573 25595 85393 30995 89198 37982 53402 93965 34095 52666 191
3 24130 48360 22527 97265 76393 64809 15179 24830 49340 32081 30680 196
4 42167 93093 06243 61680 07856 16376 39440 53537 71341 57004 00849 749
5 37570 39975 81837 16656 06121 91782 60468 81305 49684 60672 14110 069
6 77921 06907 11008 42751 27756 53498 18602 70659 90665 15053 21916 818
7 99562 72905 56420 69994 98872 31016 71194 18738 44013 48840 63213 210
8 96301 91977 05463 07972 18876 20922 94595 56869 69014 60045 18425 849
9 89579 14342 63661 10228 17453 18103 57740 84378 25331 12566 58678 449
10 85475 36857 53342 53988 53060 59533 38867 62300 08158 17983 16439 114
11 28918 69578 88231 33276 70997 79936 56865 05859 90106 31595 01547 855
12 63553 40961 48235 03427 49626 69445 18663 72695 52180 20847 12234 905
13 09429 93969 52636 92737 88974 33488 36320 17617 30015 08272 84115 271
14 10365 61129 87529 85689 48237 52267 67689 93394 01511 26358 85104 202
15 07119 97336 71048 08178 77233 13916 47564 81056 97735 85977 29372 744
16 51085 12765 51821 51259 77452 16308 60756 92144 49442 53900 70960 639
17 02368 21382 52404 60268 89368 19885 55322 44819 01188 65255 64835 449
18 01011 54092 33362 94904 31273 04146 18594 29852 71585 85030 51132 019
19 52162 53916 46369 58586 23216 14513 83149 98736 23495 64350 94738 177
20 07056 97628 33787 09998 42698 06691 76988 13602 51851 46104 88916 195
21 48663 91245 85828 14346 09172 30168 90229 04734 59193 22178 30421 616
22 54164 58492 22421 74103 47070 25306 76468 26384 58151 06646 21524 152
23 32639 32363 05597 24200 13363 38005 94342 28728 35806 06912 17012 641
24 29334 37001 87637 87308 58731 00256 45834 15398 46557 41135 10367 076
25 02488 33062 28834 07351 19731 92420 60952 61280 50001 67658 32586 866
26 81525 72295 04839 96423 24878 82651 66566 14778 76797 14780 13300 870
27 29676 20591 68086 26432 46901 20849 89768 81536 86645 12659 92259 571
28 00742 57392 39064 66432 84673 40027 32832 61362 98947 96067 64760 645
29 05366 04213 25669 26422 44407 44048 37937 63904 45766 66134 75470 665
30 91921 26418 64117 94305 26766 25940 39972 22209 71500 64568 91402 424
31 00582 04711 87917 77341 42206 35126 74087 99547 81817 42607 43808 766
32 00725 69884 62797 56170 86324 88072 76222 36086 84637 93161 76038 658
33 69011 65795 95876 55293 18988 27354 26575 08625 40801 59920 29841 801
34 25976 57948 29888 88604 67917 48708 18912 82271 65424 69774 33611 542
35 09763 83473 73577 12908 30833 18317 28290 35797 05998 41688 34952 378
41-45 46-50 51-55 56-61-5 6-10 11-15 16-20 21-25 26-30 31-35 36-40
Resultados si el punto de partida es Fila 20:
Muestra Estadístico
1 0705 2/4
2 6976 4/4
3 2833 2/4
4 7870 2/4
5 9998 1/4
6 4269 3/4
7 8066 4/4
8 9176 1/4
9 9881 2/4
10 3602 3/4
11 5185 1/4
12 1461 2/4
13 0488 4/4
14 9161 1/4
15 9509 1/4
16 2562 3/4
17 5581 1/4
18 0448 4/4
19 6639 2/4
20 1245 2/4
21 8582 3/4
22 8143 2/4
23 4609 3/4
24 1723 1/4
25 0168 3/4
Muestra Estadístico
26 9022 3/4
27 9047 2/4
28 3459 1/4
29 1932 1/4
30 2178 2/4
31 3042 3/4
32 1616 2/4
33 6699 2/4
34 9043 2/4
35 2812 4/4
36 5416 2/4
37 4584 3/4
38 9222 3/4
39 4217 2/4
40 4103 2/4
41 4707 2/4
42 0253 2/4
43 0676 3/4
44 4682 4/4
45 6384 3/4
46 5815 1/4
47 1066 3/4
48 4621 3/4
49 5241 2/4
50 5227 2/4
Tabla:
Número de
pares
Proporción
muestral Frecuencia
Proporción de
todas las
muestras
0 0/4 = 0,00 0
1 1/4 = 0,25 10
2 2/4 = 0,50 20
3 3/4 = 0,75 14
4 4/4 = 1,00 6
Total
a) ¿Cuál fue la proporción más frecuente?
b) Dibuje la distribución muestral
empírica. ¿Qué forma tiene?
Cada vez que tomamos una muestra tenemos
una estimación para el parámetro P .
Estas estimaciones varían entre muestras
variación muestral
Se puede demostrar que si tomamos una
m.a.s. de tamaño n de una población con
parámetro P , la desviación estándar de $p
es:
que depende de la verdadera proporción P y
del tamaño muestral n .
Si el tamaño muestral es 4=n y la
proporción en la población es 5,0=P
entonces la desviación estándar de $p es:
n
PP
p
)1(
ˆ
−
=σ
25,0
4
)5,01(5,0)1(
ˆ
=
−
=
−
=
n
PP
pσ
¿Que pasa si aumentamos el tamaño muestral?
¿Que pasa con P ? ¿Cómo afecta el valor de
P en la desviación estándar?
P P(1-P)
0,1 0,09
0,2 0,16
0,3 0,21
0,4 0,24
0,5 0,25
0,6 0,24
0,7 0,21
0,8 0,16
0,9 0,09
0
0.05
0.1
0.15
0.2
0.25
0.3
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
P
P(1-P)
Sesgo y Precision
Cuando estimamos un parámetro de la
población a partir de una estadística
muestral, nos va a interesar que la
estimación no tenga sesgo y sea precisa.
La figura ilustra la diferencia entre sesgo y
precisión.
Distribución muestral de
una proporción
Si P representa la proporción de elementos
en una población con cierta característica de
interés, es decir, la proporción de “éxitos”,
donde “éxito” corresponde a tener la
característica.
Si sacamos muestras aleatorias simples de
tamaño n de la población donde la
proporción de “éxitos” es P , entonces la
distribución muestral de la proporción
muestral tiene las siguientes propiedades:
1. El promedio de todos los valores
posibles de $p es igual al parámetroP . En
otras palabras, $p es un estimador insesgado
de P .
P=
pˆ
µ
2. Error estándar de la proporción
muestral: Es la desviación estándar de las
posibles proporciones muestrales y mide
la dispersión de la proporción muestral.
3. Si n es “suficientemente” grande, la
distribución de la proporción muestral es
aproximadamente Normal:
)
)1(
,(~ˆ
n
PP
PNp
−
&
cuando nP ≥ 5 y n(1-P) ≥ 5
n
PP
p
)1(
ˆ
−
=σ
Sangre
En Chile el 5,3% de la población tiene sangre factor
Rh(-). En una muestra aleatoria de 400 sujetos de esa
población, se encuentra que un 8,8% tiene factor
Rh(-).
a) ¿cuál es el valor del parámetro?
b) ¿cuál es el valor de la estadística?
c) ¿Cuál es la probabilidad de que en una nueva
muestra aleatoria de tamaño 400 de esa
población contenga al menos un 8,8% de
personas con sangre factor Rh(-)?
( )=≥ 8,8ˆpP
d) Suponga que se toma una muestra aleatoria
simple de tamaño 10 de la misma población.
Queremos calcular la probabilidad de que 8,8%
o más tenga sangre factor Rh(-).
Distribución muestral de la
media muestral
La distribución muestral de la media
muestral es la distribución de los valores de
las medias muestrales de todas las posibles
muestras del mismo tamaño n tomadas de la
misma población.
Considere una población cuya variable
aleatoria X es discreta y con la siguiente
distribución:
La media de la población esµ =
Suponga que no conocemos la población o el
valor de µ. Podemos tomar una m.a.s. de
tamaño n=2 de esta población.
¿Cuál sería una muestra de tamaño n=2 de esta
población?
¿Cuál sería la media muestral?
¿Es igual a la media de la población?
Si tomamos otra muestra de tamaño n=2,
¿obtendríamos la misma media muestral?
Distribución muestral de la media muestral
Si sacamos muestras aleatorias de tamaño n de
una población con media µ y desviación
estándar σ, entonces la distribución muestral de
la media muestral tiene las siguientes
propiedades:
1.El promedio de todos los valores posibles de
medias muestrales es igual al parámetro µ. En
otras palabras, la media muestral X es un
estimador insesgado de µ.
µµ =
x
2.Error estándar de la media muestral: Es la
desviación estándar de las posibles medias
muestrales.
n
=
x
σ
σ
El error estándar disminuye si el tamaño de la
muestra aumenta.
3.Si la población original tiene distribución
Normal, entonces para cualquier tamaño
muestral n la distribución de la media
muestral es también Normal:
),(~),(~Si
n
NxNX σµσµ ⇒
4.Si la población de origen no es Normal,
pero n es “suficientemente” grande la
distribución de la media muestral es
aproximadamente Normal:
Aún si X no es:
),(~),(
n
NxN σµσµ &⇒
Nota:
- Un tamaño de 30 es considerado suficiente.
- El resultado en (4) se conoce como el
Teorema del Límite Central.
Suponga que X = peso de carga de
camionetas en kilos, tiene distribución
normal con media = 300 k y varianza = 25.
Se toma una muestra aleatoria de 25
camionetas cargadas y se calcula la media
muestral.
Esquema de las distribuciones de la variable
aleatoria X y de la media muestral:
Distribution of X
=30µµµµ
Distribution of X
N(300,25)
N(300, 1 )
305295290285 310 315300
Suponga que X = la edad de las madres
en los nacimientos en Chile el año 1995,
tiene distribución normal con media = 26,5
años y desviación estándar 6,3 años.
a) Describa la distribución de la edad de la
madre.
b) ¿Cuál es la probabilidad de que una
madre elegida al azar tenga más de 30
años?
c) Suponga que tomamos una muestra
aleatoria de n=25 madres ¿cuál es la
probabilidad de que la media muestral
sea mayor a 30?
d) ¿porqué las respuestas en (b) y (c) son
distintas?

Distribuciones muestrales (u talca)

  • 1.
  • 2.
    Recordemos: Parámetro es unamedida de resumen numérica que se calcularía usando todas las unidades de la población. Es un número fijo. Generalmente no lo conocemos. Estadística es una medida de resumen numérica que se calcula de las unidades de la muestra. El valor de la estadística se conoce cuando tomamos una muestra, pero varia de muestra en muestra variación muestral
  • 3.
    Inferencia estadística: esel proceso de sacar conclusiones de la población basados en la información de una muestra de esa población.
  • 4.
    Objetivos de lainferencia: estimación de parámetros, intervalos de confianza y docimasia, test de hipótesis o pruebas de significación estadística.
  • 5.
    Distribuciones muestrales Una estadísticamuestral proveniente de una muestra aleatoria simple tiene un patrón de comportamiento (predecible) en repetidas muestras. Este patrón es llamado la distribución muestral de la estadística. Si conocemos la distribución muestral podemos hacer inferencia. Las distribuciones muestrales adoptan diferentes formas según las estadísticas investigadas y las características de la población estudiada.
  • 6.
    7.1 Distribución muestral deuna proporción muestral La distribución muestral de la proporción muestral es la distribución de los valores de las proporciones muestrales de todas las posibles muestras del mismo tamaño n tomadas de la misma población.
  • 7.
    Suponga que estamosinteresados en conocer la proporción de mujeres en Chile. Nuestro parámetro de interés es: Chileenhabitantesdenúmero Chileenmujeresdenúmero =P La población es demasiado grande. Hacer un censo sería demasiado caro. Decidimos estimar el verdadero parámetro a partir de una muestra. La proporción muestral sería: muestraladetamaño muestralaenmujeresdenúmero ˆ =p
  • 8.
    Supongamos que sabemosque 5,0=P ¿Qué pasa si tomamos una muestra tamaño 20=n ? Muestra #1: H M H H H M M M H H H M H M M H H M H M Proporción de mujeres $p=9/20=0,45 Muestra #2: M M H M H M M H H H H M H H M M M H M M Proporción de mujeres $p=11/20=0,55 Muestra #3: H H M M M H H M H M H M H M M H H M M H Proporción de mujeres $p=10/20=0,50
  • 9.
    En la prácticael investigador toma una muestra. El conocimiento de la distribución muestral nos servirá de base teórica para hacer inferencia estadística. Para conocer la distribución muestral de una estadística deberíamos considerar todas las posibles muestras de un tamaño n, de una población.
  • 10.
    En la práctica,podemos simular la distribución muestral aproximada o empírica, de la siguiente manera: 1. Seleccione "muchas" muestras aleatorias de mismo tamaño de una población. 2. En cada muestra calcule el estadístico muestral 3. Determine la distribución muestral aproximada
  • 11.
    Recuerden que alanalizar una distribución nos interesa: 1. Forma (simétrica o sesgada) 2. Posición central - la media de una distribución muestral nos dice si el estadístico es un "buen" (insesgado) estimador del parámetro o es sesgado. 3. Dispersión - nos da una idea del error de muestreo.
  • 12.
    ¿cuál es laproporción de números pares de la tabla de números aleatorios? Usando tabla de números aleatorios. Asumamos que el 50% de la población es par, es decir 5,0=P Vamos a tomar 50 muestras de tamaño 4=n de esta población. Seleccionamos un punto de partida y elegimos 4 números.
  • 13.
    Supongamos que elpunto de partida es Fila 20: columna fila 1 10480 15011 01536 02011 81647 91646 69179 14194 62590 36207 20969 995 2 22368 46573 25595 85393 30995 89198 37982 53402 93965 34095 52666 191 3 24130 48360 22527 97265 76393 64809 15179 24830 49340 32081 30680 196 4 42167 93093 06243 61680 07856 16376 39440 53537 71341 57004 00849 749 5 37570 39975 81837 16656 06121 91782 60468 81305 49684 60672 14110 069 6 77921 06907 11008 42751 27756 53498 18602 70659 90665 15053 21916 818 7 99562 72905 56420 69994 98872 31016 71194 18738 44013 48840 63213 210 8 96301 91977 05463 07972 18876 20922 94595 56869 69014 60045 18425 849 9 89579 14342 63661 10228 17453 18103 57740 84378 25331 12566 58678 449 10 85475 36857 53342 53988 53060 59533 38867 62300 08158 17983 16439 114 11 28918 69578 88231 33276 70997 79936 56865 05859 90106 31595 01547 855 12 63553 40961 48235 03427 49626 69445 18663 72695 52180 20847 12234 905 13 09429 93969 52636 92737 88974 33488 36320 17617 30015 08272 84115 271 14 10365 61129 87529 85689 48237 52267 67689 93394 01511 26358 85104 202 15 07119 97336 71048 08178 77233 13916 47564 81056 97735 85977 29372 744 16 51085 12765 51821 51259 77452 16308 60756 92144 49442 53900 70960 639 17 02368 21382 52404 60268 89368 19885 55322 44819 01188 65255 64835 449 18 01011 54092 33362 94904 31273 04146 18594 29852 71585 85030 51132 019 19 52162 53916 46369 58586 23216 14513 83149 98736 23495 64350 94738 177 20 07056 97628 33787 09998 42698 06691 76988 13602 51851 46104 88916 195 21 48663 91245 85828 14346 09172 30168 90229 04734 59193 22178 30421 616 22 54164 58492 22421 74103 47070 25306 76468 26384 58151 06646 21524 152 23 32639 32363 05597 24200 13363 38005 94342 28728 35806 06912 17012 641 24 29334 37001 87637 87308 58731 00256 45834 15398 46557 41135 10367 076 25 02488 33062 28834 07351 19731 92420 60952 61280 50001 67658 32586 866 26 81525 72295 04839 96423 24878 82651 66566 14778 76797 14780 13300 870 27 29676 20591 68086 26432 46901 20849 89768 81536 86645 12659 92259 571 28 00742 57392 39064 66432 84673 40027 32832 61362 98947 96067 64760 645 29 05366 04213 25669 26422 44407 44048 37937 63904 45766 66134 75470 665 30 91921 26418 64117 94305 26766 25940 39972 22209 71500 64568 91402 424 31 00582 04711 87917 77341 42206 35126 74087 99547 81817 42607 43808 766 32 00725 69884 62797 56170 86324 88072 76222 36086 84637 93161 76038 658 33 69011 65795 95876 55293 18988 27354 26575 08625 40801 59920 29841 801 34 25976 57948 29888 88604 67917 48708 18912 82271 65424 69774 33611 542 35 09763 83473 73577 12908 30833 18317 28290 35797 05998 41688 34952 378 41-45 46-50 51-55 56-61-5 6-10 11-15 16-20 21-25 26-30 31-35 36-40
  • 14.
    Resultados si elpunto de partida es Fila 20: Muestra Estadístico 1 0705 2/4 2 6976 4/4 3 2833 2/4 4 7870 2/4 5 9998 1/4 6 4269 3/4 7 8066 4/4 8 9176 1/4 9 9881 2/4 10 3602 3/4 11 5185 1/4 12 1461 2/4 13 0488 4/4 14 9161 1/4 15 9509 1/4 16 2562 3/4 17 5581 1/4 18 0448 4/4 19 6639 2/4 20 1245 2/4 21 8582 3/4 22 8143 2/4 23 4609 3/4 24 1723 1/4 25 0168 3/4
  • 15.
    Muestra Estadístico 26 90223/4 27 9047 2/4 28 3459 1/4 29 1932 1/4 30 2178 2/4 31 3042 3/4 32 1616 2/4 33 6699 2/4 34 9043 2/4 35 2812 4/4 36 5416 2/4 37 4584 3/4 38 9222 3/4 39 4217 2/4 40 4103 2/4 41 4707 2/4 42 0253 2/4 43 0676 3/4 44 4682 4/4 45 6384 3/4 46 5815 1/4 47 1066 3/4 48 4621 3/4 49 5241 2/4 50 5227 2/4
  • 16.
    Tabla: Número de pares Proporción muestral Frecuencia Proporciónde todas las muestras 0 0/4 = 0,00 0 1 1/4 = 0,25 10 2 2/4 = 0,50 20 3 3/4 = 0,75 14 4 4/4 = 1,00 6 Total a) ¿Cuál fue la proporción más frecuente? b) Dibuje la distribución muestral empírica. ¿Qué forma tiene? Cada vez que tomamos una muestra tenemos una estimación para el parámetro P . Estas estimaciones varían entre muestras variación muestral
  • 17.
    Se puede demostrarque si tomamos una m.a.s. de tamaño n de una población con parámetro P , la desviación estándar de $p es: que depende de la verdadera proporción P y del tamaño muestral n . Si el tamaño muestral es 4=n y la proporción en la población es 5,0=P entonces la desviación estándar de $p es: n PP p )1( ˆ − =σ 25,0 4 )5,01(5,0)1( ˆ = − = − = n PP pσ
  • 18.
    ¿Que pasa siaumentamos el tamaño muestral? ¿Que pasa con P ? ¿Cómo afecta el valor de P en la desviación estándar? P P(1-P) 0,1 0,09 0,2 0,16 0,3 0,21 0,4 0,24 0,5 0,25 0,6 0,24 0,7 0,21 0,8 0,16 0,9 0,09 0 0.05 0.1 0.15 0.2 0.25 0.3 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 P P(1-P)
  • 19.
    Sesgo y Precision Cuandoestimamos un parámetro de la población a partir de una estadística muestral, nos va a interesar que la estimación no tenga sesgo y sea precisa. La figura ilustra la diferencia entre sesgo y precisión.
  • 20.
    Distribución muestral de unaproporción Si P representa la proporción de elementos en una población con cierta característica de interés, es decir, la proporción de “éxitos”, donde “éxito” corresponde a tener la característica. Si sacamos muestras aleatorias simples de tamaño n de la población donde la proporción de “éxitos” es P , entonces la distribución muestral de la proporción muestral tiene las siguientes propiedades: 1. El promedio de todos los valores posibles de $p es igual al parámetroP . En otras palabras, $p es un estimador insesgado de P . P= pˆ µ
  • 21.
    2. Error estándarde la proporción muestral: Es la desviación estándar de las posibles proporciones muestrales y mide la dispersión de la proporción muestral. 3. Si n es “suficientemente” grande, la distribución de la proporción muestral es aproximadamente Normal: ) )1( ,(~ˆ n PP PNp − & cuando nP ≥ 5 y n(1-P) ≥ 5 n PP p )1( ˆ − =σ
  • 23.
    Sangre En Chile el5,3% de la población tiene sangre factor Rh(-). En una muestra aleatoria de 400 sujetos de esa población, se encuentra que un 8,8% tiene factor Rh(-). a) ¿cuál es el valor del parámetro? b) ¿cuál es el valor de la estadística? c) ¿Cuál es la probabilidad de que en una nueva muestra aleatoria de tamaño 400 de esa población contenga al menos un 8,8% de personas con sangre factor Rh(-)? ( )=≥ 8,8ˆpP d) Suponga que se toma una muestra aleatoria simple de tamaño 10 de la misma población. Queremos calcular la probabilidad de que 8,8% o más tenga sangre factor Rh(-).
  • 24.
    Distribución muestral dela media muestral La distribución muestral de la media muestral es la distribución de los valores de las medias muestrales de todas las posibles muestras del mismo tamaño n tomadas de la misma población.
  • 25.
    Considere una poblacióncuya variable aleatoria X es discreta y con la siguiente distribución: La media de la población esµ = Suponga que no conocemos la población o el valor de µ. Podemos tomar una m.a.s. de tamaño n=2 de esta población. ¿Cuál sería una muestra de tamaño n=2 de esta población? ¿Cuál sería la media muestral? ¿Es igual a la media de la población? Si tomamos otra muestra de tamaño n=2, ¿obtendríamos la misma media muestral?
  • 26.
    Distribución muestral dela media muestral Si sacamos muestras aleatorias de tamaño n de una población con media µ y desviación estándar σ, entonces la distribución muestral de la media muestral tiene las siguientes propiedades: 1.El promedio de todos los valores posibles de medias muestrales es igual al parámetro µ. En otras palabras, la media muestral X es un estimador insesgado de µ. µµ = x 2.Error estándar de la media muestral: Es la desviación estándar de las posibles medias muestrales. n = x σ σ El error estándar disminuye si el tamaño de la muestra aumenta.
  • 27.
    3.Si la poblaciónoriginal tiene distribución Normal, entonces para cualquier tamaño muestral n la distribución de la media muestral es también Normal: ),(~),(~Si n NxNX σµσµ ⇒ 4.Si la población de origen no es Normal, pero n es “suficientemente” grande la distribución de la media muestral es aproximadamente Normal: Aún si X no es: ),(~),( n NxN σµσµ &⇒
  • 28.
    Nota: - Un tamañode 30 es considerado suficiente. - El resultado en (4) se conoce como el Teorema del Límite Central.
  • 30.
    Suponga que X= peso de carga de camionetas en kilos, tiene distribución normal con media = 300 k y varianza = 25. Se toma una muestra aleatoria de 25 camionetas cargadas y se calcula la media muestral. Esquema de las distribuciones de la variable aleatoria X y de la media muestral: Distribution of X =30µµµµ Distribution of X N(300,25) N(300, 1 ) 305295290285 310 315300
  • 31.
    Suponga que X= la edad de las madres en los nacimientos en Chile el año 1995, tiene distribución normal con media = 26,5 años y desviación estándar 6,3 años. a) Describa la distribución de la edad de la madre. b) ¿Cuál es la probabilidad de que una madre elegida al azar tenga más de 30 años? c) Suponga que tomamos una muestra aleatoria de n=25 madres ¿cuál es la probabilidad de que la media muestral sea mayor a 30? d) ¿porqué las respuestas en (b) y (c) son distintas?