2. Recordemos:
Parámetro es una medida de resumen
numérica que se calcularía usando todas
las unidades de la población.
Es un número fijo.
Generalmente no lo conocemos.
Estadística es una medida de resumen
numérica que se calcula de las unidades
de la muestra.
El valor de la estadística se conoce
cuando tomamos una muestra,
pero varia de muestra en muestra
variación muestral
3. Inferencia estadística: es el proceso de
sacar conclusiones de la población
basados en la información de una muestra
de esa población.
4. Objetivos de la inferencia:
estimación de parámetros,
intervalos de confianza y
docimasia, test de hipótesis o pruebas
de significación estadística.
5. Distribuciones muestrales
Una estadística muestral proveniente de
una muestra aleatoria simple tiene un
patrón de comportamiento (predecible) en
repetidas muestras. Este patrón es
llamado la distribución muestral de la
estadística.
Si conocemos la distribución muestral
podemos hacer inferencia.
Las distribuciones muestrales adoptan
diferentes formas según las estadísticas
investigadas y las características de la
población estudiada.
6. 7.1 Distribución muestral
de una
proporción muestral
La distribución muestral de la
proporción muestral es la distribución
de los valores de las proporciones
muestrales de todas las posibles muestras
del mismo tamaño n tomadas de la
misma población.
7. Suponga que estamos interesados
en conocer la proporción de mujeres en
Chile. Nuestro parámetro de interés
es:
Chileenhabitantesdenúmero
Chileenmujeresdenúmero
=P
La población es demasiado grande. Hacer un
censo sería demasiado caro. Decidimos
estimar el verdadero parámetro a partir de
una muestra.
La proporción muestral sería:
muestraladetamaño
muestralaenmujeresdenúmero
ˆ =p
8. Supongamos que sabemos que 5,0=P ¿Qué
pasa si tomamos una muestra tamaño 20=n ?
Muestra #1:
H M H H H M M M H H H M H M M H H M H M
Proporción de mujeres $p=9/20=0,45
Muestra #2:
M M H M H M M H H H H M H H M M M H M M
Proporción de mujeres $p=11/20=0,55
Muestra #3:
H H M M M H H M H M H M H M M H H M M H
Proporción de mujeres $p=10/20=0,50
9. En la práctica el investigador toma una
muestra. El conocimiento de la
distribución muestral nos servirá de base
teórica para hacer inferencia estadística.
Para conocer la distribución muestral de
una estadística deberíamos considerar
todas las posibles muestras de un tamaño
n, de una población.
10. En la práctica, podemos simular la
distribución muestral aproximada o
empírica, de la siguiente manera:
1. Seleccione "muchas" muestras
aleatorias de mismo tamaño de una
población.
2. En cada muestra calcule el estadístico
muestral
3. Determine la distribución muestral
aproximada
11. Recuerden que al analizar una
distribución nos interesa:
1. Forma (simétrica o sesgada)
2. Posición central - la media de una
distribución muestral nos dice si el
estadístico es un "buen" (insesgado)
estimador del parámetro o es sesgado.
3. Dispersión - nos da una idea del error
de muestreo.
12. ¿cuál es la proporción de números
pares de la tabla de números aleatorios?
Usando tabla de números aleatorios.
Asumamos que el 50% de la población es
par, es decir 5,0=P
Vamos a tomar 50 muestras de tamaño
4=n de esta población.
Seleccionamos un punto de partida y
elegimos 4 números.
16. Tabla:
Número de
pares
Proporción
muestral Frecuencia
Proporción de
todas las
muestras
0 0/4 = 0,00 0
1 1/4 = 0,25 10
2 2/4 = 0,50 20
3 3/4 = 0,75 14
4 4/4 = 1,00 6
Total
a) ¿Cuál fue la proporción más frecuente?
b) Dibuje la distribución muestral
empírica. ¿Qué forma tiene?
Cada vez que tomamos una muestra tenemos
una estimación para el parámetro P .
Estas estimaciones varían entre muestras
variación muestral
17. Se puede demostrar que si tomamos una
m.a.s. de tamaño n de una población con
parámetro P , la desviación estándar de $p
es:
que depende de la verdadera proporción P y
del tamaño muestral n .
Si el tamaño muestral es 4=n y la
proporción en la población es 5,0=P
entonces la desviación estándar de $p es:
n
PP
p
)1(
ˆ
−
=σ
25,0
4
)5,01(5,0)1(
ˆ
=
−
=
−
=
n
PP
pσ
18. ¿Que pasa si aumentamos el tamaño muestral?
¿Que pasa con P ? ¿Cómo afecta el valor de
P en la desviación estándar?
P P(1-P)
0,1 0,09
0,2 0,16
0,3 0,21
0,4 0,24
0,5 0,25
0,6 0,24
0,7 0,21
0,8 0,16
0,9 0,09
0
0.05
0.1
0.15
0.2
0.25
0.3
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
P
P(1-P)
19. Sesgo y Precision
Cuando estimamos un parámetro de la
población a partir de una estadística
muestral, nos va a interesar que la
estimación no tenga sesgo y sea precisa.
La figura ilustra la diferencia entre sesgo y
precisión.
20. Distribución muestral de
una proporción
Si P representa la proporción de elementos
en una población con cierta característica de
interés, es decir, la proporción de “éxitos”,
donde “éxito” corresponde a tener la
característica.
Si sacamos muestras aleatorias simples de
tamaño n de la población donde la
proporción de “éxitos” es P , entonces la
distribución muestral de la proporción
muestral tiene las siguientes propiedades:
1. El promedio de todos los valores
posibles de $p es igual al parámetroP . En
otras palabras, $p es un estimador insesgado
de P .
P=
pˆ
µ
21. 2. Error estándar de la proporción
muestral: Es la desviación estándar de las
posibles proporciones muestrales y mide
la dispersión de la proporción muestral.
3. Si n es “suficientemente” grande, la
distribución de la proporción muestral es
aproximadamente Normal:
)
)1(
,(~ˆ
n
PP
PNp
−
&
cuando nP ≥ 5 y n(1-P) ≥ 5
n
PP
p
)1(
ˆ
−
=σ
22.
23. Sangre
En Chile el 5,3% de la población tiene sangre factor
Rh(-). En una muestra aleatoria de 400 sujetos de esa
población, se encuentra que un 8,8% tiene factor
Rh(-).
a) ¿cuál es el valor del parámetro?
b) ¿cuál es el valor de la estadística?
c) ¿Cuál es la probabilidad de que en una nueva
muestra aleatoria de tamaño 400 de esa
población contenga al menos un 8,8% de
personas con sangre factor Rh(-)?
( )=≥ 8,8ˆpP
d) Suponga que se toma una muestra aleatoria
simple de tamaño 10 de la misma población.
Queremos calcular la probabilidad de que 8,8%
o más tenga sangre factor Rh(-).
24. Distribución muestral de la
media muestral
La distribución muestral de la media
muestral es la distribución de los valores de
las medias muestrales de todas las posibles
muestras del mismo tamaño n tomadas de la
misma población.
25. Considere una población cuya variable
aleatoria X es discreta y con la siguiente
distribución:
La media de la población esµ =
Suponga que no conocemos la población o el
valor de µ. Podemos tomar una m.a.s. de
tamaño n=2 de esta población.
¿Cuál sería una muestra de tamaño n=2 de esta
población?
¿Cuál sería la media muestral?
¿Es igual a la media de la población?
Si tomamos otra muestra de tamaño n=2,
¿obtendríamos la misma media muestral?
26. Distribución muestral de la media muestral
Si sacamos muestras aleatorias de tamaño n de
una población con media µ y desviación
estándar σ, entonces la distribución muestral de
la media muestral tiene las siguientes
propiedades:
1.El promedio de todos los valores posibles de
medias muestrales es igual al parámetro µ. En
otras palabras, la media muestral X es un
estimador insesgado de µ.
µµ =
x
2.Error estándar de la media muestral: Es la
desviación estándar de las posibles medias
muestrales.
n
=
x
σ
σ
El error estándar disminuye si el tamaño de la
muestra aumenta.
27. 3.Si la población original tiene distribución
Normal, entonces para cualquier tamaño
muestral n la distribución de la media
muestral es también Normal:
),(~),(~Si
n
NxNX σµσµ ⇒
4.Si la población de origen no es Normal,
pero n es “suficientemente” grande la
distribución de la media muestral es
aproximadamente Normal:
Aún si X no es:
),(~),(
n
NxN σµσµ &⇒
28. Nota:
- Un tamaño de 30 es considerado suficiente.
- El resultado en (4) se conoce como el
Teorema del Límite Central.
29.
30. Suponga que X = peso de carga de
camionetas en kilos, tiene distribución
normal con media = 300 k y varianza = 25.
Se toma una muestra aleatoria de 25
camionetas cargadas y se calcula la media
muestral.
Esquema de las distribuciones de la variable
aleatoria X y de la media muestral:
Distribution of X
=30µµµµ
Distribution of X
N(300,25)
N(300, 1 )
305295290285 310 315300
31. Suponga que X = la edad de las madres
en los nacimientos en Chile el año 1995,
tiene distribución normal con media = 26,5
años y desviación estándar 6,3 años.
a) Describa la distribución de la edad de la
madre.
b) ¿Cuál es la probabilidad de que una
madre elegida al azar tenga más de 30
años?
c) Suponga que tomamos una muestra
aleatoria de n=25 madres ¿cuál es la
probabilidad de que la media muestral
sea mayor a 30?
d) ¿porqué las respuestas en (b) y (c) son
distintas?