2. • Distribuciones de probabilidad = frecuencias teóricas.
• Nos permiten hacer predicciones, hacer juicios o tomar decisiones.
• Las usamos porque se ajustan a observaciones.
• Cuando la data (obs) no se ajustan a la teoría (esp), estaremos frente a la
presencia de algún mecanismo biológico causando esta discrepancia (o
desviación).
• TLC: Independiente de la distribución subyacente, si las sumas o
promedios de muestras grandes e independientes son estandarizadas,
entonces seguirán una distribución normal.
• TLC apoya el uso de pruebas estadísticas que suponen distribución
normal.
4. • Comportamiento de las muestras
• La distribución de la media muestral
• La distribución de la proporción muestral
• Distribuciones muestrales e inferencia estadística
5. Supongamos que tenemos un censo (e.g. conocemos la
población completa y sus parámetros poblacionales µ y σ.
Unos años después queremos indagar nuevamente sobre los
parámetros, pero no podemos muestrear nuevamente toda la
población. Entonces, tomamos una muestra y obtenemos los
parámetros muestrales y s.
¿Cuál es la conexión entre la muestra poblacional y la
muestral?
x
9. Si tomamos una muestra mañana, tendremos otra media y
varianza, distintas muestras tendremos distintas medias y
varianzas.
De hecho, podemos tener múltiples medias dependiendo del
número de muestras que tengamos.
Entonces ¿Por qué debemos confiar en una media muestral
específica?
1. Las medias muestrales varían, pero lo hacen alrededor de la
media poblacional.
2. Aunque varían, no varían mucho. De hecho cualquier media
muestral no se ubicará muy lejos de la media poblacional (media
verdadera).
10. Si tenemos una población (universo) existe una población
completa de medias muestrales, esta población es conocida
como .
Y la probabilidad de la es la distribución de probabilidad que
describe .
El estudio de la distribución de la media muestral nos permite:
1. Estudiar como se “comportan las muestras”.
¿Qué medias muestrales encontraremos?
¿Cuál es su verosimilitud?
¿Cuál es su variabilidad?
X
X
X
11. MM1 MM2
MM1 y MM2 constituyen el conjunto , y tiene su propia distribución:
La Distribución de la Media Muestral.
X
X
12. Como ya vimos, la distribución de la media muestral se
distribuye alrededor de la media poblacional µ.
1. Entonces, la media de la distribución de la media muestral
es igual a la media poblacional µ.
2. Las medias muestrales no varían demasiado, entonces si X
tiene una desviación estándar σ y tamaño muestral n,
entonces:
La desviación estándar de
=> Mientras más grande es n, menor es σ. Esto es, menor
variación alrededor de µ.
n
X
13. Si la distribución de x es normal, es normal.
Si la distribución de x no es normal, aún será normal si la
muestra es suficientemente grande.
La distribución muestral de la media es la distribución principal
que obtendremos de variables numéricas.
Si tenemos una variable categórica, entonces nos enfocamos en
la distribución muestral de la proporción.
X
X
X
14. Si la variable x es categórica, esto significa que sus valores son
categorías (cualidades).
Supongamos que queremos conocer el sabor favorito de las personas
(chocolate, vainilla, pasas al ron) .
Estos tres sabores serán las tres categorías de x.
En general, nos interesaremos por la(s) proporción(es) de una o más
de estas categorías.
Proporción de chocolate=50% (π= 50%)
15. Tal como en el caso de , podemos tomar distintas muestras y
cada muestra nos arrojará un valor distinto de π.
π1= 39%
π2= 41%
π3= 40%
π4= 38%
.
.
.
Definimos la variable P como la distribución muestral de π.
X
16. Tal como en el caso de , esperamos que las proporciones
muestrales varíen alrededor de la π de la población.
Supongamos entonces que tenemos una variable categórica X, y
que estamos interesados en la proporción de una de las
categorías dentro de X, cuya distribución de la proporción
muestral es π.
Sea P la distribución de π.
X
17. P se distribuirá aproximadamente normal con
2
1
)1(
n
18. Usamos todo lo que hemos visto para realizar
Inferencia estadística:
1. Recolectar una muestra
2. Concluir cosas respecto de la población
19. Supongamos que tenemos dos poblaciones:
X: µ = 50 y σ=5
Y : µ = 55 y σ=20
Tenemos una muestra cuya media muestral es = 52.
¿A qué población corresponde?
24. Media muestra = 52
El valor de la media parece
extremo en X, pero no en Y.
Y~N(55, 2)
25. Media muestra = 52
El valor de la media parece
extremo en X, pero no en Y.
Entonces, inferimos que la
muestra vino de Y
Y~N(55, 2)
26. Existen dos campos principales en la inferencia
estadística:
• Estimación
• Pruebas
Inferencia: Una conclusión que surge de forma lógica a partir de
observaciones o premisas
27. • Tomamos una muestra
• Calculamos la media y, de acuerdo a ella,
• Damos un rango de valores para la media
poblacional
28. Una muestra de las notas del primer test de BIOMETRIA arrojó lo siguiente:
“Confío que el promedio del curso está entre y ”.
Calculamos la media para entregar un rango
de valores para el parámetro poblacional.
95.0)96.196.1( xx sxsxP Aleatorio X
24 6.0
17 4.0
30 5.5
32 2.0
7 2.0
8 6.5
3 2.0
14 4.0
5 4.5
13 5.5
media 4.2
desv. Estándar 1.7
n 10.0
sx 0.5
29. 1. Proponemos un valor para el parámetro
poblacional
2. Tomamos una muestra
3. Probamos nuestro supuesto contra la muestra.
30. Supuesto sobre el chocolate
Proporción poblacional: 40%
Tomamos una muestra
La proporción muestral: 32%
Conclusión
Nuestro supuesto sobre la proporción
poblacional fue errado (πpoblacional ≠ 40%)
En este caso la muestra se usa como evidencia para probar
un supuesto sobre la población.