2. Contenido
Inferencia estadística.
Población y muestra.
Muestra aleatoria.
Media muestral.
Varianza muestral.
Cuasivarianza muestral.
Proporción muestral.
Distribución de probabilidad de
estadísticos muestrales.
3. Inferencia estadística
De acuerdo al Profesor López Casuso la
estadística trata de responder a dos tipos de
preguntas:
Tipo I: Obtener una descripción de un grupo de
individuos que están siendo observados. Se
utiliza la media, desviación típica, percentiles.
Estos datos obtenidos corresponden a este
grupo particular y no pueden ser extrapolados
a otro conjunto de individuos (aunque sean
similares)
Tipo II: Consiste en buscar conclusiones mas
amplias. Inferir por medio de resultados
particulares obtenidos mediante un grupo,
conclusiones validas para un grupo mas
amplio.
4. Definiciones
Definición : El conjunto de elementos cuyas
características tratamos de estudiar, y acerca
del cual deseamos información, constituye lo
que se conoce como “Población”, “Universo” o
“Colectivo”
Definición : El subconjunto de la población
que elegimos para observar, y a partir del cual
tratamos de conocer las características de la
población, constituye una “muestra”.
7. Nuevos conceptos
Definición: Dada una población con función de densidad 𝒇(𝒙) , si
𝒙𝟏, 𝒙𝟐, ⋯ , 𝒙𝒏 son 𝒏 variables aleatorias independientes e idénticamente
distribuidas cada una con función de densidad 𝒇(𝒙), entonces, 𝒙𝟏, 𝒙𝟐, ⋯ , 𝒙𝒏
constituyen una muestra aleatoria de tamaño 𝒏 de la población, cuya
función de densidad es 𝒇 𝒙 .
8. Ejemplo
1000$ 1200$
1500$
2000$ 2100$
900$
920$ 1800$
1700$ 1000$
1700$
1800$
920$
1200$
1800$ 2100$
Supongamos que queremos realizar un
estudio sobre los salarios mensuales de
un conjunto ciudadanos.
Nuestra variable aleatoria será el salario
mensual de los ciudadanos.
Costaría mucho tiempo y/o recursos
económicos preguntar a TODOS. En lugar
decidimos preguntar a una muestra
Una vez hemos definido la variable sobre
la que vamos a trabajar y la población de
datos, toca proceder a obtener la
muestra.
Generalmente, tendremos dos opciones.
O preguntar a ciudadanos de forma
totalmente aleatoria o elegir un proceso
de selección.
El salario promedio es
1505$
9. Definición
Definición: Dada una muestra aleatoria 𝒙𝟏, 𝒙𝟐, ⋯ , 𝒙𝒏 de tamaño n de una
población con función de densidad 𝒇(𝒙), un estadístico es una función
𝒈(𝒙𝟏, 𝒙𝟐, ⋯ , 𝒙𝒏), de las variables aleatorias de la muestra que no contiene
ningún parámetro desconocido.
Al ser una función de variables aleatorias, un estadístico es también una
variable aleatoria.
Los estadísticos mas conocidos son: la media muestral, la varianza muestral,
la proporción muestral y la cuasivarianza muestral
10. Definición
Definición: Sea 𝑥1, 𝒙𝟐, ⋯ , 𝑥𝑛 una muestra aleatoria de tamaño n de una
población con función de densidad 𝑓(𝑥), con media 𝜇 y varianza finita 𝜎2. La
media muestral representada por 𝑥, es la media aritmética de los elementos
de la muestra, es decir:
𝒙 =
𝒋=𝟏
𝒏
𝒙𝒊
𝒏
Como 𝑥 es una variable aleatoria, tiene valor esperado y varianza, se puede
demostrar que:
𝐸 𝑥 = 𝜇 𝜎𝑥
2
= 𝑣𝑎𝑟 𝑥 =
𝜎2
𝑛
12. Puntos relevantes
𝑬 𝒙 = 𝝁 𝒗𝒂𝒓 𝒙 =
𝝈𝟐
𝒏
El valor esperado de la media muestral es
la media de la población
La varianza es una medida de dispersión
Mientras mas grande la muestra, mayor n
y menor varianza
13. Definición
Definición: Sea 𝑥1, 𝒙𝟐, ⋯ , 𝑥𝑛 una muestra aleatoria de tamaño n de una
población con función de densidad 𝑓 𝑥 . La varianza muestral representada
por 𝑠2
, es el promedio del cuadrado de las desviaciones de los elementos de
la muestra respecto a la media muestral, es decir:
𝒔𝟐 =
𝒋=𝟏
𝒏
𝒙𝒊 − 𝒙 𝟐
𝒏
14. Puntos relevantes
No confundir la varianza muestral 𝒔𝟐 con la
varianza de la media muestral 𝜎𝑥
2
𝒔𝟐 es un estadístico y 𝜎𝑥
2
porque se expresa en
función de un parámetro desconocido 𝜎2
𝒔𝟐 mide la dispersión de los datos en una
muestra.
𝜎𝑥
2
mide la dispersión de las medias de distintas
muestras respecto a la población
𝒔𝟐 =
𝒋=𝟏
𝒏
𝒙𝒊 − 𝒙 𝟐
𝒏
𝜎𝑥
2
=
𝝈𝟐
𝒏
15. Definición
Definición: La cuasivarianza muestral está definida como:
𝒔𝝑
𝟐
=
𝒋=𝟏
𝒏
𝒙𝒊 − 𝒙 𝟐
𝒏 − 𝟏
Definición: Dada una muestra aleatoria de tamaño 𝑛 de una población con
parámetro 𝑝 (proporción de elementos de la población que tienen una
determinada característica), la proporción muestral representada por 𝑝, se
define como el número de elementos de la muestra que tienen esa
característica, dividido por el tamaño de la muestra 𝑛, es decir:
𝑝 =
𝑥
𝑛
17. Desigualdad de Chebychev
La desigualdad de Chebychev es un teorema
que proporciona un intervalo de confianza
de la probabilidad de que una variable
aleatoria con varianza finita se sitúe a una
cierta distancia de su esperanza matemática
o de su media.
Teorema: Si 𝑥 es una variable aleatoria con media y varianzas finitas. Para
cualquier ℎ se tiene
𝑃 𝑥 − 𝐸 𝑥 ≤ ℎ ≥ 1 −
𝜎2
ℎ2
18. Ley de los grandes números
Teorema: Consideremos la variable aleatoria 𝑥 con función de densidad
𝑓 𝑥 = 𝑝𝑥
𝑞1−𝑥
para 𝑥 = 0,1. 𝑝 representa la probabilidad de obtener un
éxito en un intento de un experimento con 2 posibles resultados. Si
repetimos 𝑛 veces el experimento, 𝑥𝑖 = 1 representa que hemos obtenido
un éxito en el ejemplo 𝑖.
Luego la frecuencia relativa de éxitos en 𝑛 veces será
𝑆𝑛
𝑛
donde 𝑆𝑛 = 𝑥1 + 𝑥2 + ⋯ + 𝑥𝑛
La ley de los grandes números establece que para 𝜀 > 0
lim
𝑛→∞
𝑃
𝑆𝑛
𝑛
− 𝑝 ≤ 𝜀 = 1
En una gran cantidad de intentos, la probabilidad empírica de
un evento se aproximará a su probabilidad real.
19. Ley de los grandes números
Vamos
a
lanzar
moned
20. El teorema del límite central
Cuando 𝑛 crece la variable tiende a distribuirse como una
normal
Teorema: Sean 𝒙𝟏, 𝒙𝟐, ⋯ , 𝒙𝒏 𝑛 variables aleatorias independientes e
idénticamente distribuidas con media 𝜇 y varianza 𝜎2
. La suma 𝑆𝑛 de esas
variables es una variable aleatoria con media 𝑛𝜇 y varianza 𝑛𝜎2. Esa suma
tiende a distribuirse normalmente. En consecuencia, la variable 𝑦 tipificada,
𝑦 =
𝑆𝑛 − 𝑛𝜇
𝑛𝜎2
~𝑁 0,1
21. Los estadísticos y sus distribuciones
Los estadísticos son
variables alaeatorias
Tienen una
distribución
Hallar la distribución
Inferencia sobre la
población
Entonces
Se necesita
Para
Muestra Población
22. Distribución de la media muestral
Si la Población tiene una
distribución normal
Sean 𝑥1, 𝑥2, ⋯ , 𝑥𝑛 una muestra
aleatoria de tamaño 𝑛 de una población
con distribución 𝑁 𝜇, 𝜎2
.
Ya probamos que:
𝐸 𝑥 = 𝜇 y 𝑣𝑎𝑟 𝑥 =
𝜎2
𝑛
Se tiene que 𝑥 por definición es una
función lineal de normales
independientes.
Por teorema 5.12 López Casuso (la
suma de normales es una normal)
𝒙~𝑵 𝝁,
𝝈𝟐
𝒏
Si la Población no tiene una
distribución normal (o
desconocida)
Por el teorema central del límite,
cuando 𝑛 es lo suficientemente grande
se tiene que:
𝒙~𝑵 𝝁,
𝝈𝟐
𝒏
23. Distribución de la varianza muestral
• La varianza no es una función lineal, sino cuadrática
• No puedo obtener las mimas conclusiones que para la media.
• Vamos a hacer algunas manipulaciones algebraicas
𝑣𝑎𝑟 𝑥 = 𝑠2 =
1
𝑛
𝑖=1
𝑛
𝑥𝑖 − 𝑥 2
𝑛𝑠2 =
𝑖=1
𝑛
𝑥𝑖 − 𝑥 2
1
𝜎2 𝑛𝑠2
=
1
𝜎2
𝑖=1
𝑛
𝑥𝑖 − 𝑥 2
=
𝑖=1
𝑛
𝒙𝒊 − 𝒙
𝝈
2
24. Distribución de la varianza muestral
𝑛𝑠2
𝜎2
=
𝑖=1
𝑛
𝒙𝒊 − 𝒙
𝝈
2
•
𝒙𝒊−𝒙
𝝈
son variables aleatorias estandarizadas
• Estas variables tienen una distribución normal
• Son independientes debido al muestreo aleatorio
simple
•
𝑛𝑠2
𝜎2 es al suma de variables aleatorias normales
independientes.
• Por el teorema de Cochran sigue una distribución chi-
cuadrado de n-1 grados de libertad
Cochran, W. G. (Abril de 1934). «The distribution of quadratic forms in a normal system, with applications to the analysis of covariance».
Mathematical Proceedings of the Cambridge Philosophical Society 30 (2): 178-191