Este documento trata sobre inferencia estadística. Explica conceptos como muestreo aleatorio, estimación de parámetros poblacionales como proporciones, medias y varianzas. Detalla los métodos para estimar una proporción poblacional a partir de una muestra, incluyendo la distribución de la proporción muestral y cómo calcular intervalos de probabilidad para una proporción con un nivel de confianza dado.
Yoshikawa eiji mushashi 5 - el camino de la vida y de la muerte
Tema 05 estadistica
1. Tema
5.
Inferencia
estadís2ca
Estadís2ca
María
Dolores
Frías
Domínguez
Jesús
Fernández
Fernández
Carmen
María
Sordo
Departamento
de
Matemá.ca
Aplicada
y
Ciencias
de
la
Computación
Este
tema
se
publica
bajo
Licencia:
Crea.ve
Commons
BY-‐NC-‐SA
3.0
3. María Dolores Frías, Jesús Fernández y Carmen María Sordo
Muestreo
POBLACIÓN: todos los estudiantes de la
Universidad de Cantabria
MUESTRA: alumnos de 1º de Grado de Ingeniería
Química de la Universidad de Cantabria.
población
muestra
1. Coste reducido: la recogida y tratamiento de datos resulta
más barato al trabajar con una pequeña parte de la población
2. Mayor rapidez en la evaluación del resultado final (ej.
escrutinio de votos de las primeras mesas electorales).
3. Imposibilidad material por destrucción del objeto a estudio
(ej. duración de bombillas, si se estudia toda la población no
quedarían bombillas para vender).
Es importante elegir una muestra que represente bien a la población.
Necesidad del muestreo:
5. María Dolores Frías, Jesús Fernández y Carmen María Sordo
Inferencia Estadística
El problema que aparece con más frecuencia en la práctica es
el de la estimación de parámetros de la población, que son
desconocidos.
m u e s t r a
a l e a t o r i a
P O B L A C I Ó N
d a t o s
n u m é r i c o s
e s t a d í s t i c o s
p a r á m e t r o s
p o b l a c i ó n
m u e s t r a
a l e a t o r i a
P O B L A C I Ó N
d a t o s
n u m é r i c o s
e s t a d í s t i c o s
p a r á m e t r o s
p o b l a c i ó n
Existe una
de donde se
extrae una
la muestra
genera
utilizados
para evaluar
utilizados
para estimar
utilizados para describir la
El objetivo es deducir (inferir) características de una población
mediante el estudio de una muestra
6. María Dolores Frías, Jesús Fernández y Carmen María Sordo
Inferencia Estadística
Conjunto de métodos estadísticos que permiten deducir (inferir)
como se distribuye la población en estudio a partir de la información
que proporciona una muestra.
de donde se
extrae una
la muestra
genera
V.A. Altura
utilizados
para evaluar
utilizados para describir la
muestra aleatoria:
Alumnos de 1º de
Ingenieria Civil
POBLACIÓN:
alumnos de la
U.C
23,18,20,…
parámetro
población
μ
7.1
5.02
=S
=x
n
muestra aleatoria:
POBLACIÓN:
alumnos de la
U.C
parámetro
población
μ
=S
=x
n
Grupo alumnos
1.72,1.69,1.57... 1.90
1.71 m
0.53 m
Se desea conocer la altura de los alumnos de la Universidad de
Cantabria.
utilizados
para estimar
7. María Dolores Frías, Jesús Fernández y Carmen María Sordo
Inferencia Estadística
Estimación puntual: Obtener un pronóstico numérico
único sobre un parámetro de la distribución.
Estimación por intervalos: Obtener un margen de
variación para un parámetro de la distribución.
Población, parámetro
● proporción P
● media
● varianza σ2
Muestra, estimador parámetro
● proporción p
● media
● Varianza Sn
2
Objetivo:min∣−∣
x
24. Ejercicio
Se quiere estimar la proporción de zurdos en una población con una confianza del
95% y una precisión de 0.01.
1. ¿Cuál debe ser el tamaño de la muestra escogida?
2. Mediante un muestreo previo se estima que p 0.1, ¿qué tamaño debe tener la ≈
muestra si para calcularlo se utiliza la estimación de p obtenida?
31. Ejercicio
En un instituto se sabe que la estatura de los alumnos se ajusta a una
N(165,82
) en cm. Calcular la probabilidad de que la altura media de 64
alumnos, elegidos al azar, esté entre 163 y 167 cm.
33. María Dolores Frías, Jesús Fernández y Carmen María Sordo
Intervalos de confianza de una media
Si la aproximación normal no es válida (n pequeña y σ
desconocida), al igual que se hizo con el intervalo de probabilidad,
es necesario considerar el valor de la cuasivarianza muestral S2
y
calcular la variable t, que se distribuye según una t de Student.
α=b)μP(a −≤≤ 1
Se dice que el intervalo (a,b] es un intervalo de confianza para μ
al nivel (1 ) si se verifica:α
Usando la hipótesis de normalidad y de la misma manera que se
hizo para las proporciones:
37. María Dolores Frías, Jesús Fernández y Carmen María Sordo
Estimación de una varianza
La varianza poblacional (σ2
) es constante mientras que cada
muestra puede tener una varianza o cuasivarianza muestral
(Sn
2
, S2
) distinta.
Sn
2
y S2
son variables aleatorias por lo que es importante
determinar su distribución
La distribución de la varianza (cuasivarianza) muestral es la
distribución de probabilidad de todos los valores posibles de la
varianza (cuasivarianza) muestral.
1x
2
3S4x
2
σ
22
, n
SS
2
1S2
4S
2
2S
39. María Dolores Frías, Jesús Fernández y Carmen María Sordo
Intervalos de probabilidad de una varianza
Se denomina intervalo de probabilidad de una varianza a
aquel intervalo para el cual se sabe con una confianza 1 que α
la varianza muestral se encuentra en dicho intervalo.
Para el caso de la varianza y cuasivarianza muestrales, no
existe una distribución a la que converjan todos los casos
posibles de distribución poblacional.
La distribución de la varianza o cuasivarianza muestral
depende en alto grado de cual sea la distribución poblacional
de partida.
Para simplificar vamos a considerar en lo que sigue sólo el
caso de población normal.
α=b)SP(a n −≤≤ 12
42. María Dolores Frías, Jesús Fernández y Carmen María Sordo
Si asumimos que la población sigue una distribución N(µ, σ2
),
entonces la variable aleatoria
Por tanto:
Pero hay infinitos valores de a y b que cumplen esta relación
para una confianza dada.
≤ ≤
Intervalos de probabilidad de una varianza