Este documento presenta información sobre estimación por intervalos de confianza, incluyendo cómo calcular el tamaño de la muestra requerido para un intervalo de confianza dado y cómo estimar la media poblacional cuando la varianza es desconocida. También cubre cómo estimar la diferencia entre dos medias poblacionales usando dos muestras con varianzas conocidas.
1. Enith Cecilia Niebles Lara
Ingeniera Civil
Especialista educación Matemática
Curso para hacer clase Estadística Inferencial
Basada en recopilación Bibliográfica indicada
SEMANA 3
3. Estimación por Intervalos de Confianza
3.1 Tamaño de la Muestra
Cuando se requiere saber el tamaño de la muestra para asegurar que el error al
estimar sea menor que una cantidad determinada e.
De acuerdo a lo trabajado en semana anterior debemos elegir n de modo que
z
√
= e, Al resolver esta ecuación se obtiene para n:
n= (z σ/ e)2 Sólo si se conoce la σ de la que seleccionamos la muestra.
Nota:
Cuando se resuelve para el tamaño de la muestra n, todos los valores fraccionales
se redondean al siguiente número entero.
En caso de no conocer σ, se puede tomar una muestra preliminar de tamaño
n≥ 30 que proporcione una estimación de σ, luego con el uso de s se puede
determinar aproximadamente cuantas observaciones
se necesitan para
proporcionar el grado de precisión que se desea.
Ejemplo:
¿Qué tan grande se requiere una muestra del ejemplo anterior, si queremos tener
un 95% de confianza de que nuestra estimación de µ difiera por menos de 0.05?
Solución:
La desviación estándar poblacional es σ = 0.3; aplicando la fórmula se tiene que
n= ( (1.96)(0.3)/0.05 )2 = 138.3. Concluimos que se puede tener una confianza
de 95% de que una muestra aleatoria de tamaño n = 139 proporcionará una
estimación ̅ que difiere de µ en una cantidad menor que 0.05
1
2. Enith Cecilia Niebles Lara
Ingeniera Civil
3.2 Estimación de
desconocida
Especialista educación Matemática
Curso para hacer clase Estadística Inferencial
Basada en recopilación Bibliográfica indicada
la Media Poblacional con una Muestra, con varianza
Cuando se requiere estimar una población y no se conoce la varianza, si la
muestra aleatoria proviene de una distribución normal, entonces la variable
aleatoria tiene una distribución t de Student con n-1 grados de libertad.
T = ( ̅ - µ) ∕ (
√
)
Donde:
s = es la desviación estándar de la muestra, en
esta situación en que se desconoce
intervalo de confianza de µ.
σ, se puede utilizar T para construir un
El procedimiento es el mismo anterior, sólo que excepto que se reemplaza
σ por s y la distribución normal estándar se reemplaza por la distribución T de
Student.
Entonces
1-
- t
0
P(- t
Donde t
lados del eje
t
t
<T<
t
)
= 1-
es el valor t con n-1 grados de libertad, vemos en la gráfica un área ambos
, debido a su simetría.
2
3. Enith Cecilia Niebles Lara
Ingeniera Civil
Especialista educación Matemática
Curso para hacer clase Estadística Inferencial
Basada en recopilación Bibliográfica indicada
Ahora, si ̅ y s son la media y la desviación estándar de una muestra
aleatoria de una población normal con varianza σ2 desconocida, un
intervalo de confianza de (1- ) 100% para µ es1:
̅-t
Donde
√
t
< ̅+t
<
√
es el valor t con v = n-1 grados de libertad, que deja un área de
a la derecha.
Nota: El uso de la distribución t, se basa en la premisa de que el muestreo
se realiza de una distribución normal. Con mucha frecuencia los
estadísticos recomiendan que aunque la normalidad no se pueda suponer,
con σ desconocida y n≥ 30, S, pueda remplazar a σ y se puede utilizar el
intervalo de confianza:
̅-z
√
<
< ̅+z
√
“Por lo general este intervalo se le llama “intervalo de confianza de muestra
grande”, se justifica porque n≥ 30, S estará muy cerca de σ real y de ésta
forma el teorema del límite central sigue valiendo, se recuerda que esto es
sólo una aproximación y que la calidad de este enfoque mejora a medida
que el tamaño de la muestra crece.
Ejemplo2:
El contenido de 7 contenedores similares de ácido sulfúrico son 9.8, 10.2,
9.8, 10.4, 10.0, 10.2, y 9.6 litros. Encuentre un intervalo de confianza del
95% para la media de todos los contenedores, si se supone una distribución
aproximadamente normal”.
1
Algunos apartes fueron tomados de http://tesisdeinvestig.blogspot.com/2011/05/teoria-de-pequenasmuestras-o-teoria.html
2
Algunos
apartes
fueron
tomados
de
http://www.itch.edu.mx/academic/industrial/estadistica1/cap03.html#tres_intervalo_media_var_desconoci
da
3
4. Enith Cecilia Niebles Lara
Ingeniera Civil
Especialista educación Matemática
Curso para hacer clase Estadística Inferencial
Basada en recopilación Bibliográfica indicada
Solución:
La media muestral y la desviación estándar para los datos son
̅ = ∑ xi ∕n = 10.0 litros
(Xi- ̅ )2 ∕ n-1 0.283 litros
Ahora, (1 – )= 95%; es decir, (1 – )= 0.95
De donde = 0.05 y
= 0.025 ahora buscamos en las tablas A4 1 y
A42, t 0.025, ver anexos.
Encontramos
t 0.025 = 2.447, para v= 6 grados de libertad.
Por tanto el intervalo de confianza de 95% para µ es:
̅-t
√
̅–t
< ̅+t
<
<
√
√
< ̅+t
Reemplazando,
√
,
Seguimos reemplazando,
– (2.447)
De donde: 9.74 <
<
√
<
<
+ (2.447)
√
10.26
Se puede afirmar con una confianza del 95% de que el contenido medio con ácido
sulfúrico en los contenedores esta entre 9.74 y 10.26 litros
(Solucionar Taller 3 estimación de la media).
4
5. Enith Cecilia Niebles Lara
Ingeniera Civil
Especialista educación Matemática
Curso para hacer clase Estadística Inferencial
Basada en recopilación Bibliográfica indicada
3.3 Estimación de la Diferencia entre dos Medias Poblacionales (Con dos
Muestras) y Varianzas conocidas
Si tenemos dos poblaciones con medias
µ1 y µ2
y varianzas σ1
respectivamente, un estimador puntual de la diferencia entre µ1 y µ2
dado por la estadística ̅ 1 - ̅ 2).
y σ2
está
Para obtener una estimación de (µ1 - µ2), seleccionamos dos muestras
aleatorias independientes, una de cada población, de tamaño n1 y n2, y
calculamos la diferencia ̅ 1 - ̅ 2) de las medias muestrales y podemos esperar
que esté distribuida en forma aproximadamente normal.
Entonces un intervalo de confianza (1conocida, esta dado por:
(̅ - ̅ ) - Z √
Donde z
) 100% para (µ1 - µ2); con σ1 y σ2
< ( µ1 - µ2 )< (̅ - ̅ ) + Z √
es el valor de Z que deja un área de
a la derecha.
El grado de confianza es exacto cuando las muestras se seleccionan de
poblaciones normales.
Ejemplo:
Se lleva a cabo un experimento en que se comparan dos tipos de motores A y B.
se miden el rendimiento en millas por galón de gasolina. Se realizan 50
experimentos con el motor tipo A y 75 con el motor tipo B. La gasolina que se
utiliza y las demás condiciones se mantienen constantes.
5
6. Enith Cecilia Niebles Lara
Ingeniera Civil
Especialista educación Matemática
Curso para hacer clase Estadística Inferencial
Basada en recopilación Bibliográfica indicada
El rendimiento promedio de gasolina para el motor A es de 36 millas por galón y el
promedio para el motor B es 42 millas por galón, Encuentre un intervalo de
confianza de 96% sobre ( µB - µA ), donde µB y µA son el rendimiento de gasolina
medio poblacional para los motores A y B , respectivamente. Suponga que las
desviaciones estándar poblacionales son seis y ocho para los motores A y B,
respectivamente.
Solución:
La estimación puntual de µB - µA es ̅ - ̅ = 42 – 36 = 6
(1 – )= 96%; es decir, (1 – )= 0.96
De donde = 0.04 y
= 0.02 ahora buscamos en las tablas A3 1 y A32,
Z 0.02, ver anexos.
Encontramos que Z 0.02 = 2.05.
Reemplazamos en la fórmula para encontrar el intervalo de confianza del 96% y
obtenemos:
(
-
)–Z
√
< ( µB - µ A ) < (
-
)+Z
√
Es decir: 3.43 < ( µB - µA ) < 8.57
Si las varianzas no se conocen y las dos distribuciones relacionadas son
aproximadamente normales, aplicamos la distribución t. Ahora si no se está
dispuesto a suponer que son normales (usando muestras mayores que 30),
entonces se permite el uso de S1 y S2 en lugar de σ1 y S2 respectivamente, con
la explicación de que S1 σ1 y S2 S2… Por supuesto el intervalo en este caso es
aproximado.
(solucionar Taller 3 estimación de la diferencia de medias).
6