Este documento presenta los conceptos de intervalos de confianza para diferentes parámetros estadísticos como la media, varianza, proporción, diferencia de medias y datos pareados. Explica cómo calcular intervalos de confianza para estos parámetros utilizando diferentes distribuciones como la normal, t-Student y Chi-cuadrada. También incluye varios ejemplos numéricos para ilustrar cómo aplicar los métodos.
Normalidad: Test gráficos, Test Jarque-Bera, Test Shapiro Wilk.
Multicolinialidad: Factor inflador de varianza,
Heterocedasticidad: Test Breusch-Pagan, Test de White, Míınimos Cuadrados Generalizados, Errores robustos
Normalidad: Test gráficos, Test Jarque-Bera, Test Shapiro Wilk.
Multicolinialidad: Factor inflador de varianza,
Heterocedasticidad: Test Breusch-Pagan, Test de White, Míınimos Cuadrados Generalizados, Errores robustos
1. (2)
(2)
(1)
(1)
Capítulo 5
Estimación Por Intérvalos
Ing. Yuri Roberto Zamorano Braun
Introducción
En el Capítulo 4 se consideró dos métodos de evaluar y computar estimadores (Momentos y Máxima Verosimilitud); sin embargo, no
examinamos una medida de su respectiva fiabilidad. ¿Cuán fiable es un estimador? ¿Hasta dónde podremos confiar en un estimador puntual?
Estudiamos en el Capítulo anterior que si es la media de una muestra aleatoria de tamaño proveniente de una población normal de media
y varianza , entonces .
Si introducimos una magnitud , llamada nivel de significación (Valores comunes: 1%, 5%,10%), de tal forma que sea el punto crítico
asociado al nivel de significación , entonces si considertamos o , se puede construir los siguientes gráficos:
Intervalo de Confianza de Una Cola (Cola
izquierda)
1
3. (7)
(7)
(8)
(8)
Podemos aseverar con de nivel de confianza que la variable aleatoria tomará un valor comprendido entre y
por lo que de acuerdo a lo expuesto:
; si se despeja , se tiene: , denominado intérvalo de
confianza , y puesto que son constantes para una muestra dada, será perfectamente factible el conocer el intervalo de
confianza con un nivel de significación de o lo que resulta equivalente, con un nivel de confianza de .
El intervalo de confianza se interpreta como el segmento de la variable aleatoria donde existira una probabilidad de que el
intérvalo comprendido entre el Límite Inferior y el Límite Superior contenga al "verdadero" parámetro
poblacional. Por ende existirá también una probabilidad de de que el intérvalo anterior no contenga al parámetro poblacional.
La amplitud del intérvalo será
Ejemplo 1. Si se quiere estimar la media poblacional de una distribución normal con , , ,
, se tiene:
3
4. Se interpreta como que existe 95% de probabilidad (nivel de confianza)
sabe también que hay un 5% de probabilidad (nivel de significación), que el intérvalo [57.73,70.87] no contenga al parámetro poblacional.
Ello querrá decir que si se extraen 100 muestras aleatorias diferentes, el 95% de las veces, el intérvalo [57.73,70.87] contendrá la media
poblacional.
es arbitraria y depende del tipo de problema analizado y del investigador. Es menester acotar que
por ser una variable aleatoria, tanto el como el son también variables aleatorias.
Finalmente una propiedad deseable de los intérvalos de confianza es que su amplitud sea mínima, es decir:
NOTA IMPORTANTE: En Minitab, el cálculo de los valores críticos se realiza utilizando el nivel de confianza, por lo que para determinar
tendría que hacerse utilizando como valor de probabilidad.
Intervalos Confidenciales para la Media de una Distribución Normal
Parámetro a
estimar
Estimación Distribución Intérvalos de confianza
Media de una
con
conocida
Normal
ó
Media de una
con
desconocida y
n>30
Media de
cualquier
población y
muestras grandes
Normal
ó
4
5. (10)
(10)
(9)
(9)
Media de una
con
desconocida y
t-Student de
(n-1)
ó
Ejemplo 1. De una cierta población se ha extraído una muestra de 64 individuos, cuyo valor medio es 1012. Se sabe por otras experiencias del
mismo tipo, que la desviación típica vale 25. Hallar intervalos de confianza para el valor medio de la población a los niveles de confianza del
0.95 y 0.99.
Solución:
Ejemplo 2. En una muestra de 9 preparados de jugo de tomate se ha obtenido una media de 21 mg/100 cc y una cuasidesviación típica de 2.45
5
6. (12)
(12)
(11)
(11)
mg/100 cc de vitamina C. Supuesto que el contenido de vitamina C del jugo de tomate se distribuye según una distribución Normal de
varianza desconocida. Se pide calcular el intervalo de confianza al 98 %.
Solución:
Ejemplo 3. Supongamos el mismo ejemplo anterior, pero en el caso de disponer de los datos de los 9 preparados en contenido de vitamina C
del jugo de tomate.
1 24
2 20
3 21
4 19
5 22
6 23
7 16
8 23
9 21
6
8. Ejemplo 4. Con el fin de estudiar el número medio de flexiones continuadas que pueden realizar los alumnos, un profesor de educación física
somete a 75 de ellos, elegidos aleatoriamente, a una prueba. El número de flexiones realizado por cada alumno, así como su sexo y si realizan
o no deporte se muestran en el archivo Datos.xlsx
Se sabe que el número de flexiones se distribuye según una Normal de varianza poblacional 7.5. Determinar el intervalo de confianza a un
nivel de confianza del 95% para el número medio de flexiones.
Solución:
8
9. (16)
(16)
(15)
(15)
Intervalos Confidenciales para la Varianza de una Distribución Normal
Parámetro a
estimar
Estimación Distribución Intérvalos de confianza
Varianza de una
con
desconocida
Chi Cuadrado de
(n-1)
ó
Varianza de una No tiene
9
10. (17)
(17)
(18)
(18) (19)
(19)
con
desconocida
m=Media recortada en
(Método de Bonett)
Nota: En Minitab el cálculo se realiza utilizando el nivel de confianza:
Chi-cuadrada con 5 GL
0.975 12.8325019938675187
Luego
Chi-cuadrada con 5 GL
0.025 0.8312116134946851
Luego
10
12. (25)
(25)
(24)
(24)
Ejemplo 6. En las pruebas del uso de "alcogas", se utilizaron 16 motores experimentales diferentes. El consumo de alcogas tuvo una
desviación estandar s=2.2 galones. Construir un intervalo de confianza al 99% para el desvío estandar.
Solución.
Ejemplo 7.En un criadero de peces se crían truchas para aprovisionar ríos y lagos. El peso del pez en el momento que es liberado se puede
controlar variando la alimentación. El criadero espera una desviación estándar de 21.5 gramos en el peso de los peces. Para evaluar si el plan
de alimentación que se aplica cumple lo deseado, se toma una muestra de 25 peces obteniéndose una desviación para el peso de 28.9 gramos.
El intervalo de 95% de confianza para la varianza poblacional es:
Solución.
12
13. (28)
(28)
(27)
(27)
(26)
(26)
(29)
(29)
(30)
(30)
Por lo tanto se concluye, con un 95 % de confianza, que el desvío estándar del peso de los peces es superior al deseado por el criadero (21.5).
Si el enunciado del ejercicio fuera: Determinar el nivel de confianza de construcción del siguiente intervalo de confianza:[
, donde n=25 y
13
14. El nivel de signioficación es 5% y el nivel de confianza es del 95%.
Intervalo Confidencial para Proporciones de una Distribución Normal
Parámetro a
estimar
Estimación Distribución Intérvalos de confianza
p de Binomial Normal
ó
p de Binomial t-Student (n)
ó
Ejemplo 8. En una muestra de 900 personas con pelo oscuro se encontró que 150 de ellas tenían los ojos azules. Construir un intervalo de
confianza al 95% para la proporción de individuos que teniendo el pelo oscuro posee los ajos azules. ¿Son compatibles estos resultados con la
suposición de que dicha proporción vale 1/4?
Solución.
14
15. (33)
(33)
(31)
(31)
(32)
(32)
. La respuesta es No.
Intervalo Confidencial del Coeficiente de Variación de una Distribución Normal
Parámetro a
estimar
Estimación Distribución Intérvalos de confianza
Coeficiente de
Variación con
desconocida
Chi Cuadrado de
(n-1)
ó
15
16. (35)
(35)
(34)
(34)
Ejemplo 9. Se ha obtenido una muestra de 15 vendedores de una Editorial para estimar el valor medio de las ventas por trabajador en la
Empresa. La media y varianza de la muestra ( en miles de Bs ) son 5 y 200, respectivamente. Obtener el intervalo de confianza para el
Coeficiente de Variación de la venta por trabajador en la Editorial al 90 %.
Solución.
Intervalos Confidenciales para la Relación de Varianzas
Parámetro a
estimar
Estimación Distribución Intérvalos de confianza
Razón de
varianzas de dos
poblaciones
normales
16
17. ó
Razón de
varianzas de dos
poblaciones
normales. Método
de Levene
Término Description
de la muestra i
Zij
donde j = 1, 2, ... , ni y i =
1, 2 y Xij son
observaciones individuales
Mi la media de
Zij
Si2 la varianza
de la muestra de Zij
vi
n1 el tamaño
de la primera muestra
n2 el tamaño
Si , límite inferior =
Si , no existe un límite inferior
Si , límite superior =
Si , no existe un límite superior
17
18. (36)
(36)
de la segunda muestra
Nota: En Minitab el cálculo sería utilizando el nivel de confianza:
Distribución F con 10 GL en el numerador y 20 GL en el
denominador
0.975 2.7736713739278915
Luego
(37)
Distribución F con 10 GL en el numerador y 20 GL en el
denominador
0.025 0.2925222379839681
Luego
(38)
Ojo:
Ejemplo 10. La siguiente tabla proporciona datos sobre la precipitación total registrada en 11 estaciones meteorológicas de dos provincias
españolas. Suponiendo independencia y normalidad. Calcular un intervalo de confianza a un nivel de confianza del 80% para el cociente de
varianzas en ambas poblaciones. ¿Puede asumirse que ambas varianzas son iguales?
ProvA={100,89,84,120,130,105,60,70,90,108,130}
ProvB={120,115,96,115,140,120,75,90,108,130,135}
Solución:
18
19. (40)
(40)
(39)
(39)
Este intervalo de confianza contiene al valor 1, por lo que se puede suponer que las varianzas de las dos distribuciones son idénticas.
19
20. Intervalos Confidenciales para la Diferencia de Medias
Parámetro a
estimar
Estimación Distribución Intérvalos de confianza
Diferencia de
medias de
poblaciones
normales con
conocidos
Normal
ó
Diferencia de
medias de
poblaciones
normales y no
normales con
Normal
20
21. desconocidos y
ó
Diferencia de
medias de
poblaciones
normales con
y
desconocido y
muestras pequeñas
t-Student de
( -2)
ó
Diferencia de
medias de
poblaciones
normales con
donde las
t-Student de
(
21
22. (41)
(41)
(41)
(41)
varianzas son
deconocidas y
para muestras
pequeñas
ó
Ejemplo 11.En vista de los resultados obtenidos en el ejercicio anterior, y suponiendo que las precipitaciones registradas en 11 estaciones
meteorológicas de dos provincias se distribuyen de acuerdo a variables normales de medias y varianzas desconocidas. Obtener un intervalo de
confianza al 80% para la diferencia del número medio de precipitaciones entre las dos provincias. ¿Puede suponerse que el número medio de
precipitaciones de las dos provincias es igual?
Solución:
22
24. (43)
(43)
Intervalos Confidenciales para Datos Pareados
determinada acción, aplicarles un determinado medicamento, etc.
Supongamos que constituye las medidas o valores de respuesta de la muestra antes de aplicarles el tratamiento. Del mismo
modo, supongamos que constituye las medidas o valores de respuesta de la muestra después de aplicarles dicho tratamiento.
Si estuviéramos interesados en analizar el efecto del tratamiento, es lógico definir otra variable . El orden cómo se resta
no interesa, interesa la interpretación correcta de la diferencia y lo que se quiere analizar.
Se puede obtener estadísticas de la variable D como su media o su varianza muestral luego y
Parámetro a Estimación Distribución Intérvalos de confianza
24
25. estimar
Diferencia de
Datos Pareado
y muestras
pequeñas
t-Student de
(n-1)
ó
Ejemplo 12.En una unidad del sueño se está probando con un nuevo somnífero. Para comprobar su eficacia se toman 10 individuos al azar, un
día no se les suministra el somnífero y se les comprueba el número de horas de sueño, al día siguiente se les suministra y se vuelve a
comprobar las horas de sueño. Los resultados entes y después del tratamiento han sido los siguientes:
Antes={7.3,8.2,6.3,5.2,6.9,5.8,5.3,7.1,6.9,8.1}
Después={8.2,7.9,6.4,5.1,7.1,6.3,5.9,8.2,7.1,7.7}
Calcular un intervalo de confianza, al 96% de confianza para la diferencia del número medio de horas de sueño antes y después del
tratamiento.
Solución:
25
26. (44)
(44)
(45)
(45)
El intervalo de confianza, al 96% de confianza, para la diferencia del número medio de horas de sueño antes y después del tratamiento es [
,0.0946484]. Este intervalo contiene al 0, por lo que podemos concluir que el número de horas de sueño antes y después del
tratamiento pueden considerarse iguales, poniendo así en duda la efectividad del somnífero.
Intervalos Confidenciales para la Diferencia de Proporciones
Parámetro a
estimar
Estimación Distribución Intérvalos de confianza
Diferencia de
proporciones y
muestras grandes
Normal
ó
Ejemplo 13.Según los dirigentes del partido A, la intención de voto del partido rival B, en La Paz, es la misma que la que tiene en El Alto. Se
realiza una encuesta a 100 personas en La Paz de los que 25 mostraron su apoyo al partido B, y a otras 100 personas en El Alto de las que 30
se inclinaron por el partido B.
Construir un intervalo de confianza al 90% para la diferencia de proporciones en la estimación del voto del partido B en las dos ciudades. ¿Se
puede afirmar que los dirigentes del partido A tienen razón?
Solución:
26
27. (47)
(47)
(46)
(46)
El intervalo de confianza cubre el cero, lo que indica que no existe diferencia significativa entre la intención de voto del partido B en ambas
ciudades, con lo cual los dirigentes del partido A tienen razón con una fiabilidad del 90%.
Intervalos Confidenciales del Coeficiente de Correlación
Parámetro a Estimación Distribución Intérvalos de confianza
27
28. estimar
Coeficiente de
correlación
Normal
ó
Ejemplo 14. El coeficiente de correlación entre la altura y el peso de los residentes de un determinado municipio es 0.56. Determine el
intervalo de confianza del coeficiente de correlación a un nivel de significación de 5% de una muestra de 30 personas.
Solución:
28
29. (49)
(49)
(48)
(48)
Existe una probabilidad del 95% de que el intervalo de confianza de [0.2502, 0.7658] contenga el verdadero coeficiente de correlación de la
población entre la altura y el peso de los residentes de este municipio.
29