Este documento presenta información sobre intervalos de confianza e incluye ejemplos de cálculos de intervalos de confianza para la media y la varianza basados en datos de muestras. En particular, se define qué es un intervalo de confianza, y se explican conceptos relacionados como estimación puntual, nivel de confianza y límites de confianza. Luego, se resuelven cuatro ejercicios que implican calcular intervalos de confianza para la media y varianza a diferentes niveles de confianza usando datos de muestras y t
4. 1.- INTRODUCCION
Dentro del estudio de la inferencia estadística, se describe como se puede tomar
una muestra aleatoria y a partir de esta muestra estimar el valor de un parámetro
poblacional en la cual se puede emplear el método de muestreo y el teorema del
valor central lo que permite explicar como a partir de una muestra se puede inferir
algo acerca de una población, lo cual nos lleva a definir y elaborar una distribución
de muestreo de medias muestrales que nos permite explicar el teorema del limite
central y utilizar este teorema para encontrar las probabilidades de obtener las
distintas medias maestrales de una población.
Pero es necesario tener conocimiento de ciertos datos de la población como la
media, la desviación estándar o la forma de la población, pero a veces no se
dispone de esta información.
En este caso es necesario hacer una estimación puntual que es un valor que se
usa para estimar un valor poblacional. Pero una estimación puntual es un solo
valor y se requiere un intervalo de valores a esto se denomina intervalote
confianza y se espera que dentro de este intervalo se encuentre el parámetro
poblacional buscado. También se utiliza una estimación mediante un intervalo, el
cual es un rango de valores en el que se espera se encuentre el parámetro
poblacional
En nuestro caso se desarrolla un procedimiento para probar la validez de una
aseveración acerca de un parámetro poblacional este método es denominado
Prueba de hipótesis para una muestra.
5. 2.- HIPOTESIS Y PRUEBA DE HIPOTESIS
Tenemos que empezar por definir que es una hipótesis y que es
prueba de hipótesis.
Hipótesis es una aseveración de una población elaborado con el
propósito de poner aprueba, para verificar si la afirmación es
razonable se usan datos.
En el análisis estadístico se hace una aseveración, es decir, se
plantea una hipótesis, después se hacen las pruebas para
verificar la aseveración o para determinar que no es verdadera.
Por tanto, la prueba de hipótesis es un procedimiento basado en
la evidencia muestral y la teoría de probabilidad; se emplea para
determinar si la hipótesis es una afirmación razonable.
Prueba de una hipótesis: se realiza mediante un procedimiento
sistemático de cinco paso:
6.
7. EJERCICIO 1
Una encuesta revela que los 100 autos particulares, que constituyen una
muestra
aleatoria, se condujeron a un promedio de 12500 Km. Durante un
año, con una
desviación estándar de 2400 Km. Con base en esta
información, docimar la
hipótesis donde, en promedio, los autos particulares se condujeron a
12000 Km
durante un año, f rente a la alternativa de que el promedio sea superior.
Utilizar el
nivel de significación.
SOLUCIÓN
H0: μ = 12000
Ha: μ > 12000
n = 100
S = 2400
= 0.05
Zcalc = 2.083
8. Rechazamos la hipótesis de que μ es igual a 12000, luego aceptamos que los
autos se condujeron en un promedio superior durante ese año, al nivel del 5%.
9. EJERCICIO 2
Un criador de pollos sabe por experiencia que el peso
de los pollos de cinco meses es 4,35 libras. Los pesos
siguen una distribución normal. Para tratar de aumentar
el peso de dichas aves se le agrega un aditivo al
alimento. En una muestra de pollos de cinco meses se
obtuvieron los siguientes pesos ( en libras).
4,41 4,37 4,33 4,35 4,30 4,39
4,36 4,38 4,40 4,39
En el nivel 0,01, el aditivo ha aumentado el peso medio
de los pollos? Estime el valor de p.
10.
11. EJERCICIO 3
Lisa Monnin es directora de presupuesto en la empresa
New Process Company, desea comparar los gastos
diarios de transporte del equipo de ventas y del
personal de cobranza. Recopiló la siguiente información
muestral ( importe en dólares).
Ventas ($) 131 135 146 165 136 142
Cobranza ($) 130 102 129 143 149 120 139
Al nivel de significancia de 0,10, puede concluirse que
los gastos medios diarios del equipo de ventas son
mayores? cuál es el valor p?
12.
13. EJERCICIO 4
De una población se toma una muestra de 40 observaciones. La media
muestral es de 102 y la desviación estándar 5. De otra población se
toma una muestra de 50 observaciones. La media mustral es ahora 99 y
la desviación estándar es 6. Realice la siguiente prueba de hipótesis
usando como nivel de significancia 0,04.Ho: u1 = u2
Ho: u1 ≠ u2
a) Es esta una prueba de una o de dos colas?
Esta es una prueba de hipótesis de dos colas
b ) Establezca la regla de decisión
Si Z > que le valor crítico, se rechaza la hipótesis nula y se acepta la
hipótesis alternativa
c) Calcule el valor del estadístico de prueba
Si Z > que el valor crítico, se rechaza la hipótesis nula y se acepta H1
14.
15. EJERCICIO 5
Determine si la región de rechazo es de la cola
derecha, de la cola izquierda o de dos colas.
a.H0 : m = 15, H1 : m ¹ 15, =.05
b.H0 : p £ 0.7, H1 : p > 0.7, =.02
Solución: La forma de la región de rechazo está
determinada por la hipótesis alterna.
H1 : m ¹ 15 significa que la región está en ambas colas.
.05/2
.05/2 .05/2
.05/2
16. H1 : p > 7 significa que la región está en la cola derecha.
.02
17. EJERCICIO 6
En el Ejemplo 1a, presumamos que la región derechazo
es parte de la curva normal estándar. Complete el
dibujo de la región crítica para los valores a siguientes:
a)a = .05
Solución: a. Del ejemplo 1(a), tenemos:
De la tabla de la distribución
.05/2=0.025 .05/2=0.02 normal, la
5
P(Z z) =.025 corresponde a
un valor Z= -1.96. Por simetría
la P(Z>z)=.025 corresponde a
-1.96 1.96 Z= 1.96.
18. EJERCICIO 7
En el ejemplo 1a, presumamos que la región de rechazo
es parte de la curva t. Complete el dibujo de la región de
rechazo para:
a = .05 y u = 14
Solución: a. Del ejemplo 1(a), a = .05, y u =
14, tenemos:
De la tabla de la
.05/2=0.025 .05/2=0.025
distribución t, la
P(T t) =.025 corresponde a
un valor t= -2.086. Por
simetría la P(T>t)=.025
-2.086 2.086 corresponde a t= 2.086.
19. EJERCICIO 8
Establezca las hipótesis nula y alterna.
a. Las millas por galón (mpg) promedio de un nuevo modelo
de automóvil es 32.
b. Más del 65% de los empleados de un colegio aportan a
Fondos Unidos.
c. En promedio, los empleados de cierta compañía viven a
no más de 15 millas de la misma.
d. Al menos un 60% de la población adulta de una
comunidad votará en las próximas elecciones Presidenciales.
e. El peso promedio de un pollo para asar es de al menos
cuatro libras.
Solución:
a.H0 : m = 32
b.H0 : p ³ .65
c.H0 : m £ 15 H1 : m ¹ 32 H1 : p < .65 H1 : m > 15
d.H0 : p ³ .6
e.H0 : m ³ 4 H1 : p < .6 H1 : m < 4
21. DEFINICION
Intervalo de valores que tiene designada una probabilidad que incluya el valor real
del parámetro de población.
Para entender mas claramente este concepto, es necesario comentar de inicio
otros que al estar relacionados con el, facilitan su comprensión.
Algunos de estos conceptos a revisar son:
¯ Estimación.
¯ Estimación Puntual.
¯ Estimación de intervalo.
¯ Nivel de confianza.
¯ Limites de confianza
ESTIMACIÓN
(Del lat. aestimatĭo, -ōnis). f. Aprecio y valor que se da y en que se tasa y
considera algo. || 2. Der. La que se realiza en ciertos tributos para determinar el
valor de la base imponible.
Este es el concepto que podemos encontrar en un diccionario. Pero es además
un concepto que en nuestra vida diaria aplicamos de forma recurrente.
22. EJERCICIO 1
1- Los tiempos de reacción, en mili segundos, de 17 sujetos frente a una matriz de
15
estímulos fueron los siguientes: 448, 460, 514, 488, 592, 490, 507, 513, 492, 534,
523, 452, 464, 562, 584, 507, 461
Suponiendo que el tiempo de reacción se distribuye Normalmente, determine un
intervalo de
confianza para la media a un nivel de confianza del 95%.
Solución:
Mediante los cálculos básicos obtenemos que la media muestral vale 505,35 y la
desviación
típica 42,54.
Buscando en las tablas de la t de Student con 16 grados de libertad, obtenemos
que el valor
que deja por debajo una probabilidad de 0,975 es 2,12
Sustituyendo estos valores en la expresión del intervalo de confianza de la media
tenemos:
(505,35 - 2,12 · 42,54 / 4 ,, 505,35 + 2,12 · 42,54 / 4)
operando
( 482,80 ,, 527,90 )
23. EJERCICIO 2
2- En una muestra de 65 sujetos las puntuaciones en una escala de extroversión tienen una
media de 32,7 puntos y una desviación típica de 12,64.
a) Calcule a partir de estos datos el correspondiente intervalo de confianza, a un nivel del
90%, para la media de la población.
b) Indique, con un nivel de confianza del 95%, cual sería el máximo error que podríamos
cometer al tomar como media de la población el valor obtenido en la estimación puntual.
Solución:
a) Buscando en las tablas de la t de Student obtenemos que el valor que deja por debajo una
probabilidad del 95% es 1,671 (aproximadamente). Sustituyendo los valores de esta muestra
en la expresión del intervalo de confianza obtenemos:
( 32,7 - 1,671 · 12,64 / 8 ,, 32,7 + 1,671 · 12,64 / 8 )
operando
( 30,06 ,, 35,34 )
b) En las tablas de la t de Student encontramos que el valor de la variable que deja por
debajo una probabilidad de 0,975 es 2. En consecuencia a un nivel de confianza del 95% la
media de la población puede valer
32,7 ± 2 · 12,64 / 8
luego el máximo error que se puede cometer, a este nivel de confianza, es: 3,16
24. EJERCICIO 3
3- Con los datos del problema 1, calcule a un nivel de confianza del 90% un
intervalo de
confianza para la varianza e indique cual sería el máximo error por exceso y por
defecto que
podría cometerse utilizando el estimador insesgado de la varianza.
Solución:
Mediante cálculos básicos obtenemos que la varianza de la muestra vale 1809,29
y la
cuasivarianza 1922,37
En las tablas de la Ji-cuadrado encontramos que el valor que deja por debajo una
probabilidad de 0,05 es 7,96 y que 26,30 deja por debajo una probabilidad de
0,95.
Sustituyendo en la expresión del intervalo de confianza para la varianza tenemos:
( 17 · 1809,29 / 26,30 ,, 17 · 1809,29 / 7,96 )
operando
( 1169,50 ,, 3864,06 )
Por tanto el error por defecto sería 1922,37 - 3864,06 = -1941,69
y el error por exceso 1922,37 – 1169,50 = 752,87
25. EJERCICIO 4
4- En una muestra de 300 universitarios el 80% ha
respondido que asiste semanalmente al
cine. Entre que valores se encuentra, con un nivel de
confianza del 95%, la proporción de
universitarios que acude todas las semanas al cine.
Solución:
En las tablas de la Normal encontramos que el valor de
la variable que deja por debajo una
probabilidad de 0,975 es 1,96.
Sustituyendo en la expresión del intervalo de confianza
para una proporción:
(0,8-1,96raiz0,8*0,2/300,,0,8+1,16raiz0,8*0,2/300)
operando
( 0,755 ,, 0,845 )
26. EJERCICIO 5
Para determinar la estatura media de los varones adultos
españoles, se tomó una muestra al azar de 10 de ellos en la
que se obtuvo los valores
162, 176, 169, 165, 171, 169, 172, 168, 167 y 175 cm.
Determinar el valor de la estatura media, suponiendo que =
16.
Un estimador puntual para la estatura media µ es la que en
este caso es 169,4. Para dar un intervalo de confianza hemos
de suponer que es una v. a. normal. Como n=10, = 169,4 y =
4, para el intervalo de confianza al 95%, la expresión (4.1)
indica que
Así pues, esperamos que este intervalo sea un de los 95 de
cada 100 que contienen a µ, o, más brevemente, la estatura
media de los españoles varones adultos es algún valor entre
166,92 cm y 171,88 cm con una confianza del 95%
27. EJERCICIO 6
se conoce que n =10 y = 169,4. Ahora es preciso
calcular la varianza muestral por la fórmula
correspondiente lo que da s = 4,3. Como t0,05 (9
g.l.)= 2,262 en la tabla , entonces es el intervalo de
confianza para µ al 95% de confianza.
La interpretación del nuevo intervalo es idéntica del
que resultaba cuando la varianza era conocida, la
única diferencia es que ahora no sólo el centro del
intervalo es variable, sino que también lo es su
radio.
28. EJERCICIO 7
Si de 100 personas encuestadas, 30 se manifiestan a favor de un determinado
partido político, ¿qué porcentaje de votos obtendría dicho partido de celebrarse en
ese momento las elecciones? (confianza del 95%)
Obsérvese que x="nº de individuos, entre los 100 encuestados, que votarán al
candidato" es una Binomial de parámetro n = 100 y p desconocido. El objetivo es
determinar p teniendo en cuenta que x sigue una B(n,p), con n = 100 y x = 30 el
valor obtenido experimentalmente de esa Binomial. Conviene expresar que todo lo
que sigue contiene las fórmulas para p expresadas en tantos por uno, no en %.
Intervalo.
La distribución Binomial, bajo ciertas circunstancias, se aproxima a una Normal. Los
resultados siguientes se basan en esta aproximación. La expresión más
tradicional del intervalo de confianza para una proporción p es la siguiente:
Esta expresión es válida si x > 20 y n-x >20.Tiene la ventaja de ser cómoda, pero
a cambio es más imprecisa y tiene unas condiciones de validez más exigentes. La
siguiente expresión es más exacta (pero más incómoda) y para su validez basta
con que sean x > 5 y n - x > 5:
29.
30. EJERCICIO 8
Suponga que 100 estudiantes varones de una
universidad representan una muestra aleatoria de
las estaturas de la totalidad de estudiantes
varones. De dicha muestra se obtuvo una media
igual a 67,450 pulgadas. Se sabe que la varianza
para la estatura de los varones de dicha
universidad es 8,614 pulgadas. Encuentre un
intervalo de confianza del 95 % para la estatura
media de los estudiantes de la universidad.
31. SOLUCIÓN
1-.Lea detenidamente el enunciado, respetando las comas y puntos, tratando de identificar los datos que
se proporcionan.
En la primera parte del párrafo dice: Suponga que 100 estudiantes varones de una universidad representan
una muestra aleatoria de las estaturas de la totalidad de estudiantes varones.
Datos: Tamaño de la muestra, n = 100 estudiantes.
Variable, X = estaturas de los estudiantes varones de una universidad.
Luego: De dicha muestra se obtuvo una media igual a 67,450 pulgadas.
Dato: Media de la muestra, pulgadas.
Siguiendo: Se sabe que la varianza para la estatura de los varones de dicha universidad es 8,614
pulgadas.
Están hablando en general para la estatura de los varones de dicha universidad, por lo tanto ese valor
de la varianza es de la población y no de la muestra.
Dato: varianza de la población, pulgadas.
Finalmente: Encuentre un intervalo de confianza del 95 % para la estatura media de los estudiantes de la
universidad.
Dato: Se pide calcular un intervalo para la estatura promedio, es decir para la media de la población .
Nivel de Confianza: 95%