SlideShare una empresa de Scribd logo
CAPÍTULO VIII. CONTRASTES DE HIPÓTESIS
8.1 INTRODUCCIÓN
Hipótesis: Enunciado acerca de una población, elaborada con el propósito de ponerse a prueba.
Ejemplos de hipótesis acerca de un parámetro de población son:
La media mensual de ingresos para analistas de sistemas es 2000,
El 20% de los delincuentes juveniles son capturados y sentenciados a prisión
Contrastar una hipótesis (Prueba de hipótesis) es comparar las predicciones con la realidad que
observamos. Si dentro del margen de error que nos permitimos admitir, hay coincidencia,
aceptaremos la hipótesis y en caso contrario la rechazaremos.
Hipótesis nula: Es aquella hipótesis que se desea contrastar, se simboliza por Ho. Esta suele ser una
estrategia o medio del que se sirve el investigador para probar la alternativa. El planteamiento de Ho
permite elaborar un modelo probabilístico a partir del cual se puede llegar a una decisión final.
Hipótesis alternativa: También se conoce como experimental y se representa por H1 o Ha. Esta es la
hipótesis de investigación. De modo que se espera que hay un argumento para la hipótesis de
investigación (o alternativa) H1, demostrando que no lo hay para su contraria, la hipótesis nula.
Los contrastes pueden ser unilaterales o bilaterales (también llamados de una o dos colas)
El contraste es bilateral (dos colas) si la hipótesis alternativa H1 es del tipo ≠.
El contraste es unilateral (una cola) si la hipótesis alternativa H1 es del tipo < o >.
Nota: generalmente una a hipótesis de investigación se plantea como una hipótesis alternativa, es
decir que las hipótesis alternativa e hipótesis nula deben formularse de manera que al rechazar Ho, se
apoye la conclusión de la investigación.
8.1.1 ERRORES DE TIPO I Y DE TIPO II.
Si rechazamos una hipótesis cuando debiera ser aceptada, diremos que se ha cometido un error de
tipo I.
Error tipo I: Ho es cierto pero lo rechazo; = P(rechazar Ho) cuando es cierta
Error de tipo II: Es el error que consiste en no rechazar H0 cuando es falsa. La probabilidad de
cometer este error la denotamos con la letra β
Error tipo II: Ho es falso pero lo acepto; β = P(aceptar Ho) cuando es falsa
Región de
aceptación Región
crítica
Región
Crítica
Errores y conclusiones correctas en las pruebas de hipótesis
Conclusión
Situación en la población
Ho Verdadera H1 Verdeara
Se Acepta Ho Conclusión
correcta
Error
tipo II
Se rechaza Ho Error
tipo I
Conclusión
correcta
Observaciones.
1. Los errores de tipo I y II no están relacionados más que del siguiente modo: Cuando α decrece β
crece. Por tanto no es posible encontrar test que hagan tan pequeños como queramos ambos errores
simultáneamente. De este modo es siempre necesario privilegiar a una de las hipótesis, de manera que
no será rechazada, a menos que su falsedad se haga muy evidente. En los contrastes, la hipótesis
privilegiada es H0 que sólo será rechazada cuando la evidencia de su falsedad supere el umbral del
100(1 − α) %.
2. Al tomar α muy pequeño tendremos que β se puede aproximar a uno.
Lo ideal a la hora de definir un test es encontrar un compromiso satisfactorio entre α y β (aunque
siempre a favor de H0). Denominamos potencia de un contraste a la cantidad 1 − β.
3. En el momento de elegir una hipótesis privilegiada podemos en principio dudar entre si elegir una
dada o bien su contraria.
8.1.2 PRINCIPALES CONCEPTOS IMPLICADOS EN LA PRUEBA DE HIPÓTESIS:
Nivel de significancia. Es la probabilidad de cometer un error de tipo I, cuando la hipótesis nula es
verdadera, se denota con la letra α, y los mas conocidos son 0.05; 0.01; 0.1
El nivel de significancia se define como la máxima probabilidad de rechazar Ho cuando ésta es
verdadera.
Región crítica. El conjunto de todos los valores de la estadística de prueba que nos harían rechazar la
hipótesis nula.
Región de aceptación. Es la región complementaria de la anterior. Si el valor evaluado del estadístico
pertenece a ella No rechazamos la hipótesis. (Las hipótesis nunca se aceptan de forma definitiva, sólo
se aceptan provisionalmente, es decir, no se rechazan, a la espera de una nueva información que
eventualmente pueda llevarnos a rechazarla en el futuro).
Valor crítico: El valor o valores que separan la región crítica de los valores de la estadística de
prueba que no nos harían rechazar la hipótesis nula.
Los valores críticos dependen de la naturaleza de la hipótesis nula, la distribución de muestreo
pertinente y el nivel de significancia α.
En una prueba de dos colas, el nivel de significancia α
se divide equitativamente entre las dos colas. En una
prueba de una cola, este nivel es el área de la región a
44,1
36
5,0
1612,16
n
s
ux
teoz
partir del valor crítico hasta el extremo derecho o izquierdo, según corresponda.
Estadística de prueba: Es una estadística obtenida de una muestra o un valor basado en datos de
muestra.
p-valor. El valor de más pequeño que nos lleve a rechazar H0 se llama el p-valor de la prueba..
8.1.3 PASOS DE LA PRUEBA DE HIPÓTESIS
Pasos Ejemplo
1. Expresar la hipótesis nula y la hipótesis alternativa
Ho: µ = µo Vs H1: µ ≠ µo o H1: µ < µo o H1: µ < µo
Ho: µ = 16
H1: µ ≠ 16
2. Determinar y calcular una estadística de prueba
3. Establecer los valores críticos que determinan las
regiones de rechazo de las de no rechazo en
función del nivel de significancia
Para un α = 0,05;
4. Formular una regla de decisión
Si Z < Z α /2 se rechaza Ho
Si Z> Z α /2 se acepta Ho
H0 se rechaza si z < – 1,96 o z > 1,96
5. Aplicar la regla de decisión (conclusión). No se rechaza H0 porque 1,44 es menor
que el valor crítico 1.96
8.1.4 POTENCIA DE UNA PRUEBA DE HIPÓTESIS
Potencia de una prueba. Se define como potencia a la probabilidad de rechazar la Hipótesis Nula
cuando ésta es falsa. La potencia se denota como π.
Esta probabilidad representa la chance de concluir que Ho es falsa cuando efectivamente lo es. La
potencia se calcula como π = 1 - β, donde β es la probabilidad de cometer el Error de Tipo II.
Cuanto mayor es la potencia mejor es la prueba. La potencia es función de varios factores: a) el nivel
de significación elegido, b) la varianza de la variable aleatoria y c) el tamaño de la muestra. Cuando el
nivel de significación se ha fijado y la varianza de la variable aleatoria es conocida (o se ha estimado)
es posible controlar la potencia de la prueba manejando el tamaño muestral (o, en el caso de los
diseños experimentales, manejando el número de repeticiones).
8.1.5 EJERCICIOS RESUELTOS
En los siguientes ejercicios identifique los datos y plantee las Hipótesis
Ejercicio 1. Un jurado de elecciones de cierto país dice que el porcentaje de ausentismo generalmente
es de 30% como mínimo. Se elige una muestra de 100 individuos y se encuentra que 40 están
dispuestos a votar. Con un nivel de significancia del 5%, se puede afirmar que el jurado de elecciones
tiene razón.
Solución.
Datos
Po= 0.30=30% (porcentaje de ausentismo poblacional)
p = 60/100=0.60= 60% (porcentaje de ausentismo de la muestra)
= 0.05 (nivel de significancia)
n= 100 (tamaño de la muestra)
Hipótesis
Ho: Po ≥ 0.30 (el ausentismo como mínimo es del 30%)
H1: Po < 0.30 (el ausentismo es menor del 30%)
También se puede expresar
Ho: Po = 0.30 (el ausentismo como mínimo es del 30%) (Se considera solo el signo =)
H1: Po < 0.30 (el ausentismo es menor del 30%)
Ejercicio 2. Se desea adquirir tubos fluorescente de una empresa, siempre y cuando la vida media de
una muestra de 110 tubos fluorescentes sea mayor a 1610 horas, con una desviación típica de 100
horas. Con un nivel de significancia de 0.05 se quiere saber si la duración media de los tubos es mayor
de 1650 horas.
a) Dé las hipótesis nula y alternativa adecuada
b) En esta situación ¿Cuál es el error de tipo I? ¿Qué consecuencias tiene cometer este error?
c) En esta situación ¿Cuál es el error de tipo II? ¿Qué consecuencias tiene cometer este error?
Solución
Datos
μ = 1650 (media de la población)
1610x Media de la muestra s= 100 desviación típica de la muestra =0.05
a) Hipótesis
Ho: μ ≤ 1650 (No se adquiere los tubos)
H1: μ > 1650 (Se adquiere los tubos)
b) El error de tipo I es rechazar que la duración media es menor o igual a 1610 horas siendo estas
verdaderas, las consecuencias es que se adquiere productos que no cumplen las horas
establecidas.
c) El error de tipo II es aceptar que la duración media es menor o igual a 1610 horas siendo esta
falsa, las consecuencias es que se deja de comprar focos que cumplen las horas requeridas.
Ejercicio 3. En un muestreo realizado entre los empleados de una multinacional se eligieron al azar
15 empleados y se anotó su sueldo mensual obteniéndose los siguientes datos: 1285, 1152, 1546,
1423, 1120, 1660, 956, 1250, 1812, 1120, 1553, 1056, 1163, 1358 y 1457. El gerente afirma que el
sueldo medio de sus trabajadores está por encima de los 1500 y los sindicatos afirman que es de 1400.
Sabiendo que los sueldos en esa multinacional se distribuyen de forma aproximadamente normal,
a) Crees que efectivamente el sueldo medio de todos los trabajadores es de 1400?
b) Crees que lo que dice el gerente es cierto?
c) En la situación del gerente ¿Cuál es el error de tipo I? ¿Qué consecuencias tiene cometer este
error?
d) En la situación del gerente ¿Cuál es el error de tipo II? ¿Qué consecuencias tiene cometer este
error?
Solución
a) datos
μ = 1400 (media de la población)
15
1457...1521285
x media de la muestra
115
)(151457...11521285
2222
x
s Desviación típica de la muestra =0.05
Hipótesis
Ho: μ = 1400 (el sueldo medio de todo los trabajadores es 1400)
H1: μ ≠ 1400 (el sueldo medio de todo los trabajadores NO es 1400)
b) datos
μ = 1500 (media de la población)
15
1457...1521285
x media de la muestra
115
)(151457...11521285
2222
x
s desviación típica de la muestra =0.05
Hipótesis
Ho: μ = 1500 (el sueldo medio de todo los trabajadores No esta por encima de 1500, el gerente
miente)
H1: μ > 1500 (el sueldo medio de todo los trabajadores esta por encima de 1500, el gerente dice la
verdad)
c) El error de tipo I es rechazar que el gerente miente a pesar que realmente esta mintiendo, las
consecuencias es que se le cree a un mentiroso.
d) El error de tipo II es aceptar que el gerente miente a pesar que dice la verdad, las consecuencias
es que se deja de creer a alguien que dice la verdad.
Ejercicio 4. Para comprobar si más un tercio de las llamadas a un servicio de ambulancias son
urgencias con peligro de muerte, se ha tomado una muestra aleatoria de sus archivos y se ha
encontrado que 61 de 150 llamadas son de este tipo. ¿Tiene fundamento dicha afirmación?
Solución
Po= 1/3=0.333 (Proporción de la población)
p= 61/150 (proporción de la muestra)
Hipótesis
Ho: Po = 0.33 (No mas de 1/3 de las llamadas son urgentes con peligro de muerte)
H1: Po> 0.33 (mas de 1/3 de las llamadas son urgentes con peligro de muerte)
8.1.6 EJERCICIOS PROPUESTOS
Ejercicio 1. Un proceso de fabricación produce 12.3 unidades por hora. Esta producción tiene una
varianza igual a 4. Se sugiere un nuevo proceso que es costoso de instalar, pero se piensa que puede
incrementar la producción. Para decidir si se hace el cambio o no, se prueban 10 máquinas nuevas y
se observa que éstas producen en promedio 13.3 unidades.
a) Calcular la probabilidad del error de tipo II en la prueba para µ= 12.3 vs. µ>12.3 cuando la
verdadera esperanza del nuevo proceso es µ= 14. Trabajar con α= 0.01.
Ejercicio 2. Se acepta que después de 3 años de almacenamiento el vigor de un arbusto forrajero
medido como peso seco alcanzado a los 20 días de la germinación es de 45 mg promedio. Un nuevo
método de almacenamiento se propone para aumentar el vigor.
Se evalúan para ello 20 lotes de 10 semillas cada uno y al cabo de 3 años se las hace germinar,
obteniéndose los siguientes resultados de peso seco promedio a los 20 días:
49 43 56 57 59 65 52 51 50 55
60 65 53 57 67 56 53 37 45 42
a) Plantear las hipótesis nula y alternativa asociadas al problema.
b) ¿Cuál es el error de tipo I? ¿Qué consecuencias tiene cometer este error?
c) ¿Cuál es el error de tipo II? ¿Qué consecuencias tiene cometer este error?
Ejercicio 3. Un cierto tipo de cáncer tiene habitualmente una letalidad (número de muertos por cada
cien enfermos) de 30. Se experimenta una nueva droga en 80 casos, en los cuales se producen 15
defunciones.
a. Señale la hipótesis de trabajo.
b. Señale el nivel de significación.
c. Realice la prueba de significación estadística.
n
Zx
n
Zx 2/2/
n
s
Zx
n
s
Zx 2/2/
CAPÍTULO IX. PRUEBA DE HIPÓTESIS PARA LA MEDIA DE LA
POBLACIÓN.
9.1 PRUEBA DE HIPÓTESIS PARA LA MEDIA : MUESTRAS GRANDES.
9.1.1 INTRODUCCIÓN
Sean X1, X2, X3,...,Xn una muestra aleatoria simple (m.a.s) de una distribución normal o cualquier
distribución (si n≥30, la distribución cumple el teorema del limite central) con media desconocida µ, y
con una varianza σ2
, la distribución de x ~ N(μ,
n
2
) y la variable z ~ N(0,1).
Deseamos contrastar la hipótesis de que el parámetro poblacional μ toma un determinado valor μ0.
Es decir:
Hipótesis
Caso I Caso II Caso III
Ho : = 0
H1 : < 0
Ho : = 0
H1 : ≠ 0
Ho : = 0
H1 : > 0
9.1.2 SUPUESTOS
1. El tamaño de la muestra es grande n≥30
2. Las observaciones son independientes
3. Las medias de las muestras se distribuyen normalmente (distribución normal z), no importa cómo
sea la distribución de la población original.
Estadístico de prueba
a) Se conoce la varianza poblacional σ2
. b) Se desconoce la varianza poblacional 2
.
Intervalo de Confianza del 100(1- )% para la media poblacional , es de la forma:
a) Se conoce la varianza poblacional σ2
. b) Se desconoce la varianza poblacional σ2
.
n
ux
Z o
n
s
ux
Z o
Donde:
μ : media poblacional : Desviación estándar poblacional
n : Tamaño de la muestra
x : Media de la muestra s : Desviación estándar de la muestra
Nota: para encontrar s se utiliza la siguiente formula
1
22
n
xnx
s
Teorema del límite central: Si x es la media de una muestra aleatoria de tamaño n que se toma
de una población con cualquier distribución (oblicua a la derecha, oblicua a la izquierda, con forma
de tina, etc...), cuya media es µ y varianza finita σ2
, entonces la forma límite de la distribución de:
n
x
z
conforme n →∞, es la distribución normal estándar N (0,1).
9.1.3 EJERCICIOS RESUELTOS
Ejercicio 1. La casa Carma S.A emite su propia tarjeta de crédito. Carla, la gerente de crédito, quiere
encontrar si la media mensual de saldos no pagados es mayor que S/.400. Una revisión al azar de 172
saldos reveló que la media de la muestra es S/.407 y la desviación estándar de la muestra es S/. 38.
¿Debe Carla concluir que la población media es mayor que S/.400, con un nivel de significancia del
5%?.
Solución
Datos.
μ = 400 407x
s = 38 = 0.05 (nivel de significancia 5%)
n = 172
Paso 1: Establecemos las hipótesis
H0 : μ = 400 (La media mensual de saldo no pagados no es mayor de 400)
H1 : μ > 400 (La media mensual de saldo no pagados si es mayor de 400)
Nota: la Ho también puede expresarse como Ho : μ ≤ 50
Paso 2: Calculamos el estadístico de prueba
42,2
172
38
400407
n
s
ux
z
Z0,05=1,645
Zona de rechazo Ho
Zona de Aceptación Ho
Z0,05=1,645 Z=2,42
Zona de rechazo HoZona de Aceptación Ho
Como n > 30 la prueba es la distribución normal Z
Paso 3. Establecemos la región de rechazo para un =0.05, de la tabla normal z0.05=1.645
Paso 4. Decisión
H0 se rechaza si Z=2.42 cae en la zona de rechazo (zona achurada) es decir si
(z=2.42) > (z0.05=1.645)
Paso 5: Conclusión
Como (Z=2,42) cae en la zona de rechazo, o lo que es lo mismo (Z=2,42)> (Z0,05=1,645),
rechazamos la Ho. Es decir rechazamos que (La media mensual de saldo no pagado no es mayor de
400)
Luego Carla puede concluir que hay evidencia suficiente para aceptar que la media de saldos no
pagados es mayor que S/.400.
SOLUCIÓN EN MINITAB
Ingresamos al minitab y hacemos click en Stat>Basic statistics>1-sample Z... como se ve en la
figura siguiente
Aparece la siguiente pantalla; luego ingresamos los datos en esta..
Hacemos click en Options… ingresamos el nivel de confianza y elegimos la Alternative, finalmente
presionamos OK, luego OK y los resultados son:
One-Sample Z
Test of mu = 400 vs > 400
The assumed standard deviation = 38
95%
Lower
N Mean SE Mean Bound Z P
172 407,000 2,897 402,234 2,42 0,008
Interpretación: N=172 (tamaño de la muestra )
Mean= 407,00 (media de la muestra)
SE Mean = 2,897 (error estándar de la media)
Lower Bound = 402,234 (valor mínimo del nivel de confianza al 95% )
Z= 2,42 ( z calculado)
P = 0.008 (de 100 veces que rechazamos Ho por ser falsa, hay un probabilidad de 0.8% de
equivocarse)
Decisión: la decisión se puede tomar en función de Z=2,42 o en función de P=0,008.
En el segundo caso, Como (P = 0,008)< (α =0,05) entonces se rechaza la Ho
Conclusión. Carla tiene evidencia suficiente para aceptar que la media de saldos no pagados es mayor
que S/.400.
Media de la
muestra ( n )
Desviación
estándar de la
muestra (s) o de
la población ( )
Media de la
población ( μ )
Nivel de
confianza (1- )
Hipótesis
alternativa (mayor
que “ > “ )
Tamaño de la
muestra ( n )
932,0
36
15,5
502,49
n
s
ux
Z
Z0,01=-2,33 z=- 0,932
Ejercicio 2. El peso de un grupo de niños debe ser de 50,00 kilogramos. Sin embargo, los
trabajadores de salud afirman que tienen un peso menor a 50,00 kilogramos. Para salir de dudas, se
tomó una muestra de 36 niños, obteniendo un peso de 49,20 kilogramos, con una desviación estándar
de 5,15 kilogramos. Con un 99% de confiabilidad, ¿puede afirmarse que el peso de todos los niños es
menor de 50,00 kilogramos?
Solución.
Datos
μ = 50 n = 36
2,49x α = 0,01
s = 5,15
Prueba de hipótesis
Ho: μ = 50 (los niños NO tienen pesos menores que 50kg)
H1: μ < 50 (los niños tienen pesos menores a 50kg)
Nota: la Ho también puede expresarse como Ho : μ ≥ 50
Estadística de prueba
Como n>30 utilizamos la prueba Z, reemplazando datos
Para decidir si rechazamos o aceptamos la Ho
Construimos el gráfico y determinamos Z0,01 = – 2,33 de tabla normal
Conclusión.
Como Z= – 0,932 esta dentro de la zona de aceptación, entonces aceptamos Ho, es decir, los niños
tienen pesos mayor o igual a 50.
Utilizando Minitab
Ingresamos al minitab y hacemos click en Stat>Basic statistics>1-sample Z... y se obtiene la figura
siguiente, Aquí ingresamos los datos y activamos Options…, para ingresar el 1-
Presionamos Ok luego Ok y los resultados obtenidos son:
One-Sample Z
Test of mu = 50 vs < 50
The assumed standard deviation = 5.15
95%
Upper
N Mean SE Mean Bound Z P
36 49.2000 0.8583 50.6118 -0.93 0.176
Conclusión:
Como (P=0.176) es mayor que ( = 0.05) entonces se acepta la Ho, es decir no hay suficiente
evidencia para rechazar que los niños tengan pesos mayores o iguales a 50,00 kg.
Ejercicio 3. Los invitados a una reunión de trabajo tienen una tolerancia de 5 minutos en promedio.
Se quiere saber si un grupo de invitados están dentro de la tolerancia, para lo cual se midió el tiempo
de demora de 60 invitados, los resultados fueron
2 6 7 5 9 5 5 0 7 5 1 1 7 9 0 6 5 2 3 5 5 4 6 3 5 2 3 7 6 8
1 1 7 8 4 2 8 4 2 7 6 7 5 2 9 2 1 6 6 4 9 4 6 3 4 8 4 6 2 9
A nivel del 10%, ¿Los invitados están fuera del tiempo de tolerancia?.
Solución
Datos
μ = 5 = 10% = 0.10 n = 60
Calculamos la media aritmética ( x ) y la desviación estándar de la muestra (s)
7667.4
60
926...762
x
52020.2
59
2
)667.4(60)
2
9
2
2
2
6...
2
7
2
6
2
2(
s
Hipótesis
Ho: μ = 5 min (los invitados están dentro de la tolerancia)
H1: μ > 5 min (los invitados NO están dentro de la tolerancia)
Nota: la Ho también puede expresarse como Ho : μ ≤ 5 min
Estadística de prueba
Como n>30 utilizamos la prueba Z, reemplazando datos
72,0
60
52,2
57667,4
n
s
ux
Z
Z=-0,72 Z0,10= 1,28
Zona de rechazo HoZona de Aceptación Ho
One-Sample Z: Tiempo
Test of mu = 5 vs > 5
The assumed standard deviation = 2.52
90%
Lower
Variable N Mean StDev SE Mean Bound Z P
Tiempo 60 4.76667 2.52020 0.32533 4.34974 -0.72 0.763
Para decidir si rechazamos o no la Ho
Construimos el gráfico y determinamos Z0,1 = 1,28 de tabla normal
Conclusión. Como z=-0.72 cae en la zona de aceptación de Ho, esta no se rechaza, por lo tanto los
invitados están dentro del tiempo tolerado.
Utilizando MINITAB
Ingresamos al minitab y hacemos click en Stat>Basic statistics>1-sample Z... como se ve en la
figura siguiente
Los datos lo ingresamos en la columna C1 (Tiempo)
Nota: la desviación estándar de la muestra primero debemos encontrarlo. Para esto utilizamos
Stat>Basic statistics>Display Descriptive estatistics…
Finalmente los resultados de la prueba de hipótesis son
Conclusión. como (p=0.763> =0.1) se acepta Ho. Por lo tanto los invitados están dentro del tiempo
tolerado.
Ejercicio 4. El control de calidad de una cooperativa que produce azúcar, verifica que la presentación
del producto en bolsas de 500 g. contenga dicha cantidad. Se obtuvo una muestra de 50 bolsas los
cuales tuvieron los siguientes pesos en gramos:
505 409 500 503 515 495 501 496 498 499 497 511 497
500 498 498 596 506 499 597 497 523 506 495 500 519
494 514 500 504 510 497 489 508 522 498 485 500 498
495 497 507 501 499 508 499 506 502 503 497
a) ¿Hay evidencia suficiente en base a esta muestra, de que el contenido de las bolsas es diferente a
500 g. si el nivel de significancia es 0.01?
b) Se obtuvo otra muestra, esta de 25 bolsas, con una media de 497 g. y una desviación de 10 g. y
con 5% de nivel de significancia. ¿Podemos afirmar la hipótesis de que las bolsas contienen
menos de 500 g.?
Solución
a) ¿Hay evidencia suficiente en base a esta muestra, de que el contenido de las bolsas es diferente a
500 g. si el nivel de significancia es 0.01?
Datos
μ = 500g
Para determinar la media y la desviación estándar utilizamos Minitab, de la siguiente manera
Ingresamos los datos en C1 como se ve en la figura y Hacemos clic en Stat>Basic statistics>Display
Descriptive estatistics…
finalmente hacemos click en OK, el resultado es
Descriptive Statistics: C1
Variable N N* Mean SE Mean StDev Minimum Q1 Median Q3
C1 50 0 503.86 3.45 24.36 409.00 497.00 500.00 506.25
Variable Maximum
C1 597.00
Interpretación
N=50 (tamaño de la muestra)
Mean = 503.86 ( x media de la muestra)
StDev =24.36 (s Desviación estándar de la muestra)
Q1=497.00 (primer cuartil )
Median=500.00 (Me Mediana)
Q3=506.25 (tercer cuartil)
Hipótesis
Ho: μ = 500 g (el contenido es igual a 500g)
H1: μ ≠ 500 g (el contenido es diferente a 500g)
Para un nivel de significancia de 0.01 tenemos un nivel de confianza de 99%
Utilizando minitab se tiene
Finalmente hacemos clic on Ok luego en OK
Los resultados son
One-Sample Z: C1
Test of mu = 500 vs not = 500
The assumed standard deviation = 24.36
Variable N Mean StDev SE Mean 99% CI Z P
C1 50 503.860 24.360 3.445 (494.986, 512.734) 1.12 0.263
Conclusión
Como (p=0.263) > ( =0.01) se acepta Ho, es decir el contenido es igual a 500g
b.¿Podemos afirmar la hipótesis de que las bolsas contienen menos de 500 g.?
datos
μ= 500 n = 25 bolsas
gx 497
s = 10 g. =5% = 0.05, osea que 1- = 0.95
Hipótesis
Ho: μ = 500 g (el contenido no es menos de 500g)
H1: μ < 500 g (el contenido es menos de 500g)
Utilizando minitab se obtiene
One-Sample Z
Test of mu = 500 vs < 500
The assumed standard deviation = 10
95%
Upper
N Mean SE Mean Bound Z P
25 497.000 2.000 500.290 -1.50 0.067
Conclusión
Como (P=0.067) > ( =0.05) se acepta Ho, es decir el contenido no es menos de 500g.
Ejercicio 5. Calcular el valor de P para el ensayo de hipótesis en donde se quiere probar que la edad
promedio de los habitantes de una ciudad es superior a 65 años, se tomó una muestra de 50 habitantes
y se encontró que tenían una media de 60, una varianza es 2 años a un nivel de significancia de 0,05.
03,3
18
7
1419
n
ux
z
Solución
Datos
μ = 65 n = 50 60x Sha
= 2, =0.05
Hipótesis
Ho: u ≤ 65 (Edad promedio de la ciudad no es mayor a 65)
Ho: u > 65 (Edad promedio de la ciudad es mayor a 65);
Hacemos uso de MINITAB
One-Sample Z
Test of mu = 65 vs > 65
The assumed standard deviation = 1,4142
95%
Lower
N Mean SE Mean Bound Z P
50 60,0000 0,2000 59,6710 -25,00 1,000
DECISIÓN: Como (P=1)> (α=0,05), No se rechaza la Ho, o sea que no hay evidencia que la edad
promedio de la ciudad sea mayor de 65 año
Ejercicio 6. Un laboratorio farmacéutico afirma que el antiinflamatorio de su fabricación elimina la
inflamación en 14 minutos en los casos corrientes. Con la finalidad de comprobar estadísticamente
esta afirmación, se elige al azar 18 cerdas con inflamaciones varias y se toma como variable de
respuesta el tiempo transcurrido entre la administración del antiinflamatorio y el momento en que
desaparece la inflamación. Además, nos dicen que la variable tiempo transcurrido entre la
administración del antiinflamatorio y el momento en que desaparece la inflamación sigue una
distribución normal de media 14 y desviación 7. El tiempo medio de respuesta de la muestra fue de 19
minutos.
Se pide comprobar la afirmación del laboratorio a un nivel de significación de 0.05.
Solución:
Datos;  19x , μ = 14, σ= 7, n = 18
Hipótesis
00,10
100
20
110130
n
ux
z
Z0,05=1,645 Z=10
Zona de rechazo HoZona de Aceptación Ho
79.5
100
9.1
4.185.19
n
ux
z
Z0,025 =-1,96 Z0,025 =1,96 Z=5.79
Zona de
aceptación
Ho
Zona
rechazo Ho
Zona
rechazo Ho
Ho: μ =14
H1: μ >14
Z0,05=1,645;
Luego como Z>Z0,05 se rechaza la Ho.
NOTA: A pesar que (n=18) < 30 utilizamos la distribución Z y no la t esto se debe a que
conocemos la desviación típica de la población σ =7
Ejercicio 7. Se ha tomado una muestra aleatoria de 100 individuos para determinar si tienen
hipertensión, a los que se ha medido la presión sistólica, obteniéndose una media muestral de 130
mmHg. Se sabe que la media y desviación típica normal de la población es respectivamente 110 y 20
mmHg.
¿Cual es su conclusión a un nivel de significancia de 0.05?
Solución
Datos
n = 100 mmHgx 130 μ = 110 mmHg = 20 mmHg
Hipótesis
Ho: μ = 110 (no sufren de hipertensión)
H1: μ > 110 (sufren de hipertensión)
Z0.05=1.645
Del gráfico concluimos que se rechaza la Ho, o sea los individuos sufren hipertensión.
Ejercicio 8. Se cree que la edad promedio de los alumnos que ingresan a la Universidad es de 18.4
años. De los alumnos anteriores se elige, al azar, una muestra de 100 y se encuentra que tienen una
edad promedio de 19.5 años con desviación típica 1.9 años. De su opinión al respecto, con un nivel de
significancia de 0.05.
Solución
Datos
n = 100 añosx 5.19 μ = 18.4 años s = 1.9 años
Hipótesis
Ho: μ = 19.5 (la edad promedio es 18.4)
H1: μ ≠ 19.5 (la edad promedio es diferente a 18.4)
n
Zx
n
Zx
2/
;
2/
200
1.0
00.12;
200
1.0
00.12 007.2;993.1
n
Zx
n
Zx
2/
;
2/
200
1.0
00.22;
200
1.0
00.22 014.2;986.1
n
Zx
n
Zx
2/
;
2/
200
1.0
00.32;
200
1.0
00.32 021.2;979.1
96.1
9.0
25.0
nn
ux
z
Z0.025=1.96
Del gráfico concluimos que se rechaza la Ho, o sea la edad promedio es diferente a 18.4
Ejercicio 9. Las medidas de los diámetros de una muestra tomada al azar, de 200 cojinetes de bolas,
hechos por una determinada máquina, dieron una media de 2 cm y una desviación típica de 0,1 cm.
Hallar los intervalos de confianza del:
a. 68,26%
b. 95,44%
c. 99,73%
Para el diámetro de todos los cojinetes.
Solución
n = 200, 2x , s=0.1,
a. 1- =0.6826
= =
b. 1- =0.9544
= =
c. 1- =0.9973
= =
Ejercicio 10. Se sabe que el contenido de lactosa de cierto alimento lácteo sigue una distribución
normal, cuya varianza es conocida, teniendo un valor de 0.81. Se desea estimar el valor de la media
poblacional mediante el valor de la media de una muestra, admitiéndose un error máximo de 0,25 con
una confianza del 95%. ¿Cuál ha de ser el tamaño de la muestra?
Solución
Datos. 2
=0.81 entonces =0.9 si 1- = 0.95 entonces =0.05,
e = 0.25 = x - μ Para =0.05, de la tabla (dos colas) se tiene z /2=1.96
25.0
9.096.1 x
n , n=49.79,
Luego la muestra debe ser 50 como mínimo
68.26%
95.44%
99.73%
-z /2 z /2
x1 x2
n
Zx
n
Zx
2/
;
2/
64
5
96.114;
64
5
96.114 22.15;78.12
Ejercicio 11. En una determinada población estudiantil, la nota sigue una distribución normal
N(14,5). Si se extrae una muestra aleatoria de 64 alumnos y para un nivel de significación del 5%, ¿en
qué condiciones se rechazaría la hipótesis de que la media de la población es de 14?
Solución
Datos
Para =0.05 z=1.96 (dos colas)
La hipótesis se rechazaría cuando el valor de la media de la muestra no pertenezca al intervalo de
confianza siguiente.
= =
Ejercicio 12. Tras realizar un test de cultura general entre los habitantes de cierta población, se
observa que las puntuaciones siguen una distribución normal, de media 68 y desviación típica 18. Se
desea clasificar a los habitantes en tres grupos (de baja cultura general, de cultura general aceptable,
de cultura general excelente), de manera que el primer grupo abarque un 20% de la población, el
segundo un 65% y el tercero el 15% restante. ¿Cuáles son las puntuaciones que marcan el paso de un
grupo a otro?
Solución
Datos. =18 μ =68
=0.20 (baja cultura),
=0.65 (cultura media), =0.15 (alta cultura)
x1= u-z1 =68-0.84(18)= 52.85 x2= u+z2 =68+0.84(18)=83.15
9.1.4 EJERCICIOS PROPUESTOS
Ejercicio 1. En una fabrica de productos lácteos, una muestra de 100 unidades, dieron en promedio
un peso de 1.35 kg., con una desviación estándar de 0.2 kg. ¿Se puede asegurar para un α = 0,05 que
los pesos de los productos esta por debajo de 1.5 kg?
Ejercicio 2. Una empresa estudia introducir un nuevo sistema de producción para mejorar su
productividad media establecida actualmente en 40 unidades por persona diaria.
Se estima que el cambio no será rentable si no consigue elevar dicho numero por encima de 44 u.
Realizada una prueba con la nueva tecnología, aplicada a 40 personas, se obtuvo una producción
media de 45 y no se observó ningún cambio apreciable en la dispersión que estaba establecida en
=1.0 u. por día. ¿Se debe efectuar el cambio tecnológico?
Ejercicio 3. La policía afirma que las denuncias por robo son resueltas en 10 días en promedio, con
una varianza de 4. Se hizo una encuesta a una muestra de 200 denunciantes cuyas denuncias fueron
resueltas y se encontró que sus casos fueron resueltos en 15 día en promedio, considere una
población normal, si = 0.05, que opina de la afirmación de la policía.
0.65
0.20 0.15
z1 z2
x2 x2
Ejercicio 4. En la etiqueta de un producto comestible figura que el tiempo de duración de este es de
100 días, se eligió una muestra aleatoria de 60 artículos y se comprobó que su tiempo de duración fue
de 80 días con una varianza de 16. ¿Se puede afirmar a nivel de significación 0,05 que el tiempo de
duración media de los productos es 100 días?.
Ejercicio 5. Una encuesta realizada a 164 trabajadores de una fábrica, concluyó que el sueldo medio
es de s/. 600 con una desviación típica de 64. ¿El salario medio es mayor o igual que 500 a un nivel de
significación del 5%?
Ejercicio 6. En estudios previos se ha determinado que el nivel de colesterol promedio de pacientes
con problemas cardíacos es 222. Un cardiólogo piensa que en realidad el nivel es más alto y para
probar su afirmación usa la muestra siguiente. ¿Habrá suficiente evidencia estadística para apoyar la
afirmación del cardiólogo? Justificar su contestación.
217 245 217 226 202 233 235 242 219 221
223 238 225 216 199 224 236 218 215 240
234 248 226 221 217 210 205 222 220 210
215 220 240 230 214 210
Ejercicio 7. Un profesor universitario está interesado en determinar si las computadoras mejoran el
rendimiento de sus alumnos de estadística. Con este propósito seleccionó aleatoriamente 35
estudiantes del tercer ciclo y después de facilitarles el uso de computadoras durante un semestre,
determinó que las notas fueron en promedio 15 con varianza de 4. Si los promedios de estadística en
años anteriores eran de 12, y se consideran pruebas normalizadas, Utilizando α= 0.01, determine la
conclusión a que llegó el profesor?.
Ejercicio 8. Se sabe que el sueldo anual de los trabajadores de una empresa sigue una distribución
normal de media desconocida y desviación típica de s/500. Se ha observado el sueldo anual de 36
trabajadores de dicha empresa escogidos al azar, y se ha obtenido un valor medio de s/. 2400.
Probar la hipótesis, a un nivel de significación del 5%, si la media de la distribución muestral es de
s/2500.
a. ¿Cuáles son las hipótesis nula y alternativa del contraste?
b. Determina la forma de la región crítica.
c. ¿Se acepta la hipótesis nula con el nivel de significación indicado?
Ejercicio 9. El MTC afirma que los pasajes de taxi local son de s/5.00 Para saber si es cierto, se toma
una muestra de 36 taxis, resultando que el precio medio es de s/6.5 con desviación estándar s/0.50
.Tiene razón el MTC al 95% de confianza.
Ejercicio 10. Se quiere estudiar la vida media μ de unas resistencias producidos en una empresa. Por
experimentos anteriores, se piensa que la desviación típica de la población es 90h. Al extraer una
muestra de 80 resistencias, se encuentra una media de 1700h. a. Contrastar la hipótesis de que μ=1650
h, frente a la alternativa μ≠1650; b. Ídem., frente a la alternativa μ >1650.
Ejercicio 11. Se quiere probar la eficacia de una dieta para bajar de peso. El promotor afirma que en
un mes los participantes bajaría 5kg, para comprobar se puso a dieta a 66 personas, luego de un mes
se obtuvo una disminución de peso en promedio 4kg y una desviación estándar de 1.0 kg. a. Con un
99% de confiabilidad, ¿puede afirmarse que es cierto la afirmación del promotor?.
b. Con un 95% de confiabilidad, ¿puede afirmarse que es cierto la afirmación del promotor?.
Ejercicio 12. Una variable aleatoria sigue una distribución N(μ, 144) con μ desconocido.
a) ¿Se descartaría la hipótesis μ = 15 en favor de la alternativa μ ≠ 15, para α= 0.05,
si una muestra aleatoria de n = 64 observaciones arroja una media igual a 20?
b) Construir un intervalo de confianza del 95% para μ.
c) Considerando la misma hipótesis del punto a), ¿qué sucedería con un nivel de
significación del 1%?
d) Construir un intervalo de confianza del 99% para μ.
e) Probar H0: μ = 15 versus H1: μ > 15 para α = 0.05 y α = 0.01. Comparar con los
resultados obtenidos en los puntos a) y c).
Ejercicio 13. El gerente afirma que el contenido promedio de los botellas envasadas por su
representada es igual a 320ml. Suponga que los datos provienen de una población aproximadamente
normal. Para confirmar lo dicho por el gerente, se toma una muestra de tamaño 10, y encuentra que la
media es 300 ml. Con un nivel de confianza de 95% , determinar si tiene razón el gerente.
Ejercicio 14. Una muestra aleatoria de 100 muertes registradas en un país el año pasado muestra una
vida promedio de 71.8 años. Suponga una desviación estándar poblacional de 8.9 años, ¿esto parece
indicar que la vida media hoy en día es mayor que 70 años? Utilice un nivel de significancia de 0.05.
Ejercicio 15. Los trabajadores de una empresa que utilizan el autobús regular se quejan de que éstos
se están retrasando en media más de un cuarto de hora. Para comprobarlo han anotado el retraso de
algunos días elegidos al azar. Los datos fueron:
12 36 17 15 19 25 5 10 17 5 12 11 17 9 6 15 22 35 5 14
23 15 25 35 17 16 15 11 13 7 23 2 25 14 16 3 25 9 23 26
11 16 17 8 4 12 18 4 21 7 16 17 25 26 7 13 24 6 8 23
24 16 6 14 9 14 26 3 14 8 24 6 24 42 24 6 4 7 12 7
4 3 11 22 14 26 12 42 22 11 19 20 23 16 13 6 6 14 18 5
A nivel de significación del 10 %, ¿crees que tienen razón los trabajadores?
Ejercicio 16. Un equipo de psicólogos está estudiando el efecto del estrés sobre la presión arterial en
alumnos de la UNHEVAL. El equipo afirma que la presión sistólica media en varones jóvenes
estresados es mayor que 18 cm de Hg. Se toma una muestra de 36 alumnos y se encuentra que
6,35,18 sx ; ¿Se puede afirmar que el equipo tenía razón?
Ejercicio 17. Plantee y resuelva como mínimo 4 ejercicios, de prueba de hipótesis tomando como
datos problemas de su área.
n
ux
z o
n
s
ux
t o
n
Zx
n
Zx 2/2/
n
s
tx
n
s
tx nn )1,2/()1,2/(
9.2 PRUEBA DE HIPÓTESIS PARA LA MEDIA POBLACIONAL: MUESTRAS
PEQUEÑAS
9.2.1 INTRODUCCIÓN
Para realizar pruebas de hipótesis acerca de la media el tamaño de la muestra es pequeño, es necesario
el supuesto de normalidad en las muestras. Supongamos que 1 2 n
X , X , , X es una muestra
aleatoria de una población normal con media μ y varianza σ, la
n
s
x
T tiende a una distribución t
con n-1 grados de libertad.
Se quiere probar las hipótesis
Hipótesis
Caso I Caso II Caso III
Ho : = 0
H1 : < 0
Ho : = 0
H1 : ≠ 0
Ho : = 0
H1 : > 0
9.2.2 SUPUESTOS
1. Las muestras son muestras aleatorias simples.
2. La muestra es pequeña (n < 30)
3. Los valores de la muestra provienen de una población con una distribución normal o
aproximadamente normal.
Estadístico de prueba.
a). Se conoce la 2
poblacional (pocas veces sucede) b) Se desconoce la 2
poblacional
1-n
t~
Intervalo de Confianza. del 100(1- )% para la media poblacional , es de la forma:
a) Se conoce la varianza poblacional σ2
. b) Se desconoce la varianza poblacional σ2
.
Donde:
n : Tamaño de la muestra
x : Media de la muestra
μ : Media de la población
8
4
5
10
16
5
3545
n
s
ux
t
: Desviación estándar poblacional
s : desviación estándar de la muestra
n-1 : grados de libertad
Nota: para encontrar la media y la desviación estándar se utiliza las siguientes formulas
1
22
1
n
xnx
s
n
xi
x
n
i
Nota: para determinar si la distribución es normal, podemos utilizar las pruebas de Anderson-
darlin, shapiro-Will o Kolmogorov-Smirnov ver ejercicio 3
9.2.3 EJERCICIOS RESUELTOS
Ejercicio 1. El peso medio en mujeres comprendidas entre 30 y 40 años, es de 35kg. Un estudio
realizado en 16 mujeres con edades comprendidas en el intervalo anterior y que siguen una dieta
vegetariana da un peso medio de 45kg. Con una desviación típica de 5kg. Considerar distribución
normal.
a. Puede considerarse que la dieta vegetariana produce una modificación del peso medio de las
mujeres?.
b. Dar un intervalo de confianza al 95%, para de las vegetarianas
Solución.
Datos
n =16; α=0,05;
a) Puede considerarse que la dieta vegetariana produce una modificación del peso medio de las
mujeres?.
Hipótesis
Ho: μ = 35 (La dieta vegetariana NO produce modificaciones en el peso de las mujeres)
H1: μ ≠ 35 (La dieta vegetariana SI produce modificaciones en el peso de las mujeres).
Como la población es normal y n<30 se usa la tabla de una cola t (α,n-1)= t (0,05,15) = 2,131
Si t > t (0,05,15) = se rechaza la Ho
Decisión: como (t=8) > (t (0,05,15) = 2,131), se rechaza Ho, o sea la dieta si produce modificaciones
b. INTERVALO:
t(0,05,15) =-2,131 t(0,05,15) =2,131 t=8
Zona de
aceptación
Ho
Zona
rechazo Ho
Zona
rechazo Ho
One-Sample T
Test of mu = 35 vs not = 35
N Mean StDev SE Mean 95% CI T P
16 45,0000 5,0000 1,2500 (42,3357; 47,6643) 8,00 0,000
6643.47;3357.42
16
5
131.245;
16
5
131.245
n
s
tx
n
s
tx nn 1,()1,(
;
Solución en MINITAB
Ingresamos al minitab y hacemos click en Stat >Basic statistics >1-sample t.. como se ve en la
figura siguiente
Los resultados son los siguientes
DECISIÓN: Como (P = 0,000) < (α = 0,05) luego se rechaza Ho.
INTERVALO: (42,3357; 47,6643) al 95%
Ejercicio 2. En un muestreo realizado entre los empleados de una multinacional se eligieron al azar
15 empleados y se anotó su sueldo mensual obteniéndose los siguientes datos: 1285, 1152, 1546,
1423, 1120, 1660, 956, 1250, 1812, 1120, 1553, 1056, 1163, 1358 y 1457. El gerente afirma que el
sueldo medio de sus trabajadores está por encima de los 1500 y los sindicatos afirman que es de 1400.
Sabiendo que los sueldos en esa multinacional se distribuyen de forma aproximadamente normal,
Crees que lo que dice el gerente es cierto?
Solución.
Datos
738,2
15
105,244
15004,1327
n
s
ux
t
t = – 2,734 t(14;0,05)=1,761
Zona de
rechazo HoZona de Aceptación Ho
n = 15 μ=1500 (sueldo promedio según el gerente) s = ¿? ¿?x
Primero hallamos s y x
15
14571358116310561553112018121250956166011201423154611521285
x
4,1327
15
19911
x
115
)4,1327(15)14571358.............154611521285(
222222
s
s = 244,105
Prueba de Hipótesis
Ho: μ=1500 (sueldo promedio no es mayor que 1500)
H1: μ>1500 (sueldo promedio es mayor a 1500, según el gerente)
Estadístico de prueba
Como la población es aproximadamente normal y n<30 , utilizamos la prueba t de student
Para decidir si rechazamos Ho o aceptamos Ho, construimos la grafica y determinamos el valor de
t, de la tabla. t(14;0,05) =1,761
Conclusión.
Como t=–2,739 cae en la zona de aceptación aceptamos Ho, es decir que el gerente esta equivocado,
el sueldo de los trabajadores no es mayor que 1500.
Ejercicio 3. Un fabricante de lámparas eléctricas sostiene que la duración media de las mismas
(horas) es en promedio superior a 1300 h. Se toma una muestra de 16 lámparas siendo el resultado de
la inspección el siguiente:
980 1350 1020 1140 1520 1390 1205 1180 970 1420 1850 1300 1305 1040 1050 1520
Verificar la Ho del fabricante con un coeficiente de riesgo del 5%.
Solución
Datos
μ= 1300 n =16
?x
s = ? = 0.05
Primero
Dado que no sabemos si la población es normal; entontes debemos determinar si la distribución es
normal, para eso aplicamos la prueba de Kolmogorov-Smirnov de Minitab
Ho: la distribución es normal
H1: la distribución no es normal
Si P-value es mayor que 0.05, la distribución se considera normal.
Hacemos click en >Stat>Basic Statistics>Normality Test…,
Los datos lo ingresamos en la columna C3. y hacemos click en OK, para obtener los resultados
Los resultados son
C3
Percent
2 0 0 01 8 0 01 6 0 01 4 0 01 2 0 01 0 0 08 0 06 0 0
99
95
90
80
70
60
50
40
30
20
10
5
1
M ean
> 0.150
1265
S tD ev 241.3
N 16
K S 0.126
P - V alu e
P r o b a b i l i ty P l o t o f C 3
No r m a l
Tenemos que p-Value puede tomar valores mayores a 0.150
Para un nivel de significancia de 0.05
(p-value=0.15) > ( =0.05), luego se acepta la hipótesis nula, es decir la distribución es normal, en el
grafico puede confirmar esta afirmación.
Segundo
Sabiendo que la distribución es normal para nuestro ejemplo aplicamos la prueba de t de estudents
Hipótesis
Ho: μ ≤ 1300 (La duración de las lámparas no es mayor que 1300)
H1 : u >1300 (La duración de las lámparas es mayor que 1300)
Utilizando MINITAB tenemos:
Ingresamos las horas en C3, luego ejecutamos las opciones Stat/Basic statistics/1-sample t.., luego
completamos los datos como se ve en la figura y clickeamos ok, ok
cmS
cmX
10
170
2
5
10
4
25
10
174170
n
s
ux
t
Los resultados son:
One-Sample T: C3
Test of mu = 1300 vs > 1300
95%
Lower
Variable N Mean StDev SE Mean Bound T P
C3 16 1265.00 241.32 60.33 1159.24 -0.58 0.715
Decisión
T= – 0,58; t(0,05;16) = 1,746
Luego 0,56 < 1,756, se acepta Ho.
También (p = 0,705)> (α=0,05) luego se acepta Ho. Es decir que la duración de las lámparas no es
mayor que 1300 horas.
Ejercicio 4. Conocemos que las alturas X de los individuos de una ciudad, se distribuyen de modo
gaussiano. Deseamos contrastar con un nivel de significación de α = 0, 05 si la altura media es
diferente de 174 cm. Para ello nos basamos en un estudio en el que con una muestra de n = 25
personas se obtuvo:
Solución:
Como n< 30 se toma la prueba de t de student por ser la distribución gaussiana (normal)
El contraste que se plantea es:
H0: μ = 174 (la altura media es igual a 174)
H1: μ ≠ 174 (la altura media es diferente a 174)
La técnica a utilizar consiste en suponer que H0 es cierta y ver si el valor que toma el estadístico
Cae dentro de la zona de rechazo de Ho.
Conclusión.
Como t= –2, cae dentro la zona de aceptación de Ho, además (t= –2) < (t(0,05,24)=– 2,064) se acepta Ho,
es decir la altura media es igual a 174
En MINITAB teems:
One-Sample T
Test of mu = 174 vs not = 174
N Mean StDev SE Mean 95% CI T P
t(0,05,24) =-2,064 t(0,05,24) =2,064
t= – 2
Zona de
aceptación
Ho
Zona
rechazo Ho
Zona
rechazo Ho
t(0.05,24)=-2.064 t=-2 t(0.05,24)= 2.064
18.11
20
2
4540
n
s
ux
t
n
tx
n
tx
ss
2/
;
2/
20
2
09.240;
20
2
09.240
25 170,000 10,000 2,000 (165,872; 174,128) -2,00 0,057
Aquí su interpretación:
Test of mu = 174 vs not = 174
Prueba de la media (Ho: μ = 174) vs (Ho: μ ≠ 174)
N Mean StDev SE Mean 95% CI T P
n Media
Desviación
Estándar
Cuadrado
medio
del error
Intervalo de
confianza al 95%
Valor T Valor P
25 170,000 10,000 2,000 (165,8722; 174,1278) -2,00 0,057
La interpretación es la misma que se hace en el caso manual ya visto anteriormente.
Pero hay otra forma de tomar la decisión de aceptar la Ho y esto se hace con el Valor P;
Si Valor P ≤ α se rechaza la Ho de lo contrario se Acepta.
En este caso tenemos que Valor P=0,057 y α=0,05
Conclusión: Dado que Valor P es mayor que α entonces se acepta la Ho. y esta decisión es la misma
que vimos anteriormente.
Ejercicio 6. Con objeto de estimar el peso de los niños de un jardín se tomó una muestra aleatoria al
azar de 20 niños. Se encontró una media de 40 kg y una varianza de 4 kg.
Suponiendo que la muestra se distribuye normalmente.
d. Pruebe la hipótesis de que la media es menor que 45kg. con =0.05
e. Determine un intervalo de confianza al 95% para la media.
Solución.
Datos n=20, x =40, s= 2
a. Ho: μ ≥ 45 (La media no es menor que 45 kg)
H1: μ < 45 (La media es menor que 45 kg)
t(0,05;19) = 1,729
Conclusión. Como (t=11.18)> (t(0,05;19) = 1,729) se rechaza Ho o sea la media es menor que 45kg
b. Intervalo de confianza a 95% t0.05/2=2.09
= = (39.06; 40.94)
162.3
10
2
3032
n
s
ux
t
5.2
25
4
198200
n
s
ux
t
Ejercicio 7. Un empresario de una editorial, paga un salario mensual de s/.1000 si un vendedor vende
mas 100 libros a lo mucho en 30 días, de lo contrario solo paga s/.5 por libro vendido, un grupo de 10
vendedores vendió mas de 100 libros en 32 días, con un varianza de 4 días, si la distribución de las
ventas se considera normal, con una confianza de 0.95, ¿Cobran s/1000 cada vendedor?.
Solución
Datos n=10, x =30, s=2
Ho: μ ≤ 30 (Cobran los s/1000)
H1: μ > 30 (No cobran los s/1000)
t(0,05;9) = 1.833
Conclusión. Como (t=3.162)> (t(0,05;9) = 1.833) se rechaza Ho o sea no cobran los s/ 1000.
Ejercicio 8. Una muestra de 25 familias de una ciudad pagan en promedio por servicios s/ 200
mensual y una varianza de s/16. Se trata de ver si esta muestra es consistente con la Ho que la media
en la ciudad por servicios es de s/ 198, con una confianza de 99%, considerar la distribución normal.
Solución
Datos n=25, x =200, s=4
Ho: μ = 198 (La media de la ciudad es s/198)
H1: μ ≠ 198 (La media de la ciudad no es s/198)
t(0,005;24) = 2.797
Conclusión. Como (t=2.5)< (t(0,005;24) = 2.797) no se rechaza Ho o sea la media de la ciudad es s/198.
Ejercicio 9. Un fabricante de mantequilla quiere comprobar si el peso promedio de cada paquete es de
100 g. Se toma una muestra de 15 paquetes siendo el resultado de la inspección el siguiente:
98.7 99.5 100.2 99.7 100.5 98.8 100.0 98.6 99.1 100.3 100.2 100.4 101.0 99.0 100.0
Verificar la Ho del fabricante con un coeficiente de riesgo del 5%.
Solución.
Primero determinamos si la distribución es normal.
Aplicando kolmogorov-Smirnov de minitab
Se tiene que p-value=0.150 esto es mayor que 0.05, luego la distribución es normal, podemos aplicar
la t de estuden para probar nuestra hipótesis.
Segundo
41.1
15
744.0
10073.99
n
s
ux
t
828.2
18
3
108
n
s
ux
t
6.1
9
5.1
622.61
n
s
ux
t
Datos n=15, x =99.73, s=0.7442
Hipótesis
Ho: μ = 100 (El paquete pesa en promedio 100 g)
H1: μ ≠ 100 (El paquete no pesa en promedio 100 g)
t(0,025;14) = 2.145
Conclusión. Como (t=1.41)< (t(0,025;14) = 2.145) no se rechaza Ho o sea el paquete pesa en promedio
100 g.
Ejercicio 9. El aumento de peso promedio de 18 vacas bajo una dieta alimenticia durante dos meses
fue de 8 kg con una s=3kg. Se desea probar si es válido afirmar que esta ración aumenta el peso al
menos en 10 kg. durante los dos meses con un nivel de significación del 5%, considerar distribución
normal.
Solución.
Datos n=18, x =8, s=3
Ho: μ ≥ 10 (El peso aumenta al menos en 10 g)
H1: μ < 10 (El peso no aumenta al menos en 10 g)
De la tabla t se tiene t(0,025;14) = 1.740
Conclusión. Como (t=2.828)> (t(0,05;14) = 1.740) se rechaza Ho o sea el peso no aumenta al menos en
10 g.
Ejercicio 10. Un fabricante que elabora alimento balanceado, desea comprobar que los pesos de los
paquetes tienen un promedio 60kg. En una muestra de 9 paquetes tomados al azar se obtuvo una
media de 61.2 kg. con una desviación de 1.5 kg. si la distribución es normal ¿Que a comprobado el
fabricante con un nivel de significación del 1% ?
Solución.
Datos n=9, x =61.2, s=1.5
Ho: μ = 60 (El peso promedio es 60 kg)
H1: μ ≠ 60 (El peso promedio no es 60 kg)
De la tabla t se tiene t(0,005;8) = 3.355
Conclusión. Como (t=1.6)< (t(0,005;8) = 3.355) no se rechaza Ho o sea el peso promedio es 60 kg.
9.2.4 EJERCICIOS PROPUESTOS
Ejercicio 1. La corporación Tampico desea saber cuál es la máxima tensión de ruptura que soportan
los cables de acero que fabrica. Un cliente importante está interesado en la compra de un número
grande de cables y ha establecido que el punto de ruptura no debe ser menor que un tonelada.
Tampico piensa que una tonelada es aproximadamente el punto de ruptura de los cables, pero decide
probar la hipótesis de que la tensión de ruptura promedio es una tonelada. La muestra es de 10,
=0.05, x= 0.96, s=0.15
Ejercicio 2. Se tiene las siguientes pruebas de hipótesis
Ho: μ= 20
H1: μ≠ 20
Los datos de una muestra de 6 elementos son 16, 20, 18, 19, 20, 18
a. Calcule la media de la muestra
b. Encuentre la desviación estándar de la muestra
c. Con α=5%, cual es la regla de rechazo
d. Calcule el valor del estadístico t
e. ¿Cuál es su concusión?
f. ¿Que puede decir acercad del valor p?
Ejercicio 3. Se tiene la siguiente prueba estadística
Ho: μ= 10
H1: μ< 10
Con una muestra de 15 datos se obtuvo una s=5, use α=5% determine el valor de t y su conclusión
para cada uno de los siguientes resultados
a) x = 9 b) x = 11 c) x = 8.5 d) x = 9.5 e) x = 12
Ejercicio 4. Un cardiólogo desea hallar un intervalo de confianza del 90% para el nivel colesterol
promedio de todos los pacientes que presentan problemas cardíacos. Para esto asume que la
distribución de los niveles de colesterol es normal con una desviación estándar = 13 y usa la
siguiente muestra al azar de niveles de colesterol de 20 pacientes con problemas cardíacos.
217 223 225 245 238 216 217 226 202 233 235 242 219 221 234 199 236 248 218 224
Ejercicio 6. El pH medio del agua que sale de una planta de tratamiento debe ser de 7.0. La autoridad
sospecha que es posible que cierta planta no cumpla con la normativa. Se tomaron 15 muestras de
agua de esa planta y se obtuvo un pH de 6.7, 7.1, 6.8, 6.9, 7.3, 7.5, 6.5, 6.6, 7.3, 7.1, 6.3, 6.8, 7.0, 7.1
y 6.8. Sabiendo que el pH varía según una distribución normal, ¿hay razón para dudar que se
mantenga la especificación?
Ejercicio 7. Dos secciones de un curso de estadística son sometidas a un mismo examen final. De las
calificaciones obtenidas se extrae una muestra aleatoria de tamaño 9 en la grupo "A", y otra de tamaño
4 en el grupo "B".
Grupo "A": 65, 68, 72, 75, 82, 85, 87, 91, 95
Grupo "B": 50, 59, 71, 80
a. Con un nivel de significación de 0.05 ¿podría decirse que los dos grupos tienen las mismas
calificaciones promedio?. Suponga que provienen de poblaciones normales con varianzas iguales.
Ejercicio 8. La experiencia en la investigación de demandas por accidentes en una institución
aseguradora revela que en promedio cuesta $60 la realización de los trámites. Este costo se consideró
exorbitante en comparación al de otras compañías aseguradoras y se instauraron medidas para reducir
costos. A fin de evaluar el impacto de las medidas, se seleccionó una muestra de 16 demandas
recientes. Se encontró un costo promedio de $57 y una desviación estándar de $10. Elabore una
prueba de hipótesis que permita comprobar si los costos han disminuido, con un 99% de confianza.
Ejercicio 9. Por registros pasados se sabe que la duración promedio de unas pilas eléctricas que se
fabrican para ser utilizadas en un reloj digital es de 300 días.
Hace poco tiempo, el proceso de fabricación fue modificado para darle mayor duración. Para
comprobar la efectividad del proceso modificado, se probó una muestra de 20 pilas, y se encontró una
duración promedio de 311 días y una desviación estándar de 12 días. A un nivel de significación de
0,05, ¿puede afirmarse que el nuevo proceso aumenta la duración de las pilas?
Ejercicio 10. Un gerente de ventas de libros universitarios afirma que en promedio sus representantes
de ventas realizan 40 visitas a profesores por semana. Varios de estos representantes piensan que
realizan un número de visitas promedio superior a 40. Una muestra tomada al azar con 8 semanas
reveló un promedio de 42 visitas semanales y una desviación estándar de 2 visitas. Utilice un nivel de
confianza del 99% para aclarar esta cuestión.
Ejercicio 11. Cuando la cantidad de semillas de soja que quedan en el suelo luego de pasar
la cosechadora es igual o mayor a 80 semillas/m2, la pérdida de producción, en qq/ha, es
grande. Un productor decide probar el funcionamiento de su máquina y para ello luego de
cosechar una parcela cuenta en 10 unidades de 1 m2 cuántas semillas quedan en el suelo.
Los resultados fueron, en semillas/m2: 77 73 82 82 79 81 78 76 76 75
a) ¿Se puede concluir, trabajando con un nivel de significación del 10%, que la cosechadora
está funcionando bien?, es decir, ¿está la perdida dentro de los límites admisibles?
b) Construir un intervalo de confianza para μ apropiado para el problema.
Ejercicio 12. Referido al problema 11.
a) Si las normas técnicas indican que la desviación estándar del número de semillas caídas
por m2 no debería ser superior a 5, ¿qué se debería concluir sobre la máquina trabajando
con un nivel de significación α = 0.10?
b) Construir un intervalo de confianza para σ2
.
Ejercicio 13. Los registros de una comercializadora de repuestos para vehículos revelaron que la
duración promedio de un juego de bujías es de 44.000 kilómetros. Un fabricante de bujías, sin
embargo, afirmó que su producto tiene una vida media superior a este valor. El propietario de una
flotilla de camiones adquirió 18 bujías, como prueba. Encontró una duración promedio de 42.400
kilómetros y la desviación 1.500. Esta información muestral convenció al propietario. ¿Y a Ud.?
Ejercicio 14. Una cadena de talleres para la afinación de motores de automóvil anuncia que su
personal puede realizar el servicio completo (cambio de aceite, cambio del filtro de aceite, lavado y
engrase de motor) en un promedio de 15 minutos. Sin embargo, la gerencia ha recibido quejas de los
clientes en relación al tiempo de servicio. Para verificar la afirmación, la oficina muestreó a 21
automóviles, obteniendo una media de atención de 18 minutos y una desviación de 1 minuto.
Utilice un nivel de significación de 0,05 para probar si es razonable la afirmación de la cadena de
talleres.
Ejercicio 15. Se instala una máquina para llenar botellas pequeñas con 9,0 gramos de medicamento.
Se piensa que el peso medio es de menos de 9,0 gramos. Una muestra de llenado se da a continuación.
Pruebe la afirmación con un 99% de confianza.
9,2 8,7 8,9 8,6 8,8 8,5 8,7 9,0
Ejercicio 16. Se desea estudiar el gasto semanal de fotocopias, de los estudiantes de la UNHEVAL.
Para ello, se ha elegido una muestra aleatoria de 9 de estos estudiantes, resultando los valores
siguientes para estos gastos: 100 150 90 70 75 105 200 120 80
Se supone que la variable aleatoria objeto de estudio sigue una distribución normal de media
desconocida y de desviación típica igual a 12.
Determina un intervalo de confianza del 95% para la media del gasto semanal en fotocopias por
estudiante.
Ejercicio 17. Se sabe que la desviación típica de las notas de cierto examen es 0,4. Para una muestra
de 36 estudiantes se obtuvo una nota media de 5,6. ¿Sirven estos datos para confirmar la hipótesis de
que la nota media del examen fue de 6, a un nivel de significación de 0,05?
Ejercicio 18. Cuando fue contratado como mesonero de un restaurante, a un caballero se le dijo que
obtendría S/.20 por día en propinas. Al cabo de 25 días de trabajo, el mesonero piensa que no obtuvo
tanto en propinas. El restaurante le pidió cuentas de sus propinas durante el mes: había recibido S/.
450 en los 25 días.
Así mismo, se determinó con los datos muestrales que la desviación estándar fue de S/. 3. por día.
¿Puede el mesonero sostener estadísticamente su opinión, al 95% de confianza?
Ejercicio 19. Pruebe la hipótesis de que el contenido promedio de los envases de un lubricante en
particular es de 10 litros si los contenidos de una muestra aleatoria de 10 envases son: 10.2, 9.7, 10.1,
10.3, 10.1, 9.8, 9.9, 10.4, 10.3 y 9.8 litros. Utilice un nivel de significancia de 0.01 y suponga que la
distribución del contenido es normal.
Ejercicio 20. Una muestra de 9 explotaciones agrícolas arrojó una media de 125 ha y un desvío de 25
ha. Testar si se puede suponer con bastante confiabilidad que el promedio verdadero de la población
de explotaciones puede ser 135 ha.
2
2
2
1
2
1
2121
)(
nn
uxx
z
2
2
2
1
2
1
2121
)(
n
s
n
s
uxx
tz
2
2
2
1
2
1
2/2121
2
2
2
1
2
1
2/21
nn
Zxx
nn
Zxx
2
2
2
1
2
1
2/2121
2
2
2
1
2
1
2/21
n
s
n
s
Zxx
n
s
n
s
Zxx
9.3 PRUEBA DE HIPÓTESIS SOBRE LA DIFERENCIA ENTRE MEDIAS: MUESTRAS
GRANDES
9.3.1 INTRODUCCIÓN
Supóngase que se tiene dos poblaciones independientes con medias desconocidas μ1 y μ2, y
varianzas σ1
2
y σ2
2
. Sean 1
x y 2
x las medias de las muestras de dos poblaciones. El tamaño de cada
una de estas muestras son n1 y n2 respectivamente.
Queremos observar si la diferencia entre las medias es significativa o no, es decir.
Hipótesis
Caso I Caso II Caso III
Ho: μ1 – μ2 ≥ Δ
H1 : μ1 – μ2 < Δ
Ho: μ1 – μ2 = Δ
H1 : μ1 – μ2 ≠ Δ
Ho: μ1 – μ2 ≤ Δ
H1 : μ1 – μ2 > Δ
9.3.2 SUPUESTOS
1. Las observaciones de las muestras son aleatorias
2. Las poblaciones son independientes
3. Los tamaños de las muestras son n 1≥ 30 y n2 ≥30
4. Las poblaciones son normales o cumplen las condiciones del teorema del límite central.
Estadístico de prueba
a) Varianzas conocidas 1
2
y 2
2
b) Varianzas desconocidas 1
2
y 2
2
Intervalo de Confianza. Del 100(1- )% para la diferencia de medias poblacionales 1- 2, es de la
forma:
a) Se conoce la varianza poblacional σ2
. b) Se desconoce la varianza poblacional σ2
.
Donde:
n1: Tamaño de la muestras 1; n2 : Tamaño de la muestras 2
1
x : Media de la muestra 1 , 2
x : Media de la muestra 2
μ1 : Media de la población 2; μ2 : Media de la población 2;
1 : Desviación estándar poblacional 1 ; 2 : Desviación estándar poblacional 2
s1 : desviación estándar de la muestra 1; s : desviación estándar de la muestra 2
Z0,025=-1,96 Z0,025 =1,96
Z= – 1,38
Zona de
aceptaci
ón
Ho
Zona
rechazo
Ho
Zona
rechazo
Ho
38,1
56
169
42
225
)0(7874)(
2
2
2
1
2
1
2121
n
s
n
s
uxx
z
Notas.
1. Para muestras grandes es indistinto usar la distribución Z o distribución t de student, para
calcular el p-valor en la práctica se usa generalmente la distribución t porque en la mayoría de
los paquetes estadísticos viene como una opción
2. Si NO se conoce las desviaciones estándar de las poblaciones 1 y 2 se estima con s1 y Sha las
desviaciones estándar de las muestras
3. Generalmente se tiene que μ1 – μ2 = 0
9.3.3 EJERCICIOS RESUELTOS
Ejercicio 1. Se conocen los datos de dos muestras de dos poblaciones, que son los siguientes: Las
medias X1 = 74 ; X2 = 78 ; las varianzas S1
2
= 225 ; S2
2
= 169; las muestras n1 = 42 ; n2 = 56; Se
pide contrastar estadísticamente si existe diferencia entre las dos poblaciones, a un nivel de
significación del 0.05. Las dos poblaciones siguen una distribución Normal N(μ1,σ1
2
) y N(μ2, σ2
2
)
Solución. Sabemos que las distribuciones de las dos poblaciones son Normales, pero desconocemos el
valor de su desviación, sólo conocemos el valor de la desviación típica de las muestras entonces
estimamos las desviaciones poblacionales con las de las muestras.
Hipótesis:
Ho: μ 1 - μ 2 = 0, es decir, μ1 = μ 2 (no existe diferencia entre las poblaciones)
H1: μ 1 - μ 2 ≠ 0, es decir, μ 1 ≠ μ 2 (si existe diferencia entre las poblaciones)
Ya que el tamaño de las muestras es elevado, utilizaremos el siguiente estadístico:
Estadístico
El nivel de significación nos dice el enunciado que es de α = 0.05 como es de dos colas α/2 = 0.025, y
para el criterio de aceptación tenemos en la figura:
Conclusión. Como (Z = – 1,38) queda en el área de aceptación de Ho, luego aceptamos Ho, es decir
no existe diferencia entre las poblaciones
Solución en MINITAB
Ejecutamos las opciones Stat/Basic statistics/2 Sample t.., luego completamos los datos como se ve
en la figura y clickeamos ok, ok
8,6
45
6,3
40
9,2
)0(4,306,25)(
22
1
2
1
2
2
2
1212
n
s
n
s
uxx
z
Resultados
Two-Sample T-Test and CI
Sample N Mean StDev SE Mean
1 42 74,0 15,0 2,3
2 56 78,0 13,0 1,7
Difference = mu (1) - mu (2)
Estimate for difference: -4,00000
95% CI for difference: (-9,75807; 1,75807)
T-Test of difference = 0 (vs not =): T-Value = -1,38 P-Value = 0,171 DF = 81
Conclusión. Como (p = 0,171) > (α=0,05) luego no se rechaza Ho.
Ejercicio 2. Se realizó un estudio para comparar los años promedio de servicio de quienes se retiraron
en 2005 con los que se retiraron el año anterior en un hospital. Con un nivel de significancia de 0,01
¿podemos concluir que los trabajadores que se retiraron el 2005 trabajaron menos que los del 2004,
según la siguiente muestra?
Año 2004 2005
Media de la muestra 30,40 25,60
Desviación estándar muestra 3,6 2,9
Tamaño de la muestra 45,0 40,0
Solución.
HIPÓTESIS
Ho: μ 2 - μ 1 ≥ 0, (los trabajadores del 2005 trabajan igual o mas que los del 2004)
H1: μ 2 - μ 1 < 0, (los trabajadores del 2005 trabajan menos que los del 2004)
Concusión: Como (Z= -6,8) < (Z0,01= 2,3263) se rechaza Ho; luego los trabajadores del 2005
trabajan menos que los de 2004
Utilizando MINITAB
22,10
40
8,12
35
9,33
1,157,3)(
2
2
2
1
2
1
2121
n
s
n
s
uxx
z
Two-Sample T-Test and CI
Sample N Mean StDev SE Mean
1 40 25,60 2,90 0,46
2 45 30,40 3,60 0,54
Difference = mu (1) - mu (2)
Estimate for difference: -4,80000
99% upper bound for difference: -3,12520
T-Test of difference = 0 (vs <): T-Value = -6,80 P-Value = 0,000 DF = 82
Conclusión: como (p-value=0,00)<(α=0,01), se rechaza Ho, es decir hay suficiente evidencia para
suponer que los trabajadores del 2005 trabajan menos que los del 2004.
Ejercicio 3. En un ensayo clínico para evaluar un hipotensor se compara un grupo placebo con el
grupo tratado. La variable medida es la disminución de la presión sistólica y se obtiene: grupo placebo
n = 35; x 3,7 mm de Hg. y Sha
= 33,9; grupo tratado n = 40; x 15,1 mm de Hg. y Sha
= 12,8. ¿Es
eficaz el tratamiento?
Solución.
Se trata de un contraste sobre diferencias de medias
H0: μ1 – μ2 ≤ 0 (no varia la presión)
H1: μ1 – μ2 > 0 (la presión disminuye)
Como no conocemos σ1 ni σ2 utilizamos la s1 y Sha y la distribución t, pero como la distribución t para
muestras n>30, se aproxima a Z utilizamos la distribución Z, los resultados serán iguales a la t de
Students.
Luego tenemos que (Z = – 10,22) < (Z0,05= – 1,645), entonces se ACEPTA la Ho, significa que la
presión con el nuevo tratamiento no ha disminuido.
Utilizando MINITAB :
Two-Sample T-Test and CI
Sample N Mean StDev SE Mean
1 35 3,70 5,82 0,98
2 40 15,10 3,58 0,57
Difference = mu (1) - mu (2)
Estimate for difference: -11,4000
95% lower bound for difference: -13,2998
T-Test of difference = 0 (vs >): T-Value = -10,04 P-Value = 1,000 DF = 54
Conclusión. De aquí tenemos que (p-valor =1) > (α=0,05) luego se acepta Ho. La presión no varía.
9.3.4 EJERCICIOS PROPUESTOS
Ejercicio 1. En la actualidad las calificaciones de eficiencia de 50 trabajadores de una empresa tienen
un valor promedio de 14.5 puntos y una desviación estándar de 1.6 puntos. Sin embargo, en fechas
recientes se evaluó a 64 trabajadores, que obtuvieron una puntuación media de 16.5 puntos y una
varianza de 9.
Dentro de un nivel de confianza del 95%, ¿puede decirse que la puntuación actuales de los
trabajadores de la empresa es menor que en fechas recientes?.
Ejercicio 2. Dos compañías que fabrican bloques de concreto desean comparar la compresión
promedio de sus bloques. El interés es determinar si las dos compañías tienen compresiones promedio
iguales, o si por el contrario, existen diferencias entre las mismas. Con base a un muestreo, pudo
determinarse la información que sigue. Utilizando un nivel de significación de 0,02, ¿es posible
concluir que hay diferencias entre la compresión promedio de los bloques de ambas compañías?
Compañía 1 Compañía 2
Compresión promedio(psi) 1070 1045
Desviación estándar (psi) 63,6 57,1
Tamaño Muestra 100 64
Ejercicio 3. Un producto químico especialmente diseñado para añadir peso al grano desea determinar
si es o no eficaz. Se tomaron dos grupos: el primer grupo fue formado con grano al cual no se le
aplicó el producto y el segundo grupo fue de grano al cual si se le aplicó el producto. Una muestra de
100 mazorcas de maíz no tratado con el producto tuvo un peso promedio de 15,2 onzas, con una
desviación de 1,2 onzas. Una muestra de 400 mazorcas de maíz tratado con el producto tuvo un peso
promedio de 16 onzas, con una desviación de 1 onza. Utilizando una prueba de hipótesis con un 95%
de confiabilidad, ¿es posible concluir que el producto es eficaz?
Ejercicio 4. Las existencias de un medicamento se han surtido siempre en una farmacia un promedio
de 6,2 veces al año, con una desviación de 1,5 veces. Se sospecha que esta tasa ha cambiado en los
últimos meses. Una muestra de los últimos 36 meses reveló que ahora se surte 5,4 veces al año. ¿Ha
cambiado la tasa de surtido? Utilice un nivel de confiabilidad del 98%.
Ejercicio 5. Un fabricante de detergente afirma que su producto rinde más que los de la competencia,
para ello se tomaron 30 sabanas del mismo tamaño y color y se efectuó la prueba, encontrándose que
para un lavado perfecto se requirió de 800g de detergente con 15 de desviación estándar en un tiempo
dado, 30 sabanas del mismo tamaño y color se probaron para el detergente de la competencia
arrojando para un lavado perfecto en el mismo tiempo un promedio de 860g con desviación estándar
de 10. ¿Tiene razón el fabricante? Utilice un nivel de confianza del 99%.
Ejercicio 6. La cadena de McPato situadas en la ciudad de Piura afirma que su servicio es mas rápido
que cualquier otra cadena, una muestra de 42 atenciones demoró en promedio de 3 minutos con
desviación típica de 1 minuto. Una muestra de 45 atenciones de la cadena McPollo arrojó un tiempo
promedio de atención de 4 minutos con desviación de 0.8 minutos ¿Tiene McPato razón? Utilice una
prueba estadística con un nivel de significación de 0,10.
Ejercicio 7. Una muestra A de 49 observaciones muestrales reveló una media de 7.8, con una
desviación de 1,2. Otra muestra B de 36 observaciones arrojó una media igual a 12 y una varianza de
2. ¿La media de la muestra A es menor que la muestra B?
Ejercicio 8. 100 Empleados de una casa comercial matriz situado en la ciudad de lima ganan por
comisiones en promedio s/500 mensuales con desviación estándar de 12, 30 empleados en Huancayo
de una sucursal ganan por comisiones s/450 mensual con desviación típica de 10, con un nivel de
significación de 0.05 probar la hipótesis de que la sucursal paga menos que la casa matriz.
Ejercicio 9. Una empresa de bienes raíces está preparando un folleto que cree que puede ser de
interés para compradores de apartamentos en Las Palmeras y El Naranjal. Un elemento de interés es el
tiempo que el propietario que vende ha ocupado el inmueble. Una muestra de 40 apartamentos en las
Palmeras indicó un tiempo promedio de permanencia de 17,6 años, con una desviación de 2,3 años.
Una muestra de 55 casas en El Naranjal señaló un tiempo promedio de 18,1 años, con una desviación
de 2,9 años. Con un nivel de significación del 5%, ¿se puede concluir que los residentes de Las
palmeras tenían en propiedad sus casas por un período más corto?
Ejercicio 10. Un estudio se realiza para comparar el alquiler mensual de un departamento de una
habitación en la Avenida principal de provincias contra el costo en Lima.
Una muestra de 35 departamentos en la Avenida principal de provincias proporcionó un alquiler
mensual de S/. 370., con una desviación de S/. 30. Una muestra de 40 departamentos en Lima
demostró un valor promedio de S/. 680., con una desviación de S/.12. ¿Se puede concluir que existen
diferencias entre los alquileres?
Ejercicio 11. Se realiza una encuesta en dos zonas distintas de un país para conocer el grado de
implantación de Internet en los hogares. En la zona norte se visitaron 200 domicilios de las mismas
características seleccionados al azar y el 38% de ellos estaba dado de alta en Internet. Este número
descendía al 29% en la zona sur donde se visitaron 240 hogares. ¿Estaría justificado afirmar que en la
zona norte hay más gente conectada a Internet que en la zona sur? ¿Cuál debería haber sido el tamaño
de la muestra para poder detectar una diferencia de al menos 5 puntos porcentuales el 90% de las
veces, con un nivel de significación de 0,05?
Ejercicio 12. Se quiere saber si el aumento del precio del petróleo genera incrementos en el uso de
electricidad. Para medir cambios experimentados desde el año anterior, se elige una muestra al azar de
40 casas en el mes de enero de 2004, y se compara con una muestra de 50 casas en el mes de enero
del 2005. los resultados muestrales son:
)2005(50305925,1
)2004(40298645,1
222
111
nkwhskwhx
nkwhskwhx
Realice una prueba con un nivel de significancia de 0,10 para verificar si el promedio de consumo de
electricidad por casa ha cambiado durante el mes de enero. ¿A que conclusión deberá llegar usted?
Ejercicio 13. La gerencia de una fábrica está considerando un nuevo método de aparado en la
fabricación de zapatos. El método actual requiere en promedio de 12,5 minutos de aparado y una
desviación típica de 3 para tres docena de zapatos. Se incorporó un nuevo método de aparado y sobre
una muestra de 32 zapatos requiere en promedio 9 minutos con varianza de 4, determinar si el nuevo
método es mas eficaz a un nivel de confianza de 99%.
Ejercicio 14. En una muestra aleatoria de 35 cabinas de Internet en la ciudad de amarilis ganan en
promedio diario S/200 con una varianza de 4. En Huánuco una muestra de 30 cabinas de Internet
dijeron que ganaban en promedio diario S/250 con una desviación típica de 2.2, a un nivel de
confianza de 90%, determinar si en las cabinas de Internet de Amariles se gana más que en las de
Huánuco.
Ejercicio 15. Las exportaciones de mangos del 2006 de 30 empresas fueron en promedio de 800
toneladas métricas, con una varianza de 200 toneladas métricas al cuadrado, el 2007 estas mismas
empresas exportaron 1000 toneladas con una varianza de 150, a un nivel de confianza de 95% se
puede afirmar que el 2007 se incremento las exportaciones de mango.
2
2
2
1
2
1
21
nn
xx
z o
1
2
1
1
2
1
2/2121
1
2
1
1
2
1
2/21
nn
zxx
nn
zxx
9.4 PRUEBA DE HIPÓTESIS SOBRE LA DIFERENCIA ENTRE MEDIAS: MUESTRAS
PEQUEÑAS
9.4.1 INTRODUCCIÓN
Estas pruebas se utilizan cuando el muestreo destruye a los elementos, cuando resulta muy costoso o
cuando solo se puede obtener unos cuantos valores históricos.
Sea u1 y u2, las medias de dos poblaciones normales o aproximadamente normal; Se quiere probar la
hipótesis sobre la diferencia de medias bajo el supuesto que Ho es cierto es decir:
Hipótesis
Caso I Caso II Caso III
Ho: μ1 – μ2 ≥ Δo
H1 : μ1 – μ2 < Δo
Ho : μ1o – μ2 = Δo
H1 : μ1 – μ2 ≠ Δo
Ho: μo – μ2 ≤ Δo
H1: μ1 – μ2 > Δo
9.4.2 SUPOSICIONES
1. Las observaciones de las dos muestras son independientes
2. Las dos poblaciones son aproximadamente normales
3. Al menos una muestra es pequeña n < 30
Prueba Estadística..
Caso 1. Se conocen las desviaciones estándar de las poblaciones σ1 y σ2,.
Intervalo de Confianza. Del 100(1- )% para la diferencia de medias poblacionales 1- 2, es de la
forma:
Caso 2. Se desconoce 1 y 2 pero son iguales 1= 2= , se determina s la desviación estándar
combinada, en función de s1 y S2.
21
21
11
nn
s
xx
t o
2
2
2
1
2
1
21
n
s
n
s
xx
t o
1
2
1
1
2
1
,2/2121
1
2
1
1
2
1
,2/21
n
s
n
s
txx
n
s
n
s
txx glgl
11
221,2/2121
11
221,2/21
1111
nn
stxx
nn
stxx nnnn
Intervalo de Confianza. Del 100(1- )% para la diferencia de medias poblacionales 1- 2, es de la
forma:
Prueba t con n1+n2 – 2 grados de libertad
Donde s es un estimado conjunto de σ (desviación estándar común para ambas poblaciones (pooled
variance))
2
)1()1(
21
2
22
2
11
nn
snsn
s
Caso 3. Se desconoce 1 y 2 pero desiguales 1≠ 2 , se utiliza s1 y Sha, para estimar 1 y 2
respectivamente en este caso el método aproximado es la distribución t,
Los grados de libertad (gl) se determina con la fórmula siguiente.
2
1
1
1
1
2
2
2
2
2
2
1
2
1
1
2
2
2
2
1
2
1
n
s
nn
s
n
n
s
n
s
gl
Intervalo de Confianza. Del 100(1- )% para la diferencia de medias poblacionales 1- 2, es de la
forma:
Donde:
n1: Tamaño de la muestras 1; n2 : Tamaño de la muestras 2
1
x : Media de la muestra 1, 2
x : Media de la muestra 2
μ1 : Media de la población 2; μ2 : Media de la población 2;
1 : Desviación estándar poblacional 1 2 : Desviación estándar poblacional 2
s1 : desviación estándar de la muestra 1; Sha : desviación estándar de la muestra 2
s: desviación estándar combinada. gl : grados de libertad
T(0,1;23)=-1,714 t(0,1;23) =1,714
t= 1,193
Zona de
aceptación
Ho
Zona
rechazo Ho
Zona
rechazo Ho
De tablas t para dos colas tenemos que:
t (α ; n1+n2-2) = t (0,1 ; 10+15-2) = t (0,1 ; 23) = 1,714
Nota: en caso gl no sea entero se aproxima al menor entero
9.4.3 EJERCICIOS RESUELTOS
Ejercicio 1. Como psicólogo de un hospital para enfermos mentales el lector obtiene calificaciones
para una prueba visual motora para cada uno de dos grupos de pacientes. La calificación media para el
grupo A (10 pacientes) es 80 con desviación estándar 18, y la correspondiente al grupo B (15
pacientes) es 70 con desviación estándar 22. El lector cree tener suficiente razones para considerar las
desviaciones estándar de población iguales, las poblaciones son normales. ¿Difieren
significativamente las calificaciones con nivel de significación 10%?.
Solución
Datos
nA = 10 nB = 15 80A
x 70B
x sA = 18 sB = 22 = 0.10
Hipótesis
Ho: μA - μB = 0 (las calificaciones no difieren)
H1: μA - μB ≠ 0 (las calificaciones si difieren)
193,1
15
1
10
1
5278.20
7080
11
BA
BA
nn
s
xx
t
s = 5278.20
21510
22)115(18)110(
2
)1()1(
2222
BA
BBAA
nn
snsn
Decisión: como se observa en la figura el t esta dentro del área de aceptación de Ho., luego se acepta
Ho, es decir que las calificaciones no difieren
Utilizando MINITAB
Ejecutamos las opciones Stat/Basic statistics/2 Sample t.., luego completamos los datos como se ve
en la figura y clickeamos ok, ok
u1-
u2
H1
s1
s2
1
x
2
x
1= 2
n2
n1
t=0,68 T(0,05;10)=1,812
Zona de
rechazo HoZona de Aceptación Ho
Nota: Note que Assume equal viariances está activado
esto se hace cuando las varianzas de las poblaciones son iguales
Two-Sample T-Test and CI
Sample N Mean StDev SE Mean
1 10 80,0 18,0 5,7
2 15 70,0 22,0 5,7
Difference = mu (1) - mu (2)
Estimate for difference: 10,0000
90% CI for difference: (-4,3630; 24,3630)
T-Test of difference = 0 (vs not =): T-Value = 1,19 P-Value = 0,245 DF = 23
Both use Pooled StDev = 20,5278
Conclusión: Como (p-value = 0,245) > (α = 0,1) luego se acepta Ho.
Ejercicio 2. Para contrastar si mediante el proceso B se disminuye el tiempo de ejecución de ciertos
trabajos respecto del A, se ejecutaron 6 tareas con ambos procesos obteniéndose los siguientes
tiempos, medidos en horas:
A 2,5 7,1 5 8,5 7 8,1
B 2,3 7,1 4 8 6,6 5
Admitiéndose normalidad y con un nivel de confianza del 95% ¿qué conclusión puede derivarse de
estos datos?. Suponer que ambos procesos tienen la misma variabilidad.
Solución.
Ho: μA – μB ≤ 0 (Con el proceso B no se disminuye el tiempo de ejecución)
H1: μA – μB > 0 (Con el proceso B se disminuye el tiempo de ejecución)
37,6
6
1,875,851,75,2
A
x 5,5
6
56,6841,73,2
B
x
25,2
16
2
)37,6(6)
2
)1,8(
2
)7(
2
)5,8(
2
)5(
2
)1,7(
2
)5,2((
A
s
13,2
16
2
)5.5(8)
2
5
2
6,6
2
8
2
4
2
1,7
2
3,2(
B
s
t(0,05,10) = 1,812 una cola
68,0
6
1
6
1
6928.0
5,537,6
11
B
n
A
n
s
B
x
A
x
t
6928.0
266
13.2)5(25.2)5(
2
)1()1(
2222
BA
BBAA
nn
snsn
Conclusión: En la gráfica vemos que t=0,68 esta en la
zona de aceptación de la Ho, luego Con el proceso B no se
disminuye el tiempo de ejecución
En MINITAB
Primero ingresamos los datos en la columna C1 (XA) y C2 (XB) como en la figura
Y ejecutamos las opciones Stat/Basic statistics/2 Sample t.., luego completamos los datos como se
ve en la figura y clickeamos ok, ok
Aquí los resultados.
Two-Sample T-Test and CI: XA; XB
Two-sample T for XA vs XB
N Mean StDev SE Mean
XA 6 6,37 2,25 0,92
XB 6 5,50 2,13 0,87
Difference = mu (XA) - mu (XB)
Estimate for difference: 0,866667
95% lower bound for difference: -1,427686
T-Test of difference = 0 (vs >): T-Value = 0,68 P-Value = 0,255 DF = 10
Both use Pooled StDev = 2,1926
Conclusión. Como (p-value=0,255)>(α =0,05) se acepta Ho.
Ejercicio 3. Se quiere saber el trabajo afecta el rendimiento académico de los estudiantes de una
especialidad, para ello se evalúa a dos grupos independientes de estudiantes, supóngase que las
poblaciones son normales. El grupo 1 es el de estudiantes que trabajan y el grupo 2 es el de
estudiantes que no trabajan, los datos obtenidos en la investigación son los siguientes.
G1 5 12 8 11 12 13 8 11
G2 10 10 16 17 15 16 14 16
Con un nivel de significancia de 0.01, puede afirmarse que el trabajo disminuye el rendimiento
académico.
Solución
1: media de estudiantes que trabajan 2: media de estudiantes que no trabajan
Primero: No se conocen las 1 y 2 además no sabemos si son o no iguales, para determinar si son
iguales aplicamos la prueba de la varianza.
Ho: 1 / 2 = 1 (la varianzas son iguales)
H1: 1 / 2 ≠ 1(la varianzas no son iguales)
Aplicamos Minitab
Los resultados fueron
Test for Equal Variances: g1, g2
99% Bonferroni confidence intervals for standard deviations
N Lower StDev Upper
g1 8 1.53600 2.72554 8.09028
g2 8 1.55800 2.76457 8.20614
F-Test (normal distribution)
Test statistic = 0.97, p-value = 0.971
Levene's Test (any continuous distribution)
Test statistic = 0.00, p-value = 1.000
Como (p.value=1)>0.01 se acepta la Ho, o sea que las varianzas de las poblaciones son iguales.
Además
S1=2.73 Sha=2.76
Segundo. Como son iguales las 1 y 2 aplicamos la prueba de student con varianza combinada.
2
1
1
1
21
nn
s
xx
t
Hipótesis
Ho: 1 - 2 = 0 (el rendimiento académico no disminuye)
H1: 1 - 2 < 0 (el rendimiento académico disminuye)
Aplicando Minitab tenemos.
Two-Sample T-Test and CI: g2, g1
Two-sample T for g2 vs g1
N Mean StDev SE Mean
g2 8 14.25 2.76 0.98
g1 8 10.00 2.73 0.96
2
2
2
1
2
1
2121
)(
n
s
n
s
uxx
t
Difference = mu (g2) - mu (g1)
Estimate for difference: 4.25000
99% upper bound for difference: 7.85228
T-Test of difference = 0 (vs <): T-Value = 3.10 P-Value = 0.996 DF = 14
Both use Pooled StDev = 2.7451
Nota: aquí hemos puesto g2 primero y luego g1, porque Sha>s1
Luego como (p-value=0.004)< ( =0.01) se rechaza Ho, o sea que el trabajo diminuye el rendimiento
académico de los estudiantes.
Ejercicio 4. Se determinó la contaminación de dos ríos A y B de una ciudad analizando el PH de 100
ml de agua, el río A esta ubicado en una zona industrial y el río B esta ubicada en una zona rural. Se
dice que el agua no esta contaminada si su PH esta cercano a 7
Los datos encontrados fueron
Río n x Sha
A 5 5 0.7
B 5 7 0.07
Con un =0.05 se desea saber si el río A esta más contaminado que B. Las distribuciones son
normales, pero no se sabe si las varianzas son iguales.
Solución
Primero. Debemos determinar si las varianzas son iguales.
Utilizamos la comparación de varianzas
Test for Equal Variances
95% Bonferroni confidence intervals for standard deviations
Sample N Lower StDev Upper
1 5 0.468406 0.836660 2.89447
2 5 0.148123 0.264575 0.91531
F-Test (normal distribution)
Test statistic = 10.00, p-value = 0.047
Como (p-valor=0.047) < 0.05 se rechaza Ho, luego las distribuciones No son iguales.
Como 1≠ 2 utilizamos la distribución
Ho: 1 = 2 (El río A no esta más contaminado que el río B)
H1: 1 < 2 (El río A esta más contaminado que el río B)
Según minitab tenemos
Two-Sample T-Test and CI
Sample N Mean StDev SE Mean
1 5 5.000 0.700 0.31
2 5 7.0000 0.0700 0.031
Difference = mu (1) - mu (2)
Estimate for difference: -2.00000
95% upper bound for difference: -1.32930
T-Test of difference = 0 (vs <): T-Value = -6.36 P-Value = 0.002 DF = 4
Como p-value=0.002 < 0.05 luego se rechaza Ho, es decir el río A está mas contaminado que el río B.
Ejercicio 5. Dieciocho plantas de una misma variedad de naranjos fueron tratadas con fertilizantes. A
nueve de ellas se les aplicó una cierta dosis de nitrógeno (N) y al resto una de nitrógeno y fósforo
(NP). Se midió el rendimiento en Kg. por planta; los resultados obtenidos fueron:
N: X = 28 kg S² = 9 NP: X = 21 kg S² = 7
Interesa conocer si existen diferencias significativas entre los rendimientos de las plantas tratadas con
los dos tipos de fertilizante. (α = 0,01). Suponga varianzas iguales
Solución:
H0 : µ N = µ NP
H1 : µ N µ NP
Dado que las variancias poblacionales son iguales, de las cuales S²N y S²NP son estimaciones, se
calcula la variancia amalgmada. Si el supuesto no fuera válido debería verificarse primeramente la
homogeneidad de variancia a través del test F, en particular si las muestras de las poblaciones no son
iguales.
Donde 828427.2
299
7)19(9)19(
2
)1()1(
21
2
22
2
11
nn
snsn
s
25.5
9
2
828427.2
)2128(
11
)()(
NPN
NPNNPN
nn
s
XX
t
El valor tabulado de t, para 16 grados de libertad y nivel de significación del 1% es igual a ± 2,921.
Como el valor de la estadística calculada supera al valor tabulado, se rechaza H0 .
Conclusión existen diferencias estadísticamente significativas entre los tratamientos, siendo superior
el promedio por planta de naranjo, de aquellas que reciben el tratamiento NP.
Ejercicio 6. Se quiso probar si la cirrosis de hígado hacia variar el índice de actividad de la
colinesterasa en suero. Se eligieron dos muestras aleatorias e independientes de individuos. Los
resultados fueron:
Individuos normales n1=20 8,11
x S1=0,4
Individuos cirroticos n2=25 66,02
x S2=0,2
La cirrosis de hígado, ¿hace variar el índice de la colinesterasa en suero?
Solución:
Primero. Debemos determinar si las varianzas son iguales.
Utilizamos la comparación de varianzas
Test for Equal Variances
95% Bonferroni confidence intervals for standard deviations
Sample N Lower StDev Upper
1 20 0.293052 0.4 0.619718
2 25 0.150964 0.2 0.292749
F-Test (Normal Distribution)
Test statistic = 4.00, p-value = 0.002
Como (p-valor=0.002) < 0.05 se rechaza Ho, luego las distribuciones No son iguales.
Como 1 ≠ 2 utilizamos la distribución
2
2
2
1
2
1
2121
)(
n
S
n
S
xx
t 2
1
1
1
1
2
2
2
2
2
2
1
2
1
1
2
2
2
1
2
1
n
S
nn
S
n
n
S
n
S
gl
Hipótesis:
H0: 21
(No varía)
H1: 21
(Varía)
Según Minitab tenemos
Two-Sample T-Test and CI
Sample N Mean StDev SE Mean
1 20 1.800 0.400 0.089
2 25 0.660 0.200 0.040
Difference = mu (1) - mu (2)
Estimate for difference: 1.1400
95% CI for difference: (0.9386, 1.3414)
T-Test of difference = 0 (vs not =): T-Value = 11.64 P-Value = 0.000 DF = 26
Como P-Value = 0,000 < 0,05 luego se rechaza Ho, es decir el índice de la colinesterasa en suero no
hace variar la cirrosis de hígado.
Ejercicio 7. Muchos autores afirman que los pacientes con depresión tienen una función cortical por
debajo de lo normal debido a un riego sanguíneo cerebral por debajo de lo normal. A dos muestras de
individuos, unos con depresión y otros normales, se les midió un índice que indica el flujo sanguíneo
en la materia gris (dado en mg/(100g/min)) obteniéndose:
Depresivo n1=19 471
x S1=7,8
Normales n2=22 8,532
x S2=6,1
¿Hay evidencia significativa a favor de la afirmación de los autores?
Solución:
Primero. Debemos determinar si las varianzas son iguales.
Utilizamos la comparación de varianzas
Test for Equal Variances
99% Bonferroni confidence intervals for standard deviations
Sample N Lower StDev Upper
1 19 5.27061 7.8 13.9551
2 22 4.22499 6.1 10.3540
F-Test (Normal Distribution)
Test statistic = 1.64, p-value = 0.279
Como (p-valor=0.279) < 0.05 se rechaza Ho, luego las distribuciones No son iguales.
Como 1 ≠ 2 utilizamos la distribución
2
2
2
1
2
1
2121
)(
n
S
n
S
xx
t 2
1
1
1
1
2
2
2
2
2
2
1
2
1
1
2
2
2
1
2
1
n
S
nn
S
n
n
S
n
S
gl
Hipótesis:
H0: 21
(función cortical Normal)
H1: 21
(Función cortical por debajo de lo normal)
Según Minitab tenemos
Two-Sample T-Test and CI
Sample N Mean StDev SE Mean
1 19 47.00 7.80 1.8
2 22 53.80 6.10 1.3
Difference = mu (1) - mu (2)
Estimate for difference: -6.80
95% lower bound for difference: -10.54
T-Test of difference = 0 (vs >): T-Value = -3.07 P-Value = 0.998 DF = 33
Como P-Value = 0,998 > 0,05 luego se acepta Ho, es decir no hay evidencia significativa a favor de la
afirmación de los autores.
Ejercicio 8. Un fabricante de llantas para bicicleta afirma que sus llantas duran más que los de la
competencia, para ello se tomaron 5 llantas y la duración promedio fue de 60.000 kilómetros y una
varianza de 100. 6 llantas de la competencia arrojo un tiempo promedio de duración de 58000
kilómetros y una varianza de 90. Si las poblaciones se consideran normales de varianzas desconocidas
diferentes ¿tiene razón el fabricante? Utilice un nivel de confianza del 99%.
Solución:
Fabricante n1 = 5 600001
x V1 = 100
Competencia n2 = 6 580002
x V2 = 90
Utilizamos la distribución
2
2
2
1
2
1
2121
)(
n
S
n
S
xx
t 2
1
1
1
1
2
2
2
2
2
2
1
2
1
1
2
2
2
1
2
1
n
S
nn
S
n
n
S
n
S
gl
Hipótesis:
H0: 21
(No duran más)
H1: 21
(Duran más)
Según Minitab tenemos
Two-Sample T-Test and CI
Sample N Mean StDev SE Mean
1 5 60000.0 10.0 4.5
2 6 58000.00 9.49 3.9
Difference = mu (1) - mu (2)
Estimate for difference: 2000.00
99% lower bound for difference: 1982.86
T-Test of difference = 0 (vs >): T-Value = 338.01 P-Value = 0.000 DF = 8
Como P-Value = 0,000 < 0,01 luego se rechaza Ho, es decir que si tiene razón el fabricante que sus
llantas duran más.
9.4.4 EJERCICIOS PROPUESTOS
Ejercicio 1. Se mide la longitud de animales machos y hembras y se desea conocer si las longitudes
son diferentes.
Machos 44 48 36 32 51 45 54 56
Hembras 32 40 44 44 34 30 26
Ejercicio 2. Los pesos netos de las botellas de una muestra que llenó una máquina fabricada por Blue
y los pesos netos en una muestra de botellas llenadas por una máquina similar que manufactura Red,
Inc. fueron los siguientes:
Blue: 5 8 7 6 9 7
Red: 8 10 7 11 9 12 14 9
Pruebe al nivel de significación de 0.05 que el peso medio de las botellas que llena la máquina que
fabrica Red es mayor.
Ejercicio 3. Una muestra de las calificaciones que presentaron hombres y mujeres en un examen de
Estadística se sintetiza a continuación:
Hombres Mujeres
Media muestral 11,33 10,50
Desviación estándar 3,45 2,35
Tamaño de la muestra 6 8
¿Son las calificaciones promedios iguales, o por el contrario, existe alguna diferencia entre ellas?
Responda a esta pregunta con una prueba estadística de hipótesis que tenga un nivel de confianza del
99%.
Ejercicio 4. Un profesor está comparando las notas de dos secciones de Estadística.
Ambas secciones tuvieron 60 estudiantes, pero el profesor quiere una conclusión rápida,
fundamentado en una muestra pequeña. Así que observó en su planilla las siguientes calificaciones:
Sección “A”: 12 05 13 16 15 10
Sección “B”: 09 12 11 10 10 11
¿Se puede concluir, dentro de un nivel de confianza del 95%, que el promedio de notas de las dos
secciones es igual?
Ejercicio 5. Para dos tipos de combustibles de automóvil se tomó el rendimiento por galón de cada
uno y se presenta a continuación:
Combustible A: 45 67 54 41 38 59 48 31 59 31 50
Combustible B: 79 82 69 84 76 77 81 65 73 70 69
Con base en la información anterior se puede concluir que el rendimiento promedio del combustible B
es superior al rendimiento del combustible A? Utilice un nivel de significancia del 1%.
Ejercicio 6. Se desea analizar si existen diferencias en el contenido de proteínas del salmón y el atún
enlatados. Para ello se tomaron dos muestras de 7 unidades para cada uno de los dos productos y se
realizó la determinación del contenido proteico en lo mismo. Los resultados se presentan a
continuación:
Contenido de proteínas en porcentaje
Salmón 22.4 24.5 23.0 27.1 24.2 25.7 26.4
Atún 28.3 26.4 25.2 24.7 26.3 25.3 24.9
Esta información es suficiente para decir que ambos pescados enlatados tienen el mismo contenido de
proteína?
Ejercicio 7. Se comparan dos insecticidas A y B, pero como los niveles de interpretación son muy
variados en la plantación, se fumigó cada planta con ambos productos aplicándolos al azar en cada mitad
de la planta. Al tiempo se seleccionaron 10 hojas en cada mitad de cada planta fumigada y se registró el
número medio de insectos por hoja. Los datos son los siguientes:
Planta 1 2 3 4 5 6 7 8
Insecticida A 1.3 0.8 3.5 1.2 5.1 4.3 10.7 1.4
Insecticida B 2.1 1.5 3.9 1.8 5.0 5.4 12.9 1.1
a) Analizar la información planteando una prueba t de muestras apareadas.
b) Considerar ahora a las muestras como independientes (no apareadas) y aplicar la prueba t para esta
situación.
c) Compare los resultados obtenidos, comente sobre las ventajas y desventajas de uno y otro
procedimiento.
Ejercicio 8. Al medir el diámetro transversal del corazón de los adultos del sexo masculino y
femenino se obtuvieron los siguientes resultados:
Grupo Tamaño de muestra Media muestral (cm) S en cm
Hombres 12 13,21 1,05
Mujeres 9 11 1,01
Suponga que las varianzas de las dos poblaciones son iguales. ¿Proporcionan estos datos suficiente
evidencia que indique que el diámetro transversal promedio del corazón de los hombres es igual al de
las mujeres? Tome un nivel de significancia del 5%
Ejercicio 9. Se desea comparar la actividad motora espontánea de un grupo de 25 ratas control y otro
de 36 ratas desnutridas. Se midió el número de veces que pasaban delante de una célula fotoeléctrica
durante 24 horas. Los datos obtenidos fueron los siguientes:
Ratas de control n1=25 8,8691
x S1=106,7
Ratas desnutridas n2=36 4652
x S2=153,7
¿Se observan diferencias significativas entre el grupo control y el grupo desnutrido?
Ejercicio 10. Se quiso probar si la cirrosis de hígado hacia variar el índice de actividad de la
colinesterasa en suero. Se eligieron dos muestras aleatorias e independientes de individuos. Los
resultados fueron:
Individuos normales n1=20 8,11
x S1=0,4
Individuos cirroticos n2=25 66,02
x S2=0,2
La cirrosis de hígado, ¿hace variar el índice de la colinesterasa en suero?
Ejercicio 11. Los siguientes datos corresponden a la longitud medida en centímetros de 18 pedazos de
cable sobrantes en cada rollo utilizado: 9, 3,41, 6,13, 1,99, 6,92, 3,12, 7,86, 2,01, 5,98, 4,15, 6,87,
1,97, 4,01, 3,56, 8,04, 3,24, 5,05, 7,37. Basados en estos datos ¿podemos decir que la longitud media
de los pedazos de cable es mayor de 4 cm? Suponga población normal y tome el nivel de significancia
0,05.
Ejercicio 12. Un agrónomo mide el contenido promedio de humedad en cierta variedad de trigo que
fue secado especialmente en una muestra de 16 toneladas: 7,2, 6,8, 7,3, 7, 7,3, 7,3, 7,5, 7,3, 7,4, 7,2,
7,6, 7,1, 7,4, 6,7, 7,4, 6,9. Si el promedio de humedad excede de 7,1 el secado debe continuar.
¿Debería continuarse con el proceso de secado, de acuerdo con esta evidencia? Tome un nivel de
significancia del 5%.
Ejercicio 14. Se quiere medir el rendimiento de un automóvil, para ello se determinó el número de
km por galón de gasolina, los resultados fueron
45 67 54 41 38 59 48 31 59 31
Con esta información se puede concluir que el rendimiento promedio del combustible es superior a 50
km/galón? Utilice un nivel de significancia del 1%.
Ejercicio 15. Se presume que el consumo de gerentes por año es igual a 20 mil dólares, para ello se
tomó la siguiente información de una muestra de 11 Gerentes:
Consumo anual en miles de $: 36 22 26 18 22 14 34 25 25 18 18
Con base en los resultados anteriores considera que la presunción es cierta.
n
S
Dd
t
d
n
d
d
i
1
22
n
dnd
S
i
d
n
s
td
n
s
td d
nd
d
n 1,2/1,2/
9.5 PRUEBAS DE HIPÓTESIS PARA MEDIAS: MUESTRAS DEPENDIENTES
9.5.1 INTRODUCCIÓN
Las muestras dependientes o apareadas aparecen como distintas observaciones realizadas sobre los
mismos individuos.
Dos muestras son dependientes cuando se obtienen de sujetos comunes. También se denominan
muestras apareadas o equiparadas.
Un ejemplo de observaciones apareadas consiste en considerar a un conjunto de n personas a las que
se le aplica un tratamiento y se mide por ejemplo el nivel de estrés antes X1 y después del tratamiento
X2; la producción de una maquina en el turno mañana x1 y la producción de la misma máquina en el
turno tarde x2.
En las pruebas de datos pareados no hay necesidad de suponer que las dos poblaciones de que se trata
tienen varianzas iguales. Las hipótesis a considerar:
Hipótesis
Caso I Caso II Caso III
Ho: μd ≤ D Ho: μd = D Ho: μd ≥ D
H1 : μd > D H1 : μd ≠ D H1 : μd < D
3.5.2 SUPUESTOS
1. Las observaciones de las muestras son aleatorios
2. Las muestras deben tener distribuciones normales
Prueba estadísticas
Intervalo de Confianza. Del 100(1- )% para la diferencia de medias poblacionales d es de la
forma:
Donde:
µd : Media de las diferencias poblacional
d : Media de la diferencia de los datos de las muestras apareadas
Sd : Desviación estándar de las diferencias de los datos de las muestras apareadas
n : Número de pares de datos
95,3
)031()(
846.7
10
81.24
d
d
t
t(0,05;9)=1,8331 t=3,9
Zona de
rechazo HoZona de Aceptación Ho
n
S
d
t
d
d
9.5.3 EJERCICIOS RESUELTOS
Ejercicio 1. Se pretende demostrar que cierto tratamiento practicado durante un mes, ayuda a reducir
el colesterol. Para ello se realiza un estudio con una muestra aleatoria simple de 10 personas. Los
resultados se muestran a continuación.
Antes 200 210 330 240 260 300 245 210 190 225
Después 150 200 275 250 200 250 200 180 190 205
¿Que podemos concluir de estos datos.
Solución: Obsérvese que las mediciones se realizan sobre las mismas personas, por tanto no tenemos
dos muestras aleatorias independientes, sino una sola, en la cual lo que nos interesa es la diferencia
producida entre el colesterol antes del tratamiento y después del mismo. Para ello introducimos una
nueva variable que expresa la diferencia existente entre el colesterol antes del tratamiento y después
del mismo: D = Xant − Xdes
Antes 200 210 330 240 260 300 245 210 190 225
Después 150 200 275 250 200 250 200 180 190 205
Diferencia 50 10 55 -10 60 50 45 30 0 20
Encontrar evidencia a favor de que el tratamiento surgen el efecto deseado (baja el colesterol) es lo
mismo que encontrar evidencia estadísticamente significativa en el contraste:
Ho: μd = 0
H1 : μd > 0
Esto es de nuevo un contraste para una media, que se realiza sobre la variable
diferencia. El estadístico que usamos es:
De tablas tenemos que: t(0,05;9) = 1, 8331, para un α=5% y n-1=9 grados de libertad
Luego si suponemos que la hipótesis nula es cierta y que la variable diferencia sigue una distribución
normal de parámetros desconocidos, tenemos:
31
10
200...10551050
d , 81.24
1
22
n
dnd
d
S
Conclusión: El valor experimental se encuentra claramente en la región de rechazo por tanto
concluimos que existe evidencia estadísticamente significativa en contra de la hipótesis nula (se
rechaza) y a favor de la hipótesis alternativa (al menos con un nivel de significación del 5%).
En MINITAB
Ejecutamos las opciones Stat/Basic statistics/ Paired t.., luego completamos los datos como se ve en
la figura y clickeamos ok, ok
Se obtiene los siguientes resultados
Paired T-Test and CI: Antes; Después
Paired T for Antes - Despise
N Mean StDev SE Mean
Antes 10 241,000 45,019 14,236
Despise 10 210,000 37,491 11,856
Difference 10 31,0000 24,8104 7,8457
95% lower bound for mean difference: 16,6179
T-Test of mean difference = 0 (vs > 0): T-Value = 3,95 P-Value = 0,002
De aquí concluimos que (pvalue=0,002)<(α=0,05) entonces se rechaza Ho.
Ejercicio 2. Un fabricante deseaba comparar la resistencia al desgaste de dos tipos distintos de
neumáticos A y B. Para hacer la comparación, se asignó al azar un neumático del tipo A y uno del
tipo B a las ruedas posteriores de 20 automóviles.
Los autos recorrieron un número específico de kilómetros y se observó el desgaste de cada neumático.
Estos valores aparecen en la siguiente tabla.
A 10.6 9.8 12.3 9.7 8.8 10 9.9 9 12.1 8.9 10.1 11 11.8 9.9 12.2 12.3 10.5 8.8 8.6
9.2
B 10.2 9.4 11.8 9.1 8.3 10.1 9.2 11.2 11 8.2 10.1 10 10.3 10.4 11.1 11.3 9.3 8.5 10.3 11
Presentan los datos suficiente evidencia para concluir que hay diferencia en el desgaste promedio de
los dos tipos de neumáticos?
Solución
A 10.6 9.8 12.3 9.7 8.8 10 9.9 9 12.1 8.9 10.1 11 11.8 9.9 12.2 12.3 10.5 8.8 8.6 9.2
B 10.2 9.4 11.8 9.1 8.3 10.1 9.2 11.2 11 8.2 10.1 10 10.3 10.4 11.1 11.3 9.3 8.5 10.3 11
d 0.4 0.4 0.5 0.6 0.5 -0.1 0.7 -2.2 1.1 0.7 0 1 1.5 -0.5 1.1 1 1.2 0.3 -1.7 -1.8
24.0
20
)8.1()7.1(3.0...5.04.04.0
d , d =0, 7.4)8.1()7.1(...4.04.0d
2
)8.1(
2
)7.1(...
2
5.0
2
4.0
2
4.0
2
d 21.6
64.4
20
04.1
6.21
n
S
d
t
d
d
04.1
19
2
)7.4(20)6.21(
1
22
n
dnd
d
S
Hipótesis
Ho: μd = 0 (no hay diferencia)
H1: μd ≠ 0 (hay diferencia)
De la tabla t de estuden para dos colas, para un =0.05 ( /2=0.025)
t(0.025,19)= 2.093
Como (t(0.025,19)= 2.093 < t=4.64) se rechaza la Ho.
Luego hay suficiente evidencia que hay diferencia en el desgaste de los neumáticos.
Ejercicio 3. Un grupo de empresarios desean conocer la diferencia que hay entre el rendimiento de un
galón de gasolina del mismo octanaje entre dos establecimientos de servicio A y B. para esto
contrataron a un Ingeniero que haga el estudio, este asignó al azar un galón de la estación A y un
galón de la estación B a 9 automóviles.
Los autos recorrieron a una determinada velocidad hasta consumir totalmente el galón de gasolina.
Estos valores aparecen en la siguiente tabla
Auto 1 2 3 4 5 6 7 8 9
Est A 32 28 29.7 28 27 29 27 31 28.9
Est B 31 32.2 30.2 31.1 30.8 30 30.2 30.2 31.0
Si las poblaciones son normales, presentan los datos suficiente evidencia para concluir que hay
diferencia en el rendimiento de la gasolina según establecimiento.
Solución
Hipótesis
HO : 1= 2 (No hay diferencia de rendimiento)
H1 : 1≠ 2 (hay diferencia de rendimiento)
Aplicando minitab.
Paired T-Test and CI: A, B
Paired T for A - B
N Mean StDev SE Mean
A 9 28.9556 1.7133 0.5711
B 9 30.8222 0.7710 0.2570
Difference 9 -1.86667 2.02176 0.67392
95% CI for mean difference: (-3.42073, -0.31261)
T-Test of mean difference = 0 (vs not = 0): T-Value = -2.77 P-Value = 0.024
Según los datos, se tiene que (p–value = 0.024 < 0.05), entonces rechazamos Ho, luego hay
diferencia de rendimientos.
Capítulo viii
Capítulo viii
Capítulo viii
Capítulo viii
Capítulo viii
Capítulo viii
Capítulo viii

Más contenido relacionado

La actualidad más candente

Prueba de hipotesis estadistica aplicada a la ingenieria
Prueba de hipotesis estadistica aplicada a la ingenieriaPrueba de hipotesis estadistica aplicada a la ingenieria
Prueba de hipotesis estadistica aplicada a la ingenieria
Hector García Cárdenas
 
T de student
T de studentT de student
Prueba de hipotesis sobre la media con varianza desconocida
Prueba de hipotesis sobre la media con varianza desconocidaPrueba de hipotesis sobre la media con varianza desconocida
Prueba de hipotesis sobre la media con varianza desconocida
Karina Ruiz
 
Ejercicios prueba de hipótesis estadística
Ejercicios prueba de hipótesis estadísticaEjercicios prueba de hipótesis estadística
Ejercicios prueba de hipótesis estadística
Mark Ardiles Alegre
 
Prueba de los signos
Prueba de los signosPrueba de los signos
Prueba de los signos
Soledad Malpica
 
116168871 ejercicios-estadistica
116168871 ejercicios-estadistica116168871 ejercicios-estadistica
116168871 ejercicios-estadistica
Cesar Leiva C
 
Resueltos estimacion
Resueltos estimacionResueltos estimacion
Resueltos estimacion
Keber Quispe Gamboa
 
Problemas resueltos de distribución muestral
Problemas resueltos de distribución muestralProblemas resueltos de distribución muestral
Problemas resueltos de distribución muestral
asrodriguez75
 
Prueba de hipótesis para distribuciones normal, y t student. Presentación dis...
Prueba de hipótesis para distribuciones normal, y t student. Presentación dis...Prueba de hipótesis para distribuciones normal, y t student. Presentación dis...
Prueba de hipótesis para distribuciones normal, y t student. Presentación dis...
JAVIER SOLIS NOYOLA
 
Capitulo 4 : Pruebas de Hipótesis
Capitulo 4 : Pruebas de HipótesisCapitulo 4 : Pruebas de Hipótesis
Capitulo 4 : Pruebas de Hipótesis
ug-dipa
 
Tabla chi cuadrado 1
Tabla chi cuadrado 1Tabla chi cuadrado 1
Tabla chi cuadrado 1
Maria Noel Montevideo
 
prueba de hipotesis
prueba de hipotesisprueba de hipotesis
prueba de hipotesis
Ricardo Adrian
 
Prueba de hipotesis 2018 final
Prueba de hipotesis 2018 finalPrueba de hipotesis 2018 final
Prueba de hipotesis 2018 final
franciscoe71
 

La actualidad más candente (20)

Prueba de hipotesis estadistica aplicada a la ingenieria
Prueba de hipotesis estadistica aplicada a la ingenieriaPrueba de hipotesis estadistica aplicada a la ingenieria
Prueba de hipotesis estadistica aplicada a la ingenieria
 
T de student
T de studentT de student
T de student
 
Prueba de Hipotesis para Muestras Pequeñas Est ind clase03
Prueba de Hipotesis para Muestras Pequeñas Est ind clase03Prueba de Hipotesis para Muestras Pequeñas Est ind clase03
Prueba de Hipotesis para Muestras Pequeñas Est ind clase03
 
Prueba de hipotesis sobre la media con varianza desconocida
Prueba de hipotesis sobre la media con varianza desconocidaPrueba de hipotesis sobre la media con varianza desconocida
Prueba de hipotesis sobre la media con varianza desconocida
 
T student 5 ejemplos beeto
T student 5 ejemplos beetoT student 5 ejemplos beeto
T student 5 ejemplos beeto
 
Ejercicios prueba de hipótesis estadística
Ejercicios prueba de hipótesis estadísticaEjercicios prueba de hipótesis estadística
Ejercicios prueba de hipótesis estadística
 
Prueba de los signos
Prueba de los signosPrueba de los signos
Prueba de los signos
 
116168871 ejercicios-estadistica
116168871 ejercicios-estadistica116168871 ejercicios-estadistica
116168871 ejercicios-estadistica
 
DISTRIBUCION MUESTRAL
DISTRIBUCION MUESTRALDISTRIBUCION MUESTRAL
DISTRIBUCION MUESTRAL
 
Resueltos estimacion
Resueltos estimacionResueltos estimacion
Resueltos estimacion
 
Problemas resueltos de distribución muestral
Problemas resueltos de distribución muestralProblemas resueltos de distribución muestral
Problemas resueltos de distribución muestral
 
Prueba de hipótesis para distribuciones normal, y t student. Presentación dis...
Prueba de hipótesis para distribuciones normal, y t student. Presentación dis...Prueba de hipótesis para distribuciones normal, y t student. Presentación dis...
Prueba de hipótesis para distribuciones normal, y t student. Presentación dis...
 
Calculo del tamaño de muestra
Calculo del tamaño de muestraCalculo del tamaño de muestra
Calculo del tamaño de muestra
 
Capitulo 4 : Pruebas de Hipótesis
Capitulo 4 : Pruebas de HipótesisCapitulo 4 : Pruebas de Hipótesis
Capitulo 4 : Pruebas de Hipótesis
 
Tabla chi cuadrado 1
Tabla chi cuadrado 1Tabla chi cuadrado 1
Tabla chi cuadrado 1
 
Hipotesis2
Hipotesis2Hipotesis2
Hipotesis2
 
prueba de hipotesis
prueba de hipotesisprueba de hipotesis
prueba de hipotesis
 
Prueba de Hipotesis Est ind clase01
Prueba de Hipotesis Est ind clase01Prueba de Hipotesis Est ind clase01
Prueba de Hipotesis Est ind clase01
 
Prueba de hipotesis para proporciones Est ind clase02
Prueba de hipotesis para proporciones Est ind clase02Prueba de hipotesis para proporciones Est ind clase02
Prueba de hipotesis para proporciones Est ind clase02
 
Prueba de hipotesis 2018 final
Prueba de hipotesis 2018 finalPrueba de hipotesis 2018 final
Prueba de hipotesis 2018 final
 

Similar a Capítulo viii

Hipotesis
HipotesisHipotesis
HipotesisSer Ar
 
Tarea 7
Tarea 7Tarea 7
RESUMEN UNIDAD 1
RESUMEN UNIDAD 1RESUMEN UNIDAD 1
RESUMEN UNIDAD 1
Elizabeth Paniagua
 
Prueba de hipotesis grupo 4
Prueba de hipotesis grupo 4Prueba de hipotesis grupo 4
Prueba de hipotesis grupo 4Luis Quiazua
 
Biometria clase 7
Biometria clase 7Biometria clase 7
Biometria clase 7
Javiera Saavedra
 
1.1 prueba de hipotesis
1.1 prueba de hipotesis1.1 prueba de hipotesis
1.1 prueba de hipotesis
Ing Claudia N
 
Matematicas 7
Matematicas 7Matematicas 7
Matematicas 7
Frankeston
 
Prueba de hip_tesis_comercio_exterior444444444444
Prueba de hip_tesis_comercio_exterior444444444444Prueba de hip_tesis_comercio_exterior444444444444
Prueba de hip_tesis_comercio_exterior444444444444amandyta
 
Pruebas de hipótesis 1
Pruebas de hipótesis 1Pruebas de hipótesis 1
Pruebas de hipótesis 1
job raul uchuypoma inga
 
Introducción a las pruebas o tests de hipotesis en estadistica
Introducción a las pruebas o tests de hipotesis en estadisticaIntroducción a las pruebas o tests de hipotesis en estadistica
Introducción a las pruebas o tests de hipotesis en estadistica
romina753639
 
Contraste de hipotesis1 tema de clase
Contraste de hipotesis1   tema de claseContraste de hipotesis1   tema de clase
Contraste de hipotesis1 tema de claseeira1779
 
Mic sesión 7
Mic sesión 7Mic sesión 7
Mic sesión 7
Metodos_Cuantitativos
 
Prueba hipotesisi
Prueba hipotesisiPrueba hipotesisi
Prueba hipotesisi
caryami
 
¿Qué cosas importantes crees que deberías aprender para trabajar en el siglo ...
¿Qué cosas importantes crees que deberías aprender para trabajar en el siglo ...¿Qué cosas importantes crees que deberías aprender para trabajar en el siglo ...
¿Qué cosas importantes crees que deberías aprender para trabajar en el siglo ...alerioz
 
Contraste de hipótesis
Contraste de hipótesisContraste de hipótesis
Contraste de hipótesis
Sergio Contador
 
Exposicion 5.3 Prueba de Hipotesis Equipo Ramirez Elias Francisco
Exposicion 5.3 Prueba de Hipotesis Equipo Ramirez Elias FranciscoExposicion 5.3 Prueba de Hipotesis Equipo Ramirez Elias Francisco
Exposicion 5.3 Prueba de Hipotesis Equipo Ramirez Elias Francisco
Ariel Saenz
 
Guía de prueba de hipótesis
Guía de prueba de hipótesisGuía de prueba de hipótesis
Guía de prueba de hipótesis
Pedro González
 
Prueba de hipotesis para una muestra anexo
Prueba de hipotesis para una muestra anexoPrueba de hipotesis para una muestra anexo
Prueba de hipotesis para una muestra anexo
Estadistica_Descriptiva
 
SESIÓN 12_PRUEBA DE HIPÓTESIS_Dra. Guevara.pptx
SESIÓN 12_PRUEBA DE HIPÓTESIS_Dra. Guevara.pptxSESIÓN 12_PRUEBA DE HIPÓTESIS_Dra. Guevara.pptx
SESIÓN 12_PRUEBA DE HIPÓTESIS_Dra. Guevara.pptx
Congresista Hilda Gu Guevara Gomez
 

Similar a Capítulo viii (20)

Hipotesis
HipotesisHipotesis
Hipotesis
 
Tarea 7
Tarea 7Tarea 7
Tarea 7
 
RESUMEN UNIDAD 1
RESUMEN UNIDAD 1RESUMEN UNIDAD 1
RESUMEN UNIDAD 1
 
Prueba de hipotesis grupo 4
Prueba de hipotesis grupo 4Prueba de hipotesis grupo 4
Prueba de hipotesis grupo 4
 
Biometria clase 7
Biometria clase 7Biometria clase 7
Biometria clase 7
 
1.1 prueba de hipotesis
1.1 prueba de hipotesis1.1 prueba de hipotesis
1.1 prueba de hipotesis
 
Matematicas 7
Matematicas 7Matematicas 7
Matematicas 7
 
Prueba de hip_tesis_comercio_exterior444444444444
Prueba de hip_tesis_comercio_exterior444444444444Prueba de hip_tesis_comercio_exterior444444444444
Prueba de hip_tesis_comercio_exterior444444444444
 
Pruebas de hipótesis 1
Pruebas de hipótesis 1Pruebas de hipótesis 1
Pruebas de hipótesis 1
 
Introducción a las pruebas o tests de hipotesis en estadistica
Introducción a las pruebas o tests de hipotesis en estadisticaIntroducción a las pruebas o tests de hipotesis en estadistica
Introducción a las pruebas o tests de hipotesis en estadistica
 
Contraste de hipotesis1 tema de clase
Contraste de hipotesis1   tema de claseContraste de hipotesis1   tema de clase
Contraste de hipotesis1 tema de clase
 
Mic sesión 7
Mic sesión 7Mic sesión 7
Mic sesión 7
 
Prueba hipotesisi
Prueba hipotesisiPrueba hipotesisi
Prueba hipotesisi
 
¿Qué cosas importantes crees que deberías aprender para trabajar en el siglo ...
¿Qué cosas importantes crees que deberías aprender para trabajar en el siglo ...¿Qué cosas importantes crees que deberías aprender para trabajar en el siglo ...
¿Qué cosas importantes crees que deberías aprender para trabajar en el siglo ...
 
Contraste de hipótesis
Contraste de hipótesisContraste de hipótesis
Contraste de hipótesis
 
Hipotesis
HipotesisHipotesis
Hipotesis
 
Exposicion 5.3 Prueba de Hipotesis Equipo Ramirez Elias Francisco
Exposicion 5.3 Prueba de Hipotesis Equipo Ramirez Elias FranciscoExposicion 5.3 Prueba de Hipotesis Equipo Ramirez Elias Francisco
Exposicion 5.3 Prueba de Hipotesis Equipo Ramirez Elias Francisco
 
Guía de prueba de hipótesis
Guía de prueba de hipótesisGuía de prueba de hipótesis
Guía de prueba de hipótesis
 
Prueba de hipotesis para una muestra anexo
Prueba de hipotesis para una muestra anexoPrueba de hipotesis para una muestra anexo
Prueba de hipotesis para una muestra anexo
 
SESIÓN 12_PRUEBA DE HIPÓTESIS_Dra. Guevara.pptx
SESIÓN 12_PRUEBA DE HIPÓTESIS_Dra. Guevara.pptxSESIÓN 12_PRUEBA DE HIPÓTESIS_Dra. Guevara.pptx
SESIÓN 12_PRUEBA DE HIPÓTESIS_Dra. Guevara.pptx
 

Más de Richard Huaman Durand

Manual sst pesquero
Manual sst pesqueroManual sst pesquero
Manual sst pesquero
Richard Huaman Durand
 
Manual sst sector minero final
Manual sst sector minero finalManual sst sector minero final
Manual sst sector minero final
Richard Huaman Durand
 
Ohsas 18002 2008
Ohsas 18002 2008Ohsas 18002 2008
Ohsas 18002 2008
Richard Huaman Durand
 
Diapositiva karin satisfaccion en frentes de trabajo
Diapositiva karin satisfaccion en frentes de trabajoDiapositiva karin satisfaccion en frentes de trabajo
Diapositiva karin satisfaccion en frentes de trabajo
Richard Huaman Durand
 
Sustentacion practica pre profesional SSO en la obra Pillco Marca
Sustentacion  practica pre profesional SSO en la obra Pillco MarcaSustentacion  practica pre profesional SSO en la obra Pillco Marca
Sustentacion practica pre profesional SSO en la obra Pillco Marca
Richard Huaman Durand
 
02 resumen de teoria finaciera
02  resumen de teoria finaciera02  resumen de teoria finaciera
02 resumen de teoria finaciera
Richard Huaman Durand
 
Riesgo positivo notas
Riesgo positivo  notasRiesgo positivo  notas
Riesgo positivo notas
Richard Huaman Durand
 
Comparacion iso, efqm y seis sigma
Comparacion iso, efqm y seis sigmaComparacion iso, efqm y seis sigma
Comparacion iso, efqm y seis sigma
Richard Huaman Durand
 
Sistema HACCP 1909
Sistema HACCP 1909Sistema HACCP 1909
Sistema HACCP 1909
Richard Huaman Durand
 
Final tabajo de control estadistico USB
Final tabajo de control estadistico USBFinal tabajo de control estadistico USB
Final tabajo de control estadistico USB
Richard Huaman Durand
 
Planeación estratégica (resumen) CALIDAD
Planeación estratégica (resumen) CALIDADPlaneación estratégica (resumen) CALIDAD
Planeación estratégica (resumen) CALIDAD
Richard Huaman Durand
 
European foundation for quality management
European foundation for quality managementEuropean foundation for quality management
European foundation for quality management
Richard Huaman Durand
 
Efqm. excellence model and knowledge management implications
Efqm. excellence model and knowledge management implicationsEfqm. excellence model and knowledge management implications
Efqm. excellence model and knowledge management implications
Richard Huaman Durand
 
Artículo aplicación de seis sigma
Artículo   aplicación de seis sigmaArtículo   aplicación de seis sigma
Artículo aplicación de seis sigma
Richard Huaman Durand
 
Seguridad y salud ocupacional
Seguridad y salud ocupacionalSeguridad y salud ocupacional
Seguridad y salud ocupacional
Richard Huaman Durand
 
Prácticas de laboratorio control calidad terminado
Prácticas de laboratorio control calidad terminado  Prácticas de laboratorio control calidad terminado
Prácticas de laboratorio control calidad terminado
Richard Huaman Durand
 
Materiales para herramientas de corte
Materiales para herramientas de corteMateriales para herramientas de corte
Materiales para herramientas de corte
Richard Huaman Durand
 
Gurus de la calidad
Gurus de la calidadGurus de la calidad
Gurus de la calidad
Richard Huaman Durand
 

Más de Richard Huaman Durand (20)

Manual sst pesquero
Manual sst pesqueroManual sst pesquero
Manual sst pesquero
 
Manual sst sector textil
Manual sst sector textilManual sst sector textil
Manual sst sector textil
 
Manual sst sector minero final
Manual sst sector minero finalManual sst sector minero final
Manual sst sector minero final
 
Ohsas 18002 2008
Ohsas 18002 2008Ohsas 18002 2008
Ohsas 18002 2008
 
Diapositiva karin satisfaccion en frentes de trabajo
Diapositiva karin satisfaccion en frentes de trabajoDiapositiva karin satisfaccion en frentes de trabajo
Diapositiva karin satisfaccion en frentes de trabajo
 
Sustentacion practica pre profesional SSO en la obra Pillco Marca
Sustentacion  practica pre profesional SSO en la obra Pillco MarcaSustentacion  practica pre profesional SSO en la obra Pillco Marca
Sustentacion practica pre profesional SSO en la obra Pillco Marca
 
02 resumen de teoria finaciera
02  resumen de teoria finaciera02  resumen de teoria finaciera
02 resumen de teoria finaciera
 
Riesgo positivo notas
Riesgo positivo  notasRiesgo positivo  notas
Riesgo positivo notas
 
Comparacion iso, efqm y seis sigma
Comparacion iso, efqm y seis sigmaComparacion iso, efqm y seis sigma
Comparacion iso, efqm y seis sigma
 
Sistema HACCP 1909
Sistema HACCP 1909Sistema HACCP 1909
Sistema HACCP 1909
 
Final tabajo de control estadistico USB
Final tabajo de control estadistico USBFinal tabajo de control estadistico USB
Final tabajo de control estadistico USB
 
Planeación estratégica (resumen) CALIDAD
Planeación estratégica (resumen) CALIDADPlaneación estratégica (resumen) CALIDAD
Planeación estratégica (resumen) CALIDAD
 
European foundation for quality management
European foundation for quality managementEuropean foundation for quality management
European foundation for quality management
 
Efqm. excellence model and knowledge management implications
Efqm. excellence model and knowledge management implicationsEfqm. excellence model and knowledge management implications
Efqm. excellence model and knowledge management implications
 
Artículo aplicación de seis sigma
Artículo   aplicación de seis sigmaArtículo   aplicación de seis sigma
Artículo aplicación de seis sigma
 
Seguridad y salud ocupacional
Seguridad y salud ocupacionalSeguridad y salud ocupacional
Seguridad y salud ocupacional
 
Prácticas de laboratorio control calidad terminado
Prácticas de laboratorio control calidad terminado  Prácticas de laboratorio control calidad terminado
Prácticas de laboratorio control calidad terminado
 
Materiales para herramientas de corte
Materiales para herramientas de corteMateriales para herramientas de corte
Materiales para herramientas de corte
 
Gurus de la calidad
Gurus de la calidadGurus de la calidad
Gurus de la calidad
 
Tarea 2 calculo 2013
Tarea 2 calculo 2013Tarea 2 calculo 2013
Tarea 2 calculo 2013
 

Capítulo viii

  • 1. CAPÍTULO VIII. CONTRASTES DE HIPÓTESIS 8.1 INTRODUCCIÓN Hipótesis: Enunciado acerca de una población, elaborada con el propósito de ponerse a prueba. Ejemplos de hipótesis acerca de un parámetro de población son: La media mensual de ingresos para analistas de sistemas es 2000, El 20% de los delincuentes juveniles son capturados y sentenciados a prisión Contrastar una hipótesis (Prueba de hipótesis) es comparar las predicciones con la realidad que observamos. Si dentro del margen de error que nos permitimos admitir, hay coincidencia, aceptaremos la hipótesis y en caso contrario la rechazaremos. Hipótesis nula: Es aquella hipótesis que se desea contrastar, se simboliza por Ho. Esta suele ser una estrategia o medio del que se sirve el investigador para probar la alternativa. El planteamiento de Ho permite elaborar un modelo probabilístico a partir del cual se puede llegar a una decisión final. Hipótesis alternativa: También se conoce como experimental y se representa por H1 o Ha. Esta es la hipótesis de investigación. De modo que se espera que hay un argumento para la hipótesis de investigación (o alternativa) H1, demostrando que no lo hay para su contraria, la hipótesis nula. Los contrastes pueden ser unilaterales o bilaterales (también llamados de una o dos colas) El contraste es bilateral (dos colas) si la hipótesis alternativa H1 es del tipo ≠. El contraste es unilateral (una cola) si la hipótesis alternativa H1 es del tipo < o >. Nota: generalmente una a hipótesis de investigación se plantea como una hipótesis alternativa, es decir que las hipótesis alternativa e hipótesis nula deben formularse de manera que al rechazar Ho, se apoye la conclusión de la investigación. 8.1.1 ERRORES DE TIPO I Y DE TIPO II. Si rechazamos una hipótesis cuando debiera ser aceptada, diremos que se ha cometido un error de tipo I. Error tipo I: Ho es cierto pero lo rechazo; = P(rechazar Ho) cuando es cierta Error de tipo II: Es el error que consiste en no rechazar H0 cuando es falsa. La probabilidad de cometer este error la denotamos con la letra β Error tipo II: Ho es falso pero lo acepto; β = P(aceptar Ho) cuando es falsa
  • 2. Región de aceptación Región crítica Región Crítica Errores y conclusiones correctas en las pruebas de hipótesis Conclusión Situación en la población Ho Verdadera H1 Verdeara Se Acepta Ho Conclusión correcta Error tipo II Se rechaza Ho Error tipo I Conclusión correcta Observaciones. 1. Los errores de tipo I y II no están relacionados más que del siguiente modo: Cuando α decrece β crece. Por tanto no es posible encontrar test que hagan tan pequeños como queramos ambos errores simultáneamente. De este modo es siempre necesario privilegiar a una de las hipótesis, de manera que no será rechazada, a menos que su falsedad se haga muy evidente. En los contrastes, la hipótesis privilegiada es H0 que sólo será rechazada cuando la evidencia de su falsedad supere el umbral del 100(1 − α) %. 2. Al tomar α muy pequeño tendremos que β se puede aproximar a uno. Lo ideal a la hora de definir un test es encontrar un compromiso satisfactorio entre α y β (aunque siempre a favor de H0). Denominamos potencia de un contraste a la cantidad 1 − β. 3. En el momento de elegir una hipótesis privilegiada podemos en principio dudar entre si elegir una dada o bien su contraria. 8.1.2 PRINCIPALES CONCEPTOS IMPLICADOS EN LA PRUEBA DE HIPÓTESIS: Nivel de significancia. Es la probabilidad de cometer un error de tipo I, cuando la hipótesis nula es verdadera, se denota con la letra α, y los mas conocidos son 0.05; 0.01; 0.1 El nivel de significancia se define como la máxima probabilidad de rechazar Ho cuando ésta es verdadera. Región crítica. El conjunto de todos los valores de la estadística de prueba que nos harían rechazar la hipótesis nula. Región de aceptación. Es la región complementaria de la anterior. Si el valor evaluado del estadístico pertenece a ella No rechazamos la hipótesis. (Las hipótesis nunca se aceptan de forma definitiva, sólo se aceptan provisionalmente, es decir, no se rechazan, a la espera de una nueva información que eventualmente pueda llevarnos a rechazarla en el futuro). Valor crítico: El valor o valores que separan la región crítica de los valores de la estadística de prueba que no nos harían rechazar la hipótesis nula. Los valores críticos dependen de la naturaleza de la hipótesis nula, la distribución de muestreo pertinente y el nivel de significancia α. En una prueba de dos colas, el nivel de significancia α se divide equitativamente entre las dos colas. En una prueba de una cola, este nivel es el área de la región a
  • 3. 44,1 36 5,0 1612,16 n s ux teoz partir del valor crítico hasta el extremo derecho o izquierdo, según corresponda. Estadística de prueba: Es una estadística obtenida de una muestra o un valor basado en datos de muestra. p-valor. El valor de más pequeño que nos lleve a rechazar H0 se llama el p-valor de la prueba.. 8.1.3 PASOS DE LA PRUEBA DE HIPÓTESIS Pasos Ejemplo 1. Expresar la hipótesis nula y la hipótesis alternativa Ho: µ = µo Vs H1: µ ≠ µo o H1: µ < µo o H1: µ < µo Ho: µ = 16 H1: µ ≠ 16 2. Determinar y calcular una estadística de prueba 3. Establecer los valores críticos que determinan las regiones de rechazo de las de no rechazo en función del nivel de significancia Para un α = 0,05; 4. Formular una regla de decisión Si Z < Z α /2 se rechaza Ho Si Z> Z α /2 se acepta Ho H0 se rechaza si z < – 1,96 o z > 1,96 5. Aplicar la regla de decisión (conclusión). No se rechaza H0 porque 1,44 es menor que el valor crítico 1.96 8.1.4 POTENCIA DE UNA PRUEBA DE HIPÓTESIS Potencia de una prueba. Se define como potencia a la probabilidad de rechazar la Hipótesis Nula cuando ésta es falsa. La potencia se denota como π. Esta probabilidad representa la chance de concluir que Ho es falsa cuando efectivamente lo es. La potencia se calcula como π = 1 - β, donde β es la probabilidad de cometer el Error de Tipo II. Cuanto mayor es la potencia mejor es la prueba. La potencia es función de varios factores: a) el nivel de significación elegido, b) la varianza de la variable aleatoria y c) el tamaño de la muestra. Cuando el nivel de significación se ha fijado y la varianza de la variable aleatoria es conocida (o se ha estimado) es posible controlar la potencia de la prueba manejando el tamaño muestral (o, en el caso de los diseños experimentales, manejando el número de repeticiones). 8.1.5 EJERCICIOS RESUELTOS En los siguientes ejercicios identifique los datos y plantee las Hipótesis Ejercicio 1. Un jurado de elecciones de cierto país dice que el porcentaje de ausentismo generalmente es de 30% como mínimo. Se elige una muestra de 100 individuos y se encuentra que 40 están
  • 4. dispuestos a votar. Con un nivel de significancia del 5%, se puede afirmar que el jurado de elecciones tiene razón. Solución. Datos Po= 0.30=30% (porcentaje de ausentismo poblacional) p = 60/100=0.60= 60% (porcentaje de ausentismo de la muestra) = 0.05 (nivel de significancia) n= 100 (tamaño de la muestra) Hipótesis Ho: Po ≥ 0.30 (el ausentismo como mínimo es del 30%) H1: Po < 0.30 (el ausentismo es menor del 30%) También se puede expresar Ho: Po = 0.30 (el ausentismo como mínimo es del 30%) (Se considera solo el signo =) H1: Po < 0.30 (el ausentismo es menor del 30%) Ejercicio 2. Se desea adquirir tubos fluorescente de una empresa, siempre y cuando la vida media de una muestra de 110 tubos fluorescentes sea mayor a 1610 horas, con una desviación típica de 100 horas. Con un nivel de significancia de 0.05 se quiere saber si la duración media de los tubos es mayor de 1650 horas. a) Dé las hipótesis nula y alternativa adecuada b) En esta situación ¿Cuál es el error de tipo I? ¿Qué consecuencias tiene cometer este error? c) En esta situación ¿Cuál es el error de tipo II? ¿Qué consecuencias tiene cometer este error? Solución Datos μ = 1650 (media de la población) 1610x Media de la muestra s= 100 desviación típica de la muestra =0.05 a) Hipótesis Ho: μ ≤ 1650 (No se adquiere los tubos) H1: μ > 1650 (Se adquiere los tubos) b) El error de tipo I es rechazar que la duración media es menor o igual a 1610 horas siendo estas verdaderas, las consecuencias es que se adquiere productos que no cumplen las horas establecidas. c) El error de tipo II es aceptar que la duración media es menor o igual a 1610 horas siendo esta falsa, las consecuencias es que se deja de comprar focos que cumplen las horas requeridas. Ejercicio 3. En un muestreo realizado entre los empleados de una multinacional se eligieron al azar 15 empleados y se anotó su sueldo mensual obteniéndose los siguientes datos: 1285, 1152, 1546, 1423, 1120, 1660, 956, 1250, 1812, 1120, 1553, 1056, 1163, 1358 y 1457. El gerente afirma que el sueldo medio de sus trabajadores está por encima de los 1500 y los sindicatos afirman que es de 1400. Sabiendo que los sueldos en esa multinacional se distribuyen de forma aproximadamente normal, a) Crees que efectivamente el sueldo medio de todos los trabajadores es de 1400?
  • 5. b) Crees que lo que dice el gerente es cierto? c) En la situación del gerente ¿Cuál es el error de tipo I? ¿Qué consecuencias tiene cometer este error? d) En la situación del gerente ¿Cuál es el error de tipo II? ¿Qué consecuencias tiene cometer este error? Solución a) datos μ = 1400 (media de la población) 15 1457...1521285 x media de la muestra 115 )(151457...11521285 2222 x s Desviación típica de la muestra =0.05 Hipótesis Ho: μ = 1400 (el sueldo medio de todo los trabajadores es 1400) H1: μ ≠ 1400 (el sueldo medio de todo los trabajadores NO es 1400) b) datos μ = 1500 (media de la población) 15 1457...1521285 x media de la muestra 115 )(151457...11521285 2222 x s desviación típica de la muestra =0.05 Hipótesis Ho: μ = 1500 (el sueldo medio de todo los trabajadores No esta por encima de 1500, el gerente miente) H1: μ > 1500 (el sueldo medio de todo los trabajadores esta por encima de 1500, el gerente dice la verdad) c) El error de tipo I es rechazar que el gerente miente a pesar que realmente esta mintiendo, las consecuencias es que se le cree a un mentiroso. d) El error de tipo II es aceptar que el gerente miente a pesar que dice la verdad, las consecuencias es que se deja de creer a alguien que dice la verdad. Ejercicio 4. Para comprobar si más un tercio de las llamadas a un servicio de ambulancias son urgencias con peligro de muerte, se ha tomado una muestra aleatoria de sus archivos y se ha encontrado que 61 de 150 llamadas son de este tipo. ¿Tiene fundamento dicha afirmación? Solución Po= 1/3=0.333 (Proporción de la población)
  • 6. p= 61/150 (proporción de la muestra) Hipótesis Ho: Po = 0.33 (No mas de 1/3 de las llamadas son urgentes con peligro de muerte) H1: Po> 0.33 (mas de 1/3 de las llamadas son urgentes con peligro de muerte) 8.1.6 EJERCICIOS PROPUESTOS Ejercicio 1. Un proceso de fabricación produce 12.3 unidades por hora. Esta producción tiene una varianza igual a 4. Se sugiere un nuevo proceso que es costoso de instalar, pero se piensa que puede incrementar la producción. Para decidir si se hace el cambio o no, se prueban 10 máquinas nuevas y se observa que éstas producen en promedio 13.3 unidades. a) Calcular la probabilidad del error de tipo II en la prueba para µ= 12.3 vs. µ>12.3 cuando la verdadera esperanza del nuevo proceso es µ= 14. Trabajar con α= 0.01. Ejercicio 2. Se acepta que después de 3 años de almacenamiento el vigor de un arbusto forrajero medido como peso seco alcanzado a los 20 días de la germinación es de 45 mg promedio. Un nuevo método de almacenamiento se propone para aumentar el vigor. Se evalúan para ello 20 lotes de 10 semillas cada uno y al cabo de 3 años se las hace germinar, obteniéndose los siguientes resultados de peso seco promedio a los 20 días: 49 43 56 57 59 65 52 51 50 55 60 65 53 57 67 56 53 37 45 42 a) Plantear las hipótesis nula y alternativa asociadas al problema. b) ¿Cuál es el error de tipo I? ¿Qué consecuencias tiene cometer este error? c) ¿Cuál es el error de tipo II? ¿Qué consecuencias tiene cometer este error? Ejercicio 3. Un cierto tipo de cáncer tiene habitualmente una letalidad (número de muertos por cada cien enfermos) de 30. Se experimenta una nueva droga en 80 casos, en los cuales se producen 15 defunciones. a. Señale la hipótesis de trabajo. b. Señale el nivel de significación. c. Realice la prueba de significación estadística.
  • 7.
  • 8. n Zx n Zx 2/2/ n s Zx n s Zx 2/2/ CAPÍTULO IX. PRUEBA DE HIPÓTESIS PARA LA MEDIA DE LA POBLACIÓN. 9.1 PRUEBA DE HIPÓTESIS PARA LA MEDIA : MUESTRAS GRANDES. 9.1.1 INTRODUCCIÓN Sean X1, X2, X3,...,Xn una muestra aleatoria simple (m.a.s) de una distribución normal o cualquier distribución (si n≥30, la distribución cumple el teorema del limite central) con media desconocida µ, y con una varianza σ2 , la distribución de x ~ N(μ, n 2 ) y la variable z ~ N(0,1). Deseamos contrastar la hipótesis de que el parámetro poblacional μ toma un determinado valor μ0. Es decir: Hipótesis Caso I Caso II Caso III Ho : = 0 H1 : < 0 Ho : = 0 H1 : ≠ 0 Ho : = 0 H1 : > 0 9.1.2 SUPUESTOS 1. El tamaño de la muestra es grande n≥30 2. Las observaciones son independientes 3. Las medias de las muestras se distribuyen normalmente (distribución normal z), no importa cómo sea la distribución de la población original. Estadístico de prueba a) Se conoce la varianza poblacional σ2 . b) Se desconoce la varianza poblacional 2 . Intervalo de Confianza del 100(1- )% para la media poblacional , es de la forma: a) Se conoce la varianza poblacional σ2 . b) Se desconoce la varianza poblacional σ2 . n ux Z o n s ux Z o
  • 9. Donde: μ : media poblacional : Desviación estándar poblacional n : Tamaño de la muestra x : Media de la muestra s : Desviación estándar de la muestra Nota: para encontrar s se utiliza la siguiente formula 1 22 n xnx s Teorema del límite central: Si x es la media de una muestra aleatoria de tamaño n que se toma de una población con cualquier distribución (oblicua a la derecha, oblicua a la izquierda, con forma de tina, etc...), cuya media es µ y varianza finita σ2 , entonces la forma límite de la distribución de: n x z conforme n →∞, es la distribución normal estándar N (0,1). 9.1.3 EJERCICIOS RESUELTOS Ejercicio 1. La casa Carma S.A emite su propia tarjeta de crédito. Carla, la gerente de crédito, quiere encontrar si la media mensual de saldos no pagados es mayor que S/.400. Una revisión al azar de 172 saldos reveló que la media de la muestra es S/.407 y la desviación estándar de la muestra es S/. 38. ¿Debe Carla concluir que la población media es mayor que S/.400, con un nivel de significancia del 5%?. Solución Datos. μ = 400 407x s = 38 = 0.05 (nivel de significancia 5%) n = 172 Paso 1: Establecemos las hipótesis H0 : μ = 400 (La media mensual de saldo no pagados no es mayor de 400) H1 : μ > 400 (La media mensual de saldo no pagados si es mayor de 400) Nota: la Ho también puede expresarse como Ho : μ ≤ 50 Paso 2: Calculamos el estadístico de prueba
  • 10. 42,2 172 38 400407 n s ux z Z0,05=1,645 Zona de rechazo Ho Zona de Aceptación Ho Z0,05=1,645 Z=2,42 Zona de rechazo HoZona de Aceptación Ho Como n > 30 la prueba es la distribución normal Z Paso 3. Establecemos la región de rechazo para un =0.05, de la tabla normal z0.05=1.645 Paso 4. Decisión H0 se rechaza si Z=2.42 cae en la zona de rechazo (zona achurada) es decir si (z=2.42) > (z0.05=1.645) Paso 5: Conclusión Como (Z=2,42) cae en la zona de rechazo, o lo que es lo mismo (Z=2,42)> (Z0,05=1,645), rechazamos la Ho. Es decir rechazamos que (La media mensual de saldo no pagado no es mayor de 400) Luego Carla puede concluir que hay evidencia suficiente para aceptar que la media de saldos no pagados es mayor que S/.400. SOLUCIÓN EN MINITAB Ingresamos al minitab y hacemos click en Stat>Basic statistics>1-sample Z... como se ve en la figura siguiente
  • 11. Aparece la siguiente pantalla; luego ingresamos los datos en esta.. Hacemos click en Options… ingresamos el nivel de confianza y elegimos la Alternative, finalmente presionamos OK, luego OK y los resultados son: One-Sample Z Test of mu = 400 vs > 400 The assumed standard deviation = 38 95% Lower N Mean SE Mean Bound Z P 172 407,000 2,897 402,234 2,42 0,008 Interpretación: N=172 (tamaño de la muestra ) Mean= 407,00 (media de la muestra) SE Mean = 2,897 (error estándar de la media) Lower Bound = 402,234 (valor mínimo del nivel de confianza al 95% ) Z= 2,42 ( z calculado) P = 0.008 (de 100 veces que rechazamos Ho por ser falsa, hay un probabilidad de 0.8% de equivocarse) Decisión: la decisión se puede tomar en función de Z=2,42 o en función de P=0,008. En el segundo caso, Como (P = 0,008)< (α =0,05) entonces se rechaza la Ho Conclusión. Carla tiene evidencia suficiente para aceptar que la media de saldos no pagados es mayor que S/.400. Media de la muestra ( n ) Desviación estándar de la muestra (s) o de la población ( ) Media de la población ( μ ) Nivel de confianza (1- ) Hipótesis alternativa (mayor que “ > “ ) Tamaño de la muestra ( n )
  • 12. 932,0 36 15,5 502,49 n s ux Z Z0,01=-2,33 z=- 0,932 Ejercicio 2. El peso de un grupo de niños debe ser de 50,00 kilogramos. Sin embargo, los trabajadores de salud afirman que tienen un peso menor a 50,00 kilogramos. Para salir de dudas, se tomó una muestra de 36 niños, obteniendo un peso de 49,20 kilogramos, con una desviación estándar de 5,15 kilogramos. Con un 99% de confiabilidad, ¿puede afirmarse que el peso de todos los niños es menor de 50,00 kilogramos? Solución. Datos μ = 50 n = 36 2,49x α = 0,01 s = 5,15 Prueba de hipótesis Ho: μ = 50 (los niños NO tienen pesos menores que 50kg) H1: μ < 50 (los niños tienen pesos menores a 50kg) Nota: la Ho también puede expresarse como Ho : μ ≥ 50 Estadística de prueba Como n>30 utilizamos la prueba Z, reemplazando datos Para decidir si rechazamos o aceptamos la Ho Construimos el gráfico y determinamos Z0,01 = – 2,33 de tabla normal Conclusión. Como Z= – 0,932 esta dentro de la zona de aceptación, entonces aceptamos Ho, es decir, los niños tienen pesos mayor o igual a 50. Utilizando Minitab Ingresamos al minitab y hacemos click en Stat>Basic statistics>1-sample Z... y se obtiene la figura siguiente, Aquí ingresamos los datos y activamos Options…, para ingresar el 1-
  • 13. Presionamos Ok luego Ok y los resultados obtenidos son: One-Sample Z Test of mu = 50 vs < 50 The assumed standard deviation = 5.15 95% Upper N Mean SE Mean Bound Z P 36 49.2000 0.8583 50.6118 -0.93 0.176 Conclusión: Como (P=0.176) es mayor que ( = 0.05) entonces se acepta la Ho, es decir no hay suficiente evidencia para rechazar que los niños tengan pesos mayores o iguales a 50,00 kg. Ejercicio 3. Los invitados a una reunión de trabajo tienen una tolerancia de 5 minutos en promedio. Se quiere saber si un grupo de invitados están dentro de la tolerancia, para lo cual se midió el tiempo de demora de 60 invitados, los resultados fueron 2 6 7 5 9 5 5 0 7 5 1 1 7 9 0 6 5 2 3 5 5 4 6 3 5 2 3 7 6 8 1 1 7 8 4 2 8 4 2 7 6 7 5 2 9 2 1 6 6 4 9 4 6 3 4 8 4 6 2 9 A nivel del 10%, ¿Los invitados están fuera del tiempo de tolerancia?. Solución Datos μ = 5 = 10% = 0.10 n = 60 Calculamos la media aritmética ( x ) y la desviación estándar de la muestra (s) 7667.4 60 926...762 x 52020.2 59 2 )667.4(60) 2 9 2 2 2 6... 2 7 2 6 2 2( s Hipótesis Ho: μ = 5 min (los invitados están dentro de la tolerancia) H1: μ > 5 min (los invitados NO están dentro de la tolerancia) Nota: la Ho también puede expresarse como Ho : μ ≤ 5 min Estadística de prueba Como n>30 utilizamos la prueba Z, reemplazando datos
  • 14. 72,0 60 52,2 57667,4 n s ux Z Z=-0,72 Z0,10= 1,28 Zona de rechazo HoZona de Aceptación Ho One-Sample Z: Tiempo Test of mu = 5 vs > 5 The assumed standard deviation = 2.52 90% Lower Variable N Mean StDev SE Mean Bound Z P Tiempo 60 4.76667 2.52020 0.32533 4.34974 -0.72 0.763 Para decidir si rechazamos o no la Ho Construimos el gráfico y determinamos Z0,1 = 1,28 de tabla normal Conclusión. Como z=-0.72 cae en la zona de aceptación de Ho, esta no se rechaza, por lo tanto los invitados están dentro del tiempo tolerado. Utilizando MINITAB Ingresamos al minitab y hacemos click en Stat>Basic statistics>1-sample Z... como se ve en la figura siguiente Los datos lo ingresamos en la columna C1 (Tiempo) Nota: la desviación estándar de la muestra primero debemos encontrarlo. Para esto utilizamos Stat>Basic statistics>Display Descriptive estatistics… Finalmente los resultados de la prueba de hipótesis son
  • 15. Conclusión. como (p=0.763> =0.1) se acepta Ho. Por lo tanto los invitados están dentro del tiempo tolerado. Ejercicio 4. El control de calidad de una cooperativa que produce azúcar, verifica que la presentación del producto en bolsas de 500 g. contenga dicha cantidad. Se obtuvo una muestra de 50 bolsas los cuales tuvieron los siguientes pesos en gramos: 505 409 500 503 515 495 501 496 498 499 497 511 497 500 498 498 596 506 499 597 497 523 506 495 500 519 494 514 500 504 510 497 489 508 522 498 485 500 498 495 497 507 501 499 508 499 506 502 503 497 a) ¿Hay evidencia suficiente en base a esta muestra, de que el contenido de las bolsas es diferente a 500 g. si el nivel de significancia es 0.01? b) Se obtuvo otra muestra, esta de 25 bolsas, con una media de 497 g. y una desviación de 10 g. y con 5% de nivel de significancia. ¿Podemos afirmar la hipótesis de que las bolsas contienen menos de 500 g.? Solución a) ¿Hay evidencia suficiente en base a esta muestra, de que el contenido de las bolsas es diferente a 500 g. si el nivel de significancia es 0.01? Datos μ = 500g Para determinar la media y la desviación estándar utilizamos Minitab, de la siguiente manera Ingresamos los datos en C1 como se ve en la figura y Hacemos clic en Stat>Basic statistics>Display Descriptive estatistics…
  • 16. finalmente hacemos click en OK, el resultado es Descriptive Statistics: C1 Variable N N* Mean SE Mean StDev Minimum Q1 Median Q3 C1 50 0 503.86 3.45 24.36 409.00 497.00 500.00 506.25 Variable Maximum C1 597.00 Interpretación N=50 (tamaño de la muestra) Mean = 503.86 ( x media de la muestra) StDev =24.36 (s Desviación estándar de la muestra) Q1=497.00 (primer cuartil ) Median=500.00 (Me Mediana) Q3=506.25 (tercer cuartil) Hipótesis Ho: μ = 500 g (el contenido es igual a 500g) H1: μ ≠ 500 g (el contenido es diferente a 500g) Para un nivel de significancia de 0.01 tenemos un nivel de confianza de 99% Utilizando minitab se tiene Finalmente hacemos clic on Ok luego en OK Los resultados son One-Sample Z: C1 Test of mu = 500 vs not = 500 The assumed standard deviation = 24.36 Variable N Mean StDev SE Mean 99% CI Z P C1 50 503.860 24.360 3.445 (494.986, 512.734) 1.12 0.263 Conclusión
  • 17. Como (p=0.263) > ( =0.01) se acepta Ho, es decir el contenido es igual a 500g b.¿Podemos afirmar la hipótesis de que las bolsas contienen menos de 500 g.? datos μ= 500 n = 25 bolsas gx 497 s = 10 g. =5% = 0.05, osea que 1- = 0.95 Hipótesis Ho: μ = 500 g (el contenido no es menos de 500g) H1: μ < 500 g (el contenido es menos de 500g) Utilizando minitab se obtiene One-Sample Z Test of mu = 500 vs < 500 The assumed standard deviation = 10 95% Upper N Mean SE Mean Bound Z P 25 497.000 2.000 500.290 -1.50 0.067 Conclusión Como (P=0.067) > ( =0.05) se acepta Ho, es decir el contenido no es menos de 500g. Ejercicio 5. Calcular el valor de P para el ensayo de hipótesis en donde se quiere probar que la edad promedio de los habitantes de una ciudad es superior a 65 años, se tomó una muestra de 50 habitantes y se encontró que tenían una media de 60, una varianza es 2 años a un nivel de significancia de 0,05.
  • 18. 03,3 18 7 1419 n ux z Solución Datos μ = 65 n = 50 60x Sha = 2, =0.05 Hipótesis Ho: u ≤ 65 (Edad promedio de la ciudad no es mayor a 65) Ho: u > 65 (Edad promedio de la ciudad es mayor a 65); Hacemos uso de MINITAB One-Sample Z Test of mu = 65 vs > 65 The assumed standard deviation = 1,4142 95% Lower N Mean SE Mean Bound Z P 50 60,0000 0,2000 59,6710 -25,00 1,000 DECISIÓN: Como (P=1)> (α=0,05), No se rechaza la Ho, o sea que no hay evidencia que la edad promedio de la ciudad sea mayor de 65 año Ejercicio 6. Un laboratorio farmacéutico afirma que el antiinflamatorio de su fabricación elimina la inflamación en 14 minutos en los casos corrientes. Con la finalidad de comprobar estadísticamente esta afirmación, se elige al azar 18 cerdas con inflamaciones varias y se toma como variable de respuesta el tiempo transcurrido entre la administración del antiinflamatorio y el momento en que desaparece la inflamación. Además, nos dicen que la variable tiempo transcurrido entre la administración del antiinflamatorio y el momento en que desaparece la inflamación sigue una distribución normal de media 14 y desviación 7. El tiempo medio de respuesta de la muestra fue de 19 minutos. Se pide comprobar la afirmación del laboratorio a un nivel de significación de 0.05. Solución: Datos;  19x , μ = 14, σ= 7, n = 18 Hipótesis
  • 19. 00,10 100 20 110130 n ux z Z0,05=1,645 Z=10 Zona de rechazo HoZona de Aceptación Ho 79.5 100 9.1 4.185.19 n ux z Z0,025 =-1,96 Z0,025 =1,96 Z=5.79 Zona de aceptación Ho Zona rechazo Ho Zona rechazo Ho Ho: μ =14 H1: μ >14 Z0,05=1,645; Luego como Z>Z0,05 se rechaza la Ho. NOTA: A pesar que (n=18) < 30 utilizamos la distribución Z y no la t esto se debe a que conocemos la desviación típica de la población σ =7 Ejercicio 7. Se ha tomado una muestra aleatoria de 100 individuos para determinar si tienen hipertensión, a los que se ha medido la presión sistólica, obteniéndose una media muestral de 130 mmHg. Se sabe que la media y desviación típica normal de la población es respectivamente 110 y 20 mmHg. ¿Cual es su conclusión a un nivel de significancia de 0.05? Solución Datos n = 100 mmHgx 130 μ = 110 mmHg = 20 mmHg Hipótesis Ho: μ = 110 (no sufren de hipertensión) H1: μ > 110 (sufren de hipertensión) Z0.05=1.645 Del gráfico concluimos que se rechaza la Ho, o sea los individuos sufren hipertensión. Ejercicio 8. Se cree que la edad promedio de los alumnos que ingresan a la Universidad es de 18.4 años. De los alumnos anteriores se elige, al azar, una muestra de 100 y se encuentra que tienen una edad promedio de 19.5 años con desviación típica 1.9 años. De su opinión al respecto, con un nivel de significancia de 0.05. Solución Datos n = 100 añosx 5.19 μ = 18.4 años s = 1.9 años Hipótesis Ho: μ = 19.5 (la edad promedio es 18.4) H1: μ ≠ 19.5 (la edad promedio es diferente a 18.4)
  • 20. n Zx n Zx 2/ ; 2/ 200 1.0 00.12; 200 1.0 00.12 007.2;993.1 n Zx n Zx 2/ ; 2/ 200 1.0 00.22; 200 1.0 00.22 014.2;986.1 n Zx n Zx 2/ ; 2/ 200 1.0 00.32; 200 1.0 00.32 021.2;979.1 96.1 9.0 25.0 nn ux z Z0.025=1.96 Del gráfico concluimos que se rechaza la Ho, o sea la edad promedio es diferente a 18.4 Ejercicio 9. Las medidas de los diámetros de una muestra tomada al azar, de 200 cojinetes de bolas, hechos por una determinada máquina, dieron una media de 2 cm y una desviación típica de 0,1 cm. Hallar los intervalos de confianza del: a. 68,26% b. 95,44% c. 99,73% Para el diámetro de todos los cojinetes. Solución n = 200, 2x , s=0.1, a. 1- =0.6826 = = b. 1- =0.9544 = = c. 1- =0.9973 = = Ejercicio 10. Se sabe que el contenido de lactosa de cierto alimento lácteo sigue una distribución normal, cuya varianza es conocida, teniendo un valor de 0.81. Se desea estimar el valor de la media poblacional mediante el valor de la media de una muestra, admitiéndose un error máximo de 0,25 con una confianza del 95%. ¿Cuál ha de ser el tamaño de la muestra? Solución Datos. 2 =0.81 entonces =0.9 si 1- = 0.95 entonces =0.05, e = 0.25 = x - μ Para =0.05, de la tabla (dos colas) se tiene z /2=1.96 25.0 9.096.1 x n , n=49.79, Luego la muestra debe ser 50 como mínimo 68.26% 95.44% 99.73% -z /2 z /2 x1 x2
  • 21. n Zx n Zx 2/ ; 2/ 64 5 96.114; 64 5 96.114 22.15;78.12 Ejercicio 11. En una determinada población estudiantil, la nota sigue una distribución normal N(14,5). Si se extrae una muestra aleatoria de 64 alumnos y para un nivel de significación del 5%, ¿en qué condiciones se rechazaría la hipótesis de que la media de la población es de 14? Solución Datos Para =0.05 z=1.96 (dos colas) La hipótesis se rechazaría cuando el valor de la media de la muestra no pertenezca al intervalo de confianza siguiente. = = Ejercicio 12. Tras realizar un test de cultura general entre los habitantes de cierta población, se observa que las puntuaciones siguen una distribución normal, de media 68 y desviación típica 18. Se desea clasificar a los habitantes en tres grupos (de baja cultura general, de cultura general aceptable, de cultura general excelente), de manera que el primer grupo abarque un 20% de la población, el segundo un 65% y el tercero el 15% restante. ¿Cuáles son las puntuaciones que marcan el paso de un grupo a otro? Solución Datos. =18 μ =68 =0.20 (baja cultura), =0.65 (cultura media), =0.15 (alta cultura) x1= u-z1 =68-0.84(18)= 52.85 x2= u+z2 =68+0.84(18)=83.15 9.1.4 EJERCICIOS PROPUESTOS Ejercicio 1. En una fabrica de productos lácteos, una muestra de 100 unidades, dieron en promedio un peso de 1.35 kg., con una desviación estándar de 0.2 kg. ¿Se puede asegurar para un α = 0,05 que los pesos de los productos esta por debajo de 1.5 kg? Ejercicio 2. Una empresa estudia introducir un nuevo sistema de producción para mejorar su productividad media establecida actualmente en 40 unidades por persona diaria. Se estima que el cambio no será rentable si no consigue elevar dicho numero por encima de 44 u. Realizada una prueba con la nueva tecnología, aplicada a 40 personas, se obtuvo una producción media de 45 y no se observó ningún cambio apreciable en la dispersión que estaba establecida en =1.0 u. por día. ¿Se debe efectuar el cambio tecnológico? Ejercicio 3. La policía afirma que las denuncias por robo son resueltas en 10 días en promedio, con una varianza de 4. Se hizo una encuesta a una muestra de 200 denunciantes cuyas denuncias fueron resueltas y se encontró que sus casos fueron resueltos en 15 día en promedio, considere una población normal, si = 0.05, que opina de la afirmación de la policía. 0.65 0.20 0.15 z1 z2 x2 x2
  • 22. Ejercicio 4. En la etiqueta de un producto comestible figura que el tiempo de duración de este es de 100 días, se eligió una muestra aleatoria de 60 artículos y se comprobó que su tiempo de duración fue de 80 días con una varianza de 16. ¿Se puede afirmar a nivel de significación 0,05 que el tiempo de duración media de los productos es 100 días?. Ejercicio 5. Una encuesta realizada a 164 trabajadores de una fábrica, concluyó que el sueldo medio es de s/. 600 con una desviación típica de 64. ¿El salario medio es mayor o igual que 500 a un nivel de significación del 5%? Ejercicio 6. En estudios previos se ha determinado que el nivel de colesterol promedio de pacientes con problemas cardíacos es 222. Un cardiólogo piensa que en realidad el nivel es más alto y para probar su afirmación usa la muestra siguiente. ¿Habrá suficiente evidencia estadística para apoyar la afirmación del cardiólogo? Justificar su contestación. 217 245 217 226 202 233 235 242 219 221 223 238 225 216 199 224 236 218 215 240 234 248 226 221 217 210 205 222 220 210 215 220 240 230 214 210 Ejercicio 7. Un profesor universitario está interesado en determinar si las computadoras mejoran el rendimiento de sus alumnos de estadística. Con este propósito seleccionó aleatoriamente 35 estudiantes del tercer ciclo y después de facilitarles el uso de computadoras durante un semestre, determinó que las notas fueron en promedio 15 con varianza de 4. Si los promedios de estadística en años anteriores eran de 12, y se consideran pruebas normalizadas, Utilizando α= 0.01, determine la conclusión a que llegó el profesor?. Ejercicio 8. Se sabe que el sueldo anual de los trabajadores de una empresa sigue una distribución normal de media desconocida y desviación típica de s/500. Se ha observado el sueldo anual de 36 trabajadores de dicha empresa escogidos al azar, y se ha obtenido un valor medio de s/. 2400. Probar la hipótesis, a un nivel de significación del 5%, si la media de la distribución muestral es de s/2500. a. ¿Cuáles son las hipótesis nula y alternativa del contraste? b. Determina la forma de la región crítica. c. ¿Se acepta la hipótesis nula con el nivel de significación indicado? Ejercicio 9. El MTC afirma que los pasajes de taxi local son de s/5.00 Para saber si es cierto, se toma una muestra de 36 taxis, resultando que el precio medio es de s/6.5 con desviación estándar s/0.50 .Tiene razón el MTC al 95% de confianza. Ejercicio 10. Se quiere estudiar la vida media μ de unas resistencias producidos en una empresa. Por experimentos anteriores, se piensa que la desviación típica de la población es 90h. Al extraer una muestra de 80 resistencias, se encuentra una media de 1700h. a. Contrastar la hipótesis de que μ=1650 h, frente a la alternativa μ≠1650; b. Ídem., frente a la alternativa μ >1650. Ejercicio 11. Se quiere probar la eficacia de una dieta para bajar de peso. El promotor afirma que en un mes los participantes bajaría 5kg, para comprobar se puso a dieta a 66 personas, luego de un mes se obtuvo una disminución de peso en promedio 4kg y una desviación estándar de 1.0 kg. a. Con un 99% de confiabilidad, ¿puede afirmarse que es cierto la afirmación del promotor?. b. Con un 95% de confiabilidad, ¿puede afirmarse que es cierto la afirmación del promotor?. Ejercicio 12. Una variable aleatoria sigue una distribución N(μ, 144) con μ desconocido. a) ¿Se descartaría la hipótesis μ = 15 en favor de la alternativa μ ≠ 15, para α= 0.05,
  • 23. si una muestra aleatoria de n = 64 observaciones arroja una media igual a 20? b) Construir un intervalo de confianza del 95% para μ. c) Considerando la misma hipótesis del punto a), ¿qué sucedería con un nivel de significación del 1%? d) Construir un intervalo de confianza del 99% para μ. e) Probar H0: μ = 15 versus H1: μ > 15 para α = 0.05 y α = 0.01. Comparar con los resultados obtenidos en los puntos a) y c). Ejercicio 13. El gerente afirma que el contenido promedio de los botellas envasadas por su representada es igual a 320ml. Suponga que los datos provienen de una población aproximadamente normal. Para confirmar lo dicho por el gerente, se toma una muestra de tamaño 10, y encuentra que la media es 300 ml. Con un nivel de confianza de 95% , determinar si tiene razón el gerente. Ejercicio 14. Una muestra aleatoria de 100 muertes registradas en un país el año pasado muestra una vida promedio de 71.8 años. Suponga una desviación estándar poblacional de 8.9 años, ¿esto parece indicar que la vida media hoy en día es mayor que 70 años? Utilice un nivel de significancia de 0.05. Ejercicio 15. Los trabajadores de una empresa que utilizan el autobús regular se quejan de que éstos se están retrasando en media más de un cuarto de hora. Para comprobarlo han anotado el retraso de algunos días elegidos al azar. Los datos fueron: 12 36 17 15 19 25 5 10 17 5 12 11 17 9 6 15 22 35 5 14 23 15 25 35 17 16 15 11 13 7 23 2 25 14 16 3 25 9 23 26 11 16 17 8 4 12 18 4 21 7 16 17 25 26 7 13 24 6 8 23 24 16 6 14 9 14 26 3 14 8 24 6 24 42 24 6 4 7 12 7 4 3 11 22 14 26 12 42 22 11 19 20 23 16 13 6 6 14 18 5 A nivel de significación del 10 %, ¿crees que tienen razón los trabajadores? Ejercicio 16. Un equipo de psicólogos está estudiando el efecto del estrés sobre la presión arterial en alumnos de la UNHEVAL. El equipo afirma que la presión sistólica media en varones jóvenes estresados es mayor que 18 cm de Hg. Se toma una muestra de 36 alumnos y se encuentra que 6,35,18 sx ; ¿Se puede afirmar que el equipo tenía razón? Ejercicio 17. Plantee y resuelva como mínimo 4 ejercicios, de prueba de hipótesis tomando como datos problemas de su área.
  • 24. n ux z o n s ux t o n Zx n Zx 2/2/ n s tx n s tx nn )1,2/()1,2/( 9.2 PRUEBA DE HIPÓTESIS PARA LA MEDIA POBLACIONAL: MUESTRAS PEQUEÑAS 9.2.1 INTRODUCCIÓN Para realizar pruebas de hipótesis acerca de la media el tamaño de la muestra es pequeño, es necesario el supuesto de normalidad en las muestras. Supongamos que 1 2 n X , X , , X es una muestra aleatoria de una población normal con media μ y varianza σ, la n s x T tiende a una distribución t con n-1 grados de libertad. Se quiere probar las hipótesis Hipótesis Caso I Caso II Caso III Ho : = 0 H1 : < 0 Ho : = 0 H1 : ≠ 0 Ho : = 0 H1 : > 0 9.2.2 SUPUESTOS 1. Las muestras son muestras aleatorias simples. 2. La muestra es pequeña (n < 30) 3. Los valores de la muestra provienen de una población con una distribución normal o aproximadamente normal. Estadístico de prueba. a). Se conoce la 2 poblacional (pocas veces sucede) b) Se desconoce la 2 poblacional 1-n t~ Intervalo de Confianza. del 100(1- )% para la media poblacional , es de la forma: a) Se conoce la varianza poblacional σ2 . b) Se desconoce la varianza poblacional σ2 . Donde: n : Tamaño de la muestra x : Media de la muestra μ : Media de la población
  • 25. 8 4 5 10 16 5 3545 n s ux t : Desviación estándar poblacional s : desviación estándar de la muestra n-1 : grados de libertad Nota: para encontrar la media y la desviación estándar se utiliza las siguientes formulas 1 22 1 n xnx s n xi x n i Nota: para determinar si la distribución es normal, podemos utilizar las pruebas de Anderson- darlin, shapiro-Will o Kolmogorov-Smirnov ver ejercicio 3 9.2.3 EJERCICIOS RESUELTOS Ejercicio 1. El peso medio en mujeres comprendidas entre 30 y 40 años, es de 35kg. Un estudio realizado en 16 mujeres con edades comprendidas en el intervalo anterior y que siguen una dieta vegetariana da un peso medio de 45kg. Con una desviación típica de 5kg. Considerar distribución normal. a. Puede considerarse que la dieta vegetariana produce una modificación del peso medio de las mujeres?. b. Dar un intervalo de confianza al 95%, para de las vegetarianas Solución. Datos n =16; α=0,05; a) Puede considerarse que la dieta vegetariana produce una modificación del peso medio de las mujeres?. Hipótesis Ho: μ = 35 (La dieta vegetariana NO produce modificaciones en el peso de las mujeres) H1: μ ≠ 35 (La dieta vegetariana SI produce modificaciones en el peso de las mujeres). Como la población es normal y n<30 se usa la tabla de una cola t (α,n-1)= t (0,05,15) = 2,131 Si t > t (0,05,15) = se rechaza la Ho Decisión: como (t=8) > (t (0,05,15) = 2,131), se rechaza Ho, o sea la dieta si produce modificaciones b. INTERVALO: t(0,05,15) =-2,131 t(0,05,15) =2,131 t=8 Zona de aceptación Ho Zona rechazo Ho Zona rechazo Ho
  • 26. One-Sample T Test of mu = 35 vs not = 35 N Mean StDev SE Mean 95% CI T P 16 45,0000 5,0000 1,2500 (42,3357; 47,6643) 8,00 0,000 6643.47;3357.42 16 5 131.245; 16 5 131.245 n s tx n s tx nn 1,()1,( ; Solución en MINITAB Ingresamos al minitab y hacemos click en Stat >Basic statistics >1-sample t.. como se ve en la figura siguiente Los resultados son los siguientes DECISIÓN: Como (P = 0,000) < (α = 0,05) luego se rechaza Ho. INTERVALO: (42,3357; 47,6643) al 95% Ejercicio 2. En un muestreo realizado entre los empleados de una multinacional se eligieron al azar 15 empleados y se anotó su sueldo mensual obteniéndose los siguientes datos: 1285, 1152, 1546, 1423, 1120, 1660, 956, 1250, 1812, 1120, 1553, 1056, 1163, 1358 y 1457. El gerente afirma que el sueldo medio de sus trabajadores está por encima de los 1500 y los sindicatos afirman que es de 1400. Sabiendo que los sueldos en esa multinacional se distribuyen de forma aproximadamente normal, Crees que lo que dice el gerente es cierto? Solución. Datos
  • 27. 738,2 15 105,244 15004,1327 n s ux t t = – 2,734 t(14;0,05)=1,761 Zona de rechazo HoZona de Aceptación Ho n = 15 μ=1500 (sueldo promedio según el gerente) s = ¿? ¿?x Primero hallamos s y x 15 14571358116310561553112018121250956166011201423154611521285 x 4,1327 15 19911 x 115 )4,1327(15)14571358.............154611521285( 222222 s s = 244,105 Prueba de Hipótesis Ho: μ=1500 (sueldo promedio no es mayor que 1500) H1: μ>1500 (sueldo promedio es mayor a 1500, según el gerente) Estadístico de prueba Como la población es aproximadamente normal y n<30 , utilizamos la prueba t de student Para decidir si rechazamos Ho o aceptamos Ho, construimos la grafica y determinamos el valor de t, de la tabla. t(14;0,05) =1,761 Conclusión. Como t=–2,739 cae en la zona de aceptación aceptamos Ho, es decir que el gerente esta equivocado, el sueldo de los trabajadores no es mayor que 1500. Ejercicio 3. Un fabricante de lámparas eléctricas sostiene que la duración media de las mismas (horas) es en promedio superior a 1300 h. Se toma una muestra de 16 lámparas siendo el resultado de la inspección el siguiente: 980 1350 1020 1140 1520 1390 1205 1180 970 1420 1850 1300 1305 1040 1050 1520 Verificar la Ho del fabricante con un coeficiente de riesgo del 5%. Solución Datos μ= 1300 n =16
  • 28. ?x s = ? = 0.05 Primero Dado que no sabemos si la población es normal; entontes debemos determinar si la distribución es normal, para eso aplicamos la prueba de Kolmogorov-Smirnov de Minitab Ho: la distribución es normal H1: la distribución no es normal Si P-value es mayor que 0.05, la distribución se considera normal. Hacemos click en >Stat>Basic Statistics>Normality Test…, Los datos lo ingresamos en la columna C3. y hacemos click en OK, para obtener los resultados Los resultados son
  • 29. C3 Percent 2 0 0 01 8 0 01 6 0 01 4 0 01 2 0 01 0 0 08 0 06 0 0 99 95 90 80 70 60 50 40 30 20 10 5 1 M ean > 0.150 1265 S tD ev 241.3 N 16 K S 0.126 P - V alu e P r o b a b i l i ty P l o t o f C 3 No r m a l Tenemos que p-Value puede tomar valores mayores a 0.150 Para un nivel de significancia de 0.05 (p-value=0.15) > ( =0.05), luego se acepta la hipótesis nula, es decir la distribución es normal, en el grafico puede confirmar esta afirmación. Segundo Sabiendo que la distribución es normal para nuestro ejemplo aplicamos la prueba de t de estudents Hipótesis Ho: μ ≤ 1300 (La duración de las lámparas no es mayor que 1300) H1 : u >1300 (La duración de las lámparas es mayor que 1300) Utilizando MINITAB tenemos: Ingresamos las horas en C3, luego ejecutamos las opciones Stat/Basic statistics/1-sample t.., luego completamos los datos como se ve en la figura y clickeamos ok, ok
  • 30. cmS cmX 10 170 2 5 10 4 25 10 174170 n s ux t Los resultados son: One-Sample T: C3 Test of mu = 1300 vs > 1300 95% Lower Variable N Mean StDev SE Mean Bound T P C3 16 1265.00 241.32 60.33 1159.24 -0.58 0.715 Decisión T= – 0,58; t(0,05;16) = 1,746 Luego 0,56 < 1,756, se acepta Ho. También (p = 0,705)> (α=0,05) luego se acepta Ho. Es decir que la duración de las lámparas no es mayor que 1300 horas. Ejercicio 4. Conocemos que las alturas X de los individuos de una ciudad, se distribuyen de modo gaussiano. Deseamos contrastar con un nivel de significación de α = 0, 05 si la altura media es diferente de 174 cm. Para ello nos basamos en un estudio en el que con una muestra de n = 25 personas se obtuvo: Solución: Como n< 30 se toma la prueba de t de student por ser la distribución gaussiana (normal) El contraste que se plantea es: H0: μ = 174 (la altura media es igual a 174) H1: μ ≠ 174 (la altura media es diferente a 174) La técnica a utilizar consiste en suponer que H0 es cierta y ver si el valor que toma el estadístico Cae dentro de la zona de rechazo de Ho. Conclusión. Como t= –2, cae dentro la zona de aceptación de Ho, además (t= –2) < (t(0,05,24)=– 2,064) se acepta Ho, es decir la altura media es igual a 174 En MINITAB teems: One-Sample T Test of mu = 174 vs not = 174 N Mean StDev SE Mean 95% CI T P t(0,05,24) =-2,064 t(0,05,24) =2,064 t= – 2 Zona de aceptación Ho Zona rechazo Ho Zona rechazo Ho t(0.05,24)=-2.064 t=-2 t(0.05,24)= 2.064
  • 31. 18.11 20 2 4540 n s ux t n tx n tx ss 2/ ; 2/ 20 2 09.240; 20 2 09.240 25 170,000 10,000 2,000 (165,872; 174,128) -2,00 0,057 Aquí su interpretación: Test of mu = 174 vs not = 174 Prueba de la media (Ho: μ = 174) vs (Ho: μ ≠ 174) N Mean StDev SE Mean 95% CI T P n Media Desviación Estándar Cuadrado medio del error Intervalo de confianza al 95% Valor T Valor P 25 170,000 10,000 2,000 (165,8722; 174,1278) -2,00 0,057 La interpretación es la misma que se hace en el caso manual ya visto anteriormente. Pero hay otra forma de tomar la decisión de aceptar la Ho y esto se hace con el Valor P; Si Valor P ≤ α se rechaza la Ho de lo contrario se Acepta. En este caso tenemos que Valor P=0,057 y α=0,05 Conclusión: Dado que Valor P es mayor que α entonces se acepta la Ho. y esta decisión es la misma que vimos anteriormente. Ejercicio 6. Con objeto de estimar el peso de los niños de un jardín se tomó una muestra aleatoria al azar de 20 niños. Se encontró una media de 40 kg y una varianza de 4 kg. Suponiendo que la muestra se distribuye normalmente. d. Pruebe la hipótesis de que la media es menor que 45kg. con =0.05 e. Determine un intervalo de confianza al 95% para la media. Solución. Datos n=20, x =40, s= 2 a. Ho: μ ≥ 45 (La media no es menor que 45 kg) H1: μ < 45 (La media es menor que 45 kg) t(0,05;19) = 1,729 Conclusión. Como (t=11.18)> (t(0,05;19) = 1,729) se rechaza Ho o sea la media es menor que 45kg b. Intervalo de confianza a 95% t0.05/2=2.09 = = (39.06; 40.94)
  • 32. 162.3 10 2 3032 n s ux t 5.2 25 4 198200 n s ux t Ejercicio 7. Un empresario de una editorial, paga un salario mensual de s/.1000 si un vendedor vende mas 100 libros a lo mucho en 30 días, de lo contrario solo paga s/.5 por libro vendido, un grupo de 10 vendedores vendió mas de 100 libros en 32 días, con un varianza de 4 días, si la distribución de las ventas se considera normal, con una confianza de 0.95, ¿Cobran s/1000 cada vendedor?. Solución Datos n=10, x =30, s=2 Ho: μ ≤ 30 (Cobran los s/1000) H1: μ > 30 (No cobran los s/1000) t(0,05;9) = 1.833 Conclusión. Como (t=3.162)> (t(0,05;9) = 1.833) se rechaza Ho o sea no cobran los s/ 1000. Ejercicio 8. Una muestra de 25 familias de una ciudad pagan en promedio por servicios s/ 200 mensual y una varianza de s/16. Se trata de ver si esta muestra es consistente con la Ho que la media en la ciudad por servicios es de s/ 198, con una confianza de 99%, considerar la distribución normal. Solución Datos n=25, x =200, s=4 Ho: μ = 198 (La media de la ciudad es s/198) H1: μ ≠ 198 (La media de la ciudad no es s/198) t(0,005;24) = 2.797 Conclusión. Como (t=2.5)< (t(0,005;24) = 2.797) no se rechaza Ho o sea la media de la ciudad es s/198. Ejercicio 9. Un fabricante de mantequilla quiere comprobar si el peso promedio de cada paquete es de 100 g. Se toma una muestra de 15 paquetes siendo el resultado de la inspección el siguiente: 98.7 99.5 100.2 99.7 100.5 98.8 100.0 98.6 99.1 100.3 100.2 100.4 101.0 99.0 100.0 Verificar la Ho del fabricante con un coeficiente de riesgo del 5%. Solución. Primero determinamos si la distribución es normal. Aplicando kolmogorov-Smirnov de minitab Se tiene que p-value=0.150 esto es mayor que 0.05, luego la distribución es normal, podemos aplicar la t de estuden para probar nuestra hipótesis. Segundo
  • 33. 41.1 15 744.0 10073.99 n s ux t 828.2 18 3 108 n s ux t 6.1 9 5.1 622.61 n s ux t Datos n=15, x =99.73, s=0.7442 Hipótesis Ho: μ = 100 (El paquete pesa en promedio 100 g) H1: μ ≠ 100 (El paquete no pesa en promedio 100 g) t(0,025;14) = 2.145 Conclusión. Como (t=1.41)< (t(0,025;14) = 2.145) no se rechaza Ho o sea el paquete pesa en promedio 100 g. Ejercicio 9. El aumento de peso promedio de 18 vacas bajo una dieta alimenticia durante dos meses fue de 8 kg con una s=3kg. Se desea probar si es válido afirmar que esta ración aumenta el peso al menos en 10 kg. durante los dos meses con un nivel de significación del 5%, considerar distribución normal. Solución. Datos n=18, x =8, s=3 Ho: μ ≥ 10 (El peso aumenta al menos en 10 g) H1: μ < 10 (El peso no aumenta al menos en 10 g) De la tabla t se tiene t(0,025;14) = 1.740 Conclusión. Como (t=2.828)> (t(0,05;14) = 1.740) se rechaza Ho o sea el peso no aumenta al menos en 10 g. Ejercicio 10. Un fabricante que elabora alimento balanceado, desea comprobar que los pesos de los paquetes tienen un promedio 60kg. En una muestra de 9 paquetes tomados al azar se obtuvo una media de 61.2 kg. con una desviación de 1.5 kg. si la distribución es normal ¿Que a comprobado el fabricante con un nivel de significación del 1% ? Solución. Datos n=9, x =61.2, s=1.5 Ho: μ = 60 (El peso promedio es 60 kg) H1: μ ≠ 60 (El peso promedio no es 60 kg) De la tabla t se tiene t(0,005;8) = 3.355 Conclusión. Como (t=1.6)< (t(0,005;8) = 3.355) no se rechaza Ho o sea el peso promedio es 60 kg. 9.2.4 EJERCICIOS PROPUESTOS Ejercicio 1. La corporación Tampico desea saber cuál es la máxima tensión de ruptura que soportan los cables de acero que fabrica. Un cliente importante está interesado en la compra de un número grande de cables y ha establecido que el punto de ruptura no debe ser menor que un tonelada. Tampico piensa que una tonelada es aproximadamente el punto de ruptura de los cables, pero decide
  • 34. probar la hipótesis de que la tensión de ruptura promedio es una tonelada. La muestra es de 10, =0.05, x= 0.96, s=0.15 Ejercicio 2. Se tiene las siguientes pruebas de hipótesis Ho: μ= 20 H1: μ≠ 20 Los datos de una muestra de 6 elementos son 16, 20, 18, 19, 20, 18 a. Calcule la media de la muestra b. Encuentre la desviación estándar de la muestra c. Con α=5%, cual es la regla de rechazo d. Calcule el valor del estadístico t e. ¿Cuál es su concusión? f. ¿Que puede decir acercad del valor p? Ejercicio 3. Se tiene la siguiente prueba estadística Ho: μ= 10 H1: μ< 10 Con una muestra de 15 datos se obtuvo una s=5, use α=5% determine el valor de t y su conclusión para cada uno de los siguientes resultados a) x = 9 b) x = 11 c) x = 8.5 d) x = 9.5 e) x = 12 Ejercicio 4. Un cardiólogo desea hallar un intervalo de confianza del 90% para el nivel colesterol promedio de todos los pacientes que presentan problemas cardíacos. Para esto asume que la distribución de los niveles de colesterol es normal con una desviación estándar = 13 y usa la siguiente muestra al azar de niveles de colesterol de 20 pacientes con problemas cardíacos. 217 223 225 245 238 216 217 226 202 233 235 242 219 221 234 199 236 248 218 224 Ejercicio 6. El pH medio del agua que sale de una planta de tratamiento debe ser de 7.0. La autoridad sospecha que es posible que cierta planta no cumpla con la normativa. Se tomaron 15 muestras de agua de esa planta y se obtuvo un pH de 6.7, 7.1, 6.8, 6.9, 7.3, 7.5, 6.5, 6.6, 7.3, 7.1, 6.3, 6.8, 7.0, 7.1 y 6.8. Sabiendo que el pH varía según una distribución normal, ¿hay razón para dudar que se mantenga la especificación? Ejercicio 7. Dos secciones de un curso de estadística son sometidas a un mismo examen final. De las calificaciones obtenidas se extrae una muestra aleatoria de tamaño 9 en la grupo "A", y otra de tamaño 4 en el grupo "B". Grupo "A": 65, 68, 72, 75, 82, 85, 87, 91, 95 Grupo "B": 50, 59, 71, 80 a. Con un nivel de significación de 0.05 ¿podría decirse que los dos grupos tienen las mismas calificaciones promedio?. Suponga que provienen de poblaciones normales con varianzas iguales. Ejercicio 8. La experiencia en la investigación de demandas por accidentes en una institución aseguradora revela que en promedio cuesta $60 la realización de los trámites. Este costo se consideró exorbitante en comparación al de otras compañías aseguradoras y se instauraron medidas para reducir costos. A fin de evaluar el impacto de las medidas, se seleccionó una muestra de 16 demandas recientes. Se encontró un costo promedio de $57 y una desviación estándar de $10. Elabore una prueba de hipótesis que permita comprobar si los costos han disminuido, con un 99% de confianza. Ejercicio 9. Por registros pasados se sabe que la duración promedio de unas pilas eléctricas que se fabrican para ser utilizadas en un reloj digital es de 300 días. Hace poco tiempo, el proceso de fabricación fue modificado para darle mayor duración. Para comprobar la efectividad del proceso modificado, se probó una muestra de 20 pilas, y se encontró una
  • 35. duración promedio de 311 días y una desviación estándar de 12 días. A un nivel de significación de 0,05, ¿puede afirmarse que el nuevo proceso aumenta la duración de las pilas? Ejercicio 10. Un gerente de ventas de libros universitarios afirma que en promedio sus representantes de ventas realizan 40 visitas a profesores por semana. Varios de estos representantes piensan que realizan un número de visitas promedio superior a 40. Una muestra tomada al azar con 8 semanas reveló un promedio de 42 visitas semanales y una desviación estándar de 2 visitas. Utilice un nivel de confianza del 99% para aclarar esta cuestión. Ejercicio 11. Cuando la cantidad de semillas de soja que quedan en el suelo luego de pasar la cosechadora es igual o mayor a 80 semillas/m2, la pérdida de producción, en qq/ha, es grande. Un productor decide probar el funcionamiento de su máquina y para ello luego de cosechar una parcela cuenta en 10 unidades de 1 m2 cuántas semillas quedan en el suelo. Los resultados fueron, en semillas/m2: 77 73 82 82 79 81 78 76 76 75 a) ¿Se puede concluir, trabajando con un nivel de significación del 10%, que la cosechadora está funcionando bien?, es decir, ¿está la perdida dentro de los límites admisibles? b) Construir un intervalo de confianza para μ apropiado para el problema. Ejercicio 12. Referido al problema 11. a) Si las normas técnicas indican que la desviación estándar del número de semillas caídas por m2 no debería ser superior a 5, ¿qué se debería concluir sobre la máquina trabajando con un nivel de significación α = 0.10? b) Construir un intervalo de confianza para σ2 . Ejercicio 13. Los registros de una comercializadora de repuestos para vehículos revelaron que la duración promedio de un juego de bujías es de 44.000 kilómetros. Un fabricante de bujías, sin embargo, afirmó que su producto tiene una vida media superior a este valor. El propietario de una flotilla de camiones adquirió 18 bujías, como prueba. Encontró una duración promedio de 42.400 kilómetros y la desviación 1.500. Esta información muestral convenció al propietario. ¿Y a Ud.? Ejercicio 14. Una cadena de talleres para la afinación de motores de automóvil anuncia que su personal puede realizar el servicio completo (cambio de aceite, cambio del filtro de aceite, lavado y engrase de motor) en un promedio de 15 minutos. Sin embargo, la gerencia ha recibido quejas de los clientes en relación al tiempo de servicio. Para verificar la afirmación, la oficina muestreó a 21 automóviles, obteniendo una media de atención de 18 minutos y una desviación de 1 minuto. Utilice un nivel de significación de 0,05 para probar si es razonable la afirmación de la cadena de talleres. Ejercicio 15. Se instala una máquina para llenar botellas pequeñas con 9,0 gramos de medicamento. Se piensa que el peso medio es de menos de 9,0 gramos. Una muestra de llenado se da a continuación. Pruebe la afirmación con un 99% de confianza. 9,2 8,7 8,9 8,6 8,8 8,5 8,7 9,0 Ejercicio 16. Se desea estudiar el gasto semanal de fotocopias, de los estudiantes de la UNHEVAL. Para ello, se ha elegido una muestra aleatoria de 9 de estos estudiantes, resultando los valores siguientes para estos gastos: 100 150 90 70 75 105 200 120 80 Se supone que la variable aleatoria objeto de estudio sigue una distribución normal de media desconocida y de desviación típica igual a 12. Determina un intervalo de confianza del 95% para la media del gasto semanal en fotocopias por estudiante.
  • 36. Ejercicio 17. Se sabe que la desviación típica de las notas de cierto examen es 0,4. Para una muestra de 36 estudiantes se obtuvo una nota media de 5,6. ¿Sirven estos datos para confirmar la hipótesis de que la nota media del examen fue de 6, a un nivel de significación de 0,05? Ejercicio 18. Cuando fue contratado como mesonero de un restaurante, a un caballero se le dijo que obtendría S/.20 por día en propinas. Al cabo de 25 días de trabajo, el mesonero piensa que no obtuvo tanto en propinas. El restaurante le pidió cuentas de sus propinas durante el mes: había recibido S/. 450 en los 25 días. Así mismo, se determinó con los datos muestrales que la desviación estándar fue de S/. 3. por día. ¿Puede el mesonero sostener estadísticamente su opinión, al 95% de confianza? Ejercicio 19. Pruebe la hipótesis de que el contenido promedio de los envases de un lubricante en particular es de 10 litros si los contenidos de una muestra aleatoria de 10 envases son: 10.2, 9.7, 10.1, 10.3, 10.1, 9.8, 9.9, 10.4, 10.3 y 9.8 litros. Utilice un nivel de significancia de 0.01 y suponga que la distribución del contenido es normal. Ejercicio 20. Una muestra de 9 explotaciones agrícolas arrojó una media de 125 ha y un desvío de 25 ha. Testar si se puede suponer con bastante confiabilidad que el promedio verdadero de la población de explotaciones puede ser 135 ha.
  • 37. 2 2 2 1 2 1 2121 )( nn uxx z 2 2 2 1 2 1 2121 )( n s n s uxx tz 2 2 2 1 2 1 2/2121 2 2 2 1 2 1 2/21 nn Zxx nn Zxx 2 2 2 1 2 1 2/2121 2 2 2 1 2 1 2/21 n s n s Zxx n s n s Zxx 9.3 PRUEBA DE HIPÓTESIS SOBRE LA DIFERENCIA ENTRE MEDIAS: MUESTRAS GRANDES 9.3.1 INTRODUCCIÓN Supóngase que se tiene dos poblaciones independientes con medias desconocidas μ1 y μ2, y varianzas σ1 2 y σ2 2 . Sean 1 x y 2 x las medias de las muestras de dos poblaciones. El tamaño de cada una de estas muestras son n1 y n2 respectivamente. Queremos observar si la diferencia entre las medias es significativa o no, es decir. Hipótesis Caso I Caso II Caso III Ho: μ1 – μ2 ≥ Δ H1 : μ1 – μ2 < Δ Ho: μ1 – μ2 = Δ H1 : μ1 – μ2 ≠ Δ Ho: μ1 – μ2 ≤ Δ H1 : μ1 – μ2 > Δ 9.3.2 SUPUESTOS 1. Las observaciones de las muestras son aleatorias 2. Las poblaciones son independientes 3. Los tamaños de las muestras son n 1≥ 30 y n2 ≥30 4. Las poblaciones son normales o cumplen las condiciones del teorema del límite central. Estadístico de prueba a) Varianzas conocidas 1 2 y 2 2 b) Varianzas desconocidas 1 2 y 2 2 Intervalo de Confianza. Del 100(1- )% para la diferencia de medias poblacionales 1- 2, es de la forma: a) Se conoce la varianza poblacional σ2 . b) Se desconoce la varianza poblacional σ2 . Donde: n1: Tamaño de la muestras 1; n2 : Tamaño de la muestras 2 1 x : Media de la muestra 1 , 2 x : Media de la muestra 2 μ1 : Media de la población 2; μ2 : Media de la población 2; 1 : Desviación estándar poblacional 1 ; 2 : Desviación estándar poblacional 2 s1 : desviación estándar de la muestra 1; s : desviación estándar de la muestra 2
  • 38. Z0,025=-1,96 Z0,025 =1,96 Z= – 1,38 Zona de aceptaci ón Ho Zona rechazo Ho Zona rechazo Ho 38,1 56 169 42 225 )0(7874)( 2 2 2 1 2 1 2121 n s n s uxx z Notas. 1. Para muestras grandes es indistinto usar la distribución Z o distribución t de student, para calcular el p-valor en la práctica se usa generalmente la distribución t porque en la mayoría de los paquetes estadísticos viene como una opción 2. Si NO se conoce las desviaciones estándar de las poblaciones 1 y 2 se estima con s1 y Sha las desviaciones estándar de las muestras 3. Generalmente se tiene que μ1 – μ2 = 0 9.3.3 EJERCICIOS RESUELTOS Ejercicio 1. Se conocen los datos de dos muestras de dos poblaciones, que son los siguientes: Las medias X1 = 74 ; X2 = 78 ; las varianzas S1 2 = 225 ; S2 2 = 169; las muestras n1 = 42 ; n2 = 56; Se pide contrastar estadísticamente si existe diferencia entre las dos poblaciones, a un nivel de significación del 0.05. Las dos poblaciones siguen una distribución Normal N(μ1,σ1 2 ) y N(μ2, σ2 2 ) Solución. Sabemos que las distribuciones de las dos poblaciones son Normales, pero desconocemos el valor de su desviación, sólo conocemos el valor de la desviación típica de las muestras entonces estimamos las desviaciones poblacionales con las de las muestras. Hipótesis: Ho: μ 1 - μ 2 = 0, es decir, μ1 = μ 2 (no existe diferencia entre las poblaciones) H1: μ 1 - μ 2 ≠ 0, es decir, μ 1 ≠ μ 2 (si existe diferencia entre las poblaciones) Ya que el tamaño de las muestras es elevado, utilizaremos el siguiente estadístico: Estadístico El nivel de significación nos dice el enunciado que es de α = 0.05 como es de dos colas α/2 = 0.025, y para el criterio de aceptación tenemos en la figura: Conclusión. Como (Z = – 1,38) queda en el área de aceptación de Ho, luego aceptamos Ho, es decir no existe diferencia entre las poblaciones Solución en MINITAB Ejecutamos las opciones Stat/Basic statistics/2 Sample t.., luego completamos los datos como se ve en la figura y clickeamos ok, ok
  • 39. 8,6 45 6,3 40 9,2 )0(4,306,25)( 22 1 2 1 2 2 2 1212 n s n s uxx z Resultados Two-Sample T-Test and CI Sample N Mean StDev SE Mean 1 42 74,0 15,0 2,3 2 56 78,0 13,0 1,7 Difference = mu (1) - mu (2) Estimate for difference: -4,00000 95% CI for difference: (-9,75807; 1,75807) T-Test of difference = 0 (vs not =): T-Value = -1,38 P-Value = 0,171 DF = 81 Conclusión. Como (p = 0,171) > (α=0,05) luego no se rechaza Ho. Ejercicio 2. Se realizó un estudio para comparar los años promedio de servicio de quienes se retiraron en 2005 con los que se retiraron el año anterior en un hospital. Con un nivel de significancia de 0,01 ¿podemos concluir que los trabajadores que se retiraron el 2005 trabajaron menos que los del 2004, según la siguiente muestra? Año 2004 2005 Media de la muestra 30,40 25,60 Desviación estándar muestra 3,6 2,9 Tamaño de la muestra 45,0 40,0 Solución. HIPÓTESIS Ho: μ 2 - μ 1 ≥ 0, (los trabajadores del 2005 trabajan igual o mas que los del 2004) H1: μ 2 - μ 1 < 0, (los trabajadores del 2005 trabajan menos que los del 2004) Concusión: Como (Z= -6,8) < (Z0,01= 2,3263) se rechaza Ho; luego los trabajadores del 2005 trabajan menos que los de 2004 Utilizando MINITAB
  • 40. 22,10 40 8,12 35 9,33 1,157,3)( 2 2 2 1 2 1 2121 n s n s uxx z Two-Sample T-Test and CI Sample N Mean StDev SE Mean 1 40 25,60 2,90 0,46 2 45 30,40 3,60 0,54 Difference = mu (1) - mu (2) Estimate for difference: -4,80000 99% upper bound for difference: -3,12520 T-Test of difference = 0 (vs <): T-Value = -6,80 P-Value = 0,000 DF = 82 Conclusión: como (p-value=0,00)<(α=0,01), se rechaza Ho, es decir hay suficiente evidencia para suponer que los trabajadores del 2005 trabajan menos que los del 2004. Ejercicio 3. En un ensayo clínico para evaluar un hipotensor se compara un grupo placebo con el grupo tratado. La variable medida es la disminución de la presión sistólica y se obtiene: grupo placebo n = 35; x 3,7 mm de Hg. y Sha = 33,9; grupo tratado n = 40; x 15,1 mm de Hg. y Sha = 12,8. ¿Es eficaz el tratamiento? Solución. Se trata de un contraste sobre diferencias de medias H0: μ1 – μ2 ≤ 0 (no varia la presión) H1: μ1 – μ2 > 0 (la presión disminuye) Como no conocemos σ1 ni σ2 utilizamos la s1 y Sha y la distribución t, pero como la distribución t para muestras n>30, se aproxima a Z utilizamos la distribución Z, los resultados serán iguales a la t de Students. Luego tenemos que (Z = – 10,22) < (Z0,05= – 1,645), entonces se ACEPTA la Ho, significa que la presión con el nuevo tratamiento no ha disminuido.
  • 41. Utilizando MINITAB : Two-Sample T-Test and CI Sample N Mean StDev SE Mean 1 35 3,70 5,82 0,98 2 40 15,10 3,58 0,57 Difference = mu (1) - mu (2) Estimate for difference: -11,4000 95% lower bound for difference: -13,2998 T-Test of difference = 0 (vs >): T-Value = -10,04 P-Value = 1,000 DF = 54 Conclusión. De aquí tenemos que (p-valor =1) > (α=0,05) luego se acepta Ho. La presión no varía. 9.3.4 EJERCICIOS PROPUESTOS Ejercicio 1. En la actualidad las calificaciones de eficiencia de 50 trabajadores de una empresa tienen un valor promedio de 14.5 puntos y una desviación estándar de 1.6 puntos. Sin embargo, en fechas recientes se evaluó a 64 trabajadores, que obtuvieron una puntuación media de 16.5 puntos y una varianza de 9. Dentro de un nivel de confianza del 95%, ¿puede decirse que la puntuación actuales de los trabajadores de la empresa es menor que en fechas recientes?. Ejercicio 2. Dos compañías que fabrican bloques de concreto desean comparar la compresión promedio de sus bloques. El interés es determinar si las dos compañías tienen compresiones promedio iguales, o si por el contrario, existen diferencias entre las mismas. Con base a un muestreo, pudo determinarse la información que sigue. Utilizando un nivel de significación de 0,02, ¿es posible concluir que hay diferencias entre la compresión promedio de los bloques de ambas compañías? Compañía 1 Compañía 2 Compresión promedio(psi) 1070 1045 Desviación estándar (psi) 63,6 57,1 Tamaño Muestra 100 64 Ejercicio 3. Un producto químico especialmente diseñado para añadir peso al grano desea determinar si es o no eficaz. Se tomaron dos grupos: el primer grupo fue formado con grano al cual no se le aplicó el producto y el segundo grupo fue de grano al cual si se le aplicó el producto. Una muestra de 100 mazorcas de maíz no tratado con el producto tuvo un peso promedio de 15,2 onzas, con una desviación de 1,2 onzas. Una muestra de 400 mazorcas de maíz tratado con el producto tuvo un peso
  • 42. promedio de 16 onzas, con una desviación de 1 onza. Utilizando una prueba de hipótesis con un 95% de confiabilidad, ¿es posible concluir que el producto es eficaz? Ejercicio 4. Las existencias de un medicamento se han surtido siempre en una farmacia un promedio de 6,2 veces al año, con una desviación de 1,5 veces. Se sospecha que esta tasa ha cambiado en los últimos meses. Una muestra de los últimos 36 meses reveló que ahora se surte 5,4 veces al año. ¿Ha cambiado la tasa de surtido? Utilice un nivel de confiabilidad del 98%. Ejercicio 5. Un fabricante de detergente afirma que su producto rinde más que los de la competencia, para ello se tomaron 30 sabanas del mismo tamaño y color y se efectuó la prueba, encontrándose que para un lavado perfecto se requirió de 800g de detergente con 15 de desviación estándar en un tiempo dado, 30 sabanas del mismo tamaño y color se probaron para el detergente de la competencia arrojando para un lavado perfecto en el mismo tiempo un promedio de 860g con desviación estándar de 10. ¿Tiene razón el fabricante? Utilice un nivel de confianza del 99%. Ejercicio 6. La cadena de McPato situadas en la ciudad de Piura afirma que su servicio es mas rápido que cualquier otra cadena, una muestra de 42 atenciones demoró en promedio de 3 minutos con desviación típica de 1 minuto. Una muestra de 45 atenciones de la cadena McPollo arrojó un tiempo promedio de atención de 4 minutos con desviación de 0.8 minutos ¿Tiene McPato razón? Utilice una prueba estadística con un nivel de significación de 0,10. Ejercicio 7. Una muestra A de 49 observaciones muestrales reveló una media de 7.8, con una desviación de 1,2. Otra muestra B de 36 observaciones arrojó una media igual a 12 y una varianza de 2. ¿La media de la muestra A es menor que la muestra B? Ejercicio 8. 100 Empleados de una casa comercial matriz situado en la ciudad de lima ganan por comisiones en promedio s/500 mensuales con desviación estándar de 12, 30 empleados en Huancayo de una sucursal ganan por comisiones s/450 mensual con desviación típica de 10, con un nivel de significación de 0.05 probar la hipótesis de que la sucursal paga menos que la casa matriz. Ejercicio 9. Una empresa de bienes raíces está preparando un folleto que cree que puede ser de interés para compradores de apartamentos en Las Palmeras y El Naranjal. Un elemento de interés es el tiempo que el propietario que vende ha ocupado el inmueble. Una muestra de 40 apartamentos en las Palmeras indicó un tiempo promedio de permanencia de 17,6 años, con una desviación de 2,3 años. Una muestra de 55 casas en El Naranjal señaló un tiempo promedio de 18,1 años, con una desviación de 2,9 años. Con un nivel de significación del 5%, ¿se puede concluir que los residentes de Las palmeras tenían en propiedad sus casas por un período más corto? Ejercicio 10. Un estudio se realiza para comparar el alquiler mensual de un departamento de una habitación en la Avenida principal de provincias contra el costo en Lima. Una muestra de 35 departamentos en la Avenida principal de provincias proporcionó un alquiler mensual de S/. 370., con una desviación de S/. 30. Una muestra de 40 departamentos en Lima demostró un valor promedio de S/. 680., con una desviación de S/.12. ¿Se puede concluir que existen diferencias entre los alquileres? Ejercicio 11. Se realiza una encuesta en dos zonas distintas de un país para conocer el grado de implantación de Internet en los hogares. En la zona norte se visitaron 200 domicilios de las mismas características seleccionados al azar y el 38% de ellos estaba dado de alta en Internet. Este número descendía al 29% en la zona sur donde se visitaron 240 hogares. ¿Estaría justificado afirmar que en la zona norte hay más gente conectada a Internet que en la zona sur? ¿Cuál debería haber sido el tamaño de la muestra para poder detectar una diferencia de al menos 5 puntos porcentuales el 90% de las veces, con un nivel de significación de 0,05?
  • 43. Ejercicio 12. Se quiere saber si el aumento del precio del petróleo genera incrementos en el uso de electricidad. Para medir cambios experimentados desde el año anterior, se elige una muestra al azar de 40 casas en el mes de enero de 2004, y se compara con una muestra de 50 casas en el mes de enero del 2005. los resultados muestrales son: )2005(50305925,1 )2004(40298645,1 222 111 nkwhskwhx nkwhskwhx Realice una prueba con un nivel de significancia de 0,10 para verificar si el promedio de consumo de electricidad por casa ha cambiado durante el mes de enero. ¿A que conclusión deberá llegar usted? Ejercicio 13. La gerencia de una fábrica está considerando un nuevo método de aparado en la fabricación de zapatos. El método actual requiere en promedio de 12,5 minutos de aparado y una desviación típica de 3 para tres docena de zapatos. Se incorporó un nuevo método de aparado y sobre una muestra de 32 zapatos requiere en promedio 9 minutos con varianza de 4, determinar si el nuevo método es mas eficaz a un nivel de confianza de 99%. Ejercicio 14. En una muestra aleatoria de 35 cabinas de Internet en la ciudad de amarilis ganan en promedio diario S/200 con una varianza de 4. En Huánuco una muestra de 30 cabinas de Internet dijeron que ganaban en promedio diario S/250 con una desviación típica de 2.2, a un nivel de confianza de 90%, determinar si en las cabinas de Internet de Amariles se gana más que en las de Huánuco. Ejercicio 15. Las exportaciones de mangos del 2006 de 30 empresas fueron en promedio de 800 toneladas métricas, con una varianza de 200 toneladas métricas al cuadrado, el 2007 estas mismas empresas exportaron 1000 toneladas con una varianza de 150, a un nivel de confianza de 95% se puede afirmar que el 2007 se incremento las exportaciones de mango.
  • 44. 2 2 2 1 2 1 21 nn xx z o 1 2 1 1 2 1 2/2121 1 2 1 1 2 1 2/21 nn zxx nn zxx 9.4 PRUEBA DE HIPÓTESIS SOBRE LA DIFERENCIA ENTRE MEDIAS: MUESTRAS PEQUEÑAS 9.4.1 INTRODUCCIÓN Estas pruebas se utilizan cuando el muestreo destruye a los elementos, cuando resulta muy costoso o cuando solo se puede obtener unos cuantos valores históricos. Sea u1 y u2, las medias de dos poblaciones normales o aproximadamente normal; Se quiere probar la hipótesis sobre la diferencia de medias bajo el supuesto que Ho es cierto es decir: Hipótesis Caso I Caso II Caso III Ho: μ1 – μ2 ≥ Δo H1 : μ1 – μ2 < Δo Ho : μ1o – μ2 = Δo H1 : μ1 – μ2 ≠ Δo Ho: μo – μ2 ≤ Δo H1: μ1 – μ2 > Δo 9.4.2 SUPOSICIONES 1. Las observaciones de las dos muestras son independientes 2. Las dos poblaciones son aproximadamente normales 3. Al menos una muestra es pequeña n < 30 Prueba Estadística.. Caso 1. Se conocen las desviaciones estándar de las poblaciones σ1 y σ2,. Intervalo de Confianza. Del 100(1- )% para la diferencia de medias poblacionales 1- 2, es de la forma: Caso 2. Se desconoce 1 y 2 pero son iguales 1= 2= , se determina s la desviación estándar combinada, en función de s1 y S2. 21 21 11 nn s xx t o
  • 45. 2 2 2 1 2 1 21 n s n s xx t o 1 2 1 1 2 1 ,2/2121 1 2 1 1 2 1 ,2/21 n s n s txx n s n s txx glgl 11 221,2/2121 11 221,2/21 1111 nn stxx nn stxx nnnn Intervalo de Confianza. Del 100(1- )% para la diferencia de medias poblacionales 1- 2, es de la forma: Prueba t con n1+n2 – 2 grados de libertad Donde s es un estimado conjunto de σ (desviación estándar común para ambas poblaciones (pooled variance)) 2 )1()1( 21 2 22 2 11 nn snsn s Caso 3. Se desconoce 1 y 2 pero desiguales 1≠ 2 , se utiliza s1 y Sha, para estimar 1 y 2 respectivamente en este caso el método aproximado es la distribución t, Los grados de libertad (gl) se determina con la fórmula siguiente. 2 1 1 1 1 2 2 2 2 2 2 1 2 1 1 2 2 2 2 1 2 1 n s nn s n n s n s gl Intervalo de Confianza. Del 100(1- )% para la diferencia de medias poblacionales 1- 2, es de la forma: Donde: n1: Tamaño de la muestras 1; n2 : Tamaño de la muestras 2 1 x : Media de la muestra 1, 2 x : Media de la muestra 2 μ1 : Media de la población 2; μ2 : Media de la población 2; 1 : Desviación estándar poblacional 1 2 : Desviación estándar poblacional 2 s1 : desviación estándar de la muestra 1; Sha : desviación estándar de la muestra 2 s: desviación estándar combinada. gl : grados de libertad
  • 46. T(0,1;23)=-1,714 t(0,1;23) =1,714 t= 1,193 Zona de aceptación Ho Zona rechazo Ho Zona rechazo Ho De tablas t para dos colas tenemos que: t (α ; n1+n2-2) = t (0,1 ; 10+15-2) = t (0,1 ; 23) = 1,714 Nota: en caso gl no sea entero se aproxima al menor entero 9.4.3 EJERCICIOS RESUELTOS Ejercicio 1. Como psicólogo de un hospital para enfermos mentales el lector obtiene calificaciones para una prueba visual motora para cada uno de dos grupos de pacientes. La calificación media para el grupo A (10 pacientes) es 80 con desviación estándar 18, y la correspondiente al grupo B (15 pacientes) es 70 con desviación estándar 22. El lector cree tener suficiente razones para considerar las desviaciones estándar de población iguales, las poblaciones son normales. ¿Difieren significativamente las calificaciones con nivel de significación 10%?. Solución Datos nA = 10 nB = 15 80A x 70B x sA = 18 sB = 22 = 0.10 Hipótesis Ho: μA - μB = 0 (las calificaciones no difieren) H1: μA - μB ≠ 0 (las calificaciones si difieren) 193,1 15 1 10 1 5278.20 7080 11 BA BA nn s xx t s = 5278.20 21510 22)115(18)110( 2 )1()1( 2222 BA BBAA nn snsn Decisión: como se observa en la figura el t esta dentro del área de aceptación de Ho., luego se acepta Ho, es decir que las calificaciones no difieren Utilizando MINITAB Ejecutamos las opciones Stat/Basic statistics/2 Sample t.., luego completamos los datos como se ve en la figura y clickeamos ok, ok u1- u2 H1 s1 s2 1 x 2 x 1= 2 n2 n1
  • 47. t=0,68 T(0,05;10)=1,812 Zona de rechazo HoZona de Aceptación Ho Nota: Note que Assume equal viariances está activado esto se hace cuando las varianzas de las poblaciones son iguales Two-Sample T-Test and CI Sample N Mean StDev SE Mean 1 10 80,0 18,0 5,7 2 15 70,0 22,0 5,7 Difference = mu (1) - mu (2) Estimate for difference: 10,0000 90% CI for difference: (-4,3630; 24,3630) T-Test of difference = 0 (vs not =): T-Value = 1,19 P-Value = 0,245 DF = 23 Both use Pooled StDev = 20,5278 Conclusión: Como (p-value = 0,245) > (α = 0,1) luego se acepta Ho. Ejercicio 2. Para contrastar si mediante el proceso B se disminuye el tiempo de ejecución de ciertos trabajos respecto del A, se ejecutaron 6 tareas con ambos procesos obteniéndose los siguientes tiempos, medidos en horas: A 2,5 7,1 5 8,5 7 8,1 B 2,3 7,1 4 8 6,6 5 Admitiéndose normalidad y con un nivel de confianza del 95% ¿qué conclusión puede derivarse de estos datos?. Suponer que ambos procesos tienen la misma variabilidad. Solución. Ho: μA – μB ≤ 0 (Con el proceso B no se disminuye el tiempo de ejecución) H1: μA – μB > 0 (Con el proceso B se disminuye el tiempo de ejecución) 37,6 6 1,875,851,75,2 A x 5,5 6 56,6841,73,2 B x 25,2 16 2 )37,6(6) 2 )1,8( 2 )7( 2 )5,8( 2 )5( 2 )1,7( 2 )5,2(( A s 13,2 16 2 )5.5(8) 2 5 2 6,6 2 8 2 4 2 1,7 2 3,2( B s t(0,05,10) = 1,812 una cola 68,0 6 1 6 1 6928.0 5,537,6 11 B n A n s B x A x t
  • 48. 6928.0 266 13.2)5(25.2)5( 2 )1()1( 2222 BA BBAA nn snsn Conclusión: En la gráfica vemos que t=0,68 esta en la zona de aceptación de la Ho, luego Con el proceso B no se disminuye el tiempo de ejecución En MINITAB Primero ingresamos los datos en la columna C1 (XA) y C2 (XB) como en la figura Y ejecutamos las opciones Stat/Basic statistics/2 Sample t.., luego completamos los datos como se ve en la figura y clickeamos ok, ok Aquí los resultados. Two-Sample T-Test and CI: XA; XB Two-sample T for XA vs XB N Mean StDev SE Mean XA 6 6,37 2,25 0,92 XB 6 5,50 2,13 0,87 Difference = mu (XA) - mu (XB) Estimate for difference: 0,866667 95% lower bound for difference: -1,427686 T-Test of difference = 0 (vs >): T-Value = 0,68 P-Value = 0,255 DF = 10 Both use Pooled StDev = 2,1926 Conclusión. Como (p-value=0,255)>(α =0,05) se acepta Ho. Ejercicio 3. Se quiere saber el trabajo afecta el rendimiento académico de los estudiantes de una especialidad, para ello se evalúa a dos grupos independientes de estudiantes, supóngase que las poblaciones son normales. El grupo 1 es el de estudiantes que trabajan y el grupo 2 es el de estudiantes que no trabajan, los datos obtenidos en la investigación son los siguientes. G1 5 12 8 11 12 13 8 11 G2 10 10 16 17 15 16 14 16
  • 49. Con un nivel de significancia de 0.01, puede afirmarse que el trabajo disminuye el rendimiento académico. Solución 1: media de estudiantes que trabajan 2: media de estudiantes que no trabajan Primero: No se conocen las 1 y 2 además no sabemos si son o no iguales, para determinar si son iguales aplicamos la prueba de la varianza. Ho: 1 / 2 = 1 (la varianzas son iguales) H1: 1 / 2 ≠ 1(la varianzas no son iguales) Aplicamos Minitab Los resultados fueron Test for Equal Variances: g1, g2 99% Bonferroni confidence intervals for standard deviations N Lower StDev Upper g1 8 1.53600 2.72554 8.09028 g2 8 1.55800 2.76457 8.20614 F-Test (normal distribution) Test statistic = 0.97, p-value = 0.971 Levene's Test (any continuous distribution) Test statistic = 0.00, p-value = 1.000 Como (p.value=1)>0.01 se acepta la Ho, o sea que las varianzas de las poblaciones son iguales. Además S1=2.73 Sha=2.76 Segundo. Como son iguales las 1 y 2 aplicamos la prueba de student con varianza combinada. 2 1 1 1 21 nn s xx t Hipótesis Ho: 1 - 2 = 0 (el rendimiento académico no disminuye) H1: 1 - 2 < 0 (el rendimiento académico disminuye) Aplicando Minitab tenemos. Two-Sample T-Test and CI: g2, g1 Two-sample T for g2 vs g1 N Mean StDev SE Mean g2 8 14.25 2.76 0.98 g1 8 10.00 2.73 0.96
  • 50. 2 2 2 1 2 1 2121 )( n s n s uxx t Difference = mu (g2) - mu (g1) Estimate for difference: 4.25000 99% upper bound for difference: 7.85228 T-Test of difference = 0 (vs <): T-Value = 3.10 P-Value = 0.996 DF = 14 Both use Pooled StDev = 2.7451 Nota: aquí hemos puesto g2 primero y luego g1, porque Sha>s1 Luego como (p-value=0.004)< ( =0.01) se rechaza Ho, o sea que el trabajo diminuye el rendimiento académico de los estudiantes. Ejercicio 4. Se determinó la contaminación de dos ríos A y B de una ciudad analizando el PH de 100 ml de agua, el río A esta ubicado en una zona industrial y el río B esta ubicada en una zona rural. Se dice que el agua no esta contaminada si su PH esta cercano a 7 Los datos encontrados fueron Río n x Sha A 5 5 0.7 B 5 7 0.07 Con un =0.05 se desea saber si el río A esta más contaminado que B. Las distribuciones son normales, pero no se sabe si las varianzas son iguales. Solución Primero. Debemos determinar si las varianzas son iguales. Utilizamos la comparación de varianzas Test for Equal Variances 95% Bonferroni confidence intervals for standard deviations Sample N Lower StDev Upper 1 5 0.468406 0.836660 2.89447 2 5 0.148123 0.264575 0.91531 F-Test (normal distribution) Test statistic = 10.00, p-value = 0.047 Como (p-valor=0.047) < 0.05 se rechaza Ho, luego las distribuciones No son iguales. Como 1≠ 2 utilizamos la distribución Ho: 1 = 2 (El río A no esta más contaminado que el río B) H1: 1 < 2 (El río A esta más contaminado que el río B)
  • 51. Según minitab tenemos Two-Sample T-Test and CI Sample N Mean StDev SE Mean 1 5 5.000 0.700 0.31 2 5 7.0000 0.0700 0.031 Difference = mu (1) - mu (2) Estimate for difference: -2.00000 95% upper bound for difference: -1.32930 T-Test of difference = 0 (vs <): T-Value = -6.36 P-Value = 0.002 DF = 4 Como p-value=0.002 < 0.05 luego se rechaza Ho, es decir el río A está mas contaminado que el río B. Ejercicio 5. Dieciocho plantas de una misma variedad de naranjos fueron tratadas con fertilizantes. A nueve de ellas se les aplicó una cierta dosis de nitrógeno (N) y al resto una de nitrógeno y fósforo (NP). Se midió el rendimiento en Kg. por planta; los resultados obtenidos fueron: N: X = 28 kg S² = 9 NP: X = 21 kg S² = 7 Interesa conocer si existen diferencias significativas entre los rendimientos de las plantas tratadas con los dos tipos de fertilizante. (α = 0,01). Suponga varianzas iguales Solución: H0 : µ N = µ NP H1 : µ N µ NP Dado que las variancias poblacionales son iguales, de las cuales S²N y S²NP son estimaciones, se calcula la variancia amalgmada. Si el supuesto no fuera válido debería verificarse primeramente la homogeneidad de variancia a través del test F, en particular si las muestras de las poblaciones no son iguales. Donde 828427.2 299 7)19(9)19( 2 )1()1( 21 2 22 2 11 nn snsn s 25.5 9 2 828427.2 )2128( 11 )()( NPN NPNNPN nn s XX t El valor tabulado de t, para 16 grados de libertad y nivel de significación del 1% es igual a ± 2,921. Como el valor de la estadística calculada supera al valor tabulado, se rechaza H0 . Conclusión existen diferencias estadísticamente significativas entre los tratamientos, siendo superior el promedio por planta de naranjo, de aquellas que reciben el tratamiento NP. Ejercicio 6. Se quiso probar si la cirrosis de hígado hacia variar el índice de actividad de la colinesterasa en suero. Se eligieron dos muestras aleatorias e independientes de individuos. Los resultados fueron: Individuos normales n1=20 8,11 x S1=0,4 Individuos cirroticos n2=25 66,02 x S2=0,2
  • 52. La cirrosis de hígado, ¿hace variar el índice de la colinesterasa en suero? Solución: Primero. Debemos determinar si las varianzas son iguales. Utilizamos la comparación de varianzas Test for Equal Variances 95% Bonferroni confidence intervals for standard deviations Sample N Lower StDev Upper 1 20 0.293052 0.4 0.619718 2 25 0.150964 0.2 0.292749 F-Test (Normal Distribution) Test statistic = 4.00, p-value = 0.002 Como (p-valor=0.002) < 0.05 se rechaza Ho, luego las distribuciones No son iguales. Como 1 ≠ 2 utilizamos la distribución 2 2 2 1 2 1 2121 )( n S n S xx t 2 1 1 1 1 2 2 2 2 2 2 1 2 1 1 2 2 2 1 2 1 n S nn S n n S n S gl Hipótesis: H0: 21 (No varía) H1: 21 (Varía) Según Minitab tenemos Two-Sample T-Test and CI Sample N Mean StDev SE Mean 1 20 1.800 0.400 0.089 2 25 0.660 0.200 0.040 Difference = mu (1) - mu (2) Estimate for difference: 1.1400 95% CI for difference: (0.9386, 1.3414) T-Test of difference = 0 (vs not =): T-Value = 11.64 P-Value = 0.000 DF = 26 Como P-Value = 0,000 < 0,05 luego se rechaza Ho, es decir el índice de la colinesterasa en suero no hace variar la cirrosis de hígado. Ejercicio 7. Muchos autores afirman que los pacientes con depresión tienen una función cortical por debajo de lo normal debido a un riego sanguíneo cerebral por debajo de lo normal. A dos muestras de individuos, unos con depresión y otros normales, se les midió un índice que indica el flujo sanguíneo en la materia gris (dado en mg/(100g/min)) obteniéndose:
  • 53. Depresivo n1=19 471 x S1=7,8 Normales n2=22 8,532 x S2=6,1 ¿Hay evidencia significativa a favor de la afirmación de los autores? Solución: Primero. Debemos determinar si las varianzas son iguales. Utilizamos la comparación de varianzas Test for Equal Variances 99% Bonferroni confidence intervals for standard deviations Sample N Lower StDev Upper 1 19 5.27061 7.8 13.9551 2 22 4.22499 6.1 10.3540 F-Test (Normal Distribution) Test statistic = 1.64, p-value = 0.279 Como (p-valor=0.279) < 0.05 se rechaza Ho, luego las distribuciones No son iguales. Como 1 ≠ 2 utilizamos la distribución 2 2 2 1 2 1 2121 )( n S n S xx t 2 1 1 1 1 2 2 2 2 2 2 1 2 1 1 2 2 2 1 2 1 n S nn S n n S n S gl Hipótesis: H0: 21 (función cortical Normal) H1: 21 (Función cortical por debajo de lo normal) Según Minitab tenemos Two-Sample T-Test and CI Sample N Mean StDev SE Mean 1 19 47.00 7.80 1.8 2 22 53.80 6.10 1.3 Difference = mu (1) - mu (2) Estimate for difference: -6.80 95% lower bound for difference: -10.54 T-Test of difference = 0 (vs >): T-Value = -3.07 P-Value = 0.998 DF = 33 Como P-Value = 0,998 > 0,05 luego se acepta Ho, es decir no hay evidencia significativa a favor de la afirmación de los autores. Ejercicio 8. Un fabricante de llantas para bicicleta afirma que sus llantas duran más que los de la competencia, para ello se tomaron 5 llantas y la duración promedio fue de 60.000 kilómetros y una varianza de 100. 6 llantas de la competencia arrojo un tiempo promedio de duración de 58000
  • 54. kilómetros y una varianza de 90. Si las poblaciones se consideran normales de varianzas desconocidas diferentes ¿tiene razón el fabricante? Utilice un nivel de confianza del 99%. Solución: Fabricante n1 = 5 600001 x V1 = 100 Competencia n2 = 6 580002 x V2 = 90 Utilizamos la distribución 2 2 2 1 2 1 2121 )( n S n S xx t 2 1 1 1 1 2 2 2 2 2 2 1 2 1 1 2 2 2 1 2 1 n S nn S n n S n S gl Hipótesis: H0: 21 (No duran más) H1: 21 (Duran más) Según Minitab tenemos Two-Sample T-Test and CI Sample N Mean StDev SE Mean 1 5 60000.0 10.0 4.5 2 6 58000.00 9.49 3.9 Difference = mu (1) - mu (2) Estimate for difference: 2000.00 99% lower bound for difference: 1982.86 T-Test of difference = 0 (vs >): T-Value = 338.01 P-Value = 0.000 DF = 8 Como P-Value = 0,000 < 0,01 luego se rechaza Ho, es decir que si tiene razón el fabricante que sus llantas duran más. 9.4.4 EJERCICIOS PROPUESTOS Ejercicio 1. Se mide la longitud de animales machos y hembras y se desea conocer si las longitudes son diferentes. Machos 44 48 36 32 51 45 54 56 Hembras 32 40 44 44 34 30 26 Ejercicio 2. Los pesos netos de las botellas de una muestra que llenó una máquina fabricada por Blue y los pesos netos en una muestra de botellas llenadas por una máquina similar que manufactura Red, Inc. fueron los siguientes: Blue: 5 8 7 6 9 7 Red: 8 10 7 11 9 12 14 9 Pruebe al nivel de significación de 0.05 que el peso medio de las botellas que llena la máquina que fabrica Red es mayor.
  • 55. Ejercicio 3. Una muestra de las calificaciones que presentaron hombres y mujeres en un examen de Estadística se sintetiza a continuación: Hombres Mujeres Media muestral 11,33 10,50 Desviación estándar 3,45 2,35 Tamaño de la muestra 6 8 ¿Son las calificaciones promedios iguales, o por el contrario, existe alguna diferencia entre ellas? Responda a esta pregunta con una prueba estadística de hipótesis que tenga un nivel de confianza del 99%. Ejercicio 4. Un profesor está comparando las notas de dos secciones de Estadística. Ambas secciones tuvieron 60 estudiantes, pero el profesor quiere una conclusión rápida, fundamentado en una muestra pequeña. Así que observó en su planilla las siguientes calificaciones: Sección “A”: 12 05 13 16 15 10 Sección “B”: 09 12 11 10 10 11 ¿Se puede concluir, dentro de un nivel de confianza del 95%, que el promedio de notas de las dos secciones es igual? Ejercicio 5. Para dos tipos de combustibles de automóvil se tomó el rendimiento por galón de cada uno y se presenta a continuación: Combustible A: 45 67 54 41 38 59 48 31 59 31 50 Combustible B: 79 82 69 84 76 77 81 65 73 70 69 Con base en la información anterior se puede concluir que el rendimiento promedio del combustible B es superior al rendimiento del combustible A? Utilice un nivel de significancia del 1%. Ejercicio 6. Se desea analizar si existen diferencias en el contenido de proteínas del salmón y el atún enlatados. Para ello se tomaron dos muestras de 7 unidades para cada uno de los dos productos y se realizó la determinación del contenido proteico en lo mismo. Los resultados se presentan a continuación: Contenido de proteínas en porcentaje Salmón 22.4 24.5 23.0 27.1 24.2 25.7 26.4 Atún 28.3 26.4 25.2 24.7 26.3 25.3 24.9 Esta información es suficiente para decir que ambos pescados enlatados tienen el mismo contenido de proteína? Ejercicio 7. Se comparan dos insecticidas A y B, pero como los niveles de interpretación son muy variados en la plantación, se fumigó cada planta con ambos productos aplicándolos al azar en cada mitad de la planta. Al tiempo se seleccionaron 10 hojas en cada mitad de cada planta fumigada y se registró el número medio de insectos por hoja. Los datos son los siguientes: Planta 1 2 3 4 5 6 7 8 Insecticida A 1.3 0.8 3.5 1.2 5.1 4.3 10.7 1.4 Insecticida B 2.1 1.5 3.9 1.8 5.0 5.4 12.9 1.1 a) Analizar la información planteando una prueba t de muestras apareadas. b) Considerar ahora a las muestras como independientes (no apareadas) y aplicar la prueba t para esta situación. c) Compare los resultados obtenidos, comente sobre las ventajas y desventajas de uno y otro procedimiento.
  • 56. Ejercicio 8. Al medir el diámetro transversal del corazón de los adultos del sexo masculino y femenino se obtuvieron los siguientes resultados: Grupo Tamaño de muestra Media muestral (cm) S en cm Hombres 12 13,21 1,05 Mujeres 9 11 1,01 Suponga que las varianzas de las dos poblaciones son iguales. ¿Proporcionan estos datos suficiente evidencia que indique que el diámetro transversal promedio del corazón de los hombres es igual al de las mujeres? Tome un nivel de significancia del 5% Ejercicio 9. Se desea comparar la actividad motora espontánea de un grupo de 25 ratas control y otro de 36 ratas desnutridas. Se midió el número de veces que pasaban delante de una célula fotoeléctrica durante 24 horas. Los datos obtenidos fueron los siguientes: Ratas de control n1=25 8,8691 x S1=106,7 Ratas desnutridas n2=36 4652 x S2=153,7 ¿Se observan diferencias significativas entre el grupo control y el grupo desnutrido? Ejercicio 10. Se quiso probar si la cirrosis de hígado hacia variar el índice de actividad de la colinesterasa en suero. Se eligieron dos muestras aleatorias e independientes de individuos. Los resultados fueron: Individuos normales n1=20 8,11 x S1=0,4 Individuos cirroticos n2=25 66,02 x S2=0,2 La cirrosis de hígado, ¿hace variar el índice de la colinesterasa en suero? Ejercicio 11. Los siguientes datos corresponden a la longitud medida en centímetros de 18 pedazos de cable sobrantes en cada rollo utilizado: 9, 3,41, 6,13, 1,99, 6,92, 3,12, 7,86, 2,01, 5,98, 4,15, 6,87, 1,97, 4,01, 3,56, 8,04, 3,24, 5,05, 7,37. Basados en estos datos ¿podemos decir que la longitud media de los pedazos de cable es mayor de 4 cm? Suponga población normal y tome el nivel de significancia 0,05. Ejercicio 12. Un agrónomo mide el contenido promedio de humedad en cierta variedad de trigo que fue secado especialmente en una muestra de 16 toneladas: 7,2, 6,8, 7,3, 7, 7,3, 7,3, 7,5, 7,3, 7,4, 7,2, 7,6, 7,1, 7,4, 6,7, 7,4, 6,9. Si el promedio de humedad excede de 7,1 el secado debe continuar. ¿Debería continuarse con el proceso de secado, de acuerdo con esta evidencia? Tome un nivel de significancia del 5%. Ejercicio 14. Se quiere medir el rendimiento de un automóvil, para ello se determinó el número de km por galón de gasolina, los resultados fueron 45 67 54 41 38 59 48 31 59 31 Con esta información se puede concluir que el rendimiento promedio del combustible es superior a 50 km/galón? Utilice un nivel de significancia del 1%. Ejercicio 15. Se presume que el consumo de gerentes por año es igual a 20 mil dólares, para ello se tomó la siguiente información de una muestra de 11 Gerentes: Consumo anual en miles de $: 36 22 26 18 22 14 34 25 25 18 18 Con base en los resultados anteriores considera que la presunción es cierta.
  • 57. n S Dd t d n d d i 1 22 n dnd S i d n s td n s td d nd d n 1,2/1,2/ 9.5 PRUEBAS DE HIPÓTESIS PARA MEDIAS: MUESTRAS DEPENDIENTES 9.5.1 INTRODUCCIÓN Las muestras dependientes o apareadas aparecen como distintas observaciones realizadas sobre los mismos individuos. Dos muestras son dependientes cuando se obtienen de sujetos comunes. También se denominan muestras apareadas o equiparadas. Un ejemplo de observaciones apareadas consiste en considerar a un conjunto de n personas a las que se le aplica un tratamiento y se mide por ejemplo el nivel de estrés antes X1 y después del tratamiento X2; la producción de una maquina en el turno mañana x1 y la producción de la misma máquina en el turno tarde x2. En las pruebas de datos pareados no hay necesidad de suponer que las dos poblaciones de que se trata tienen varianzas iguales. Las hipótesis a considerar: Hipótesis Caso I Caso II Caso III Ho: μd ≤ D Ho: μd = D Ho: μd ≥ D H1 : μd > D H1 : μd ≠ D H1 : μd < D 3.5.2 SUPUESTOS 1. Las observaciones de las muestras son aleatorios 2. Las muestras deben tener distribuciones normales Prueba estadísticas Intervalo de Confianza. Del 100(1- )% para la diferencia de medias poblacionales d es de la forma: Donde: µd : Media de las diferencias poblacional d : Media de la diferencia de los datos de las muestras apareadas Sd : Desviación estándar de las diferencias de los datos de las muestras apareadas n : Número de pares de datos
  • 58. 95,3 )031()( 846.7 10 81.24 d d t t(0,05;9)=1,8331 t=3,9 Zona de rechazo HoZona de Aceptación Ho n S d t d d 9.5.3 EJERCICIOS RESUELTOS Ejercicio 1. Se pretende demostrar que cierto tratamiento practicado durante un mes, ayuda a reducir el colesterol. Para ello se realiza un estudio con una muestra aleatoria simple de 10 personas. Los resultados se muestran a continuación. Antes 200 210 330 240 260 300 245 210 190 225 Después 150 200 275 250 200 250 200 180 190 205 ¿Que podemos concluir de estos datos. Solución: Obsérvese que las mediciones se realizan sobre las mismas personas, por tanto no tenemos dos muestras aleatorias independientes, sino una sola, en la cual lo que nos interesa es la diferencia producida entre el colesterol antes del tratamiento y después del mismo. Para ello introducimos una nueva variable que expresa la diferencia existente entre el colesterol antes del tratamiento y después del mismo: D = Xant − Xdes Antes 200 210 330 240 260 300 245 210 190 225 Después 150 200 275 250 200 250 200 180 190 205 Diferencia 50 10 55 -10 60 50 45 30 0 20 Encontrar evidencia a favor de que el tratamiento surgen el efecto deseado (baja el colesterol) es lo mismo que encontrar evidencia estadísticamente significativa en el contraste: Ho: μd = 0 H1 : μd > 0 Esto es de nuevo un contraste para una media, que se realiza sobre la variable diferencia. El estadístico que usamos es: De tablas tenemos que: t(0,05;9) = 1, 8331, para un α=5% y n-1=9 grados de libertad Luego si suponemos que la hipótesis nula es cierta y que la variable diferencia sigue una distribución normal de parámetros desconocidos, tenemos: 31 10 200...10551050 d , 81.24 1 22 n dnd d S Conclusión: El valor experimental se encuentra claramente en la región de rechazo por tanto concluimos que existe evidencia estadísticamente significativa en contra de la hipótesis nula (se rechaza) y a favor de la hipótesis alternativa (al menos con un nivel de significación del 5%). En MINITAB Ejecutamos las opciones Stat/Basic statistics/ Paired t.., luego completamos los datos como se ve en la figura y clickeamos ok, ok
  • 59. Se obtiene los siguientes resultados Paired T-Test and CI: Antes; Después Paired T for Antes - Despise N Mean StDev SE Mean Antes 10 241,000 45,019 14,236 Despise 10 210,000 37,491 11,856 Difference 10 31,0000 24,8104 7,8457 95% lower bound for mean difference: 16,6179 T-Test of mean difference = 0 (vs > 0): T-Value = 3,95 P-Value = 0,002 De aquí concluimos que (pvalue=0,002)<(α=0,05) entonces se rechaza Ho. Ejercicio 2. Un fabricante deseaba comparar la resistencia al desgaste de dos tipos distintos de neumáticos A y B. Para hacer la comparación, se asignó al azar un neumático del tipo A y uno del tipo B a las ruedas posteriores de 20 automóviles. Los autos recorrieron un número específico de kilómetros y se observó el desgaste de cada neumático. Estos valores aparecen en la siguiente tabla. A 10.6 9.8 12.3 9.7 8.8 10 9.9 9 12.1 8.9 10.1 11 11.8 9.9 12.2 12.3 10.5 8.8 8.6 9.2 B 10.2 9.4 11.8 9.1 8.3 10.1 9.2 11.2 11 8.2 10.1 10 10.3 10.4 11.1 11.3 9.3 8.5 10.3 11 Presentan los datos suficiente evidencia para concluir que hay diferencia en el desgaste promedio de los dos tipos de neumáticos? Solución A 10.6 9.8 12.3 9.7 8.8 10 9.9 9 12.1 8.9 10.1 11 11.8 9.9 12.2 12.3 10.5 8.8 8.6 9.2 B 10.2 9.4 11.8 9.1 8.3 10.1 9.2 11.2 11 8.2 10.1 10 10.3 10.4 11.1 11.3 9.3 8.5 10.3 11 d 0.4 0.4 0.5 0.6 0.5 -0.1 0.7 -2.2 1.1 0.7 0 1 1.5 -0.5 1.1 1 1.2 0.3 -1.7 -1.8 24.0 20 )8.1()7.1(3.0...5.04.04.0 d , d =0, 7.4)8.1()7.1(...4.04.0d 2 )8.1( 2 )7.1(... 2 5.0 2 4.0 2 4.0 2 d 21.6
  • 60. 64.4 20 04.1 6.21 n S d t d d 04.1 19 2 )7.4(20)6.21( 1 22 n dnd d S Hipótesis Ho: μd = 0 (no hay diferencia) H1: μd ≠ 0 (hay diferencia) De la tabla t de estuden para dos colas, para un =0.05 ( /2=0.025) t(0.025,19)= 2.093 Como (t(0.025,19)= 2.093 < t=4.64) se rechaza la Ho. Luego hay suficiente evidencia que hay diferencia en el desgaste de los neumáticos. Ejercicio 3. Un grupo de empresarios desean conocer la diferencia que hay entre el rendimiento de un galón de gasolina del mismo octanaje entre dos establecimientos de servicio A y B. para esto contrataron a un Ingeniero que haga el estudio, este asignó al azar un galón de la estación A y un galón de la estación B a 9 automóviles. Los autos recorrieron a una determinada velocidad hasta consumir totalmente el galón de gasolina. Estos valores aparecen en la siguiente tabla Auto 1 2 3 4 5 6 7 8 9 Est A 32 28 29.7 28 27 29 27 31 28.9 Est B 31 32.2 30.2 31.1 30.8 30 30.2 30.2 31.0 Si las poblaciones son normales, presentan los datos suficiente evidencia para concluir que hay diferencia en el rendimiento de la gasolina según establecimiento. Solución Hipótesis HO : 1= 2 (No hay diferencia de rendimiento) H1 : 1≠ 2 (hay diferencia de rendimiento) Aplicando minitab. Paired T-Test and CI: A, B Paired T for A - B N Mean StDev SE Mean A 9 28.9556 1.7133 0.5711 B 9 30.8222 0.7710 0.2570 Difference 9 -1.86667 2.02176 0.67392 95% CI for mean difference: (-3.42073, -0.31261) T-Test of mean difference = 0 (vs not = 0): T-Value = -2.77 P-Value = 0.024 Según los datos, se tiene que (p–value = 0.024 < 0.05), entonces rechazamos Ho, luego hay diferencia de rendimientos.