Arquitectura Moderna Walter Gropius- Frank Lloyd Wright
PruebasHipótesisMuestra
1. PruebasPruebas dede hiphipóótesistesis parapara
unauna muestramuestra
Ref:Ref:
Apuntes de Estadística, Mtra Leticia de la Torre
Instituto Tecnológico de Chiuhuahua
2. Las secciones anteriores han mostrado cómo puede estimarse un parámetro
de una población a partir de los datos contenidos en una muestra. Puede
encontrarse ya sea un sólo número (estimador puntual) o un intervalo de
valores posibles (intervalo de confianza).
Sin embargo, muchos problemas de ingeniería, ciencia, y administración,
requieren que se tome una decisión entre aceptar o rechazar una
proposición sobre algún parámetro de la población.
Esta proposición recibe el nombre de hiphipóótesistesis. Este es uno de los
aspectos más útiles de la inferencia estadística, puesto que muchos tipos de
problemas de toma de decisiones, pruebas o experimentos en el mundo de
la ingeniería, pueden formularse como problemas deproblemas de prueba deprueba de
hiphipóótesistesis.
3. Una hiphipóótesis estadtesis estadíísticastica es una proposición o supuesto
sobre los parámetros de una o más poblaciones.
Empecemos con un ejemplo, suponga que se tiene interés en la rapidez de
combustión de un agente propulsor sólido utilizado en los sistemas de salida
de emergencia para la tripulación de aeronaves. El interés se centra sobre la
rapidez de combustión promedio. De manera específica, el interés recae en
decir si la rapidez de combustión promedio es o no 50 cm/s. Esto puede
expresarse de manera formal como dos alternativas o hipótesis:
Ho; μ = 50 cm/s La rapidez promedio sí es de 50 cm/s
H1; μ ≠ 50 cm/s La rapidez promedio no es de 50 cm/s
La proposición Ho; μ = 50 cm/s se conoce como hipótesis nula (PENSAR:
NO HAY DIFERENCIA) , mientras que la proposición H1; μ ≠ 50 cm/s, recibe
el nombre de hipótesis alternativa (PENSAR: SÍ HAY DIFERENCIA).
4. Ahora bien, se podría considerar sólo una dirección en el caso en la
hipótesis alternativa o sea que la hipótesis alternativa especifique valores de
μμ que pueden ser mayores o menores que 50 cm/s, esto también se conoce
como hiphipóótesis alternativa de una cola o unilateraltesis alternativa de una cola o unilateral. En algunas situaciones,
lo que se desea es formular una hipótesis alternativa unilateral, como en los
casos:
Ho; μ = 50 cm/s
H1; μ > 50 cm/s
o
Ho; μ = 50 cm/s
H1; μ < 50 cm/s
5. Es importante recordar que las hiplas hipóótesis siempre son proposicionestesis siempre son proposiciones
sobre la poblacisobre la poblacióón o distribucin o distribucióón bajo estudio, non bajo estudio, no proposicionesproposiciones
sobre la muestrasobre la muestra.
Por lo general, el valor del parámetro de la población especificado en la
hipótesis nula se determina en una de tres maneras diferentes:
1. Puede ser resultado de la experiencia pasada o del conocimiento del
proceso, entonces el objetivo de la prueba de hipótesis usualmente es
determinar si ha cambiado el valor del parámetro.
2. Puede obtenerse a partir de alguna teoría o modelo que se relaciona
con el proceso bajo estudio. En este caso, el objetivo de la prueba de
hipótesis es verificar la teoría o modelo.
3. Cuando el valor del parámetro proviene de consideraciones externas
tales como las especificaciones de diseño o ingeniería, o de
obligaciones contractuales. En esta situación, el objetivo usual de la
prueba de hipótesis es probar el cumplimiento de las especificaciones.
6. Un procedimiento que conduce a una decisión sobre una hipótesis en
particular recibe el nombre de prueba de hipprueba de hipóótesistesis. Los procedimientos
de prueba de hipótesis dependen del empleo de la información contenida en
la muestra aleatoria de la población de interés.
Si esta información es consistente con la hipótesis, se concluye que ésta es
verdadera; sin embargo si esta información es inconsistente con la
hipótesis, se concluye que esta es falsa.
Debe hacerse hincapié en que la verdad o falsedad de una hipótesis en
particular nunca puede conocerse con certidumbre, a menos que pueda
examinarse a toda la población.
Usualmente esto es imposible en muchas situaciones prácticas. Por tanto, es
necesario desarrollar un procedimiento de prueba de hipótesis teniendo en
cuenta la probabilidad de llegar a una conclusión equivocada.
7. La hiphipóótesis nulatesis nula, representada por HoHo, es la afirmación sobre una o más
características de poblaciones que al inicio se supone cierta (es decir, la
“creencia a priori”).
La hiphipóótesis alternativatesis alternativa, representada por HH11, es la afirmación
contradictoria a Ho, y éésta generalmente es la hipsta generalmente es la hipóótesis a investigartesis a investigar.
La hipótesis nula se rechaza en favor de la hipótesis alternativa, sólo si la
evidencia muestral sugiere que Ho es falsa. Si la muestra no contradice
decididamente a Ho, se continúa creyendo en la validez de la hipótesis
nula. Entonces, las dos conclusiones posibles de un análisis por prueba de
hipótesis son:
Rechazar HoRechazar Ho
oo
No rechazar Ho.No rechazar Ho.
8. Prueba de una HipPrueba de una Hipóótesistesis
Para ilustrar los conceptos generales, considere el problema anterior de la
rapidez de combustión. La hipótesis nula podría ser que la rapidez promedio
de combustión es 50 cm/s, mientras que la hipótesis alternativa es que ésta
no es igual a 50 cm/s. Esto es, como se mencionó al principio, lo que se
desea probar es:
Ho; μ = 50 cm/s
H1; μ ≠ 50 cm/s
Supóngase que se realiza una prueba sobre una muestra de 10
especímenes, y que se observa cual es la rapidez de combustión promedio
muestral. La media muestral es un estimador de la media verdadera de la
población. Un valor de la media muestral que esté próximo al valor
hipotético μμ = 50 cm/s es una evidencia de que el verdadero valor de la
media μμ es realmente 50 cm/s; esto es, que apoya la hipótesis nula Ho. Por
otra parte, una media muestral muy diferente de 50 cm/s constituye una
evidencia que apoya la hipótesis alternativa H1. Por tanto, en este caso, la
media muestral es el estadístico de prueba.
x
9. La media muestral puede tomar muchos valores diferentes. Supóngase que
si 48.5 ≤ ≤ 51.5, entonces no se rechaza la hipótesis nula Ho; μ = 50
cm/s, y que si x < 48.5 ó x >51.5, entonces se acepta la hipótesis
alternativa H1; μ ≠ 50 cm/s.
Los valores de que son menores que 48.5 o mayores que 51.5
constituyen la regiregióón crn crííticatica de la prueba, mientras que todos los valores
que están en el intervalo 48.5 ≤ ≤ 51.5 forman la regiregióón den de
aceptaciaceptacióón de la hipn de la hipóótesis nulatesis nula. Las fronteras entre las regiones crítica y
de aceptación reciben el nombre de valores crvalores crííticosticos.
La costumbre es establecer conclusiones con respecto a la hipótesis nula
Ho. Por tanto, se rechaza Ho en favor de H1 si el estadístico de prueba cae
en la región crítica, de lo contrario, no se rechaza Ho.
¿Puedes ver la similitud
de esto con los
intervalos de confianza?
x
x
x
10. Este procedimiento de decisión puede conducir a una de dos conclusiones
erróneas. Por ejemplo, es posible que el valor verdadero de la rapidez
promedio de combustión del agente propulsor sea igual a 50 cm/s. Sin
embargo, para todos los especímenes bajo prueba, bien puede observarse
un valor del estadístico de prueba que cae en la región crítica. En este
caso, la hipótesis nula Ho será rechazada en favor de la alternativa H1
cuando, de hecho, Ho en realidad es verdadera.
Este tipo de conclusión equivocada se conoce como error tipoerror tipo I.
El errorerror tipotipo II se define
como el rechazo de la
hipótesis nula Ho cuando
ésta es verdadera.
x
11. Para probar si cometemos un error del tipo Ierror del tipo I consideramos un “nivel de
significancia” que nos ayuda a determinar lala probabilidad de cometerprobabilidad de cometer
este tipo de erroreste tipo de error..
A este nivelA este nivel se denomina con la letrase denomina con la letra αα.
Si tuviéramos un nivel de confianza del 95% (0.95) entonces el nivel de
significancia sería del 5% (0.05).
Nivel de confianza = (1- α)α)
Análogamente si se tiene un nivel de confianza del 90% entonces el nivel de
significancia sería del 10%.
12. Ahora supóngase que la verdadera rapidez promedio de combustión es
diferente de 50 cm/s, aunque la media muestral x cae por error de
muestreo dentro de la región de aceptación.
En este caso se acepta Ho cuando ésta es falsa.
Este tipo de conclusión recibe el nombre de error tipo IIerror tipo II.
El error tipo II se define
como la aceptación de la
hipótesis nula
cuando ésta es falsa.
A la probabilidad de tener un error de tipo II se denomina con lA la probabilidad de tener un error de tipo II se denomina con laa
letraletra ββ..
13. Tipos de Pruebas de HipTipos de Pruebas de Hipóótesistesis
Como mencionamos antes, se pueden presentar dos tipos de pruebas de
hipótesis que son:
1. De dos colas, o bilateral.
2. De una cola, o uniilateral.
Este último puede ser de cola derecha o izquierda.
Ho; μ = 50
H1; μ ≠ 50
Ho; μ = 50
H1; μ > 50 H1; μ < 50
14. El tipo de prueba depende de lo que se necesite probar.
1. De una cola derecha.
El investigador desea comprobar la hipótesis de un valor mayor en el
parámetro que el de la hipótesis nula, en este caso el nivel de
significancia se carga todo hacia el lado derecho, para definir las
regiones de aceptación y de rechazo.
Prueba de hipótesis:
Ho; Dato ≤ x
H1; Dato > x
Región de aceptación
de Ho
Región de rechazo
de Ho = αα
15. 2. De una cola izquierda:
El investigador desea comprobar la hipótesis de que el parámetro sea
menor que el de la hipótesis nula, en este caso el nivel de significancia
se carga todo hacia el lado izquierdo, para definir las regiones de
aceptación y de rechazo.
Prueba de hipótesis:
Ho; Parámetro ≥ x
H1; Parámetro < x Región de aceptación
de Ho
Región de rechazo
de Ho= αα
16. De dos colas:
El investigador desea comprobar la hipótesis de un cambio en el parámetro,
es decir, no importa si es mayor o menor y lo que se busca es si hay
diferencia con el valor planteado. El nivel de significancia se divide en
dos y existen dos regiones de rechazo.
Prueba de hipótesis:
Ho; Parámetro = x
H1; Parámetro ≠ x Región de aceptación
de Ho
Región de rechazo
de Ho= αα/2/2 Región de rechazo
de Ho= αα/2/2
17. SelecionaSeleciona lala probabilidadprobabilidad de errorde error tipotipo I:I: αα
((nivelnivel de significancia).de significancia).
EncuentraEncuentra el valorel valor estadestadíísticostico crcrííticotico correspondientecorrespondiente ((zzαα enen
lala tablatabla de lade la distribucidistribucióónn normalnormal estestáándarndar oo ttαα en laen la
distribucidistribucióónn t de student).t de student).
CalculaCalcula el valor delel valor del estadestadíísticostico parapara lala muestramuestra
Si Z o tSi Z o t caecae en elen el rangorango crcrííticotico zzαα ,,ttαα entoncesentonces,, rechazarechaza HH00
UnaUna ReglaRegla parapara RechazarRechazar HH00
18. EJEMPLOS.
1.1. Una muestra aleatoria de 100 muertes registradas en Estados Unidos el
año pasado muestra una vida promedio de 71.8 años. Suponga una
desviación estándar poblacional de 8.9 años. Queremos probar si la
vida media hoy en día es mayor a 70 años con base en esa muestra. La
muestra parecería indicar que es así pero ¿Cuál es la probabilidad de
que la media de la muestra no refleje la verdadera media de la
población?
Utilizar un nivel de significancia de 0.05.
Solución:
Se trata de una distribución muestral de medias con desviación estándar
conocida.
1.Datos:
μμ =70 años
s = 8.9 años
= 71.8 años
n = 100
α = 0.05
x
19. 2. Establecemos la hipótesis
Ho; μ = 70 años.
H1; μ > 70 años.
3. Nivel de significancia
αα = 0.05, zzαα = 1.645
4. Regla de decisión:
Si zz ≤ 1.645 no se rechaza Ho.
Si zz > 1.645 se rechaza Ho.
5. Cálculos:
6. Decisión y justificación.
Como 2.02 >1.645 se rechaza Ho y se concluye con un nivel de significancia
del 0.05 que la vida media hoy en día es mayor que 70 años.
0.4
0.3
0.2
0.1
0.0
X
Density
1.64
0.05
0
Distribution Plot
Normal, Mean=0, StDev=1
20. 22. Una empresa eléctrica fabrica baterías de celular que tienen una duración
que se distribuye de forma aproximadamente normal con una media de
800 horas y una desviación estándar de 40 horas. Si una muestra
aleatoria de 30 baterías tiene una duración promedio de 788 horas,
¿muestran los datos suficiente evidencia para decir que la duración
media no es 800? Utilice un nivel de significancia del 0.04.
Solución:
1. Se trata de una distribución muestral de medias con desviación estándar
poblacional conocida. Por lo tanto usamos la distribución normal.
2. Datos:
μ =800 horas
s = 40 horas
= 788 horas
n = 30
α = 0.04
x
21. 3. Prueba de hipótesis.
Como a la empresa no le preocupa si la duración es igual o mayor a su
propuesta, entonces las hipótesis a plantear son:
Ho; μ ≥ 800 horas
H1; μ < 800 horas
4. Nivel de significancia
a = 0.04, zzaa = -1.75
0.4
0.3
0.2
0.1
0.0
z
Density
0.04
0-1.75
Distribution Plot
Normal, Mean=0, StDev=1
22. 5. Regla de decisión:
Si zz ≥ -1.75 no se rechaza Ho.
Si zz < -1.75 se rechaza Ho.
6. Cálculos:
7. Decisión y justificación
Como -1.643 ≥ -1.75 por lo tanto, no se rechaza Hono se rechaza Ho y se concluye con un
nivel de significancia del 0.04 que la duración media de las baterías no
ha cambiado.
0.4
0.3
0.2
0.1
0.0
z
Density
0.04
0-1.75
Distribution Plot
Normal, Mean=0, StDev=1
23. Muestras pequeMuestras pequeññasas
Para el caso de muestras pequePara el caso de muestras pequeññas (nas (n <<
30)30), el procedimiento a seguir es similar al, el procedimiento a seguir es similar al
anterior, con la diferencia que empleamosanterior, con la diferencia que empleamos
la distribucila distribucióón t den t de studentstudent
24. Ejemplos:
1. El Instituto Eléctrico Edison publica cifras del número anual de
Kilowatt-hora que gastan varios aparatos eléctrodomésticos. Se afirma
que una aspiradora gasta un promedio de 46 kilowatt-hora al año. Si una
muestra aleatoria de 12 hogares que se incluye en un estudio indica que
las aspiradoras gastan un promedio de 42 kilowatt-hora al año con una
desviación estándar de 11.9 kilowatt-hora, ¿esto sugiere con un nivel de
significancia de 0.05 que las aspiradoras gastan, en promedio, menos de
46 kilowatt-hora anualmente? Suponga que la población de kilowatt-hora
es normal.
Solución:
1. Datos:
μ= 46 kilowatt-hora
s= 11.9 kilowatt-hora
= 42 kilowatt-hora
n = 12
α = 0.05
x
25. 2. Prueba de hipótesis
HoHo; μ = 46 kilowatt-hora
H1H1; μ < 46 kilowatt-hora
3. Valores críticos
tc para 0.95 (α = 0.05)
con 11 grados de libertad
4. Regla de decisión:
Si t ≥ -1.796 No se rechaza HoHo
Si t < -1.796 Se rechaza HoHo
0.4
0.3
0.2
0.1
0.0
XDensity
-1.796 0
0.05
Distribution Plot
T, df=11
26. 5. Cálculo del valor t para los datos
6. Decisión y justificación :
Como –1.16 > -1.796, por lo tanto no se rechaza Ho y se concluye con un
nivel de significancia del 0.05 que el número promedio de kilowatt-hora
que gastan al año las aspiradoras no es significativamente menor que 46.
0.4
0.3
0.2
0.1
0.0
X
Density
-1.796 0
0.05
Distribution Plot
T, df=11
42 46
1.16
11.9
12
x
t
s
n
μ− −
= = = −
27. ¿¿CuCuááll eses elel mmááximoximo dede probabilidadprobabilidad dede errorerror tipotipo
II ((αα)) queque estarestarííamosamos dispuestosdispuestos aa aceptaraceptar??
NivelNivel dede significanciasignificancia αα
Región de rechazo
de Ho= αα
28. SiSi σσ eses conocidaconocida y losy los datosdatos sonson normalesnormales,, aplicamosaplicamos elel TeoremaTeorema
deldel LLíímitemite Central yCentral y dependiendodependiendo de lode lo queque sese deseadesea probarprobar::
HH00:: µµ == µµ 00 HHaa:: µµ << µµ00 unauna colacola izquierdaizquierda
HH00:: µµ == µµ 00 HHaa:: µµ >> µµ00 unauna colacola derechaderecha
HH00:: µµ == µµ 00 HHaa:: µµ ≠≠ µµ00 dos colasdos colas
PruebasPruebas de Hipde Hipóótesistesis en generalen general
Se compara con zα/2 ó zα
n
x
z
σ
μ0−
=
29. Recordando que:
La estadística de la prueba t tiene una distribución t de
student con n-1 grados de libertad.
Cuando n > 30, se puede usar la tabla de la distribución normal
en vez de la t.
Usamos la prueba tt con lacon la desviación estándar de la muestra:
y se compara con tα/2 ó tαn
s
x
t 0μ−
=
Si σ es desconocida (la desviación estándar de la población), pero
tenemos datos distribuídos de forma normal y n ≤ 30.
30. Es laEs la probabilidadprobabilidad dede observarobservar un valorun valor extremoextremo de lade la estadestadíísticastica aa
pruebaprueba sisi sese suponesupone queque lala hiphipóótesistesis nulanula eses ciertacierta..
SiSi HH00 eses ciertacierta, y la, y la alternativaalternativa eses HHaa:: µµ<< µµ00 ¿¿CuCuááll eses lala probabilidadprobabilidad dede
observarobservar z <z < --2.41?2.41?
El área desde z = -2.41 hacia el extremo
nos da un valor de
0.00798 por lo que
ese es el valor de p.
Valor p de laValor p de la pruebaprueba
0.4
0.3
0.2
0.1
0.0
X
Density
-2.41 0
0.00798
Distribution Plot
Normal, Mean=0, StDev=1
31. -1.7293
P(t<-1.7293) = .05
Si t < -1.7293 se rechaza
HH00 al nivel αα del 5%5% de
significancia.
Pero también se puede
comparar el valor de pp
directamente con el de
α (= 0.05)α (= 0.05).
Si pp es menor que αα se
rechaza HH00 al nivel del
5%5% de significancia.
-t.05 = -1.7293
EjemploEjemplo dede empleoempleo del valor p.del valor p.
El área color amarillo sería
el valor p para una t = - 2.41,
puede verse que es menor al
área azul que es la región
crítica. Eso implica que un
valor de t = - 2.41 rechaza la
hipótesis nula.
-2.41
33. 1. Una muestra aleatoria de 64 bolsas de hojuelas de maíz pesan, en
promedio 5.23 onzas con una desviación estándar de 0.24 onzas. El
fabricante quiere poner en la etiqueta que el peso promedio es de 5.5
onzas. Probar la hipótesis de que μ ≥ 5.5 onzas contra la hipótesis
alternativa, μ < 5.5 onzas con un nivel de significancia de 0.05.
SoluciSolucióónn.
Se trata de una distribución muestral de medias con desviación estándar
desconocida, pero como el tamaño de muestra es mayor a 30 se puede
tomar la desviación muestral como un estimador puntual para la
poblacional.
DatosDatos:
μ= 5.5 onzas
s= 0.24 onzas
= 5.23 onzas
n = 64
α = 0.05
x
34. Prueba de hipPrueba de hipóótesistesis
Ho; μ ≥ 5.5 onzas
H1; μ < 5.5 onzas
Regla de decisiRegla de decisióón:n:
Si Z ≥ -1.645 No se rechaza Ho
Si Z < -1.645 Se rechaza Ho
Cálculos
5 23 5 5
9
0 24
64
. .
.
x
z
s
n
μ− −
= = = −
35. JustificaciJustificacióón y decisin y decisióón:n:
Como –9 < -1.645 por lo tanto se rechaza Ho y se concluye con un nivel de
significancia del 0.05 que las bolsas de hojuelas de maíz pesan en promedio
menos de 5.5 onzas.
2. Un constructor afirma que se instalan calefactores en 70% de todas las
casas que se construyen hoy en día en la ciudad de Richmond. ¿Estaría de
acuerdo con esta afirmación si una investigación de casas nuevas en esta
ciudad muestra que 8 de 15 tienen instaladas calefactores ? Utilizar un
nivel de significancia de 0.10.
SoluciSolucióónn.
Se trata de una distribucidistribucióón muestral de proporcionesn muestral de proporciones y una prueba de dos
colas.
DatosDatos:
P= 0.70
p = 8/15 = 0.5333
n = 15
α = 0.10
Como nP ≥ 5 y n(1-P)
casi 5, 30 podemos
usar la z
36. Prueba de hipPrueba de hipóótesistesis
Ho; P = 0.70
H1; P ≠ 0.70
Regla de DecisiRegla de Decisióón:n:
Si –1.7613 ≤ t ≤ 1.7613 No se rechaza Ho
Si Z < -1.7613 ó si Z > 1.7613 Se rechaza Ho
CCáálculos:lculos:
0 533 0 70
1 41
1 0 70 0 30
15
. .
.
( ) ( . )( . )
p P
t
P P
n
− −
= = = −
−
t= -1.7613 t=1.7613
37. DecisiDecisióón y justificacin y justificacióón:n:
Como –1.7613≤ -1.41 ≤ 1.7613 No se rechaza Ho y se concluye con un
nivel de significancia de 0.10 que la afirmación del constructor es cierta.
38. 3. Una lata de 12 onzas de refresco se diseña para que contenga una
cantidad ligeramente mayor que 12 onzas, de tal manera que si excede este
volúmen no hay problemas. Sin embargo, un volúmen menor a 12 onzas
ocasiona que los consumidores demanden al fabricante. En el proceso
normal de producción, el fabricante supone que μ es igual o mayor a 12
onzas. Suponiendo que se prueba una muestra de 45 latas y se encuentra
un volúmen promedio de 10.5 onzas con una desviación estándar de 2
onzas, establecer si se puede afirmar con un nivel de significancia de 0.01
que el fabricante está en lo correcto.
SoluciSolucióónn
Se trata de una distribución de medias con n > 30.
Datos:
μ= 12
=10.5
s = 2
n = 45
α = 0.01
x
39. Prueba de hipPrueba de hipóótesistesis
Ho; μ ≥ 12 onzas
H1; μ < 12 onzas
Regla de decisiRegla de decisióón:n:
Si Z ≥ -2.326 No se rechaza Ho
Si Z < -2.326 Se rechaza Ho
CCáálculos:lculos:
Zα=-2.326
α =0.01
10 5 12 0
5 03
2
45
. .
.
x
z
s
n
μ− −
= = = −
40. JustificaciJustificacióón y decisin y decisióón:n:
Como –5.03 < - 2.326 por lo tanto se rechaza Ho y se concluye con un nivel
de significancia del 0.01 que no se pude afirma que las latas tengan un
volumen de 12 onzas en promedio.
4. Resolver el problema anterior considerando un nivel de significancia de
0.05.
SoluciSolucióónn
Mismos datos excepto α = 0.05
Mismas hipótesis
Mismos cálculos
Encontramos que el valor crítico de Z es ahora Zα = -1.649, por lo que el
resultado anterior no se altera ya que –5.03 < - 1.649, por lo tanto la
Ho también se rechaza a un nivel de significancia de 0.05