Prueba de hipótesis

PRUEBA DE HIPÓTESIS ÁLVARO VALENCIA OROZCO

PRUEBA DE HIPÓTESIS

La estadística inferencial es el proceso de usar la información de una muestra para describir
el estado de una población. Sin embargo es frecuente que usemos la información de una
muestra para probar un reclamo o conjetura sobre la población. El reclamo o conjetura se
refiere a una hipótesis. El proceso que corrobora si la información de una muestra sostiene
o refuta el reclamo se llama prueba de hipótesis.
HIPÓTESIS Y NIVELES DE SIGNIFICANCIA
En la prueba de hipótesis se pone a prueba un reclamo hecho sobra la naturaleza de una
población a base de la información de una muestra. El reclamo se llama hipótesis estadística.

Hipótesis Estadística: Una hipótesis estadística es un reclamo hecho sobre la
naturaleza de una población.
Por ejemplo, la premisa formulada por un productor de baterías para autos de que su batería
dura en promedio 48 meses, es una hipótesis estadística porque el manufacturero no
inspecciona la vida de cada batería que él produce.
Si surgieran quejas de parte de los clientes, entonces se pone a prueba el reclamo del
manufacturero. La hipótesis estadística sometida a prueba se llama la hipótesis nula, y se
denota como H0.
COMO ESTABLECER LA HIPÓTESIS NULA Y LA ALTERNA
Hipótesis Nula (H0): premisa, reclamo, o conjetura que se pronuncia sobre la naturaleza
de una o varias poblaciones.
Por ejemplo, para probar o desaprobar el reclamo pronunciado por el productor de baterías
debemos probar la hipótesis estadística de que 48. Por lo tanto, la hipótesis nula es:
H0 : 48.
Luego se procede a tomar una muestra aleatoria de baterías y medir su vida media. Si la
información obtenida de la muestra no apoya el reclamo en la hipótesis nula (H0), entonces
otra cosa es cierta. La premisa alterna a la hipótesis nula se llama hipótesis alterna y se
representa por H1.

Hipótesis Alterna: Una premisa que es cierta cuando la hipótesis nula es falsa.

Por ejemplo, para el productor de baterías
H0 : 48 y
H1 : < 48

Para probar si la hipótesis nula es cierta, se toma una muestra aleatoria y se calcula la
información, como el promedio, la proporción, etc. Esta información muestral se llama
estadística de prueba.

Estadística de Prueba: Una estadística de prueba se basa en la información de la muestra
como la media o la proporción.

ERROR TIPO 1 Y ERROR TIPO 2

A base de la información de una muestra nosotros podemos cometer dos tipos de errores en
nuestra decisión.
1. Podemos rechazar un H0 que es cierto.


2. Podemos aceptar un H0 que es falso.
El primero se llama error Tipo 1
Error Tipo 1: Cuando rechazamos una Hipótesis Nula que es cierta cometemos error tipo 1.

Y el segundo error se llama error Tipo 2.
Error Tipo 2: Cuando aceptamos una Hipótesis Nula que es falsa cometemos error tipo 2.

NIVEL DE SIGNIFICANCIA ( )

Para ser muy cuidadosos en no cometer el error tipo 1, debemos especificar la probabilidad
de rechazar H0, denotada por . A ésta se le llama nivel de significancia.

Nivel de Significancia: La probabilidad ( más alta de rechazar H0 cuando H0 es cierto
se llama nivel de significancia.
Comentario: Para mantener la probabilidad de cometer el error tipo 1 baja, debemos
escoger un valor pequeño de .

Usando un valor preasignado de se construye una región de rechazo o región crítica en
la curva normal estándar o en la curva t que indica si debemos rechazar H0.

Región Crítica o de Rechazo: Una región crítica o de rechazo es una parte de la curva
de z o de la curva t donde se rechaza H0.
La región puede ser de una cola o de dos dependiendo de la hipótesis alterna.

Ejemplos Para H1: > valor aceptado, la región de rechazo está dada por:

(cola derecha, z ó t)

Para H1 : < valor aceptado, la región de rechazo está dada por:

(cola izquierda, z ó t)

Para H1 : valor aceptado, la región de rechazo es de dos colas y está dada
por:

(2-colas, z ó t)
/2 /2

Ejemplo 1: Determine si la región de rechazo es de la cola derecha, de la cola izquierda o de
dos colas.
a. H0 : = 15, H1 : 15, =.05

b. H0 : p 0.7, H1 : p > 0.7, =.02


Solución: La forma de la región de rechazo está determinada por la hipótesis alterna.
a. H1 : 15 significa que la región está en ambas colas.

.05/2 .05/2

b. H1 : p > 7 significa que la región está en la cola derecha.

.02

Ejemplo 2: En el Ejemplo 1a, presumamos que la región de rechazo es parte de la curva
normal estándar. Complete el dibujo de la región crítica para los valores
siguientes:
a. = .05
Solución:
a. Del ejemplo 1(a), tenemos:

De la tabla de la distribución normal,
.05/2=0.025 .05/2=0.025
la P(Z z) =.025 corresponde a un
valor Z= -1.96. Por simetría la
-1.96 1.96 P(Z>z)=.025 corresponde a Z= 1.96.

Ejemplo 3: En el ejemplo 1a, presumamos que la región de rechazo es parte de la curva t.
Complete el dibujo de la región de rechazo para:
a. = .05 y = 14

Solución:
a. Del ejemplo 1(a), = .05, y = 14, tenemos:

De la tabla de la distribución t, la
.05/2=0.025 .05/2=0.025 P(T t) =.025 corresponde a un valor
t= -2.086. Por simetría la
-2.086 2.086 P(T>t)=.025 corresponde a t= 2.086.

Ejemplo 4: Establezca las hipótesis nula y alterna.
a. Las millas por galón (mpg) promedio de un nuevo modelo de automóvil es
32.
b. Más del 65% de los empleados de un colegio aportan a Fondos Unidos.
c. En promedio, los empleados de cierta compañía viven a no más de 15 millas
de la misma.


d. Al menos un 60% de la población adulta de una comunidad votará en las
próximas elecciones Presidenciales.
e. El peso promedio de un pollo para asar es de al menos cuatro libras.
Solución:
a. H0 : = 32 b. H0 : p .65 c. H0 : 15
H1 : 32 H1 : p .65 H1 : > 15

d. H0 : p .6 e. H0 : 4
H1 : p < .6 H1 : <4

EJERCICIOS

En los ejercicios (1-6) determine si la región de rechazo para la hipótesis nula está en la cola
izquierda, en la cola derecha, o ambas colas. Para el nivel de significancia dibuje la región
de rechazo.

1. H0 : 11; H1 : > 11 2. H0 5.8; H1 : < 5.8

3. H0 : p = 0.4; H1 : p 0.4 4. H0 : = 110; H1 : 110

5. H0 : p 0.3; H1 : p < 0.3 6. H0 : p 0.8; H1 : p < 0.8

En los ejercicios (7 - 18) complete la región de rechazo (encuentre el valor de z y t).

7. a) z, si = .05 b) t, si = .025 y =9

8. a) z, si = .01 b) t, si = .05 y = 13

9. a) z, si = .02 b) t, si = .01 y =5

10. a) z, si = .025 b) t, si = .01 y =9

11. a) z, si = .05 b) t, si =.05 y = 10
/2 /2


12. a) z, si = .01 b) t, si =0.1 y =7
/2 /2

En los ejercicios (13 - 18) establezca las hipótesis nula y alterna.

13. Los automóviles estacionados en el estacionamiento de periodo prolongado del
aeropuerto internacional de Bogotá permanecen un promedio de 2.5 días.

14. Una nueva marca de llantas radiales dura en promedio más de 48,000 millas.

15. El balance promedio de una cuenta de cheques en el First State Bank es de al menos
$150 dólares.

16. Se reclama que al menos el 60% de las compras realizadas en cierta tienda por
departamentos son artículos de especiales.

17. Se reclama que el 20% de los graduados de cierto colegio privado solicitan admisión a
escuelas de medicina.

18. Un dentista reclama que el 5% de sus pacientes sufren enfermedades en las encías.

PRUEBA DE HIPÓTESIS PARA UNA MUESTRA

INTRODUCCION
Dentro del estudio de la inferencia estadística, se describe como se puede tomar una muestra
aleatoria y a partir de esta muestra estimar el valor de un parámetro poblacional en la cual se puede
emplear el método de muestreo y el teorema del valor central lo que permite explicar cómo a partir
de una muestra se puede inferir algo acerca de una población, lo cual nos lleva a definir y elaborar
una distribución de muestreo de medias muestrales que nos permite explicar el teorema del límite
central y utilizar este teorema para encontrar las probabilidades de obtener las distintas medias
maestrales de una población.
Pero es necesario tener conocimiento de ciertos datos de la población como la media, la desviación
estándar o la forma de la población, pero a veces no se dispone de esta información.
En este caso es necesario hacer una estimación puntual que es un valor que se usa para estimar un
valor poblacional. Pero una estimación puntual es un solo valor y se requiere un intervalo de valores
a esto se denomina intervalo de confianza y se espera que dentro de este intervalo se encuentre el
parámetro poblacional buscado. También se utiliza una estimación mediante un intervalo, el cual es
un rango de valores en el que se espera se encuentre el parámetro poblacional
En nuestro caso se desarrolla un procedimiento para probar la validez de una aseveración acerca de
un parámetro poblacional este método es denominado Prueba de hipótesis para una muestra.

HIPOTESIS Y PRUEBA DE HIPOTESIS
Tenemos que empezar por definir que es una hipótesis y que es prueba de hipótesis.
Hipótesis es una aseveración de una población elaborado con el propósito de poner a prueba, para
verificar si la afirmación es razonable se usan datos.
En el análisis estadístico se hace una aseveración, es decir, se plantea una hipótesis, después se hacen
las pruebas para verificar la aseveración o para determinar que no es verdadera.
Por tanto, la prueba de hipótesis es un procedimiento basado en la evidencia muestral y la teoría de
probabilidad; se emplea para determinar si la hipótesis es una afirmación razonable.


Prueba de una hipótesis: se realiza mediante un procedimiento sistemático de cinco paso:

Siguiendo este procedimiento sistemático, al llegar al paso cinco se puede o no rechazar la hipótesis,
pero debemos de tener cuidado con esta determinación ya que en la consideración de estadística no
proporciona evidencia de que algo sea verdadero. Esta prueba aporta una clase de prueba más allá de
una duda razonable. Analizaremos cada paso en detalle

Objetivo de la prueba de hipótesis.
El propósito de la prueba de hipótesis no es cuestionar el valor calculado del estadístico (muestral),
sino hacer
un juicio con respecto a la diferencia entre estadístico de muestra y un valor planteado del
parámetro.

Procedimiento sistemático para una prueba de hipótesis de una muestra
Paso 1: Plantear la hipótesis nula Ho y la hipótesis alternativa H1.
Cualquier investigación estadística implica la existencia de hipótesis o afirmaciones acerca de las
poblaciones que se estudian.
La hipótesis nula (Ho) se refiere siempre a un valor especificado del parámetro de población, no a una
estadística de muestra. La letra H significa hipótesis y el subíndice cero no hay diferencia. Por lo
general hay un "no" en la hipótesis nula que indica que "no hay cambio" Podemos rechazar o aceptar
Ho.
La hipótesis nula es una afirmación que no se rechaza a menos que los datos maestrales
proporcionen evidencia convincente de que es falsa. El planteamiento de la hipótesis nula siempre
contiene un signo de igualdad con respecto al valor especificado del parámetro.
La hipótesis alternativa (H1) es cualquier hipótesis que difiera de la hipótesis nula. Es una afirmación
que se acepta si los datos maestrales proporcionan evidencia suficiente de que la hipótesis nula es
falsa. Se le conoce también como la hipótesis de investigación. El planteamiento de la hipótesis
alternativa nunca contiene un signo de igualdad con respecto al valor especificado del parámetro.

Paso 2: Seleccionar el nivel de significancia.
Nivel de significancia: Probabilidad de rechazar la hipótesis nula cuando es verdadera. Se le denota
mediante la letra griega α, también es denominada como nivel de riesgo, este término es más
adecuado ya que se corre el riesgo de rechazar la hipótesis nula, cuando en realidad es verdadera.
Este nivel esta bajo el control de la persona que realiza la prueba.
Si suponemos que la hipótesis planteada es verdadera, entonces, el nivel de significación indicará la
probabilidad de no aceptarla, es decir, estén fuera de área de aceptación. El nivel de confianza
(1-α), indica la probabilidad de aceptar la hipótesis planteada, cuando es verdadera en la población.


La distribución de muestreo de la estadística de prueba se divide en dos regiones, una región de
rechazo (conocida como región crítica) y una región de no rechazo (aceptación). Si la estadística de
prueba cae dentro de la región de aceptación, no se puede rechazar la hipótesis nula.
La región de rechazo puede considerarse como el conjunto de valores de la estadística de prueba que
no tienen posibilidad de presentarse si la hipótesis nula es verdadera. Por otro lado, estos valores no
son tan improbables de presentarse si la hipótesis nula es falsa. El valor crítico separa la región de no
rechazo de la de rechazo.

Tipos de errores
Cualquiera sea la decisión tomada a partir de una prueba de hipótesis, ya sea de aceptación de la Ho o
de la H1, puede incurrirse en error:
Un error tipo I se presenta si la hipótesis nula Ho es rechazada cuando es verdadera y debía ser
aceptada. La probabilidad de cometer un error tipo I se denomina con la letra alfa α
Un error tipo II, se denota con la letra griega β se presenta si la hipótesis nula es aceptada cuando de
hecho es falsa y debía ser rechazada.
En cualquiera de los dos casos se comete un error al tomar una decisión equivocada.
En la siguiente tabla se muestran las decisiones que pueden tomar el investigador y las
consecuencias posibles.

Tabla 1. Consecuencias de las Decisiones en Pruebas de Hipótesis.

Situaciones Posibles
Decisiones Posibles La hipótesis nula es verdadera La hipótesis nula es falsa
Aceptar la Hipótesis Nula Se acepta correctamente Error tipo II

Rechazar la Hipótesis Nula Error tipo I Se rechaza correctamente

Para que cualquier ensayo de hipótesis sea bueno, debe diseñarse de forma que minimice los errores
de decisión. En la práctica un tipo de error puede tener más importancia que el otro, y así se tiene a
conseguir poner una limitación al error de mayor importancia. La única forma de reducir ambos
tipos de errores es incrementar el tamaño de la muestra, lo cual puede ser o no ser posible.
La probabilidad de cometer un error de tipo II denotada con la letra griega beta β, depende de la
diferencia entre los valores supuesto y real del parámetro de la población. Como es más fácil
encontrar diferencias grandes, si la diferencia entre la estadística de muestra y el correspondiente
parámetro de población es grande, la probabilidad de cometer un error de tipo II, probablemente sea
pequeña.
El estudio y las conclusiones que obtengamos para una población cualquiera, se habrán apoyado
exclusivamente en el análisis de una parte de ésta. De la probabilidad con la que estemos dispuestos


a asumir estos errores, dependerá, por ejemplo, el tamaño de la muestra requerida. Las
contrastaciones se apoyan en que los datos de partida siguen una distribución normal
Existe una relación inversa entre la magnitud de los errores α y β: conforme a aumenta, β disminuye.
Esto obliga a establecer con cuidado el valor de a para las pruebas estadísticas. Lo ideal sería
establecer α y β. En la práctica se establece el nivel α y para disminuir el Error β se incrementa el
número de observaciones en la muestra, pues así se acortan los limites de confianza respecto a la
hipótesis planteada .La meta de las pruebas estadísticas es rechazar la hipótesis planteada. En otras
palabras, es deseable aumentar cuando ésta es verdadera, o sea, incrementar lo que se llama poder
de la prueba (1- β) La aceptación de la hipótesis planteada debe interpretarse como que la
información aleatoria de la muestra disponible no permite detectar la falsedad de esta hipótesis.

Paso 3: Cálculo del valor estadístico de prueba
Valor determinado a partir de la información muestral, que se utiliza para determinar si se rechaza la
hipótesis nula., existen muchos estadísticos de prueba para nuestro caso utilizaremos los estadísticos
z y t. La elección de uno de estos depende de la cantidad de muestras que se toman, si las muestras
son de la prueba son iguales a 30 o más se utiliza el estadístico z, en caso contrario se utiliza el
estadístico t.

Tipos de prueba
a) Prueba bilateral o de dos extremos: la hipótesis planteada se formula con la igualdad
Ejemplo
H0 : µ = 200
H1 : µ ≠ 200

b) Pruebas unilateral o de un extremo: la hipótesis planteada se formula con ≥ o ≤
H0 : µ ≥ 200 H0 : µ ≤ 200
H1 : µ < 200 H1 : µ > 200

En las pruebas de hipótesis para la media (μ), cuando se conoce la desviación estándar (σ)
poblacional, o cuando el valor de la muestra es grande (30 o más), el valor estadístico de prueba es z
y se determina a partir de:


El valor estadístico z, para muestra grande y desviación estándar poblacional desconocida se
determina por la ecuación:

En la prueba para una media poblacional con muestra pequeña y desviación estándar poblacional
desconocida se utiliza el valor estadístico t.

Paso Formular la regla de decisión
SE establece las condiciones específicas en la que se rechaza la hipótesis nula y las condiciones en
que no se rechaza la hipótesis nula. La región de rechazo define la ubicación de todos los valores que
son tan grandes o tan pequeños, que la probabilidad de que se presenten bajo la suposición de que la
hipótesis nula es verdadera, es muy remota

Distribución muestral del valor estadístico z, con prueba de una cola a la derecha
Valor critico: Es el punto de división entre la región en la que se rechaza la hipótesis nula y la región
en la que no se rechaza la hipótesis nula.

Paso 5: Tomar una decisión.
En este último paso de la prueba de hipótesis, se calcula el estadístico de prueba, se compara con el
valor crítico y se toma la decisión de rechazar o no la hipótesis nula. Tenga presente que en una
prueba de hipótesis solo se puede tomar una de dos decisiones: aceptar o rechazar la hipótesis nula.
Debe subrayarse que siempre existe la posibilidad de rechazar la hipótesis nula cuando no debería
haberse rechazado (error tipo I). También existe la posibilidad de que la hipótesis nula se acepte
cuando debería haberse rechazado (error de tipo II).

Ejemplo en la cual se indica el procedimiento para la prueba de hipótesis

El jefe de la Biblioteca Especializada de la Facultad de Ingeniería Eléctrica y Electrónica de la UNAC
manifiesta que el número promedio de lectores por día es de 350. Para confirmar o no este supuesto
se controla la cantidad de lectores que utilizaron la biblioteca durante 30 días. Se considera el nivel
de significancia de 0.05
Datos:


Día Usuarios Día Usuarios Día Usuario
1 356 11 305 21 429
2 427 12 413 22 376
3 387 13 391 23 328
510 14 380 24 411
5 288 15 382 25 397
6 290 16 389 26 365
7 320 17 405 27 405
8 350 18 293 28 369
9 403 19 276 29 429
10 329 20 417 30 364

Solución: Se trata de un problema con una media poblacional: muestra grande y desviación estándar
poblacional desconocida.

Paso 01: Seleccionamos la hipótesis nula y la hipótesis alternativa
Ho: μ═350
Ha: μ≠ 350
Paso 02: Nivel de confianza o significancia 95%
α═0.05
Paso 03: Calculamos o determinamos el valor estadístico de prueba
De los datos determinamos: que el estadístico de prueba es t, debido a que el numero de muestras es
igual a 30, conocemos la media de la población, pero la desviación estándar de la población es
desconocida, en este caso determinamos la desviación estándar de la muestra y la utilizamos en la
formula reemplazando a la desviación estándar de la población.

Calculamos la desviación estándar muestral y la media de la muestra empleando Excel, lo cual se
muestra en el cuadro que sigue.

Columna1
Media 372.8
Error típico 9.56951578
Mediana 381
Moda 405
Desviación estándar 52.4143965
Varianza de la muestra 2747.26897
Curtosis 0.36687081
Coeficiente de asimetría 0.04706877
Rango 234
Mínimo 276
Máximo 510
Suma 11184
Cuenta 30
Nivel de confianza
(95.0%) 19.571868


x 372.8 350 22.8
Z 2.38
s 52.4 9.6
n 30
Paso 04: Formulación de la regla de decisión.
La regla de decisión la formulamos teniendo en cuenta que esta es una prueba de dos colas, la mitad
de 0.05, es decir 0.025, está en cada cola. el área en la que no se rechaza Ho está entre las dos colas, es
por consiguiente 0.95. El valor critico para 0.05 da un valor de Zc = 1.96.
Por consiguiente la regla de decisión: es rechazar la hipótesis nula y aceptar la hipótesis alternativa,
si el valor Z calculado no queda en la región comprendida entre -1.96 y +1.96, esto es
1.96 Z 1.96 . En caso contrario no se rechaza la hipótesis nula si Z queda entre -1.96 y +1.96.
Paso 05: Toma de decisión.
En este último paso comparamos el estadístico de prueba calculado en el paso 3 que es Z = 2.38 y lo
comparamos con el valor critico de Zc = 1.96. Como el estadístico de prueba calculado cae a la
derecha del valor critico de Z, se rechaza Ho. Por tanto no se confirma el supuesto del Jefe de la
Biblioteca.

Conclusiones:
Se rechaza la hipótesis nula (Ho), se acepta la hipótesis alterna (H1) a un nivel de significancia de
α = 0.05. La prueba resultó ser significativa.
La evidencia estadística no permite aceptar la aceptar la hipótesis nula.

CÁLCULO E INTERPRETACIÓN DE VALORES DE P

El valor de p es una medida de probabilidad. En concreto, se trata de la probabilidad de que la media
muestral sea como mínimo tan extrema (tan alta o tan baja) como la obtenida en realidad, siempre
que el valor hipotético de µ sea cierto. El valor de p mide la probabilidad de que, si la media
poblacional no es igual al valor hipotético, los resultados muestrales sean al menos tan extremos
como los realmente obtenidos en la muestra. Es decir, siempre con la condición de que la hipótesis
nula sea cierta, el valor de p mide la probabilidad de que los resultados muestrales sean:
1. Al menos tan altos o
2. Al menos tan bajos como los hallados en la muestra.

Algo más importante quizá es que “el valor de p es el valor más pequeño de al cual se puede
rechazar la hipótesis nula”.

El siguiente ejemplo ilustra el modo de calcular estos valores de p.

La mayor cadena de venta al por menor, WAL- MART, cifra en 15 millones de dólares sus ventas por
tienda.

A. Si se elige al azar una muestra de 120 tiendas y se hallan unas ventas promedio de 15.39
millones de dólares, con una desviación típica de 2.9 millones de dólares, será que se
encuentra respaldada la hipótesis de que μ =15 millones de dólares al nivel de significación
del 10%?.

Ho: µ=15
H1: µ


Región de rechazo Región de rechazo

Región de no rechazo

Ho: µ=15
Z = -1.65 Z = 1.65

Recuerde que el Z crítico, Z( , se obtiene en la tabla del apéndice II (Áreas bajo la curva
normal), y que para nuestro ejemplo corresponde a un área de 0,45 y por tanto Z = -1.65 y
Z = 1.65
2.9
xc 15 1.65 *
120
x c1 14.56
x c 2 15.44
REGLA DE DECISIÓN: No rechazar la hipótesis nula si 14.56 X 15.44 y rechazar la
hipótesis nula si X 14.56 o X 15.44
CONCLUSIÓN: No rechazar la hipótesis nula ya que se encuentra respaldada a ese nivel de
significancia

B. Calcular el valor de p asociado con estos datos.

15.39 15
Z test 1.47
2.9
120
Al buscar en el apéndice II encontramos que para Z = 1.47 se obtiene un área de 0.4292
Por tanto el valor de p será: p (0.5 0.4292) * 2 0.1416
“Y esto significa que la hipótesis nula será rechazada a niveles de significancia
superiores al 14.16%”

ERRORES DE TIPO I Y DE TIPO II EN UN CONTRASTE DE HIPÓTESIS

Si rechazamos una hipótesis cuando debiera ser aceptada, cometemos un error de tipo I, mientras
que si la aceptamos debiendo ser rechazada diremos que hemos cometido un error de tipo II.
Minimizar los errores no es una cuestión sencilla, un tipo suele ser más grave que otro y los intentos
de disminuir uno suelen producir el aumento del otro. La única forma de disminuir ambos a la vez es
aumentar el tamaño de la muestra.


La probabilidad de cometer un error de tipo I es el nivel de significación , la probabilidad de
cometer un error de tipo II depende del verdadero valor de µ y del tamaño de la muestra.
Los errores tipo I y tipo II están relacionados. Una disminución en la probabilidad de uno por lo
general tiene como resultado un aumento en la probabilidad del otro.
El tamaño de la región crítica, y por tanto la probabilidad de cometer un error tipo I, siempre se
puede reducir al ajustar el o los valores críticos.
Un aumento en el tamaño muestral n reducirá y de forma simultánea.
Si la hipótesis nula es falsa, es un máximo cuando el valor real del parámetro se aproxima al
hipotético. Entre más grande sea la distancia entre el valor real y el valor hipotético, será menor

El rechazo de una hipótesis nula cuando es cierta se denomina error de tipo I, y su probabilidad (que
es también el nivel de significancia) se simboliza como .

El hecho de que p sea muy bajo no califica el acontecimiento como imposible. Simplemente que tiene
poca probabilidad de ocurrir al azar. A la probabilidad de cometer error tipo I se la denomina
nivel de significación Habitualmente el investigador fija a priori el nivel de significación crítico
para rechazar Ho ( ). Si P es menor que , se rechaza. En caso contrario, se acepta Ho.

El hecho de aceptar una hipótesis nula cuando es falsa se denomina error de tipo II, y su probabilidad
se simboliza como . La probabilidad de cometer un tipo de error puede reducirse sólo si deseamos
incrementar la probabilidad de cometer el otro tipo de error. Con el propósito de obtener una baja,
tendremos que tolerar una alta. Los responsables de la toma de decisiones deciden el nivel de
significancia adecuado, al examinar los costos o desventajas vinculadas con ambos tipos de errores.

Una vez especificado el valor de el de queda fijado para cualquier tamaño de muestra
determinado. El valor de o probabilidad de cometer un error de tipo II, depende del valor
verdadero de µ. Si, por ejemplo, µ vale 100, existirá un determinado valor para . Pero si µ es en
realidad 110, existe un valor de diferente.

La pregunta se convierte entonces en ésta: si la hipótesis nula es falsa, cuál es la probabilidad de no
rechazarla y por consiguiente cometer un error de tipo II?.
Veámoslo con un ejemplo:
Para el ejemplo anterior si µ es en realidad 14.8 millones, cuál es la probabilidad de cometer un error
de tipo II?

P(error tipo II ) P(14.16 x 15.44)

Hallamos Z para cada uno de estos valores extremos
15.44 14.8
Z 2.42
2.9
120
que corresponde a un área de 0.4922 (Apéndice II, tabla de la distribución normal)


14.56 14.8
Z 0.91
2.9
120
que corresponde a un área de 0.3186 (Apéndice II, tabla de la distribución normal)

Por tanto P(error tipo II ) 0.4922 0.3186 0.8108 o 81.08%

Ejercicios

1. La mayor cadena de venta al por menor, WAL- MART, cifra en 15 millones de dólares sus
ventas por tienda. Si se elige al azar una muestra de 120 tiendas y se hallan unas ventas
promedio de 15.39 millones de dólares, con una desviación típica de 2.9 millones de dólares,
será que se encuentra respaldada la hipótesis de que μ =15 millones de dólares al nivel de
significación del 10%?.

2. Resuelva el ejercicio anterior, si la estimación de ventas se ha expresado así: “los ingresos
no superan los 15 millones de dólares por tienda”

3. Una revista especializada decía que la gente tardaba 34 horas de promedio en aprender un
nuevo programa informático. Está respaldada esta afirmación al nivel del 10% si 35
personas emplearan una media de 40.58 horas, con una desviación típica de 19.7 horas?

4. Un convenio trabajadores- dirección exige una producción media diaria de 50 unidades. Una
muestra de 150 días revela una media de 47.3 con una desviación típica de 5.7 unidades.
Poner α=5% y determinar si se cumple esta clausula del contrato.

5. Se utiliza una máquina para llenar latas de 18 onzas. Si la máquina funciona mal, tiene que
ser reajustada. Se elige una muestra de 500 latas, que dan una media de 18.9 onzas con una
desviación típica de 4.7 onzas. Para un nivel de significancia del 5% determine si se debe
reajustar la máquina.


6. En un artículo se debatía la creciente tendencia a que los empleados demanden a sus
empresas por incumplimiento de sus promesas en relación con algunos beneficios sanitarios
y concluía que el juicio medio se entablaba por 115000 dólares, Si 42 juicios dieron una
media de 114412 dólares con una desviación típica de 14000 dólares, determine si está
respaldada la hipótesis al nivel del 7%.

7. Un medicamento en estudio tiene que reducir en 13 puntos la presión sanguínea en
pacientes cardíacos antes de ser aceptado para uso general. En una prueba sobre 51
pacientes se redujo la presión en 12.2 puntos en promedio con una desviación típica de 2.3
puntos. Al nivel del 1% se debe aprobar este medicamento?

8. Los miembros de un club están desencantados por la decisión del dueño de un campo de
fútbol al limitar las reservas a un tiempo inaceptable. Afirman que cada partido dura en
promedio 2 horas. De 27 partidos recientes, se halló una media de 1.82 horas con una
desviación típica de 0.32 horas. El dueño del campo está dispuesto a retirar el límite de
tiempo si los miembros del club tiene la razón. A un nivel del 2%, cuál será la decisión?

9. Determine el nivel de significancia más pequeño para el cual se puede rechazar la hipótesis
nula en los ejercicios anteriores.

PRUEBA DE HIPOTESIS PARA LA PROPORCION
Frecuentemente se desea estimar la proporción de elementos que tienen una característica
determinada, en tal caso, las observaciones son de naturaleza cualitativa. Cuando se analiza
información cualitativa y se está interesado en verificar un supuesto acerca de la proporción
poblacional de elementos que tienen determinada característica, es útil trabajar con la
prueba de hipótesis para la proporción.

Así por ejemplo; un político puede estar interesado en conocer si ha habido un aumento en la
proporción (porcentaje) de votantes que lo favorecen en las próximas elecciones; un
productor de cereales puede querer conocer si ha ocurrido o no una baja en la proporción de
clientes que prefieren su marca de cereal; un hospital desea confirmar el reclamo de un
manufacturero de medicamentos quien afirma que éste cura al 80% de los usuarios. Estos
ejemplos son algunas de las situaciones donde nos interesa probar alguna afirmación
referente a una proporción. El procedimiento para probar una proporción en una población
normal es casi igual al usado para las medias.

La información que suele disponerse para la estimación de una porción real o verdadera
x
(porcentaje o probabilidad) es una proporción muestral , donde x es el número de veces
n
que ha ocurrido un evento en n ensayos. Por ejemplo, si en una muestra aleatoria de 600
compras realizadas en una tienda y 300 se realizan con tarjeta de crédito, entonces
x 300
0.50 se puede utilizar esa cifra como estimación de punto de la proporción real
n 600
de compras realizadas en ese negocio que se abonaron a tarjetas de crédito. De la misma
forma muchas compañías podrían estimar las proporciones de muchas transacciones. La
hipótesis alterna puede ser una de las alternativas usuales unilateral o bilateral tales
como: p p 0 , p p 0 , ..o.. p p 0 .


El proceso de prueba de hipótesis para la proporción poblacional p es muy similar al de μ. Un
valor Zc calculado a partir de la muestra se compara con un valor crítico de Z dados en las

p p x np
tablas. Zc se obtiene así: Zc . O también se puede utilizar: Zc
p.q npq
n
¿Cómo probar una proporción?
Podemos usar cualquiera de los siguientes métodos:
1. Método de la región de rechazo (Método 1) ó
2. Método del valor P (Método 2)

A. MÉTODO DE LA REGIÓN DE RECHAZO (MÉTODO 1)

Digamos que po es la proporción aceptada o reclamada.

Paso 1 Establezca las hipótesis. Ho : p = po
H1 : p > po ó
p < po ó
p po

Paso 2 Use el nivel de significancia ( ) y dibuje la región de rechazo en la curva normal
estándar (curva z).

/2 /2

z -z -z z
(H1: p > po) (H1: p < po) (H1: p po)

x
Paso 3 Calcule el valor z para la proporción muestral p usando la fórmula
n
p p0 p0 (1 p0 )
Z= , p
p n
Paso 4 Dibuje este valor de z en el diagrama de la región de rechazo (Paso 2).
Paso 5 Si el valor z cae dentro de la región de rechazo (sombreada), entonces rechace
Ho. Si cae fuera de la región sombreada, entonces no rechace Ho.

Paso 6 Escriba la conclusión de la prueba.

Ejemplo 1: Prueba la hipótesis H0 : po = 0.4

H1 : p 0.4

suponga que p = 0.45, n = 200, y = .01


Solución:
Paso 1 H0 : po = 0.4
H1 : p 0.4

Paso 2 Usando = .01, el diagrama de la región de rechazo es:

.005 .005

-2.575 2.575
Paso 3 Calculando el valor z para la proporción muestral p = 0.45, obtenemos:

0.4(1 0.4)
p 0.0346
200
0.45 0.4
Z= 1.45
0.0346
Paso 4 Dibujando z = 1.45 en el diagrama de la región de rechazo (Paso 2) obtenemos:

1.45

.005 .005

-2.575 2.575

Paso 5 Como el valor z está fuera de la región de rechazo (sombreada), por lo tanto no
rechazamos Ho.

Paso 6 La proporción en la población es 0.4.

B. MÉTODO DEL VALOR P (MÉTODO 2)

Dejemos que p0 sea la proporción aceptada o reclamada.

Paso 1 Establezca las hipótesis: H0 : p = p0
H1 : p > p0 ó
p < p0 ó
p p0

x
Paso 2 Calcule el valor z para la proporción muestral p usando la fórmula:
n
p p0 p0 (1 p0 )
Z= , donde p .
p n
Paso 3 Usando la hipótesis alterna dibuja la región bajo la curva z que representa los
valores extremos.


Valor P Valor P P/2 P/2

z -z -z z
(H1 : p > po) (H1 : p < po) (H1 : p po)

Paso 4 El valor P = al área de la cola sombreada (s) en el Paso 3.
Paso 5 Si el valor P < , entonces rechaza H0
Si el valor P , entonces no rechaces H0.

Paso 6 Escribe la conclusión de la prueba.

Ejemplo 1: Pruebe la hipótesis H0 : p = 0.4
H1 : p 0.4
Presuma que = 0.45, n = 200, y = 0.01.
Solución:
Paso 1 H0 : p = 0.4
H1 : p 0.4

Paso 2 Calculando el valor z de p , obtenemos
0.4(1 0.4)
p 0.0346
200
0.45 0.4
Z= 1.45
0.0346

Paso 3 La región bajo la curva z que contiene los valores extremos de Z es

P/2 P/2

-1.45 1.45
Paso 4 El valor P = suma de las áreas de las regiones sombreadas en el Paso 3.
= 2(el área a la derecha de 1.45)
= 2(0.5 – .4265)
= 0.147
Paso 5 Como el valor P es mayor que , entonces no podemos rechazar H0.

Paso 6 La proporción en la población es 0.4.

Ejercicios resueltos
1. Se afirma que, de todas las familias que salen de Cumana por lo menos el 30 % se
mudan a Maracaibo. Si una muestra de 600 mudanzas tomada al azar de los


registros de la Alcaldía de Cumana revela que de los permisos de mudanza
autorizados 153 fueron para Maracaibo, pruebe la hipótesis nula p = 0.30 contra la
hipótesis alternativa p < 30 con un nivel de significancia del 1 %.

SOLUCIÓN: Para calcular la proporción p lo primero que se ha de hacer es determinar la
proporción, luego se plantea una hipótesis unilateral con un nivel de significancia al 1%.

 153
n 600,.. p 0.255,.. p 0.30,..q 0.70,..Z 2.33,.x 153.
600
Hipótesis:

H0 : p 0.30
H1 : p 0.30
Regla de decisión o Región crítica: Se rechaza la Hipótesis nula si: Z c Z es
decir, Z c 2.33 .

Aplicando formula se tiene:

p p 0.255 0.300 0.045 0.045
Zc Zc 2.41
p.q 0.3x0.7 0.00035 0.0187
n 600
O también Aplicando:

x np 153 600(0.30) 153 180 27
Zc 2.41
npq 600(0.30)(0.70) 126 11,225

Conclusión: Como Z c es menor que Z , es decir, Z c 2.41 2.33 , se rechaza
H0 : p 0.30 con un nivel de significancia de 0.01. Esto se puede observar en la grafica
D en donde Zc 2.41 cae fuera del área de aceptación, por lo tanto, se cumple que
H1 : p 0.30 , es decir, menos del 30 % de las familias que salen de Cumana, se mudan a
Maracaibo.

Se recomienda al estudiante que aplique el método del valor p para solucionar el ejercicio.

2. Se sabe que el 10 % de los fumadores prefieren la marca de cigarrillo Malboro.
Después de una campaña publicitaria del cigarrillo Malboro, se entrevistaron a 200
fumadores para determinar la eficiencia de la campaña publicitaria. El resultado de
la muestra realizada detecto un total de 26 personas que fumaban Malboro.
¿Pueden considerarse que esos datos presentan evidencia suficiente para indicar
que hubo un aumento en la aceptación del cigarrillo Malboro. Obtenga las
conclusiones del planteamiento desarrollando un contraste de hipótesis con un nivel
de significancia del 5 %.

SOLUCIÓN: Para resolver el problema se plantea una hipótesis alternativa unilateral por la
derecha. Por tabla se sabe que al 5 % por la derecha Z 1,645 .


 26
Datos: p 0.10,..q 0.90...... p 0.13,..n 200.
200
Hipótesis:

H0 : p 0.10
H1 : p 0.10

Regla de decisión o Región crítica: Se rechaza la Hipótesis nula si Z c Z , es decir,
Zc 1,645 .


p p 0.13 0.10 0.03 0.03
Zc Zc 1.41
p.q 0.1x0.9 0.00045 0.02127
n 200

Conclusión: Como Z c es menor que Z , es decir, Z c 1.41 1.96 , se acepta
H0 : p 0.10 con un nivel de significancia de 0.05. Esto se puede observar en la grafica A
en donde Zc 1.41 cae dentro del área de aceptación, por lo tanto, el 10 % de los
fumadores prefieren Malboro, lo que indica que la campaña publicitaria no fue efectiva ya
que de haberlo sido se hubiese aceptado la hipótesis H1 : p 0.10.

3. Un fabricante de semiconductores produce controladores que se emplean en el
sistema eléctrico de vehículos. El cliente requiere que la proporción de
controladores defectuosos no sea mayor de 0.05, y que el fabricante demuestre estas
características del proceso de fabricación con este nivel de calidad, con un nivel de
significancia del 5 %. El fabricante de semiconductores toma una muestra aleatoria
de 200 dispositivos y encuentra que 4 de ellos son defectuosos. ¿El fabricante puede
demostrar al cliente la calidad exigida? Saque sus conclusiones.

SOLUCIÓN: para resolver el problema hay que plantear una hipótesis alternativa unilateral
de una cola por la izquierda es decir, p< 0.05 y para ello se busca en la tabla el valor de
Z ,..que..es..Z 1,645 .

Datos: p 0.05, q 0.95, p 4 200 0.02, n 200.

Hipótesis:

H0 : p 0.05
H1 : p 0.05

Regla de decisión o Región crítica: Se rechaza la Hipótesis nula si Z c Z ,es
decir, Z c 1,645 .



p p 0.02 0.05 0.03 0.03
Zc Zc 1.95
p.q 0.05x0.95 0.0002375 0.0154
n 200

Conclusión: Como Z c es menor que Z , es decir, Z c 1.95 1,645 , se rechaza
en donde Zc 1.95 cae fuera del área de aceptación, por lo tanto, H1 : p 0.05 se
acepta y se concluye que la proporción de artículos defectuosos es menor del 5 %, como
quería el cliente.

4. Se ha afirmado que por lo menos el 60 % de los alumnos de primero y segundo
semestre de un Tecnológico prefieren estudiar a partir de las dos de la madrugada.
Si 4 de una muestra de alumnos de primero y segundo semestre de n =14 tomadas al
azar, afirman estudiar a partir de las dos de la madrugada, pruebe con un nivel de
significancia del 5 % si se debe aceptar la hipótesis nula p≥0.60 contra la hipótesis
alternativa p<0.60.

Datos: p 0.60,..q 0.40,..n 14,..x 14,..nivel..de..significancia..al..0.05.

SOLUCIÓN: Por tabla al 0.05 de significancia se sabe que la hipótesis alternativa unilateral
por la izquierda es Z 1,645 .

Hipótesis:

H0 : p 0.60
H1 : p 0.60

Regla de decisión o Región crítica: Se rechaza la Hipótesis nula si Z c Z ,es
decir, Z c 1,645 .

x np 4 14(0.60) 4 8.40 4.4
Z 2.40
npq 14(0.60)(0.40) 3.36 1,833

Conclusión: Como Z c es menor que Z , es decir, Z c 2.40 1,645 , se rechaza
en donde Zc 2.40 cae fuera del área de aceptación, por lo tanto, H1 : p 0.60 se
acepta y se concluye que la proporción de estudiantes del primero y segundo semestre que
prefieren estudiar a partir de las dos de la madrugada es menor del 60 %.


EJERCICIOS

En los ejercicios (1-5) use el método de la región de rechazo para probar la hipótesis.

1. H0 : 0.6

H1 : p 0.6, x= 0.65, n = 100, y = 0.01

2. H0 : p = 0.29

H1 : p 0.29, x= 0.26, n = 90, y = 0.01

3. H0 : p = 0.36

H1 : p < 0.36, x = 0.34, n = 630, y = 0.05

4. Un manufacturero de juguetes Tailandés reclama que solo un 10% de los osos de
juguete hechos para hablar están defectuosos. Cuatrocientos de éstos juguetes se
sometieron a prueba de forma aleatoria y se encontró que 50 estaban defectuosos.
Pruebe el reclamo del manufacturero con un nivel de significancia de 5%.

5. Una agencia de empleos afirma que el 80% de todas las solicitudes hechas por
mujeres con hijos prefieren trabajos a tiempo parcial. En una muestra aleatoria de
200 solicitantes mujeres con niños, se encontró que 110 prefirieron trabajos a tiempo
parcial. Pruebe la hipótesis de la agencia con un nivel de significancia de 5%.

En los ejercicios (6 - 10) use el método del valor-p para pruebas de hipótesis.
6. H0 : p = 0.2

H1 : p > 0.2, x= 0.245, n = 400, y = 0.01

7. H0 : p = 0.55

H1 : p < 0.55, x = 175, n = 300, y = 0.05

8. H0 : p = 0.2

H1 : p 0.2, x = 235, n = 1000, y = 0.02

9. Nacionalmente, un 16 % de los hogares tiene una computadora personal. En una
muestra aleatoria de 80 hogares en Baltimore, solo 13 poseían una computadora
personal. Con un nivel de significancia de 5%, pruebe si el porciento de hogares en
Baltimore que tienen computadoras personales es menor que el porcentaje nacional.

10. El registrador de cierta universidad ha dicho que está dispuesto a permitir una
sección del curso ESTAD 121 una vez a la semana si más del 65% de los estudiantes
matriculados en el curso expresan que prefieren el curso una vez a la semana, en vez
de dos veces a la semana. En una muestra aleatoria de 40 estudiantes, 26 indicaron
su preferencia de una vez a la semana. Usando un nivel de significancia de 0.01, debe


el registrador autorizar el ofrecimiento del curso ESTAD 121 una vez?

11. El director de un supermercado piensa que el 50% de sus clientes gastan menos de 10
dólares durante una visita a la tienda. Muchas de sus decisiones en materia de fijación
de precios se basa en esa hipótesis. Decide contrastar la hipótesis con una muestra de
50 clientes cuyos gastos totales se indican a continuación. Qué revelan estos datos
sobre las decisiones de fijación de precios del director?. Utilice un nivel de
significancia del 5%

18.17 8.73 21.12 10.00 4.12 0.65 8.73 17.17 8.42 18.42
7.17 4.12 17.18 5.12 27.18 11.12 2.17 11.17 7.12 4.82
2.08 8.15 6.12 5.12 2.17 3.32 6.42 17.89 9.17 5.55
4.17 5.15 2.12 12.12 8.15 4.83 12.18 11.12 2.63 11.11
18.02 17.15 9.99 18.17 3.02 10.12 8.84 8.92 21.22 17.83

Prueba de hipótesis

Recomendados

Recomendados

Más contenido relacionado

La actualidad más candente

La actualidad más candente (20)

Destacado

Destacado (16)

Similar a Prueba de hipótesis

Similar a Prueba de hipótesis (20)

Más de varo99

Más de varo99 (6)

Último

Último (11)

Prueba de hipótesis