PRUEBAS DE HIPÓTESIS DE UNA POBLACIÓN P. Reyes/Sept. 2007
PRUEBAS DE HIPÓTESIS
DE UNA POBLACION
P. Reyes
Septiembre 2007
1
PRUEBAS DE HIPÓTESIS DE UNA POBLACIÓN P. Reyes/Sept. 2007
CONTENIDO
1. Introducción
2. Pruebas de hipótesis para una población
3. Prueba de hipótesis estadística
4. Ejemplos de fórmulas para calcular los estadísticos de prueba
5. Ejemplos de pruebas de hipótesis de una población
6. Ejercicios adicionales
2
PRUEBAS DE HIPÓTESIS DE UNA POBLACIÓN P. Reyes/Sept. 2007
Pruebas de hipótesis de una población
1. Introducción
La inferencia estadística es el proceso mediante el cual se utiliza la
información de los datos de una muestra para extraer conclusiones acerca
de la población de la que se seleccionó la muestra. Las técnicas de
inferencia estadística se dividen en dos áreas principales: Estimación de
intervalos de confianza y Pruebas de hipótesis.
En cada prueba estadística, se comparan algunos valores observados
contra algunos esperados u otro valor observado comparando
estimaciones de parámetros (media, desviación estándar, varianza).
Estas estimaciones de los verdaderos parámetros son obtenidos usando
una muestra de datos y calculando los estadísticos.
La capacidad para detectar una diferencia entre lo que es observado y lo
que es esperado depende del desarrollo de la muestra de datos.
Incrementando el tamaño de la muestra mejora la estimación y la
confianza en las conclusiones estadísticas.
Al realizar pruebas de hipótesis, se parte de que un valor supuesto
(hipotético) es el parámetro poblacional. Después de recolectar una
muestra aleatoria, se compara el estadístico muestral, así como la media
(x), con el parámetro hipotético, se compara con una supuesta media
poblacional (). Después se acepta o se rechaza el valor hipotético, según
proceda. Se rechaza el valor hipotético sólo si el resultado muestral resulta
muy poco probable cuando la hipótesis es cierta.
3
PRUEBAS DE HIPÓTESIS DE UNA POBLACIÓN P. Reyes/Sept. 2007
Se trata de probar una afirmación sobre parámetros de la población
(media µ; varianza σ2
o proporción π) en base a datos de estadísticos
de una muestra (X media, s2
o p respectivamente):
Por ejemplo, probar las afirmaciones en los parámetros se usan los
estadísticos:
En una población
 La media poblacional µ = 12; estadístico Zc
 La varianza poblacional σ2
= 12; estadístico χc
2
 La proporción poblacional π = 0.3 estadístico Zc
En dos poblaciones
 Las medias poblacionales son iguales µ1 = µ2 o µ1 - µ2 = 0;
estadístico Zc o Tc
 Las varianzas poblacionales son iguales σ12
= σ22
o σ12
- σ22
= 0;
estadístico Fc
 Las proporciones poblacionales son iguales π1 = π2 o π1 - π2 = 0
estadístico Zc
La prueba de hipótesis tiene varias etapas:
Etapa 1.- Planear la hipótesis nula y la hipótesis alternativa. La hipótesis nula
(H0) es el valor hipotético del parámetro que se compra con el resultado
muestral resulta muy poco probable cuando la hipótesis es cierta.
Etapa 2.- Especificar el nivel de significancia que se va a utilizar. El nivel de
significancia del 5%, entonces se rechaza la hipótesis nula solamente si el
4
PRUEBAS DE HIPÓTESIS DE UNA POBLACIÓN P. Reyes/Sept. 2007
resultado muestral es tan diferente del valor hipotético que una diferencia
de esa magnitud o mayor, pudiera ocurrir aleatoria mente con una
probabilidad de 0.05 o menos.
Etapa 3.- Elegir el estadístico de prueba. El estadístico de prueba puede ser
el estadístico muestral (el estimador no segado del parámetro que se
prueba) o una versión transformada de ese estadístico muestral. Por
ejemplo, para probar el valor hipotético de una media poblacional, se
toma la media de una muestra aleatoria de esa distribución normal,
entonces es común que se transforme la media en un valor Z el cual, a su
vez, sirve como estadística de prueba.
Etapa 4.- Establecer el valor o valores críticos del estadístico de prueba.
Habiendo especificado la hipótesis nula, el nivel de significancia y el
estadístico de prueba que se van a utilizar, se procede a establecer el o los
valores críticos del estadístico de prueba. Puede haber uno o más de esos
valores, dependiendo de si se va a realizar una prueba de uno o dos
extremos o colas.
Etapa 5.- Determinar el valor real del estadístico de prueba. Por ejemplo, al
probar un valor hipotético de la media poblacional, se toma una muestra
aleatoria y se determina el valor de la media muestral. Si el valor crítico que
se establece es un valor de Z, entonces se transforma la media muestral en
un valor de Z.
Etapa 6.- Tomar la decisión. Se compara el valor observado del estadístico
muestral con el valor (o valores) críticos del estadístico de prueba. Después
no se rechaza o se rechaza la hipótesis nula. Si se rechaza ésta, se acepta
la alternativa; a su vez, esta decisión tendrá efecto sobre otras decisiones
5
PRUEBAS DE HIPÓTESIS DE UNA POBLACIÓN P. Reyes/Sept. 2007
de los administradores operativos, como por ejemplo, mantener o no un
estándar de desempeño o cuál de dos estrategias de mercadotecnia
utilizar.
La distribución apropiada de la prueba estadística se divide en dos
regiones: una región de rechazo y una de no rechazo. Si estadístico de
prueba cae en esta última región no se puede rechazar la hipótesis nula y
se llega a la conclusión de que el proceso funciona correctamente.
Al tomar la decisión con respecto a la hipótesis nula, se debe determinar el
valor crítico en la distribución estadística que divide la región del rechazo
(en la cual la hipótesis nula no se puede rechazar) de la región de rechazo.
A hora bien el valor crítico depende del tamaño de la región de rechazo.
Pasos de la prueba de hipótesis:
1. Definir el Problema ( Problema Práctico).
2. Señalar los Objetivos ( Problema Estadístico).
3. Determinar tipo de datos: Atributo o Variable.
4. Si son datos Variables: Hacer Prueba de Normalidad.
5. Establecer las Hipótesis: Hipótesis Nula (Ho con signo igual), o la
Hipótesis Alterna (Ha con signo de mayor o menor).
6. Seleccionar el nivel de Alfa (normalmente 0.05 o 5%).
7. Establecer el tamaño de la muestra, 10≥ .
8. Desarrollar el Plan de Muestreo.
9. Seleccionar Muestras y Obtener Datos.
10.Decidir la prueba estadística apropiada y calcular el estadístico
de prueba (Z, t, X2 o F) a partir de los datos.
6
PRUEBAS DE HIPÓTESIS DE UNA POBLACIÓN P. Reyes/Sept. 2007
11.Obtener el estadístico correspondiente de tablas o Excel.
12.Determinar la probabilidad de que el estadístico de prueba
calculado ocurra al azar.
13.Comparar el estadístico calculado con el de tablas y ver si cae
en la región de rechazo o ver si la probabilidad es menor a alfa,
rechace Ho y acepte Ha. En caso contrario no rechace Ho.
14.Con los resultados interprete una conclusión estadística para la
solución práctica.
7
PRUEBAS DE HIPÓTESIS DE UNA POBLACIÓN P. Reyes/Sept. 2007
2. Pruebas de hipótesis para una población
Se trata de probar una afirmación sobre parámetros de la población
(media µ; varianza σ2 o proporción π) en base a datos de estadísticos de
una muestra (X media, s2 o p respectivamente):
ELEMENTOS DE LA PRUEBA:
• Prueba Estadística: Procedimiento para decidir aceptar o rechazar
hipótesis.
• Hipótesis: Es una afirmación acerca de una o más poblaciones.
• Hipótesis Nula (Ho): Usualmente es una afirmación representando una
situación “status quo”. Generalmente deseamos rechazar la hipótesis
nula.
o Es la hipótesis o afirmación a ser probada
o Puede ser por ejemplo µ =, σ, o π a constante
o Sólo puede ser rechazada o no rechazada
• Hipótesis Alterna (Ha): Es lo que aceptamos si podemos rechazar la
hipótesis nula. Ha es lo que queremos probar.
o Es la hipótesis que se acepta como verdadera cuando se rechaza
Ho, es su complemento
o Puede ser por ejemplo   7 para prueba de dos colas
µ < 7 para prueba de cola izquierda
µ > 7 para prueba de cola derecha
8
PRUEBAS DE HIPÓTESIS DE UNA POBLACIÓN P. Reyes/Sept. 2007
• Estadístico de prueba: Calculado con datos de la muestra.
• Región de Rechazo: Indica los valores de la prueba estadística para
que podamos rechazar la Hipótesis nula (Ho). Esta región esta basada
en un riesgo a deseado, normalmente 0.05 o 5%.
• Estadístico de prueba(Z, t, X2 o F): Para probar la hipótesis nula se calcula
un estadístico de prueba con la información de la muestra el cual se
compara a un valor crítico apropiado. De esta forma se toma una
decisión sobre rechazar o no rechazar la Ho.
• Error tipo I (alfa = nivel de significancia, normal=0.05): Se comete al
rechazar la Ho cuando en realidad es verdadera. También se denomina
riesgo del productor
• Error tipo II (beta): Se comete cuando no se rechaza la hipótesis nula
siendo en realidad falsa. Es el riesgo del consumidor
Las pruebas de hipótesis pueden ser de dos colas, de cola derecha o de
cola izquierda, a continuación se esquematizan cada una de ellas.
9
PRUEBAS DE HIPÓTESIS DE UNA POBLACIÓN P. Reyes/Sept. 2007
3. Prueba de hipótesis Estadística
- Hipótesis nula Ho, complemento de la Hipótesis alterna:
o Es la hipótesis o afirmación a ser probada
o Puede ser por ejemplo µ =, ≤, o ≥ a 5
o Sólo puede ser rechazada o no rechazada
- Hipótesis alterna Ha, complemento de la hipótesis nula:
o Es la hipótesis que se acepta como verdadera cuando se
rechaza Ho, es su complemento
o Si el signo de la hipótesis alterna es ≠ entonces se trata de una
prueba de dos colas; si es > de cola derecha y si es < de cola
izquierda.
10
Pruebas de Hipótesis de dos colas:
Ho: a = b
Ha: a ≠ b
Pruebas de Hipótesis de cola derecha:
Ho: a ≤ b
Ha: a > b
Pruebas de Hipótesis cola izquierda:
Ho: a ≥ b
Ha: a < b
Zα/20-Zα/2
Región de
Rechazo
Región de
Rechazo
Zα/20
Región de
Rechazo
Zα/20-Zα/2
Región de
Rechazo
PRUEBAS DE HIPÓTESIS DE UNA POBLACIÓN P. Reyes/Sept. 2007
o Puede ser por ejemplo µ ≠ 5 para prueba de dos colas
o µ < 5 para prueba de cola izquierda
o µ > 5 para prueba de cola derecha
Pasos de la prueba de hipótesis:
• Se plantea inicialmente la Ha si en el problema se muestra la
afirmación de ser menor o mayor a un valor establecido histórico.
• Se plantea inicialmente la Ho si en el problema se muestra la
afirmación igual (es, históricamente ha sido); mayor o igual (cuando
menos) o menor o igual (a lo más) a un valor establecido histórico.
• No importa cual se plantee primero, siempre la conclusión se hace
contra la Ho (se rechaza o no se rechaza)
• El intervalo de confianza es el intervalo donde se estima que se
encuentre el parámetro de la población (media µ; varianza σ2
o
proporción π) para un cierto nivel de confianza o de significancia.
11
Regiones de rechazo
PRUEBAS DE HIPÓTESIS DE UNA POBLACIÓN P. Reyes/Sept. 2007
Estadístico de prueba
o Para probar la hipótesis nula se calcula un estadístico de
prueba con la información de la muestra el cual se compara a
un valor crítico apropiado. De esta forma se toma una decisión
sobre rechazar o no rechazar la Ho
- Error tipo I (alfa = nivel de significancia, es común = 0.05 ). Alfa = 1-
Nivel de confianza
o Se comete al rechazar la Ho cuando en realidad es
verdadera. También se denomina riesgo del productor.
- Error tipo II (beta )
o Se comete cuando no se rechaza la hipótesis nula siendo en
realidad falsa. Es el riesgo del consumidor
Pruebas de Hipótesis de dos colas:
Si la Ho: µ = que un valor poblacional, entonces el riesgo alfa se
reparte en ambos extremos de la distribución. Por ejemplo si Ha:
µ≠ 10 se tiene:
Ho: a = b
Ha: a ≠ b
12
PRUEBAS DE HIPÓTESIS DE UNA POBLACIÓN P. Reyes/Sept. 2007
Pruebas de Hipótesis de cola derecha:
Si la Ho: µ ≤, que un valor poblacional, entonces el riesgo alfa se
coloca en el extremo derecho de la distribución. Por ejemplo si Ho
µ ≤ 10 y Ha: µ >10 se tiene una prueba de cola derecha:
Ho: a ≤ b
Ha: a > b
13
Región de
rechazo
Regiones de rechazo
PRUEBAS DE HIPÓTESIS DE UNA POBLACIÓN P. Reyes/Sept. 2007
Pruebas de Hipótesis cola izquierda:
Si la Ho: µ ≥ que un valor poblacional, entonces el riesgo alfa se
coloca en el extremo izquierdo de la distribución. Por ejemplo si
Ho µ ≥ 10 y Ha: µ < 10 se tiene una prueba de cola izquierda:
Ho: a ≥ b
Ha: a < b
14
Región de
rechazo
PRUEBAS DE HIPÓTESIS DE UNA POBLACIÓN P. Reyes/Sept. 2007
Pasos para realizar una prueba de hipótesis
Probar la hipótesis de igualdad de una media µ para n > 30
1) Establecer las hipótesis e identificar el nivel de significancia alfa o 1- Nivel
de confianza (NC)
Ho: µ=µο Ha: µ≠µο
2) Calcular el estadístico de prueba Zc o Tc con fórmula
3) Determinar el estadístico de tablas Zt o Tc de Excel para una cierta alfa
o 1-NC
4) Establecer la región de rechazo con Zt y ver si cae ahí Zc
Las regiones de rechazo prueba de 2 colas: -Zα/2 y Zα/2
5) Determinar el Intervalo de confianza para la media y ver si incluye a la
media de la hipótesis, si no rechazar Ho
6) Determinar el valor P correspondiente a Zc y comparar contra Alfa/2, si
es menor rechazar Ho
15
PRUEBAS DE HIPÓTESIS DE UNA POBLACIÓN P. Reyes/Sept. 2007
4. Fórmulas para calcular los estadísticos de prueba
Fórmulas para Intervalos de confianza de parámetros de una población
a) Intervalo de confianza para estimar µ con muestras grandes (n >= 30 ) y
cuando ya se cuenta con historial, o sea que σ es conocida:
n
ZXparaIC
σ
µ α 2/±=
Si la σ no se conoce entonces se usa S de la muestra en su lugar
n
S
ZXparaIC 2/αµ ±=
b) Intervalo de confianza para estimar µ con muestras pequeñas (n < 30;
grados de libertad = gl. = n –1):
n
S
tXparaIC gl,2/αµ ±=
c) Intervalo de confianza para estimar π proporción poblacional:
p
p
SZpparaIC
n
pp
S
2/
)1(
απ ±=
−
=
d) Tamaño de muestra para estimar µ en función del error )( µ−X :
2
2
2/
)( µ
α
−
=
X
Z
n
e) Tamaño de muestra para estimar π en función del error )( π−p , en el
peor caso π = 0.5:
2
2
2/
)(
)1)((
π
ππα
−
−
=
p
Z
n
16
PRUEBAS DE HIPÓTESIS DE UNA POBLACIÓN P. Reyes/Sept. 2007
Fórmulas para calcular los estadísticos utilizados en las pruebas de
Hipótesis de una pob.
f) Estadístico Zc muestras grandes (n >= 30 ) y cuando la σ es conocida (ya
se tiene historial):
n
X
Zc HIPOTESIS
σ
µ−
= f) Si no se conoce la σ entonces se reemplaza por la
S de la muestra.
g) Estadístico tc para muestras pequeñas (n < 30) y la σ es desconocida:
ns
X
t HIPOTESIS
C
µ−
=
h) Estadístico Zc para proporciones y muestras grandes (n >= 30):
p
HIPOTESIS
HIPOTESISHIPOTESIS
p
p
Zc
n
σ
π
ππ
σ
−
=
−
=
)1(
17
PRUEBAS DE HIPÓTESIS DE UNA POBLACIÓN P. Reyes/Sept. 2007
Ejemplos de cada uno de los casos
a) Estadístico Zc muestras grandes (n >= 30 ) o cuando la σ es
conocida (ya se tiene historial):
valorHa
valorHo
≠
=
µ
µ
:
:
n
X
Zc HIPOTESIS
σ
µ−
=
Estadístico de tablas Zalfa o Zalfa/2 en Excel =DISTR.NORM.ESTAND.INV(alfa
o alfa/2)
Estadístico de tablas Zalfa o Zalfa/2 en Minitab >Calc >Probability
distributions> Normal:
Inverse Cummulative prob; Mean = 0; Std. Dev. = 0; Input constant =
Alfa o alfa/2
Intervalo de confianza para estimar µ con muestras grandes (n >= 30) o
cuando ya se cuenta con historial, o sea que σ es conocida:
n
ZXparaIC
σ
µ α 2/±=
Si no se conoce la σ entonces se reemplaza por la S de la muestra.
n
S
ZXparaIC 2/αµ ±=
El valor p de probabilidad correspondiente al estadístico Zc se determina
como sigue:
18
PRUEBAS DE HIPÓTESIS DE UNA POBLACIÓN P. Reyes/Sept. 2007
P value en Excel =DISTR.NORM.ESTAND(Zc)
P value en Minitab >Calc >Probability distributions> Normal:
Cummulative prob; Mean = 0; Std. Dev. = 0; Input constant = Zc
Prueba de hipótesis en Minitab:
>Stat >Basic statistics > 1-Sample Z
Utilizar Sample in columns o Summarized data
Sample size 49 Mean 11.5 Standar deviation 1.1
Test Mean 12
Graphs – Seleccionar º! Individual value plot
Confidence level 90% Alternative not equal
OK
Resultados:
One-Sample Z
Test of mu = 12 vs not = 12
The assumed standard deviation = 1.1
N Mean SE Mean 90% CI Z P
49 11.5000 0.1571 (11.2415, 11.7585) -3.18 0.001
Criterios de rechazo de Ho:
19
PRUEBAS DE HIPÓTESIS DE UNA POBLACIÓN P. Reyes/Sept. 2007
Si Zc cae en la zona de rechazo
El valor de la Hipótesis no se encuentra en el Intervalo de confianza
El valor P es menor que el valor de alfa (prueba de una cola) o de alfa/2
(dos colas).
b) Estadístico tc para muestras pequeñas (n < 30) y la σ es desconocida:
valorHa
valorHo
≠
=
µ
µ
:
:
ns
X
t HIPOTESIS
C
µ−
=
Estadístico de tablas Talfa o Talfa/2 en Excel =DISTR.T.INV(2*alfa o alfa,
grados de libertad n-1)
Estadístico de tablas Talfa o Talfa/2 en Minitab >Calc >Probability
distributions> :
Inverse Cummulative prob; Degrees of freedom = n-1; Input constant
= Alfa o alfa/2
Intervalo de confianza para estimar µ con muestras pequeñas (n < 30;
grados de libertad (gl.) = n –1):
n
S
tXparaIC gl,2/αµ ±=
El valor p de probabilidad correspondiente al estadístico Tc se determina
como sigue:
P value en Excel =DISTR.T(Tc, grados de libertad, 1 o 2 colas)
P value en Minitab >Calc >Probability distributions> T:
20
PRUEBAS DE HIPÓTESIS DE UNA POBLACIÓN P. Reyes/Sept. 2007
Cummulative prob; Degrees of freedom = n-1; Input constant = Tc
Prueba de hipótesis en Minitab:
>Stat >Basic statistics > 1-Sample t
Utilizar Sample in columns o Summarized data
Sample size 10 Mean 11277 Standar deviation 3772
Test Mean 12000
Graphs – Seleccionar º! Individual value plot
Confidence level 95% Alternative not equal
OK
Resultados:
One-Sample T
Test of mu = 12000 vs not = 12000
N Mean StDev SE Mean 95% CI T P
10 11277.0 3772.0 1192.8 (8578.7, 13975.3) -0.61 0.559
Criterios de rechazo de Ho:
Si Tc cae en la zona de rechazo
El valor de la Hipótesis no se encuentra en el Intervalo de confianza
21
PRUEBAS DE HIPÓTESIS DE UNA POBLACIÓN P. Reyes/Sept. 2007
El valor P es menor que el valor de alfa (prueba de una cola) o de alfa/2
(dos colas).
c) Estadístico Zc para proporciones y muestras grandes (n >=
30):
valorHa
valorHo
≠
=
π
π
:
:
p
HIPOTESIS
HIPOTESISHIPOTESIS
p
p
Zc
n
σ
π
ππ
σ
−
=
−
=
)1(
Estadístico de tablas Zalfa o Zalfa/2 en Excel =DISTR.NORM.ESTAND.INV(alfa
o alfa/2)
Estadístico de tablas Zalfa o Zalfa/2 en Minitab >Calc >Probability
distributions> Normal:
Inverse Cummulative prob; Mean = 0; Std. Dev. = 0; Input constant =
Alfa o alfa/2
Intervalo de confianza para estimar π proporción poblacional:
p
p
SZpparaIC
n
pp
S
2/
)1(
απ ±=
−
=
El valor p de probabilidad correspondiente al estadístico Zc se determina
como sigue:
22
PRUEBAS DE HIPÓTESIS DE UNA POBLACIÓN P. Reyes/Sept. 2007
P value en Excel =DISTR.NORM.ESTAND(Zc)
P value en Minitab >Calc >Probability distributions> Normal:
Cummulative prob; Mean = 0; Std. Dev. = 0; Input constant = Zc
23
PRUEBAS DE HIPÓTESIS DE UNA POBLACIÓN P. Reyes/Sept. 2007
Prueba de hipótesis en Minitab
>Stat >Basic statistics > 1- Proportion
Summarized data
Number of trial 500 Number of events 225
Graphs – Seleccionar º! Individual value plot
Confidence level 98% Test proportion 0.40 Alternative Less than
º! Use test and interval based on normal distribution
OK
Resultados
Test and CI for One Proportion
Test of p = 0.4 vs p < 0.4
98%
Upper
Sample X N Sample p Bound Z-Value P-Value
1 225 500 0.450000 0.495693 2.28 0.989
Criterios de rechazo de Ho:
Si Zc cae en la zona de rechazo
24
PRUEBAS DE HIPÓTESIS DE UNA POBLACIÓN P. Reyes/Sept. 2007
El valor de la Hipótesis no se encuentra en el Intervalo de confianza
El valor P es menor que el valor de alfa (prueba de una cola) o de alfa/2
(dos colas).
d) Cálculo del estadístico con base en Chi cuadrada
para prueba de una varianza.
Ho: 2
σ =
2
0σ
Ho: 2
σ ≠
2
0σ
El estad
Donde:
2
0σ la varianza de la hipótesis
N = número de datos de la muestra
S2 = varianza de los datos de la muestra
25
PRUEBAS DE HIPÓTESIS DE UNA POBLACIÓN P. Reyes/Sept. 2007
e) Tamaño de muestra para estimar µ en función del error
)( µ−X :
2
2
2/
)( µ
α
−
=
X
Z
n
f) Tamaño de muestra para estimar π en función del error )( π−p
, en el peor caso π = 0.5:
2
2
2/
)(
)1)((
π
ππα
−
−
=
p
Z
n
26
PRUEBAS DE HIPÓTESIS DE UNA POBLACIÓN P. Reyes/Sept. 2007
5. Ejemplos de pruebas de hipótesis de una población
Ejemplos de Prueba de hipótesis Estadística
Paso 1. Para una muestra grande (n >30) probar la hipótesis de una media
µ . Establecer alfa.
Ho: oµµ =
Ha: 0µµ ≠
Paso 2. Calcular el estadístico de prueba
n
s
Zcalc
0µµ −
=
Paso 3. Establecer la región de rechazo, para prueba de 2 colas:
22 αα ψ ZZ−
Paso 4. Si el valor del estadístico de prueba cae en la región de rechazo
rechazaremos Ho de otra manera no podemos rechazar Ho.
27
Zα/2
0
-Zα/2
Región de
Rechazo
Región de
Rechazo
PRUEBAS DE HIPÓTESIS DE UNA POBLACIÓN P. Reyes/Sept. 2007
Paso 5. Calcular el intervalo de confianza IC para un nivel de confianza de
1-alfa, si la media de la hipótesis se encuentra dentro del intervalo, no
rechazar Ho y viceversa.
Paso 6. Calcular el valor de Probabilidad P para el estadístico calculado a
partir de la muestra Zc o Tc por medio de:
Para Zc: P = distr.norm.estand.inv(-Zc)
Para Tc: P = distr.t.inv(Tc, grados de libertad, 1 o 2 colas)
Para Chi2: P = Prueba.chi.inv(Chi c, grados de libertad)
Si el valor de P es menor o igual a alfa se rechaza Ho y se acepta Ha (en el
caso de dos colas el valor de P total es del doble del calculado).
Prueba Z de 2 colas
Problema 1
Los enanos de Blanca Nieves le informan que excavan 12 toneladas
promedio por semana. Nieves recolecta datos de 49 semanas y obtiene
X=11.5, s= 1.1 a un nivel de significancia α=10%. Los Enanos están en lo
cierto.
Solución
1) Planteamiento de hipótesis
Ho: μ=12
Ha: μ≠12
2) Determinar estadístico de la prueba Z
28
PRUEBAS DE HIPÓTESIS DE UNA POBLACIÓN P. Reyes/Sept. 2007
Zc= 11.5 – 12/ (1.1 / √49) = -0.5/ 0.157 = -3.185
3) Determinar el valor de Zt de acuerdo al valor de alfa
10% / 2 = 0.05
Z de tablas 0.05 = -1.64
4) Interpretación y conclusiones
Dado que Zc=-3.185 es menor que Zt=-1.64 la Ho se rechaza a un nivel alfa
del 10%.
Los enanos no excavan 12 toneladas al día
5) Intervalo de confianza
IC = Media +-Zalfa/2* S/ raiz(n)
IC = 11.5+- 1.64* 1.1/raiz(49) = (11.242, 11.75)
La media de la hipótesis no se encuentra en el intervalo de
confianza, se rechaza Ho.
6) Valor P del estadístico de prueba
P =distr.norm.estand(Zc) =distr.norm.estand(-3.18) = 0.00073
Como el valor P es menor a alfa/2 entonces se rechaza Ho
29
PRUEBAS DE HIPÓTESIS DE UNA POBLACIÓN P. Reyes/Sept. 2007
Prueba Minitab:
>Stat >Basic statistics > 1-Sample Z
Summarized data
Sample size 49 Mean 11.5 Standar deviation 1.1
Test Mean 12
Graphs – Seleccionar º! Individual value plot
Confidence level 90% Alternative not equal
OK
RESULTADOS Y CONCLUSIONES……
Problema 2
Se quiere probar la afirmación de que la distancia promedio viajada por
pelotas de golf es de 250 yardas a un 95% de confianza.
Z Se toma una muestra de 16 distancias
269
300
268
278
282
263
301
295
288
278
276
286
296
265
271
30
PRUEBAS DE HIPÓTESIS DE UNA POBLACIÓN P. Reyes/Sept. 2007
279
RESULTADOS Y CONCLUSIONES……
En vez de seleccionar Summarized data, seleccionar Samples in columns
Prueba Z de una cola
Problema 3
Se planea en un restaurante eliminar del menú el pollo frito. Se afirma que
las ventas habían descendido por debajo de la media histórica de $4500.
¿Parece una decisión adecuada si en una muestra de n=144
observaciones se observa Xmedia= 4,477, s=1,128 con α= 2%?
Solución
1) Planteamiento de hipótesis
Ho: μ≥4500
Ha: μ<4500
2) Determinar estadístico de la prueba Z
Zc= 4477 – 4500 / (1128 / √144) = -23/ 94= -0.245
3) Determinar el valor de Z en tablas de acuerdo al valor de alfa 2%
Zt de tablas 0.02 = -2.053
4) Interpretación y conclusiones
Dado que Zc=-0.245 es mayor que Zt=-2.053 la Ho no se rechaza a una alfa
del 2%.
31
PRUEBAS DE HIPÓTESIS DE UNA POBLACIÓN P. Reyes/Sept. 2007
5) Intervalo de confianza
IC = Media +-Zalfa/2* S/ raiz(n)
IC = 4477 +- 2.053* 1128/raiz(144) = (4284.01, 4669.98)
La media de la hipótesis si se encuentra en el intervalo de confianza,
no se rechaza Ho.
6) Valor P del estadístico de prueba
P =distr.norm.estand(Zc) =distr.norm.estand(-0.245) = 0.4032
Como el valor P es mayor a alfa entonces no se rechaza Ho, no han
descendido las ventas.
Prueba Minitab (Options: Confidence level 98% Alternative Less
Than)
RESULTADOS Y CONCLUSIONES……
Prueba t de dos colas
Problema 4
Un distribuidor piensa que el promedio de sus ventas son de $12000 al mes.
Selecciona n=10 meses y encuentra X=11,277, s=3,772. Aun alfa del 5%
¿qué se puede concluir?
Solución
1) Planteamiento de hipótesis
Ho: μ=12000
Ha: μ≠12000
32
PRUEBAS DE HIPÓTESIS DE UNA POBLACIÓN P. Reyes/Sept. 2007
2) Determinar estadístico de la prueba t
tc= 11277 – 12000 / (3772 / √10) = -723 / 1192.81 = - 0.6061
3) Determinar el valor de t en tablas de acuerdo al valor de alfa y los
grados de libertad
gl= n-1= 10-1 =9 para un alfa / 2 de 0.05/2= 0.025
tt de tablas para 0.025 con 9 gl = 2.262 con =distr.t.inv(0.05,9) = 2.262
4) Interpretación y conclusiones
Dado que tc= -0.6061 es mayor que tt= - 2.262 la Ho no se rechaza a un
nivel alfa del 5%.
Las ventas son de $12000 al mes
5) Intervalo de confianza
IC = Media +-Talfa/2* S/ raiz(n)
IC = 11277+- 2.262* 3772/raiz(10) = ( 8578.86, 13975.14)
La media de la hipótesis se encuentra en el intervalo de confianza,
NO se rechaza Ho.
6) Valor P del estadístico de prueba
P =distr.t(Tc, gl, colas) =distr.t(0.6061, 9, 2) = 0.5594
Como el valor P es mayor a alfa/2 entonces NO se rechaza Ho, las
ventas son de $12000.
Prueba Minitab
33
PRUEBAS DE HIPÓTESIS DE UNA POBLACIÓN P. Reyes/Sept. 2007
>Stat >Basic statistics > 1-Sample t
Summarized data
Sample size 10 Mean 11277 Standar deviation 3772
Test Mean 12000
Graphs – Seleccionar º! Individual value plot
Confidence level 95% Alternative not equal
OK
RESULTADOS Y CONCLUSIONES……
Problema 5
Las ganancias por acción son de 3 dolares, probar para un 95% de
confianza si esto es cierto. Una muestra de datos arrojó los resultados
siguientes:
1.92
2.16
3.63
3.16
4.02
3.14
2.2
2.34
3.05
2.38
34
PRUEBAS DE HIPÓTESIS DE UNA POBLACIÓN P. Reyes/Sept. 2007
RESULTADOS Y CONCLUSIONES……
Prueba t de una cola
Problema 6
La vida útil de un foco es de 5,000 horas. Un nuevo diseño se piensa
incremente esta vida. Se prueban n=25 focos con fusión a X=5,117, s=
1,886. Concluir para un nivel alfa del 5%.
Solución
1) Planteamiento de hipótesis
Ho: μ≤5000
Ha: μ>5000
2) Determinar estadístico de la prueba t
tc= 5117 – 5000 / (1886 / √25) = 117 / 377.2 = 0.310
3) Determinar el valor de t en tablas de acuerdo al valor de alfa y los
grados de libertad
35
PRUEBAS DE HIPÓTESIS DE UNA POBLACIÓN P. Reyes/Sept. 2007
gl= n-1= 25-1 =24 para alfa de 0.05
tt de tablas 0.05 con 24 gl = 1.71 de =distr.t.inv(0.1,24) =1.71
4) Interpretación y conclusiones
Dado que tc=0.310 es menor que tt=1.71 la Ho no se rechaza a un nivel alfa
de 5%.
La vida de los focos es de 5000 horas.
5) Intervalo de confianza
IC = Media +-Talfa/2* S/ raiz(n)
IC = 5117+- 1.71* 1886/raiz(25) = ( 4471.988, 5762.012 )
La media de la hipótesis se encuentra en el intervalo de confianza,
NO se rechaza Ho.
6) Valor P del estadístico de prueba
P =distr.t(Tc, gl, colas) =distr.t(0.31, 24, 1) = 0.3796
Como el valor P es mayor a alfa entonces NO se rechaza Ho, la vida es de
5000 Hrs.
Prueba Minitab (Confidence level 95% Alternative greater than)
RESULTADOS Y CONCLUSIONES……
Problema 7
Las horas tomadas para plantar un árbol mediano son las siguientes. Probar
a un 5% si el tiempo es > 2 Hrs.
36
PRUEBAS DE HIPÓTESIS DE UNA POBLACIÓN P. Reyes/Sept. 2007
1.9
1.7
2.8
2.4
2.6
2.5
2.8
3.2
1.6
2.5
RESULTADOS Y CONCLUSIONES……
Prueba Z para una proporción
Problema 8
Midwest planea comercializar un producto sólo si por lo menos el 40% del
público lo prefiere. En una muestra de 500 personas encuentra que 225 lo
prefieren. ¿A un nivel alfa de 2%, Midwest debe comercializar el producto?
Solución
1) Planteamiento de hipótesis
Ho: π≥0.40
Ha: π<0.40
2) Determinar estadístico de la prueba Z
σp = √(0.40)(1-0.40) / 500 = 0.022
p= 225/500 = 0.45
Zc= 0.45-0.40/ 0.022) = 0.05/ 0.022 = 2.27
3) Determinar el valor de Z en tablas de acuerdo al valor de alfa
0.02%
37
PRUEBAS DE HIPÓTESIS DE UNA POBLACIÓN P. Reyes/Sept. 2007
Z de tablas para 0.02 = -2.053
4) Interpretación y conclusiones
Dado que Zc=2.27 es mayor que Zt=-2.053 la Ho no se rechaza a un nivel
alfa del 2%.
La proporción no es menor al 40% se debe comercializar el producto.
5) Intervalo de confianza
p = 225/500 = 0.45
Sp = raiz (p(1-p)/n)) = raiz(0.45(0.55)/500) = 0.02418
IC = p +- Zalfa/2 * Sp
IC = 045 +- 2.053*0.024 = (0.400, 0.4992)
La media de la hipótesis se encuentra en el intervalo de confianza,
NO se rechaza Ho.
6) Valor P del estadístico de prueba
P =distr.norm.estand (Zc) =distr.norm.estand (2.27) = 0.98839
Como el valor P es mayor a alfa/2 entonces NO se rechaza Ho, la
proporción es 0.40.
Prueba Minitab
>Stat >Basic statistics > 1- Proportion
38
PRUEBAS DE HIPÓTESIS DE UNA POBLACIÓN P. Reyes/Sept. 2007
Summarized data
Number of trial 500 Number of events 225
Graphs – Seleccionar º! Individual value plot
Confidence level 98% Test proportion 0.40
Alternative Less than
º! Use test and interval based on normal distribution
OK
RESULTADOS Y CONCLUSIONES……
39
PRUEBAS DE HIPÓTESIS DE UNA POBLACIÓN P. Reyes/Sept. 2007
Problema 9
Un estudio indicó que el 64% de los consumidores de supermercado creen
en las marcas propias. El fabricante de una salsa de tomate preguntó a
100 compradores donde 52 prefieren marca propia, probar si el porcentaje
de preferencias es menor al 64%, para un 5% de nivel de significancia
Ha: pi < 0.64 Ho: Pi >= 0.64 Trials 100
Prueba de cola izquierda Events 52
NC 95%
Alternate Less Than
RESULTADOS Y CONCLUSIONES……
Problema 10
Midlakes canceló sus vuelos ya que se estimó que más del 18% involucraba
aviones con fallas mecánicas. ¿Este estimado se confirma a un nivel alfa
del 0.05 si D = 24 aviones de n = 120 tenían fallas?
Solución
1) Planteamiento de hipótesis
Ho: π ≤0.18
Ha: π >0.18
2) Determinar estadístico de la prueba Z
σp = √(0.18)(1-0.18) / 120 = 0.035
p= 24/120 = 0.2
Zc= 0.2-0.18/ 0.035) = 0.02/ 0.035 = 0.571
3) Determinar el valor de Z en tablas de acuerdo al valor de alfa de 0.05%
Z de tablas para 0.05 = 1.64
40
PRUEBAS DE HIPÓTESIS DE UNA POBLACIÓN P. Reyes/Sept. 2007
4) Interpretación y conclusiones
Dado que Zc=0.571 es menor que Zt=1.64 la Ho no se rechaza a un nivel de
confianza del 5%.
La proporción de aviones con falla es del 0.18
5) Intervalo de confianza
p = 24/120 = 0.2
Sp = raiz (p(1-p)/n)) = raíz(0.2(0.8)/120) = 0.0365
IC = p +- Zalfa/2 * Sp
IC = 0.2 +- 1.64*0.0365 = (0.1402, 0.2598)
La media de la hipótesis se encuentra en el intervalo de confianza,
NO se rechaza Ho.
6) Valor P del estadístico de prueba
P =distr.norm.estand (Zc) =distr.norm.estand (-0.571) = 0.284
Como el valor P es mayor a alfa/2 entonces NO se rechaza Ho, la
proporción es 0.18.
Prueba Minitab (Confidence level 95% Alternative Greater than)
RESULTADOS Y CONCLUSIONES……
41
PRUEBAS DE HIPÓTESIS DE UNA POBLACIÓN P. Reyes/Sept. 2007
Prueba de hipótesis para una varianza
Problema 10
Se trata de probar si la varianza poblacional de las rentas en las ciudades
es de 30.
Los datos de la renta para diferentes ciudades es la siguiente:
Ciudad Renta
A 47
B 50
C 53
D 45
E 40
F 43
G 39
H 37
La varianza de los datos en Excel es: = Var( datos de rentas ) = 31.0714286
Paso 1. σ2
= σ0
2
σ2
≠ σ0
2
Ho: Varianza = 30 Ha: Varianza ≠ 30
Paso 2. Estadístico de Prueba Chi cuadrado calculado Chic:
Donde:
σ0
2
= Varianza de Ho = 30;
N = número de datos = 8;
Varianza de datos S2
= 31.0714286
42
PRUEBAS DE HIPÓTESIS DE UNA POBLACIÓN P. Reyes/Sept. 2007
χc
2
= (8-1)*31.0714286 / 30 = 7.25
Paso 3. Estadístico correspondiente a alfa α =0.05 (por tanto α/2 = 0.025).
De tablas o con Excel por ser una prueba de dos colas:
χ2
α/2, n-1 = prueba.chi.inv(0.025, 8-1) = 16.0127643
χ2
(1-α/2), n-1 = prueba.chi.inv(0.975, 8-1) = 1.68986919
Paso 4. Se observa si el χ2
c cae en la zona de rechazo, como en este caso
no es así, no hay evidencia suficiente para rechazar Ho, y se considera que
la varianza si es de 30.
Paso 5. Calculando el valor P correspondiente a la Chi calculada (χ2
c se
tiene:
P = distr.Chi(χ2
c, n-1) = distr.chi(7.25, 7) = 0.4033
Como el valor P correspondiente a X2
c es mayor que Alfa/2, no se rechaza
la Ho
43
α/2 = 0.025 α/2 = 0.025
α/2 = 0.025
P =0.4033
PRUEBAS DE HIPÓTESIS DE UNA POBLACIÓN P. Reyes/Sept. 2007
Paso 6. Calculando ahora el intervalo de confianza para la varianza
poblacional se tiene:
Sustituyendo valores se tiene: (13.58291398, 128.7081872)
Como el 30 de la Ho se encuentra en el intervalo de confianza, no se
rechaza Ho indicando que la varianza no es diferente de 70.
44
PRUEBAS DE HIPÓTESIS DE UNA POBLACIÓN P. Reyes/Sept. 2007
6. Ejercicios adicionales:
12. Los tiempos que toma el registro de las órdenes en un negocio son los
siguientes:
1.9 1.7 2.8 2.4 2.6 2.5 2.8 3.2 1.6 2.5
a) Probar a un Nivel de Confianza del 90% si el tiempo es mayor a 1.98.
b) Probar a un alfa de 0.02 si la desviación estándar es mayor a 0.6.
13. Se quiere probar la afirmación de que la distancia viajada por pelotas
de golf es de 250 yardas a un 95% de confianza.Se toma una muestra de
36 distancias
269 300 268 278 282 263 301 295 288 278 276 286 296 265 271 279
284 260 275 282 260 266 270 293 272 285 293 281 269 291 274 277
299 263 264 273
14. Las Ganancias por acción son de 3 dólares para un 95% de confianza,
probar esta afirmación..
Una muestra de datos arrojó los resultados siguientes:
1.92 2.16 3.63 3.16 4.02 3.14 2.2 2.34 3.05 2.38
15. Un estudio encontró que 40% de los usuarios de Internet recibieron más
de 10 mensajes diarios. Si de 420 usuarios 188 recibieron estos mensajes, a
un nivel de 5% ¿Cuál es la conclusión?
45
PRUEBAS DE HIPÓTESIS DE UNA POBLACIÓN P. Reyes/Sept. 2007
16. Un estudio indicó que el 64% de los consumidores de supermercado
creen en las marcas propias. El fabricante de una salsa de tomate
preguntó a 100 compradores donde 52 prefieren marca propia, probar si
el porcentaje de preferencias es menor al 64%, para un 5% de nivel de
significancia.
17. Un restaurante planea una oferta especial si más del 15% de los clientes
compra vasos de diseño especial con personajes de caricaturas. En una
prueba 88 de 500 clientes compraron vasos. A un 0.01 de nivel de
significancia, ¿Cuál es su recomendación?
18. Las rentas diarias de automoviles en Dólares de ocho ciudades se
muestra a continuación:
Ciudad A B C D E F G H
Renta 47 50 53 45 40 43 39 37
¿A un 5% se comprueba la hipótesis de que la varianza de la población es
de 30?
19. Se midió la temperatura de fusión de un aceite vegetal hidrogenado
en n=16 muestras y se encontró una media de 94.32. Si la temperatura de
fusión sigue una distribución normal con sigma = 1.20.
a) Probar a un 95% de nivel de confianza de que la media se ha
mantenido en 95.
20. La duración promedio de cierto foco es de 750 horas. El cliente
cambiaría de marca sólo que se demuestre que de manera concluyente
que la vida de los focos es menor que la anunciada. Se elige una muestra
46
PRUEBAS DE HIPÓTESIS DE UNA POBLACIÓN P. Reyes/Sept. 2007
aleatoria de 20 focos, se determina su duración y se obtiene una vida
media de 738.44 con una desviación estándar de 38.20.
a) ¿Cuál sería la conclusión a un 95% de nivel de confianza?
21. Después de ciertas horas de trabajo se determinó el desgaste de
flechas en 0.0001” para cada una de las n=8 máquinas que tienen plomo y
cobre como material de soporte, y se obtuvo como resultado que la
media fue de 3.72 con desviación estándar de 1.25.
a) Se desea probar si el desgaste es mayor a 3.5 a un 95% de nivel de
confianza.
22. Las lecturas de radiación de Radón tomadas en 12 lugares fueron
como sigue:
105.6, 90.9, 91.2, 96.9, 96.5, 91.3, 100.1, 105, 99.6, 107.7, 103.3 y 92.4.
a) A un alfa de 5%, ¿indican las lecturas que difieren de 100?.
23. Se prueban 100 baterías de Ni-H para celdas de prueba y se determina
que 14 de ellas se ampoyan en sus placas fallando. Para un 5% de nivel de
significancia.
a) ¿Proporciona lo anterior una evidencia de que más del 10% de las
baterías fallan?
24. Para un cierto servicio los tiempos de respuesta son de 3 horas, probar
la afirmación para un 98% de nivel de confianza.
47
PRUEBAS DE HIPÓTESIS DE UNA POBLACIÓN P. Reyes/Sept. 2007
Una muestra de datos arrojó los resultados siguientes:
1.92
2.16
3.63
3.16
4.02
3.14
2.2
2.34
3.05
2.38
25. Las horas tomadas para mantenimiento son las siguientes. Probar a un
5% si el tiempo es > 2 Hrs.
Tiempos
1.9
1.7
2.8
2.4
2.6
2.5
2.8
3.2
1.6
2.5
26. Un estudio encontró que 40% de los usuarios de Internet recibieron más
de 10 mensajes diarios
Si de 420 usuarios 188 recibieron estos mensajes, a un nivel de 5% ¿Cúal es
la conclusión?
48
PRUEBAS DE HIPÓTESIS DE UNA POBLACIÓN P. Reyes/Sept. 2007
27. Un estudio indicó que el 64% de los consumidores de supermercado
creen en las marcas propias. El fabricante de una salsa de tomate
preguntó a 100 compradores donde 52 prefieren marca propia,
probar si el porcentaje de preferencias es menor al 64%, para un 5% de
nivel de significancia.
49

Pruebas hipotesis 1_pob2

  • 1.
    PRUEBAS DE HIPÓTESISDE UNA POBLACIÓN P. Reyes/Sept. 2007 PRUEBAS DE HIPÓTESIS DE UNA POBLACION P. Reyes Septiembre 2007 1
  • 2.
    PRUEBAS DE HIPÓTESISDE UNA POBLACIÓN P. Reyes/Sept. 2007 CONTENIDO 1. Introducción 2. Pruebas de hipótesis para una población 3. Prueba de hipótesis estadística 4. Ejemplos de fórmulas para calcular los estadísticos de prueba 5. Ejemplos de pruebas de hipótesis de una población 6. Ejercicios adicionales 2
  • 3.
    PRUEBAS DE HIPÓTESISDE UNA POBLACIÓN P. Reyes/Sept. 2007 Pruebas de hipótesis de una población 1. Introducción La inferencia estadística es el proceso mediante el cual se utiliza la información de los datos de una muestra para extraer conclusiones acerca de la población de la que se seleccionó la muestra. Las técnicas de inferencia estadística se dividen en dos áreas principales: Estimación de intervalos de confianza y Pruebas de hipótesis. En cada prueba estadística, se comparan algunos valores observados contra algunos esperados u otro valor observado comparando estimaciones de parámetros (media, desviación estándar, varianza). Estas estimaciones de los verdaderos parámetros son obtenidos usando una muestra de datos y calculando los estadísticos. La capacidad para detectar una diferencia entre lo que es observado y lo que es esperado depende del desarrollo de la muestra de datos. Incrementando el tamaño de la muestra mejora la estimación y la confianza en las conclusiones estadísticas. Al realizar pruebas de hipótesis, se parte de que un valor supuesto (hipotético) es el parámetro poblacional. Después de recolectar una muestra aleatoria, se compara el estadístico muestral, así como la media (x), con el parámetro hipotético, se compara con una supuesta media poblacional (). Después se acepta o se rechaza el valor hipotético, según proceda. Se rechaza el valor hipotético sólo si el resultado muestral resulta muy poco probable cuando la hipótesis es cierta. 3
  • 4.
    PRUEBAS DE HIPÓTESISDE UNA POBLACIÓN P. Reyes/Sept. 2007 Se trata de probar una afirmación sobre parámetros de la población (media µ; varianza σ2 o proporción π) en base a datos de estadísticos de una muestra (X media, s2 o p respectivamente): Por ejemplo, probar las afirmaciones en los parámetros se usan los estadísticos: En una población  La media poblacional µ = 12; estadístico Zc  La varianza poblacional σ2 = 12; estadístico χc 2  La proporción poblacional π = 0.3 estadístico Zc En dos poblaciones  Las medias poblacionales son iguales µ1 = µ2 o µ1 - µ2 = 0; estadístico Zc o Tc  Las varianzas poblacionales son iguales σ12 = σ22 o σ12 - σ22 = 0; estadístico Fc  Las proporciones poblacionales son iguales π1 = π2 o π1 - π2 = 0 estadístico Zc La prueba de hipótesis tiene varias etapas: Etapa 1.- Planear la hipótesis nula y la hipótesis alternativa. La hipótesis nula (H0) es el valor hipotético del parámetro que se compra con el resultado muestral resulta muy poco probable cuando la hipótesis es cierta. Etapa 2.- Especificar el nivel de significancia que se va a utilizar. El nivel de significancia del 5%, entonces se rechaza la hipótesis nula solamente si el 4
  • 5.
    PRUEBAS DE HIPÓTESISDE UNA POBLACIÓN P. Reyes/Sept. 2007 resultado muestral es tan diferente del valor hipotético que una diferencia de esa magnitud o mayor, pudiera ocurrir aleatoria mente con una probabilidad de 0.05 o menos. Etapa 3.- Elegir el estadístico de prueba. El estadístico de prueba puede ser el estadístico muestral (el estimador no segado del parámetro que se prueba) o una versión transformada de ese estadístico muestral. Por ejemplo, para probar el valor hipotético de una media poblacional, se toma la media de una muestra aleatoria de esa distribución normal, entonces es común que se transforme la media en un valor Z el cual, a su vez, sirve como estadística de prueba. Etapa 4.- Establecer el valor o valores críticos del estadístico de prueba. Habiendo especificado la hipótesis nula, el nivel de significancia y el estadístico de prueba que se van a utilizar, se procede a establecer el o los valores críticos del estadístico de prueba. Puede haber uno o más de esos valores, dependiendo de si se va a realizar una prueba de uno o dos extremos o colas. Etapa 5.- Determinar el valor real del estadístico de prueba. Por ejemplo, al probar un valor hipotético de la media poblacional, se toma una muestra aleatoria y se determina el valor de la media muestral. Si el valor crítico que se establece es un valor de Z, entonces se transforma la media muestral en un valor de Z. Etapa 6.- Tomar la decisión. Se compara el valor observado del estadístico muestral con el valor (o valores) críticos del estadístico de prueba. Después no se rechaza o se rechaza la hipótesis nula. Si se rechaza ésta, se acepta la alternativa; a su vez, esta decisión tendrá efecto sobre otras decisiones 5
  • 6.
    PRUEBAS DE HIPÓTESISDE UNA POBLACIÓN P. Reyes/Sept. 2007 de los administradores operativos, como por ejemplo, mantener o no un estándar de desempeño o cuál de dos estrategias de mercadotecnia utilizar. La distribución apropiada de la prueba estadística se divide en dos regiones: una región de rechazo y una de no rechazo. Si estadístico de prueba cae en esta última región no se puede rechazar la hipótesis nula y se llega a la conclusión de que el proceso funciona correctamente. Al tomar la decisión con respecto a la hipótesis nula, se debe determinar el valor crítico en la distribución estadística que divide la región del rechazo (en la cual la hipótesis nula no se puede rechazar) de la región de rechazo. A hora bien el valor crítico depende del tamaño de la región de rechazo. Pasos de la prueba de hipótesis: 1. Definir el Problema ( Problema Práctico). 2. Señalar los Objetivos ( Problema Estadístico). 3. Determinar tipo de datos: Atributo o Variable. 4. Si son datos Variables: Hacer Prueba de Normalidad. 5. Establecer las Hipótesis: Hipótesis Nula (Ho con signo igual), o la Hipótesis Alterna (Ha con signo de mayor o menor). 6. Seleccionar el nivel de Alfa (normalmente 0.05 o 5%). 7. Establecer el tamaño de la muestra, 10≥ . 8. Desarrollar el Plan de Muestreo. 9. Seleccionar Muestras y Obtener Datos. 10.Decidir la prueba estadística apropiada y calcular el estadístico de prueba (Z, t, X2 o F) a partir de los datos. 6
  • 7.
    PRUEBAS DE HIPÓTESISDE UNA POBLACIÓN P. Reyes/Sept. 2007 11.Obtener el estadístico correspondiente de tablas o Excel. 12.Determinar la probabilidad de que el estadístico de prueba calculado ocurra al azar. 13.Comparar el estadístico calculado con el de tablas y ver si cae en la región de rechazo o ver si la probabilidad es menor a alfa, rechace Ho y acepte Ha. En caso contrario no rechace Ho. 14.Con los resultados interprete una conclusión estadística para la solución práctica. 7
  • 8.
    PRUEBAS DE HIPÓTESISDE UNA POBLACIÓN P. Reyes/Sept. 2007 2. Pruebas de hipótesis para una población Se trata de probar una afirmación sobre parámetros de la población (media µ; varianza σ2 o proporción π) en base a datos de estadísticos de una muestra (X media, s2 o p respectivamente): ELEMENTOS DE LA PRUEBA: • Prueba Estadística: Procedimiento para decidir aceptar o rechazar hipótesis. • Hipótesis: Es una afirmación acerca de una o más poblaciones. • Hipótesis Nula (Ho): Usualmente es una afirmación representando una situación “status quo”. Generalmente deseamos rechazar la hipótesis nula. o Es la hipótesis o afirmación a ser probada o Puede ser por ejemplo µ =, σ, o π a constante o Sólo puede ser rechazada o no rechazada • Hipótesis Alterna (Ha): Es lo que aceptamos si podemos rechazar la hipótesis nula. Ha es lo que queremos probar. o Es la hipótesis que se acepta como verdadera cuando se rechaza Ho, es su complemento o Puede ser por ejemplo   7 para prueba de dos colas µ < 7 para prueba de cola izquierda µ > 7 para prueba de cola derecha 8
  • 9.
    PRUEBAS DE HIPÓTESISDE UNA POBLACIÓN P. Reyes/Sept. 2007 • Estadístico de prueba: Calculado con datos de la muestra. • Región de Rechazo: Indica los valores de la prueba estadística para que podamos rechazar la Hipótesis nula (Ho). Esta región esta basada en un riesgo a deseado, normalmente 0.05 o 5%. • Estadístico de prueba(Z, t, X2 o F): Para probar la hipótesis nula se calcula un estadístico de prueba con la información de la muestra el cual se compara a un valor crítico apropiado. De esta forma se toma una decisión sobre rechazar o no rechazar la Ho. • Error tipo I (alfa = nivel de significancia, normal=0.05): Se comete al rechazar la Ho cuando en realidad es verdadera. También se denomina riesgo del productor • Error tipo II (beta): Se comete cuando no se rechaza la hipótesis nula siendo en realidad falsa. Es el riesgo del consumidor Las pruebas de hipótesis pueden ser de dos colas, de cola derecha o de cola izquierda, a continuación se esquematizan cada una de ellas. 9
  • 10.
    PRUEBAS DE HIPÓTESISDE UNA POBLACIÓN P. Reyes/Sept. 2007 3. Prueba de hipótesis Estadística - Hipótesis nula Ho, complemento de la Hipótesis alterna: o Es la hipótesis o afirmación a ser probada o Puede ser por ejemplo µ =, ≤, o ≥ a 5 o Sólo puede ser rechazada o no rechazada - Hipótesis alterna Ha, complemento de la hipótesis nula: o Es la hipótesis que se acepta como verdadera cuando se rechaza Ho, es su complemento o Si el signo de la hipótesis alterna es ≠ entonces se trata de una prueba de dos colas; si es > de cola derecha y si es < de cola izquierda. 10 Pruebas de Hipótesis de dos colas: Ho: a = b Ha: a ≠ b Pruebas de Hipótesis de cola derecha: Ho: a ≤ b Ha: a > b Pruebas de Hipótesis cola izquierda: Ho: a ≥ b Ha: a < b Zα/20-Zα/2 Región de Rechazo Región de Rechazo Zα/20 Región de Rechazo Zα/20-Zα/2 Región de Rechazo
  • 11.
    PRUEBAS DE HIPÓTESISDE UNA POBLACIÓN P. Reyes/Sept. 2007 o Puede ser por ejemplo µ ≠ 5 para prueba de dos colas o µ < 5 para prueba de cola izquierda o µ > 5 para prueba de cola derecha Pasos de la prueba de hipótesis: • Se plantea inicialmente la Ha si en el problema se muestra la afirmación de ser menor o mayor a un valor establecido histórico. • Se plantea inicialmente la Ho si en el problema se muestra la afirmación igual (es, históricamente ha sido); mayor o igual (cuando menos) o menor o igual (a lo más) a un valor establecido histórico. • No importa cual se plantee primero, siempre la conclusión se hace contra la Ho (se rechaza o no se rechaza) • El intervalo de confianza es el intervalo donde se estima que se encuentre el parámetro de la población (media µ; varianza σ2 o proporción π) para un cierto nivel de confianza o de significancia. 11 Regiones de rechazo
  • 12.
    PRUEBAS DE HIPÓTESISDE UNA POBLACIÓN P. Reyes/Sept. 2007 Estadístico de prueba o Para probar la hipótesis nula se calcula un estadístico de prueba con la información de la muestra el cual se compara a un valor crítico apropiado. De esta forma se toma una decisión sobre rechazar o no rechazar la Ho - Error tipo I (alfa = nivel de significancia, es común = 0.05 ). Alfa = 1- Nivel de confianza o Se comete al rechazar la Ho cuando en realidad es verdadera. También se denomina riesgo del productor. - Error tipo II (beta ) o Se comete cuando no se rechaza la hipótesis nula siendo en realidad falsa. Es el riesgo del consumidor Pruebas de Hipótesis de dos colas: Si la Ho: µ = que un valor poblacional, entonces el riesgo alfa se reparte en ambos extremos de la distribución. Por ejemplo si Ha: µ≠ 10 se tiene: Ho: a = b Ha: a ≠ b 12
  • 13.
    PRUEBAS DE HIPÓTESISDE UNA POBLACIÓN P. Reyes/Sept. 2007 Pruebas de Hipótesis de cola derecha: Si la Ho: µ ≤, que un valor poblacional, entonces el riesgo alfa se coloca en el extremo derecho de la distribución. Por ejemplo si Ho µ ≤ 10 y Ha: µ >10 se tiene una prueba de cola derecha: Ho: a ≤ b Ha: a > b 13 Región de rechazo Regiones de rechazo
  • 14.
    PRUEBAS DE HIPÓTESISDE UNA POBLACIÓN P. Reyes/Sept. 2007 Pruebas de Hipótesis cola izquierda: Si la Ho: µ ≥ que un valor poblacional, entonces el riesgo alfa se coloca en el extremo izquierdo de la distribución. Por ejemplo si Ho µ ≥ 10 y Ha: µ < 10 se tiene una prueba de cola izquierda: Ho: a ≥ b Ha: a < b 14 Región de rechazo
  • 15.
    PRUEBAS DE HIPÓTESISDE UNA POBLACIÓN P. Reyes/Sept. 2007 Pasos para realizar una prueba de hipótesis Probar la hipótesis de igualdad de una media µ para n > 30 1) Establecer las hipótesis e identificar el nivel de significancia alfa o 1- Nivel de confianza (NC) Ho: µ=µο Ha: µ≠µο 2) Calcular el estadístico de prueba Zc o Tc con fórmula 3) Determinar el estadístico de tablas Zt o Tc de Excel para una cierta alfa o 1-NC 4) Establecer la región de rechazo con Zt y ver si cae ahí Zc Las regiones de rechazo prueba de 2 colas: -Zα/2 y Zα/2 5) Determinar el Intervalo de confianza para la media y ver si incluye a la media de la hipótesis, si no rechazar Ho 6) Determinar el valor P correspondiente a Zc y comparar contra Alfa/2, si es menor rechazar Ho 15
  • 16.
    PRUEBAS DE HIPÓTESISDE UNA POBLACIÓN P. Reyes/Sept. 2007 4. Fórmulas para calcular los estadísticos de prueba Fórmulas para Intervalos de confianza de parámetros de una población a) Intervalo de confianza para estimar µ con muestras grandes (n >= 30 ) y cuando ya se cuenta con historial, o sea que σ es conocida: n ZXparaIC σ µ α 2/±= Si la σ no se conoce entonces se usa S de la muestra en su lugar n S ZXparaIC 2/αµ ±= b) Intervalo de confianza para estimar µ con muestras pequeñas (n < 30; grados de libertad = gl. = n –1): n S tXparaIC gl,2/αµ ±= c) Intervalo de confianza para estimar π proporción poblacional: p p SZpparaIC n pp S 2/ )1( απ ±= − = d) Tamaño de muestra para estimar µ en función del error )( µ−X : 2 2 2/ )( µ α − = X Z n e) Tamaño de muestra para estimar π en función del error )( π−p , en el peor caso π = 0.5: 2 2 2/ )( )1)(( π ππα − − = p Z n 16
  • 17.
    PRUEBAS DE HIPÓTESISDE UNA POBLACIÓN P. Reyes/Sept. 2007 Fórmulas para calcular los estadísticos utilizados en las pruebas de Hipótesis de una pob. f) Estadístico Zc muestras grandes (n >= 30 ) y cuando la σ es conocida (ya se tiene historial): n X Zc HIPOTESIS σ µ− = f) Si no se conoce la σ entonces se reemplaza por la S de la muestra. g) Estadístico tc para muestras pequeñas (n < 30) y la σ es desconocida: ns X t HIPOTESIS C µ− = h) Estadístico Zc para proporciones y muestras grandes (n >= 30): p HIPOTESIS HIPOTESISHIPOTESIS p p Zc n σ π ππ σ − = − = )1( 17
  • 18.
    PRUEBAS DE HIPÓTESISDE UNA POBLACIÓN P. Reyes/Sept. 2007 Ejemplos de cada uno de los casos a) Estadístico Zc muestras grandes (n >= 30 ) o cuando la σ es conocida (ya se tiene historial): valorHa valorHo ≠ = µ µ : : n X Zc HIPOTESIS σ µ− = Estadístico de tablas Zalfa o Zalfa/2 en Excel =DISTR.NORM.ESTAND.INV(alfa o alfa/2) Estadístico de tablas Zalfa o Zalfa/2 en Minitab >Calc >Probability distributions> Normal: Inverse Cummulative prob; Mean = 0; Std. Dev. = 0; Input constant = Alfa o alfa/2 Intervalo de confianza para estimar µ con muestras grandes (n >= 30) o cuando ya se cuenta con historial, o sea que σ es conocida: n ZXparaIC σ µ α 2/±= Si no se conoce la σ entonces se reemplaza por la S de la muestra. n S ZXparaIC 2/αµ ±= El valor p de probabilidad correspondiente al estadístico Zc se determina como sigue: 18
  • 19.
    PRUEBAS DE HIPÓTESISDE UNA POBLACIÓN P. Reyes/Sept. 2007 P value en Excel =DISTR.NORM.ESTAND(Zc) P value en Minitab >Calc >Probability distributions> Normal: Cummulative prob; Mean = 0; Std. Dev. = 0; Input constant = Zc Prueba de hipótesis en Minitab: >Stat >Basic statistics > 1-Sample Z Utilizar Sample in columns o Summarized data Sample size 49 Mean 11.5 Standar deviation 1.1 Test Mean 12 Graphs – Seleccionar º! Individual value plot Confidence level 90% Alternative not equal OK Resultados: One-Sample Z Test of mu = 12 vs not = 12 The assumed standard deviation = 1.1 N Mean SE Mean 90% CI Z P 49 11.5000 0.1571 (11.2415, 11.7585) -3.18 0.001 Criterios de rechazo de Ho: 19
  • 20.
    PRUEBAS DE HIPÓTESISDE UNA POBLACIÓN P. Reyes/Sept. 2007 Si Zc cae en la zona de rechazo El valor de la Hipótesis no se encuentra en el Intervalo de confianza El valor P es menor que el valor de alfa (prueba de una cola) o de alfa/2 (dos colas). b) Estadístico tc para muestras pequeñas (n < 30) y la σ es desconocida: valorHa valorHo ≠ = µ µ : : ns X t HIPOTESIS C µ− = Estadístico de tablas Talfa o Talfa/2 en Excel =DISTR.T.INV(2*alfa o alfa, grados de libertad n-1) Estadístico de tablas Talfa o Talfa/2 en Minitab >Calc >Probability distributions> : Inverse Cummulative prob; Degrees of freedom = n-1; Input constant = Alfa o alfa/2 Intervalo de confianza para estimar µ con muestras pequeñas (n < 30; grados de libertad (gl.) = n –1): n S tXparaIC gl,2/αµ ±= El valor p de probabilidad correspondiente al estadístico Tc se determina como sigue: P value en Excel =DISTR.T(Tc, grados de libertad, 1 o 2 colas) P value en Minitab >Calc >Probability distributions> T: 20
  • 21.
    PRUEBAS DE HIPÓTESISDE UNA POBLACIÓN P. Reyes/Sept. 2007 Cummulative prob; Degrees of freedom = n-1; Input constant = Tc Prueba de hipótesis en Minitab: >Stat >Basic statistics > 1-Sample t Utilizar Sample in columns o Summarized data Sample size 10 Mean 11277 Standar deviation 3772 Test Mean 12000 Graphs – Seleccionar º! Individual value plot Confidence level 95% Alternative not equal OK Resultados: One-Sample T Test of mu = 12000 vs not = 12000 N Mean StDev SE Mean 95% CI T P 10 11277.0 3772.0 1192.8 (8578.7, 13975.3) -0.61 0.559 Criterios de rechazo de Ho: Si Tc cae en la zona de rechazo El valor de la Hipótesis no se encuentra en el Intervalo de confianza 21
  • 22.
    PRUEBAS DE HIPÓTESISDE UNA POBLACIÓN P. Reyes/Sept. 2007 El valor P es menor que el valor de alfa (prueba de una cola) o de alfa/2 (dos colas). c) Estadístico Zc para proporciones y muestras grandes (n >= 30): valorHa valorHo ≠ = π π : : p HIPOTESIS HIPOTESISHIPOTESIS p p Zc n σ π ππ σ − = − = )1( Estadístico de tablas Zalfa o Zalfa/2 en Excel =DISTR.NORM.ESTAND.INV(alfa o alfa/2) Estadístico de tablas Zalfa o Zalfa/2 en Minitab >Calc >Probability distributions> Normal: Inverse Cummulative prob; Mean = 0; Std. Dev. = 0; Input constant = Alfa o alfa/2 Intervalo de confianza para estimar π proporción poblacional: p p SZpparaIC n pp S 2/ )1( απ ±= − = El valor p de probabilidad correspondiente al estadístico Zc se determina como sigue: 22
  • 23.
    PRUEBAS DE HIPÓTESISDE UNA POBLACIÓN P. Reyes/Sept. 2007 P value en Excel =DISTR.NORM.ESTAND(Zc) P value en Minitab >Calc >Probability distributions> Normal: Cummulative prob; Mean = 0; Std. Dev. = 0; Input constant = Zc 23
  • 24.
    PRUEBAS DE HIPÓTESISDE UNA POBLACIÓN P. Reyes/Sept. 2007 Prueba de hipótesis en Minitab >Stat >Basic statistics > 1- Proportion Summarized data Number of trial 500 Number of events 225 Graphs – Seleccionar º! Individual value plot Confidence level 98% Test proportion 0.40 Alternative Less than º! Use test and interval based on normal distribution OK Resultados Test and CI for One Proportion Test of p = 0.4 vs p < 0.4 98% Upper Sample X N Sample p Bound Z-Value P-Value 1 225 500 0.450000 0.495693 2.28 0.989 Criterios de rechazo de Ho: Si Zc cae en la zona de rechazo 24
  • 25.
    PRUEBAS DE HIPÓTESISDE UNA POBLACIÓN P. Reyes/Sept. 2007 El valor de la Hipótesis no se encuentra en el Intervalo de confianza El valor P es menor que el valor de alfa (prueba de una cola) o de alfa/2 (dos colas). d) Cálculo del estadístico con base en Chi cuadrada para prueba de una varianza. Ho: 2 σ = 2 0σ Ho: 2 σ ≠ 2 0σ El estad Donde: 2 0σ la varianza de la hipótesis N = número de datos de la muestra S2 = varianza de los datos de la muestra 25
  • 26.
    PRUEBAS DE HIPÓTESISDE UNA POBLACIÓN P. Reyes/Sept. 2007 e) Tamaño de muestra para estimar µ en función del error )( µ−X : 2 2 2/ )( µ α − = X Z n f) Tamaño de muestra para estimar π en función del error )( π−p , en el peor caso π = 0.5: 2 2 2/ )( )1)(( π ππα − − = p Z n 26
  • 27.
    PRUEBAS DE HIPÓTESISDE UNA POBLACIÓN P. Reyes/Sept. 2007 5. Ejemplos de pruebas de hipótesis de una población Ejemplos de Prueba de hipótesis Estadística Paso 1. Para una muestra grande (n >30) probar la hipótesis de una media µ . Establecer alfa. Ho: oµµ = Ha: 0µµ ≠ Paso 2. Calcular el estadístico de prueba n s Zcalc 0µµ − = Paso 3. Establecer la región de rechazo, para prueba de 2 colas: 22 αα ψ ZZ− Paso 4. Si el valor del estadístico de prueba cae en la región de rechazo rechazaremos Ho de otra manera no podemos rechazar Ho. 27 Zα/2 0 -Zα/2 Región de Rechazo Región de Rechazo
  • 28.
    PRUEBAS DE HIPÓTESISDE UNA POBLACIÓN P. Reyes/Sept. 2007 Paso 5. Calcular el intervalo de confianza IC para un nivel de confianza de 1-alfa, si la media de la hipótesis se encuentra dentro del intervalo, no rechazar Ho y viceversa. Paso 6. Calcular el valor de Probabilidad P para el estadístico calculado a partir de la muestra Zc o Tc por medio de: Para Zc: P = distr.norm.estand.inv(-Zc) Para Tc: P = distr.t.inv(Tc, grados de libertad, 1 o 2 colas) Para Chi2: P = Prueba.chi.inv(Chi c, grados de libertad) Si el valor de P es menor o igual a alfa se rechaza Ho y se acepta Ha (en el caso de dos colas el valor de P total es del doble del calculado). Prueba Z de 2 colas Problema 1 Los enanos de Blanca Nieves le informan que excavan 12 toneladas promedio por semana. Nieves recolecta datos de 49 semanas y obtiene X=11.5, s= 1.1 a un nivel de significancia α=10%. Los Enanos están en lo cierto. Solución 1) Planteamiento de hipótesis Ho: μ=12 Ha: μ≠12 2) Determinar estadístico de la prueba Z 28
  • 29.
    PRUEBAS DE HIPÓTESISDE UNA POBLACIÓN P. Reyes/Sept. 2007 Zc= 11.5 – 12/ (1.1 / √49) = -0.5/ 0.157 = -3.185 3) Determinar el valor de Zt de acuerdo al valor de alfa 10% / 2 = 0.05 Z de tablas 0.05 = -1.64 4) Interpretación y conclusiones Dado que Zc=-3.185 es menor que Zt=-1.64 la Ho se rechaza a un nivel alfa del 10%. Los enanos no excavan 12 toneladas al día 5) Intervalo de confianza IC = Media +-Zalfa/2* S/ raiz(n) IC = 11.5+- 1.64* 1.1/raiz(49) = (11.242, 11.75) La media de la hipótesis no se encuentra en el intervalo de confianza, se rechaza Ho. 6) Valor P del estadístico de prueba P =distr.norm.estand(Zc) =distr.norm.estand(-3.18) = 0.00073 Como el valor P es menor a alfa/2 entonces se rechaza Ho 29
  • 30.
    PRUEBAS DE HIPÓTESISDE UNA POBLACIÓN P. Reyes/Sept. 2007 Prueba Minitab: >Stat >Basic statistics > 1-Sample Z Summarized data Sample size 49 Mean 11.5 Standar deviation 1.1 Test Mean 12 Graphs – Seleccionar º! Individual value plot Confidence level 90% Alternative not equal OK RESULTADOS Y CONCLUSIONES…… Problema 2 Se quiere probar la afirmación de que la distancia promedio viajada por pelotas de golf es de 250 yardas a un 95% de confianza. Z Se toma una muestra de 16 distancias 269 300 268 278 282 263 301 295 288 278 276 286 296 265 271 30
  • 31.
    PRUEBAS DE HIPÓTESISDE UNA POBLACIÓN P. Reyes/Sept. 2007 279 RESULTADOS Y CONCLUSIONES…… En vez de seleccionar Summarized data, seleccionar Samples in columns Prueba Z de una cola Problema 3 Se planea en un restaurante eliminar del menú el pollo frito. Se afirma que las ventas habían descendido por debajo de la media histórica de $4500. ¿Parece una decisión adecuada si en una muestra de n=144 observaciones se observa Xmedia= 4,477, s=1,128 con α= 2%? Solución 1) Planteamiento de hipótesis Ho: μ≥4500 Ha: μ<4500 2) Determinar estadístico de la prueba Z Zc= 4477 – 4500 / (1128 / √144) = -23/ 94= -0.245 3) Determinar el valor de Z en tablas de acuerdo al valor de alfa 2% Zt de tablas 0.02 = -2.053 4) Interpretación y conclusiones Dado que Zc=-0.245 es mayor que Zt=-2.053 la Ho no se rechaza a una alfa del 2%. 31
  • 32.
    PRUEBAS DE HIPÓTESISDE UNA POBLACIÓN P. Reyes/Sept. 2007 5) Intervalo de confianza IC = Media +-Zalfa/2* S/ raiz(n) IC = 4477 +- 2.053* 1128/raiz(144) = (4284.01, 4669.98) La media de la hipótesis si se encuentra en el intervalo de confianza, no se rechaza Ho. 6) Valor P del estadístico de prueba P =distr.norm.estand(Zc) =distr.norm.estand(-0.245) = 0.4032 Como el valor P es mayor a alfa entonces no se rechaza Ho, no han descendido las ventas. Prueba Minitab (Options: Confidence level 98% Alternative Less Than) RESULTADOS Y CONCLUSIONES…… Prueba t de dos colas Problema 4 Un distribuidor piensa que el promedio de sus ventas son de $12000 al mes. Selecciona n=10 meses y encuentra X=11,277, s=3,772. Aun alfa del 5% ¿qué se puede concluir? Solución 1) Planteamiento de hipótesis Ho: μ=12000 Ha: μ≠12000 32
  • 33.
    PRUEBAS DE HIPÓTESISDE UNA POBLACIÓN P. Reyes/Sept. 2007 2) Determinar estadístico de la prueba t tc= 11277 – 12000 / (3772 / √10) = -723 / 1192.81 = - 0.6061 3) Determinar el valor de t en tablas de acuerdo al valor de alfa y los grados de libertad gl= n-1= 10-1 =9 para un alfa / 2 de 0.05/2= 0.025 tt de tablas para 0.025 con 9 gl = 2.262 con =distr.t.inv(0.05,9) = 2.262 4) Interpretación y conclusiones Dado que tc= -0.6061 es mayor que tt= - 2.262 la Ho no se rechaza a un nivel alfa del 5%. Las ventas son de $12000 al mes 5) Intervalo de confianza IC = Media +-Talfa/2* S/ raiz(n) IC = 11277+- 2.262* 3772/raiz(10) = ( 8578.86, 13975.14) La media de la hipótesis se encuentra en el intervalo de confianza, NO se rechaza Ho. 6) Valor P del estadístico de prueba P =distr.t(Tc, gl, colas) =distr.t(0.6061, 9, 2) = 0.5594 Como el valor P es mayor a alfa/2 entonces NO se rechaza Ho, las ventas son de $12000. Prueba Minitab 33
  • 34.
    PRUEBAS DE HIPÓTESISDE UNA POBLACIÓN P. Reyes/Sept. 2007 >Stat >Basic statistics > 1-Sample t Summarized data Sample size 10 Mean 11277 Standar deviation 3772 Test Mean 12000 Graphs – Seleccionar º! Individual value plot Confidence level 95% Alternative not equal OK RESULTADOS Y CONCLUSIONES…… Problema 5 Las ganancias por acción son de 3 dolares, probar para un 95% de confianza si esto es cierto. Una muestra de datos arrojó los resultados siguientes: 1.92 2.16 3.63 3.16 4.02 3.14 2.2 2.34 3.05 2.38 34
  • 35.
    PRUEBAS DE HIPÓTESISDE UNA POBLACIÓN P. Reyes/Sept. 2007 RESULTADOS Y CONCLUSIONES…… Prueba t de una cola Problema 6 La vida útil de un foco es de 5,000 horas. Un nuevo diseño se piensa incremente esta vida. Se prueban n=25 focos con fusión a X=5,117, s= 1,886. Concluir para un nivel alfa del 5%. Solución 1) Planteamiento de hipótesis Ho: μ≤5000 Ha: μ>5000 2) Determinar estadístico de la prueba t tc= 5117 – 5000 / (1886 / √25) = 117 / 377.2 = 0.310 3) Determinar el valor de t en tablas de acuerdo al valor de alfa y los grados de libertad 35
  • 36.
    PRUEBAS DE HIPÓTESISDE UNA POBLACIÓN P. Reyes/Sept. 2007 gl= n-1= 25-1 =24 para alfa de 0.05 tt de tablas 0.05 con 24 gl = 1.71 de =distr.t.inv(0.1,24) =1.71 4) Interpretación y conclusiones Dado que tc=0.310 es menor que tt=1.71 la Ho no se rechaza a un nivel alfa de 5%. La vida de los focos es de 5000 horas. 5) Intervalo de confianza IC = Media +-Talfa/2* S/ raiz(n) IC = 5117+- 1.71* 1886/raiz(25) = ( 4471.988, 5762.012 ) La media de la hipótesis se encuentra en el intervalo de confianza, NO se rechaza Ho. 6) Valor P del estadístico de prueba P =distr.t(Tc, gl, colas) =distr.t(0.31, 24, 1) = 0.3796 Como el valor P es mayor a alfa entonces NO se rechaza Ho, la vida es de 5000 Hrs. Prueba Minitab (Confidence level 95% Alternative greater than) RESULTADOS Y CONCLUSIONES…… Problema 7 Las horas tomadas para plantar un árbol mediano son las siguientes. Probar a un 5% si el tiempo es > 2 Hrs. 36
  • 37.
    PRUEBAS DE HIPÓTESISDE UNA POBLACIÓN P. Reyes/Sept. 2007 1.9 1.7 2.8 2.4 2.6 2.5 2.8 3.2 1.6 2.5 RESULTADOS Y CONCLUSIONES…… Prueba Z para una proporción Problema 8 Midwest planea comercializar un producto sólo si por lo menos el 40% del público lo prefiere. En una muestra de 500 personas encuentra que 225 lo prefieren. ¿A un nivel alfa de 2%, Midwest debe comercializar el producto? Solución 1) Planteamiento de hipótesis Ho: π≥0.40 Ha: π<0.40 2) Determinar estadístico de la prueba Z σp = √(0.40)(1-0.40) / 500 = 0.022 p= 225/500 = 0.45 Zc= 0.45-0.40/ 0.022) = 0.05/ 0.022 = 2.27 3) Determinar el valor de Z en tablas de acuerdo al valor de alfa 0.02% 37
  • 38.
    PRUEBAS DE HIPÓTESISDE UNA POBLACIÓN P. Reyes/Sept. 2007 Z de tablas para 0.02 = -2.053 4) Interpretación y conclusiones Dado que Zc=2.27 es mayor que Zt=-2.053 la Ho no se rechaza a un nivel alfa del 2%. La proporción no es menor al 40% se debe comercializar el producto. 5) Intervalo de confianza p = 225/500 = 0.45 Sp = raiz (p(1-p)/n)) = raiz(0.45(0.55)/500) = 0.02418 IC = p +- Zalfa/2 * Sp IC = 045 +- 2.053*0.024 = (0.400, 0.4992) La media de la hipótesis se encuentra en el intervalo de confianza, NO se rechaza Ho. 6) Valor P del estadístico de prueba P =distr.norm.estand (Zc) =distr.norm.estand (2.27) = 0.98839 Como el valor P es mayor a alfa/2 entonces NO se rechaza Ho, la proporción es 0.40. Prueba Minitab >Stat >Basic statistics > 1- Proportion 38
  • 39.
    PRUEBAS DE HIPÓTESISDE UNA POBLACIÓN P. Reyes/Sept. 2007 Summarized data Number of trial 500 Number of events 225 Graphs – Seleccionar º! Individual value plot Confidence level 98% Test proportion 0.40 Alternative Less than º! Use test and interval based on normal distribution OK RESULTADOS Y CONCLUSIONES…… 39
  • 40.
    PRUEBAS DE HIPÓTESISDE UNA POBLACIÓN P. Reyes/Sept. 2007 Problema 9 Un estudio indicó que el 64% de los consumidores de supermercado creen en las marcas propias. El fabricante de una salsa de tomate preguntó a 100 compradores donde 52 prefieren marca propia, probar si el porcentaje de preferencias es menor al 64%, para un 5% de nivel de significancia Ha: pi < 0.64 Ho: Pi >= 0.64 Trials 100 Prueba de cola izquierda Events 52 NC 95% Alternate Less Than RESULTADOS Y CONCLUSIONES…… Problema 10 Midlakes canceló sus vuelos ya que se estimó que más del 18% involucraba aviones con fallas mecánicas. ¿Este estimado se confirma a un nivel alfa del 0.05 si D = 24 aviones de n = 120 tenían fallas? Solución 1) Planteamiento de hipótesis Ho: π ≤0.18 Ha: π >0.18 2) Determinar estadístico de la prueba Z σp = √(0.18)(1-0.18) / 120 = 0.035 p= 24/120 = 0.2 Zc= 0.2-0.18/ 0.035) = 0.02/ 0.035 = 0.571 3) Determinar el valor de Z en tablas de acuerdo al valor de alfa de 0.05% Z de tablas para 0.05 = 1.64 40
  • 41.
    PRUEBAS DE HIPÓTESISDE UNA POBLACIÓN P. Reyes/Sept. 2007 4) Interpretación y conclusiones Dado que Zc=0.571 es menor que Zt=1.64 la Ho no se rechaza a un nivel de confianza del 5%. La proporción de aviones con falla es del 0.18 5) Intervalo de confianza p = 24/120 = 0.2 Sp = raiz (p(1-p)/n)) = raíz(0.2(0.8)/120) = 0.0365 IC = p +- Zalfa/2 * Sp IC = 0.2 +- 1.64*0.0365 = (0.1402, 0.2598) La media de la hipótesis se encuentra en el intervalo de confianza, NO se rechaza Ho. 6) Valor P del estadístico de prueba P =distr.norm.estand (Zc) =distr.norm.estand (-0.571) = 0.284 Como el valor P es mayor a alfa/2 entonces NO se rechaza Ho, la proporción es 0.18. Prueba Minitab (Confidence level 95% Alternative Greater than) RESULTADOS Y CONCLUSIONES…… 41
  • 42.
    PRUEBAS DE HIPÓTESISDE UNA POBLACIÓN P. Reyes/Sept. 2007 Prueba de hipótesis para una varianza Problema 10 Se trata de probar si la varianza poblacional de las rentas en las ciudades es de 30. Los datos de la renta para diferentes ciudades es la siguiente: Ciudad Renta A 47 B 50 C 53 D 45 E 40 F 43 G 39 H 37 La varianza de los datos en Excel es: = Var( datos de rentas ) = 31.0714286 Paso 1. σ2 = σ0 2 σ2 ≠ σ0 2 Ho: Varianza = 30 Ha: Varianza ≠ 30 Paso 2. Estadístico de Prueba Chi cuadrado calculado Chic: Donde: σ0 2 = Varianza de Ho = 30; N = número de datos = 8; Varianza de datos S2 = 31.0714286 42
  • 43.
    PRUEBAS DE HIPÓTESISDE UNA POBLACIÓN P. Reyes/Sept. 2007 χc 2 = (8-1)*31.0714286 / 30 = 7.25 Paso 3. Estadístico correspondiente a alfa α =0.05 (por tanto α/2 = 0.025). De tablas o con Excel por ser una prueba de dos colas: χ2 α/2, n-1 = prueba.chi.inv(0.025, 8-1) = 16.0127643 χ2 (1-α/2), n-1 = prueba.chi.inv(0.975, 8-1) = 1.68986919 Paso 4. Se observa si el χ2 c cae en la zona de rechazo, como en este caso no es así, no hay evidencia suficiente para rechazar Ho, y se considera que la varianza si es de 30. Paso 5. Calculando el valor P correspondiente a la Chi calculada (χ2 c se tiene: P = distr.Chi(χ2 c, n-1) = distr.chi(7.25, 7) = 0.4033 Como el valor P correspondiente a X2 c es mayor que Alfa/2, no se rechaza la Ho 43 α/2 = 0.025 α/2 = 0.025 α/2 = 0.025 P =0.4033
  • 44.
    PRUEBAS DE HIPÓTESISDE UNA POBLACIÓN P. Reyes/Sept. 2007 Paso 6. Calculando ahora el intervalo de confianza para la varianza poblacional se tiene: Sustituyendo valores se tiene: (13.58291398, 128.7081872) Como el 30 de la Ho se encuentra en el intervalo de confianza, no se rechaza Ho indicando que la varianza no es diferente de 70. 44
  • 45.
    PRUEBAS DE HIPÓTESISDE UNA POBLACIÓN P. Reyes/Sept. 2007 6. Ejercicios adicionales: 12. Los tiempos que toma el registro de las órdenes en un negocio son los siguientes: 1.9 1.7 2.8 2.4 2.6 2.5 2.8 3.2 1.6 2.5 a) Probar a un Nivel de Confianza del 90% si el tiempo es mayor a 1.98. b) Probar a un alfa de 0.02 si la desviación estándar es mayor a 0.6. 13. Se quiere probar la afirmación de que la distancia viajada por pelotas de golf es de 250 yardas a un 95% de confianza.Se toma una muestra de 36 distancias 269 300 268 278 282 263 301 295 288 278 276 286 296 265 271 279 284 260 275 282 260 266 270 293 272 285 293 281 269 291 274 277 299 263 264 273 14. Las Ganancias por acción son de 3 dólares para un 95% de confianza, probar esta afirmación.. Una muestra de datos arrojó los resultados siguientes: 1.92 2.16 3.63 3.16 4.02 3.14 2.2 2.34 3.05 2.38 15. Un estudio encontró que 40% de los usuarios de Internet recibieron más de 10 mensajes diarios. Si de 420 usuarios 188 recibieron estos mensajes, a un nivel de 5% ¿Cuál es la conclusión? 45
  • 46.
    PRUEBAS DE HIPÓTESISDE UNA POBLACIÓN P. Reyes/Sept. 2007 16. Un estudio indicó que el 64% de los consumidores de supermercado creen en las marcas propias. El fabricante de una salsa de tomate preguntó a 100 compradores donde 52 prefieren marca propia, probar si el porcentaje de preferencias es menor al 64%, para un 5% de nivel de significancia. 17. Un restaurante planea una oferta especial si más del 15% de los clientes compra vasos de diseño especial con personajes de caricaturas. En una prueba 88 de 500 clientes compraron vasos. A un 0.01 de nivel de significancia, ¿Cuál es su recomendación? 18. Las rentas diarias de automoviles en Dólares de ocho ciudades se muestra a continuación: Ciudad A B C D E F G H Renta 47 50 53 45 40 43 39 37 ¿A un 5% se comprueba la hipótesis de que la varianza de la población es de 30? 19. Se midió la temperatura de fusión de un aceite vegetal hidrogenado en n=16 muestras y se encontró una media de 94.32. Si la temperatura de fusión sigue una distribución normal con sigma = 1.20. a) Probar a un 95% de nivel de confianza de que la media se ha mantenido en 95. 20. La duración promedio de cierto foco es de 750 horas. El cliente cambiaría de marca sólo que se demuestre que de manera concluyente que la vida de los focos es menor que la anunciada. Se elige una muestra 46
  • 47.
    PRUEBAS DE HIPÓTESISDE UNA POBLACIÓN P. Reyes/Sept. 2007 aleatoria de 20 focos, se determina su duración y se obtiene una vida media de 738.44 con una desviación estándar de 38.20. a) ¿Cuál sería la conclusión a un 95% de nivel de confianza? 21. Después de ciertas horas de trabajo se determinó el desgaste de flechas en 0.0001” para cada una de las n=8 máquinas que tienen plomo y cobre como material de soporte, y se obtuvo como resultado que la media fue de 3.72 con desviación estándar de 1.25. a) Se desea probar si el desgaste es mayor a 3.5 a un 95% de nivel de confianza. 22. Las lecturas de radiación de Radón tomadas en 12 lugares fueron como sigue: 105.6, 90.9, 91.2, 96.9, 96.5, 91.3, 100.1, 105, 99.6, 107.7, 103.3 y 92.4. a) A un alfa de 5%, ¿indican las lecturas que difieren de 100?. 23. Se prueban 100 baterías de Ni-H para celdas de prueba y se determina que 14 de ellas se ampoyan en sus placas fallando. Para un 5% de nivel de significancia. a) ¿Proporciona lo anterior una evidencia de que más del 10% de las baterías fallan? 24. Para un cierto servicio los tiempos de respuesta son de 3 horas, probar la afirmación para un 98% de nivel de confianza. 47
  • 48.
    PRUEBAS DE HIPÓTESISDE UNA POBLACIÓN P. Reyes/Sept. 2007 Una muestra de datos arrojó los resultados siguientes: 1.92 2.16 3.63 3.16 4.02 3.14 2.2 2.34 3.05 2.38 25. Las horas tomadas para mantenimiento son las siguientes. Probar a un 5% si el tiempo es > 2 Hrs. Tiempos 1.9 1.7 2.8 2.4 2.6 2.5 2.8 3.2 1.6 2.5 26. Un estudio encontró que 40% de los usuarios de Internet recibieron más de 10 mensajes diarios Si de 420 usuarios 188 recibieron estos mensajes, a un nivel de 5% ¿Cúal es la conclusión? 48
  • 49.
    PRUEBAS DE HIPÓTESISDE UNA POBLACIÓN P. Reyes/Sept. 2007 27. Un estudio indicó que el 64% de los consumidores de supermercado creen en las marcas propias. El fabricante de una salsa de tomate preguntó a 100 compradores donde 52 prefieren marca propia, probar si el porcentaje de preferencias es menor al 64%, para un 5% de nivel de significancia. 49