Este documento describe los conceptos básicos de las pruebas de hipótesis. Explica que una prueba de hipótesis involucra contrastar una hipótesis nula con una hipótesis alternativa mediante la toma de una decisión estadística. También define los términos hipótesis nula, hipótesis alternativa y nivel de significancia, los cuales son elementos clave de cualquier prueba de hipótesis. Por último, presenta ejemplos detallados del uso de las pruebas Z de una muestra y t de una m
1. ESTADÍSTICA APLICADA
A LA INGENIERÍA
PRUEBA DE HIPOTESIS
Una prueba de hipótesis es cualquier afirmación acerca de
una población y/o Sus parámetros. Consiste en contrastar
dos hipótesis estadísticas. Tal contraste involucra la toma de
decisión acerca de las hipótesis. La decisión consiste en
rechazar o no una hipótesis en favor de la otra.
KASSANDRA MARGARITA GÓMEZ RODRÍGUEZ
[Seleccionarfecha]
PROFESOR: EDGAR MATA ORTIZ
2. INTRODUCCIÓN
Las hipótesis constituyen instrumentos muy poderosos para el avance del
conocimiento, puesto que aunque sean formuladas por el hombre, pueden ser
sometidas a prueba y demostrarse como probablemente correctas o incorrectas
sin que interfieran los valores y las creencias del individuo”.
En realidad no podemos probar que una hipótesis sea verdadera o falsa, sino
argumentar que de acuerdo con ciertos datos obtenidos en una investigación
particular, fue apoyada o no. Desde el punto de vista técnico no se acepta una
hipótesis a través de un estudio, sino que se aporta evidencia en su favor o en su
contra. Desde luego, cuantas más investigaciones apoyen una hipótesis, más
credibilidad tendrá ésta; y por supuesto, es válida para el contexto (lugar, tiempo
y sujetos u objetos) en el cual se comprobó. Al menos lo es probabilísticamente.
Una hipótesis estadística se denota por “H” y son dos:
- Ho: hipótesis nula
- H1: hipótesis alternativa
Partes de una hipótesis
- La hipótesis nula “Ho”
Se refiere siempre a un valor especifico del parámetro de la población, no a una
estadística de muestra. La letra H significa hipótesis y el subíndice cero no hay
diferencia. Por lo general hay un “no” en la hipótesis nula que indica que “no hay
cambio” Podemos rechazar o aceptar Ho.
Por lo tanto la hipótesis nula es una afirmación que no se rechaza a menos que
los datos muestrales proporcionen evidencia convincente de que es falsa. El
planteamiento de la hipótesis nula siempre contiene un signo de igualdad con
respecto al valor especificado del parámetro.
3. - La hipótesis alternativa “H1”
Es cualquier hipótesis que difiera de la hipótesis nula. Es una afirmación que se
acepta si los datos muestrales proporcionan evidencia suficiente de que la
hipótesis nula es falsa. Se le conoce también como la hipótesis de investigación.
El planteamiento de la hipótesis alternativa nunca contiene un signo de igualdad
con respecto al valor especificado del parámetro.
2. Nivel de significancia
Probabilidad de rechazar la hipótesis nula cuando es verdadera. Se le denota
mediante la letra griega α, también es denominada como nivel de riesgo, este
término es más adecuado ya que se corre el riesgo de rechazar la hipótesis nula,
cuando en realidad es verdadera.
La distribución de muestreo de la estadística de prueba se divide en dos
regiones, una región de rechazo (conocida como región crítica) y una región de
no rechazo (aceptación). Si la estadística de prueba cae dentro de la región de
aceptación, no se puede rechazar la hipótesis nula. Estos valores no son tan
improbables de presentarse si la hipótesis nula es falsa. El valor crítico separa la
región de no rechazo de la de
rechazo.
4. PRUEBA DE HIPOTESIS
Z de 1MUESTRA:
Z de 1 muestra calcula un intervalo de confianza o realiza una prueba de
hipótesis de la media cuando la desviación estándar de la población, s, es
conocida. Este procedimiento se basa en una distribución normal, de manera que
para las muestras pequeñas, este procedimiento funciona mejor si sus datos
fueron extraídos de una distribución normal o una distribución cercana a normal.
A partir del Teorema del límite central, usted puede utilizar este procedimiento si
tiene una muestra grande, sustituyendo la desviación estándar de la muestra por
s. Una regla de oro común consiste en considerar que las muestras con un
tamaño de 30 o más son muestras grandes. Muchos analistas eligen el
procedimiento t y no el procedimiento Z cuando s es desconocida.
Utilice Z de 1 muestra para calcular un intervalo de confianza o realizar una
prueba de hipótesis de la media cuando no se conoce s. Para una prueba Z de
una muestra de dos colas, las hipótesis son:
H0 : m = m 0 versus H1: m ≠ m0
Donde m es la media de la población y m 0 es la media de la población
hipotética.
5. REVISIÓN GENERAL
Utilice Z de 1 muestra para calcular un intervalo de confianza o realizar una
prueba de hipótesis de la media
una muestra de dos colas, las hipótesis son:
H0 0 versus H1 0
Donde población 0 es la media de la población
hipotética.
Elementos del cuadro de diálogo
Muestras en columnas: Elija esta opción si ha ingresado datos sin procesar en
columnas. Ingrese las columnas que contienen los datos de muestra.
Datos resumidos: Elija esta opción si tiene valores de resumen para el tamaño
de la muestra y la media.
Tamaño de la muestra: Ingrese el valor para el tamaño de la muestra .
Media: Ingrese el valor para la media de la muestra.
Desviación estándar: Ingrese el valor de la desviación estándar de población.
Realizar prueba de hipótesis: Marque esta opción para realizar una prueba de
hipótesis.
Media hipotética: 0.
6. EJEMPLO:
Las mediciones se tomaron en nueve artefactos. Usted sabe que la distribución
de las mediciones históricamente ha estado cerca de una distribución normal con
s = 0.2. Puesto que usted conoce el valor de s y desea probar si la media de
población es 5 y obtener un intervalo de confianza de 90% para la media, usted
utiliza el procedimiento Z.
1 Abra la hoja de trabajo EJA_ESTAD.MTW.
2 Elija Estadísticas > Estadísticas básicas > Z de 1 muestra.
3 En Muestras en columnas, ingrese Valores.
4 En Desviación estándar, ingrese 0.2.
5 Marque Realizar prueba de hipótesis. En Media hipotética, ingrese 5.
6 Haga clic en Opciones. En Nivel de confianza, ingrese 90. Haga clic en
Aceptar.
7 Haga clic en Gráficas. Marque Gráfica de valores individuales. Haga clic
en Aceptar en cada cuadro de diálogo.
Z de una muestra: Valores
Prueba de mu = 5 vs. no = 5
La desviación estándar supuesta = 0.2
Error
estándar
de la
Variable N Media Desv.Est. Media IC de 90% Z
P
Valores 9 4.7889 0.2472 0.0667 (4.6792, 4.8985) -3.17
0.002
Salida de la ventana Gráfica
7. Interpretación de los resultados
La estadística de prueba, Z, para probar si la media de población es igual a 5 es -
3.17. El valor p, o la probabilidad de rechazar la hipótesis nula cuando es
verdadera, es 0.002. Esto se denomina un nivel de significancia obtenido, valor p
o a obtenido de la prueba. Debido a que el valor p de 0.002 es más pequeño que
los niveles a comúnmente elegidos, existe evidencia significativa de que m no es
igual a 5, de manera que usted puede rechazar H0 en favor de que el valor de m
no es 5.
Una prueba de hipótesis en a = 0.1 también puede realizarse al observar una
gráfica de valores individuales. El valor hipotético se ubica fuera del intervalo de
confianza de 90% para la media de población (4.6792, 4.8985) y de este modo
puede rechazar la hipótesis nula.
8. 2.-Las estaturas de 1000 estudiantes están distribuidas aproximadamente en
forma normal con una media de 174.5 centímetros y una desviación estándar de
6.9 centímetros. Si se extraen 200 muestras aleatorias de tamaño 25 sin
reemplazo de esta población, determine:
a. El número de las medias muestrales que caen entre 172.5 y 175.8 centímetros.
b. El número de medias muestrales que caen por debajo de 172 centímetros.
Solución:
Como se puede observar en este ejercicio se cuenta con una población finita y
un muestreo sin reemplazo, por lo que se tendrá que agregar el factor de
corrección. Se procederá a calcular el denominador de Z para sólo sustituirlo en
cada inciso.
a)
10. t de 1 muestra
Revisión general
Realiza una prueba t de una muestra o intervalo de confianza t para la media.
Utilice t de 1 muestra para calcular un intervalo de confianza y realice una prueba
de hipótesis de la media cuando no se conoce la desviación estándar de la
población, s. Para una t de una muestra con dos colas,
H0: m = m0 versus H1: m ≠ m0
donde m es la media de la población y m 0 es la media de la población hipotética.
Elementos del cuadro de diálogo
Muestras en columnas: Elija esta opción si ha ingresado datos sin procesar en
columnas. Ingrese las columnas que contienen los datos de muestra.
Datos resumidos: Elija si tiene valores de resumen para el tamaño de la
muestra, media y desviación estándar.
Tamaño de la muestra: Ingrese el valor para el tamaño de la muestra .
Media: Ingrese el valor para la media de la muestra.
Desviación estándar: Ingrese el valor para la desviación estándar de la
muestra.
Realizar prueba de hipótesis: Marque esta opción para realizar una prueba de
hipótesis.
Media hipotética: 0.
11. EJEMPLO
Las mediciones se tomaron en nueve artefactos. Usted sabe que la distribución
de las mediciones de los artefactos históricamente ha estado cerca de una
media de población es 5 y para obtener un intervalo de confianza de 90% para la
media, usted utiliza un procedimiento t.
1 Abra la hoja de trabajo EJA_ESTAD.MTW.
2 Elija Estadísticas > Estadísticas básicas > t de 1 muestra.
3 En Muestras en columnas, ingrese Valores.
4 Marque Realizar prueba de hipótesis. En Media hipotética, ingrese 5.
5 Haga clic en Opciones. En Nivel de confianza, ingrese 90. Haga clic en
Aceptar en cada cuadro de diálogo.
Salida de la ventana Sesión
T de una muestra: Valores
Prueba de mu = 5 vs. no = 5
Error
estándar
de la
Variable N Media Desv.Est. media IC de 90% T P
Valores 9 4.7889 0.2472 0.0824 (4.6357, 4.9421) -
2.56
0.034
12. Interpretación de los resultados
El valor p de esta prueba, o la probabilidad de obtener más valores extremos de
la estadística de prueba en virtud de las probabilidades si la hipótesis nula fuera
verdadera, es de 0.034. Esto se denomina nivel de significancia obtenido o valor
p. Por lo tanto, rechace H0 si su nivel a aceptable es mayor que el valor p o
0.034.
Un intervalo de confianza
(4.6357,4.9421). Este intervalo es ligeramente más amplio que el intervalo Z
correspondiente que se muestra en Ejemplo de Z de 1 muestra.
2.- Un medicamento para malestar estomacal tiene la advertencia de que
algunos usuarios pueden presentar una reacción adversa a él, más aún, se
piensa que alrededor del 3% de los usuarios tienen tal reacción. Si una muestra
aleatoria de 150 personas con malestar estomacal usa el medicamento,
encuentre la probabilidad de que la proporción de la muestra de los usuarios que
realmente presentan una reacción adversa, exceda el 4%.
a. Resolverlo mediante la aproximación de la normal a la binomial
b. Resolverlo con la distribución muestral de proporciones
Datos:
n=150 personas
p=0.03
x= (0.04)(150) = 6 personas
p(x>6) = ?
Media = np= (150)(0.03)= 4.5
13. p(x>6) = 0.1685. Este valor significa que existe una probabilidad del 17% de
que al extraer una muestra de 150 personas, mas de 6 presentarán una
reacción adversa.
a. Distribución Muestral de Proporciones
Datos:
n=150 personas
P=0.03
p= 0.04
p(p>0.04) = ?
14. Observe que este valor es igual al obtenido y la interpretación es: existe una
probabilidad del 17% de que al tomar una muestra de 150 personas se tenga una
proporción mayor de 0.04 presentando una reacción adversa.
3.- El rector de una universidad pública afirma que el 15% de los estudiantes de
la universidad que el dirige está en contra de una ley que actualmente se discute
en el congreso y que supuestamente afecta a la comunidad universitaria. El
representante de los estudiantes, considera que dicha proporción es mayor y
para comprobarlo toma una muestra de 100 estudiantes seleccionados
aleatoriamente y encuentra que el 23% están en desacuerdo con dicho proyecto
de ley. Se pide comprobar si el rector tiene o no la razón con un nivel de
significación del 5%.
No se sabe si la población está normalmente distribuida, pero n=100>30, por lo
cual según el teorema central del límite, las proporciones muestrales se
distribuirán aproximadamente como una distribución normal.
Hipótesis nula e hipótesis alternativa: H0: P = 0.15, Ha: P > 0.15. La prueba es
unilateral a la derecha, puesto que el representante de los estudiantes, piensa
que la proporción es superior a la afirmada por el señor rector.
Nivel de significación: α = 0.05
15. Criterio de decisión: Como la proporción muestral se distribuye normalmente y la
prueba es unilateral a la derecha, entonces, según la tabla el valor de z es:
+1.64. Por lo tanto, el criterio de decisión será el siguiente: “Si el valor de Z
calculado es mayor que +1.64, se rechaza la hipótesis nula de que la proporción
es del 15%”.
Cálculo del estadístico sobre el cual se basará la decisión: n=100, p=0.23,
q=0.77. Según la fórmula 6.13 de la página 171 para Z, en la distribución en el
muestreo de la proporción, el correspondiente valor de z será:
Tomar la decisión: Como el valor de Z calculado (+2.24) se encuentra en la zona
de rechazo, entonces, con un nivel de significación del 5%, debemos rechazar la
hipótesis nula de que la proporción de estudiantes en contra de la ley es del 15%
y por consiguiente debemos aceptar la hipótesis del representante estudiantil de
que dicha proporción es mayor.
16. t de 2 muestras
Realiza una prueba t de 2 muestras independientes y genera un intervalo de
confianza.
Cuando tenga muestras dependientes, utilice Estadísticas > Estadísticas básicas
> t pareada.
Utilice t de 2 muestras para realizar una prueba de hipótesis y calcular un
intervalo de confianza o la diferencia entre dos medias de población cuando las
desviaciones estándar de las poblaciones, s, sean desconocidas. Para una
prueba t de 2 muestras con dos colas
H0: m1 - m 2 = d 0 versus H1: m 1 - m2 ≠ d 0
donde m1 y m 2 son las medias de población y d 0 es la diferencia hipotética
entre las dos medias de población.
Para calcular un prueba t y un intervalo de confianza de la media
1 Elija Estadísticas > Estadísticas básicas > t de 1 muestra.
2 En Muestras en columnas, ingrese las columnas que contienen las
muestras.
3 Si lo desea, utilice cualquier opción del cuadro de diálogo y luego haga clic
en Aceptar.
17. Elementos del cuadro de diálogo
Muestras en una columna: Elija esta opción si los datos de la muestra se
encuentran en una columna individual, diferenciados por los valores de subíndice
(códigos de grupo) en una segunda columna.
Muestras: Ingrese la columna que contiene los datos.
Subíndices: Ingrese la columna que contiene los subíndices de la muestra.
Muestras en diferentes columnas: Elija esta opción si los datos de las dos
muestras están en columnas separadas.
Primero: Ingrese la columna que contiene una muestra.
Segundo: Ingrese la columna que contiene la otra muestra.
Datos resumidos (diferencias): Elija esta opción si tiene valores de resumen
para el tamaño de la muestra, media y desviación estándar para cada muestra.
Nombre
Tamaño de la muestra: Ingrese el valor para el tamaño de la muestra.
Media: Ingrese el valor de la media.
Desviación estándar: Ingrese el valor de la desviación estándar.
Segundo
Tamaño de la muestra: Ingrese el valor del tamaño de la muestra.
Media: Ingrese el valor de la media.
Desviación estándar: Ingrese el valor de la desviación estándar.
Asumir varianzas iguales: Marque esta opción para presuponer que las
poblaciones tienen varianzas iguales. La opción predeterminada es presuponer
varianzas desiguales. Véase Varianzas iguales o desiguales.
18. Ejemplo de una t de 2 muestras con las Muestras en una columna
Se llevó a cabo un estudio para evaluar la efectividad de dos dispositivos para
mejorar la eficiencia de sistemas de calefacción domésticos a gas. El consumo
de energía en las viviendas se midió después de la instalación de uno de los dos
dispositivos. Los dos dispositivos eran: un regulador eléctrico (Regulador=1) y un
regulador de activación térmica (Regulador=2). Los datos de consumo de
energía (BTU.Con) se apilan en una columna y una columna de agrupación
(Regulador) contiene identificadores o subíndices para denotar la población.
Supongamos que realizó una prueba de varianza y no encontró evidencia de que
las varianzas no sean iguales (véase Ejemplo de 2 varianzas). Ahora, usted
desea comparar la efectividad de estos dos dispositivos al determinar si existe o
no evidencia de que la diferencia entre los dispositivos es diferente de cero.
1 Abra la hoja de trabajo HORNO.MTW.
2 Elija Estadísticas > Estadísticas básicas > t de 2 muestras.
3 Elija Muestras en una columna.
4 En Muestras, ingrese 'BTU.Con'.
5 En Subíndices, ingrese Regulador.
6 Marque la opción Asumir varianzas iguales. Haga clic en Aceptar.
19. Salida de la ventana Sesión
Prueba T e IC de dos muestras: BTU.Con, Regulador
T de dos muestras para BTU.Con
Error
estándar
de la
Regulador N Media Desv.Est. media
1 40 9.91 3.02 0.48
2 50 10.14 2.77 0.39
Diferencia = mu (1) - mu (2)
Estimado de la diferencia: -0.235
IC de 95% para la diferencia: (-1.450, 0.980)
Prueba T de diferencia = 0 (vs. no =): Valor T = -0.38 Valor P = 0.701 GL = 88
Ambos utilizan Desv.Est. agrupada = 2.8818
20. Interpretación de los resultados
Minitab muestra una tabla de los tamaños de muestras, las medias de muestras,
las desviaciones estándar y los errores estándar de las dos muestras.
Debido a que anteriormente no se encontró evidencia de que las varianzas sean
desiguales, decidimos utilizar la desviación estándar agrupada al elegir Asumir
varianzas iguales. La desviación estándar agrupada, 2.8818, se utiliza para
calcular la estadística de prueba y los intervalos de confianza .
Una segunda tabla ofrece un nivel de confianza para la diferencia en las medias
0.980), el cual incluye cero, lo que sugiere que no existe diferencia. El siguiente
es el resultado de la prueba de hipótesis
un valor p de 0.701 y 88 grados de libertad .
Debido a que el valor p es mayor que los niveles a normalmente elegidos, no
existe evidencia de que haya diferencia en uso de energía cuando se utiliza un
regulador eléctrico versus un regulador de activación térmica.
2.- Una compañía de transportes requiere comprar un gran lote de buses para el
transporte urbano con el fin de reemplazar su parque automotor y para tal fin
desea comprobar la afirmación hecha por el proveedor de la marca B, en el
sentido de que la marca A es menos ahorradora de combustible. Para tal fin la
empresa toma una muestra aleatoria de 35 vehículos marca A y encuentra que la
misma tiene un promedio en el rendimiento de 18 kilómetros/galón con una
desviación estándar de 8 kilómetros/galón, mientras que una muestra de 32
vehículos marca B presenta un promedio de 22 kilómetros/galón con desviación
estándar de 3 kilómetros /galón. ¿Qué decisión debe tomar el gerente de la
compañía con un nivel de significación del 5%?
Hipótesis nula e hipótesis alternativa: H0: µA=0 µB = 0 , Ha: µA - µB ˂ 0. La
prueba es unilateral a la izquierda.
21. 2) Nivel de significación: α=0.05
3) Criterio de decisión: Como las diferencias de medias muestrales se distribuyen
normalmente,
entonces, según las tablas, el valor de Z es: -1.64. Por lo tanto, el criterio de
decisión será el siguiente:
“Si el valor de Z calculado es menor que –1.64 se rechaza la hipótesis nula de
que el rendimiento en ambas marcas es igual”.
Cálculo del estadístico sobre el cual se basará la decisión: nA=35, ẋA =18, SA=8,
nB=32, ẋB =22,
SB=3. Según la fórmula 6.8 de la página 168 sobre la distribución en el muestreo
de la diferencia de medias, el correspondiente valor de Z será:
Tomar la decisión: Como el valor de Z calculado (-2.75) se encuentra en la zona
de rechazo,
entonces, con un nivel de significación del 5%, debemos rechazar la hipótesis
nula de que el ahorro en ambas marcas es igual y en éstas condiciones
debemos aceptar la hipótesis alternativa de que la marca A es menos ahorradora
de combustible que la marca B.
Nota: Observemos que como no conocíamos las desviaciones estándar
poblacionales para el cálculo de z, pudimos reemplazar a éstas por las
desviaciones estándar muestrales, puesto que ambos tamaños de muestra son
mayores que 30.
22. t pareada
Realiza una prueba t pareada . Este procedimiento es apropiado para poner a
prueba la diferencia media entre observaciones pareadas cuando las diferencias
pareadas siguen una distribución normal.
Utilice el comando t pareada para calcular un intervalo de confianza y realizar
una prueba de hipótesis de la diferencia media entre las observaciones pareadas
de la población. Una prueba t pareada crea correspondencia en pares de
respuestas que son dependientes o están relacionadas. Esta correspondencia
permite explicar la variabilidad entre los pares que por lo general produce un
término de error más pequeño y, de esta manera, se aumenta la sensibilidad de
la prueba de hipótesis o intervalo de confianza.
Como ejemplos típicos de datos pareados figuran las mediciones hechas en
gemelos o mediciones del tipo "antes y después". Para una prueba t pareada:
H0 d 0 versus H1 d 0
Donde d es la media de la población 0 es la media
hipotética de las diferencias.
Cuando las muestras se extraen de manera independiente de dos poblaciones,
utilice Estadísticas > Estadísticas básicas > t de 2 muestras.
Elementos del cuadro de diálogo
Muestra en columnas: Elija esta opción si ha ingresado datos sin procesar en
dos columnas.
Primera muestra: Ingrese la columna que contiene la primera muestra
Segunda muestra: Ingrese la columna que contiene la segunda muestra
Datos resumidos (diferencias): Elija si tiene valores de resumen para el
tamaño de la muestra , media y desviación estándar de la media.
Tamaño de muestra: Ingrese el valor del tamaño de la muestra.
Media: Ingrese el valor de la media.
Desviación estándar: Ingrese el valor de la desviación estándar.
23. Elija Estadísticas > Estadísticas básicas > t pareada.
2 En Primera muestra, ingrese la columna que contiene la primera muestra.
3 En Segunda muestra, ingrese la columna que contiene la segunda muestra.
4 Si lo desea, utilice cualquiera de las opciones del cuadro de diálogo y haga
clic en Aceptar.
Ejemplo de t pareada
Una empresa fabricante de zapatos desea comparar dos materiales, A y B, para
utilizar en las suelas de los zapatos para niños varones. En este ejemplo, cada
uno de diez niños en un estudio usó un par especial de zapatos con la suela de
un zapato hecha con el material A y con la suela del otro zapato hecha con el
material B. El tipo de suela fue asignado de forma aleatoria para explicar las
diferencias sistemáticas en el desgaste entre el pie izquierdo y el derecho.
Después de tres meses, los zapatos se miden para su uso.
Para estos datos, usted utilizaría un diseño pareado en vez de un diseño no
pareado. Un procedimiento t pareado probablemente tendría un término de error
más pequeño que el que correspondería a un procedimiento no pareado porque
éste elimina la variabilidad causada por diferencias entre los pares. Por ejemplo,
es posible que uno de los niños viva en la ciudad y camine sobre pavimento la
mayor parte del día, mientras que otro niño pudiera vivir en el campo y pasar
gran parte del día sobre superficies no pavimentadas.
1 Abra la hoja de trabajo EJA_ESTAD.MTW.
2 Elija Estadísticas > Estadísticas básicas > t pareada.
3 Elija Muestras en columnas.
4 En Primera muestra, ingrese Mat-A. En Segunda muestra, ingrese Mat-B.
Haga clic en Aceptar.
24. Salida de la ventana Sesión
IC y Prueba T pareada: Mat-A, Mat-B
T pareada para Mat-A - Mat-B
Error
estándar
de la
N Media Desv.Est. media
Mat-A 10 10.630 2.451 0.775
Mat-B 10 11.040 2.518 0.796
Diferencia 10 -0.410 0.387 0.122
IC de 95% para la diferencia media:: (-0.687, -0.133)
Prueba t de diferencia media = 0 (vs. no = 0): Valor T = -3.35 Valor P = 0.009
25. Interpretación de los resultados
El intervalo de confianza para la media de la diferencia entre los dos materiales
no incluye cero, lo cual sugiere una diferencia entre ellos. El valor p pequeño (p =
los dos materiales no tienen el mismo rendimiento. Específicamente, el Material
B (media = 11.04) tuvo mejor rendimiento que el Material A (media = 10.63) en lo
que respecta a desgaste a lo largo del período de prueba de tres meses.
Compare los resultados del procedimiento pareado con los resultados del no
pareado, prueba t de dos muestras (Estadísticas > Estadísticas básicas > t de 2
muestras). Los resultados del procedimiento pareado nos inducen a creer que los
del procedimiento no pareado (no se muestran) son totalmente diferentes. Una
prueba t no pareada produce un valor t
en estos resultados, no sería posible rechazar la hipótesis nula y podríamos
concluir que no existe diferencia en el rendimiento de los dos materiales.
En el procedimiento no pareado, la gran cantidad de varianza en el desgaste de
los zapatos entre los niños (el desgaste promedio para un niño fue de 6.50 y para
otro de 14.25) oculta la diferencia, hasta cierto punto menos drástica, en el
desgaste entre los zapatos izquierdo y derecho (la diferencia más grande entre
zapatos fue de 1.10). Esta es la razón por la cual un diseño experimental
pareado y un análisis subsiguiente con una prueba t pareada, cuando
corresponda, es con frecuencia mucho más potente que un enfoque no pareado.
26. 1 Proporción
Realiza una prueba de una proporción binomial.
Utilice 1 Proporción para calcular un intervalo de confianza y realizar una prueba
de hipótesis de la proporción . Por ejemplo, una fábrica de repuestos para
vehículos afirma que menos del 2% de sus bujías son defectuosas. Usted podría
tomar una muestra aleatoria de las bujías y determinar si la proporción
defectuosa real coincide o no con la afirmación. Para una prueba de dos colas de
una proporción:
H0: p = p0 versus H1: p ≠ p0 donde p es la proporción de población y p0 es el
valor hipotético.
Para comparar dos proporciones, utilice Estadísticas > Estadísticas básicas > 2
proporciones.
Elementos del cuadro de diálogo
Muestras en columnas: Elija esta opción si usted tiene datos en las columnas,
luego, ingrese las columnas que contienen los datos de muestra. Cada celda de
estas columnas debe tener uno de dos valores posibles y corresponder a un
elemento o sujeto. Los valores posibles en las columnas deben ser idénticos si
usted ingresa columnas múltiples.
Datos resumidos: Elija esta opción si tiene valores de resumen para los
números de ensayos y eventos.
Número de eventos: Ingrese el número de eventos observados. Si usted
ingresa más de un valor; el valor entero que ingrese en Número de ensayos se
aplicará a todos.
Número de ensayos: Ingrese un valores individuales para el número de
ensayos.
Realizar prueba de hipótesis: Marque esta opción para realizar la prueba de
hipótesis de que la proporción de población es igual a un valor especificado.
Proporción hipotética: Ingrese el valor de la proporción para la hipótesis nula
de la prueba.
27. Procedimiento:
Elija Estadísticas > Estadísticas básicas > 1 Proporción.
2 Realice uno de los siguientes procedimientos:
Si tiene datos sin procesar, elija Muestras en columnas, e ingrese las
columnas que contienen los datos sin procesar.
Si tiene datos resumidos:
1 Elija Datos resumidos.
2 En Número de ensayos, ingrese un valor entero numérico simple para el
número de ensayos. Con frecuencia, el número de ensayos será su tamaño de
muestra..
3 En Número de eventos, ingrese uno o más valores enteros numéricos como
el número observado de eventos.
3 Si lo desea, utilice cualquiera de las opciones del cuadro de diálogo y haga
clic en Aceptar.
1.- A una fiscal de condado le gustaría postularse para la fiscalía del estado. Ella
decide que renunciará a su cargo en la oficina del condado y postularse para la
fiscalía del estado si más del 65% de los miembros de su partido la respaldan.
Usted necesita probar H0: p = .65 versus H1: p > .65
Como su director de campaña, usted recopiló información de 950 miembros del
partido seleccionados de manera aleatoria y observa que 560 miembros del
partido apoyan a la candidata. Una prueba de proporción se realizó para
determinar si la proporción de los partidarios era o no mayor que la proporción
requerida de 0.65. Además, se construyó un límite de confianza del 95% para
determinar el límite inferior para la proporción de partidarios.
1 Elija Estadísticas > Estadísticas básicas > 1 Proporción.
2 Elija Datos resumidos.
3 En Número de eventos, ingrese 560. En Número de ensayos, ingrese 950.
4 Marque Realizar prueba de hipótesis. En Proporción hipotética, ingrese
0.65.
28. 5 Haga clic en Opciones. En Hipótesis alterna, elija Mayor que. Haga clic en
Aceptar en cada cuadro de diálogo.
Salida de la ventana Sesión
Prueba e IC para una proporción
Prueba de p = 0.65 vs. p > 0.65
95% Límite Valor P
Muestra X N Muestra p inferior exacto
1 5 60 950 0.589474 0.562515 1.000
Interpretación de los resultados
El valor p de 1.0 sugiere que los datos son consistentes con la hipótesis nula
(H0: p = 0.65), es decir, la proporción de los miembros del partido que apoyan a
la candidata no es mayor que la proporción requerida de 0.65. Como su director
de campaña, usted le aconsejaría no postularse para la fiscalía del estado.
29. 2.- El rector de una universidad pública afirma que el 15% de los estudiantes de
la universidad que el dirige está en contra de una ley que actualmente se discute
en el congreso y que supuestamente afecta a la comunidad universitaria. El
representante de los estudiantes, considera que dicha proporción es mayor y
para comprobarlo toma una muestra de 100 estudiantes seleccionados
aleatoriamente y encuentra que el 23% están en desacuerdo con dicho proyecto
de ley. Se pide comprobar si el rector tiene o no la razón con un nivel de
significación del 5%.
H0: P=0.15, Ha: P> 0.15
Nivel de significación: α = 0.05
Cálculo del estadístico sobre el cual se basará la decisión: n=100, p=0.23,
q=0.77. Según la fórmula
6.13 de la página 171 para Z, en la distribución en el muestreo de la proporción,
el correspondiente valor de z será:
Tomar la decisión: Como el valor de Z calculado (+2.24) se encuentra en la zona
de rechazo, entonces, con un nivel de significación del 5%, debemos rechazar la
hipótesis nula de que la proporción de estudiantes en contra de la ley es del 15%
y por consiguiente debemos aceptar la hipótesis del representante estudiantil de
que dicha proporción es mayor.
30. 2 proporciones
Revisión general
Realiza una prueba de dos proporciones binomiales .
Utilice el comando 2 proporciones para calcular un intervalo de confianza y
realizar una prueba de hipótesis de la diferencia entre dos proporciones. Minitab
ofrece dos pruebas de hipótesis para la diferencia entre dos proporciones: La
prueba exacta de Fisher y una prueba basada en una aproximación normal. La
prueba de aproximación normal puede ser inexacta para muestras en las cuales
el número de eventos de cada muestra es menor que cinco o si la diferencia
entre el número de ensayos y eventos de cada muestra es menor que cinco. La
prueba exacta de Fisher es exacta para todos los tamaños de muestra , pero
sólo se puede calcular cuando la hipótesis nula establece que las proporciones
de población son iguales. En otras palabras, Minitab sólo realiza la prueba exacta
de Fisher cuando usted especifica una diferencia de la prueba de cero en el
cuadro de diálogo secundario Opciones.
Por ejemplo, supongamos que usted desea saber si la proporción de
consumidores que responden a una encuesta pudiera incrementarse al ofrecer
un incentivo tal como una muestra del producto. Usted puede incluir la muestra
del producto en la mitad de sus correos y determinar si obtiene más repuestas
del grupo que recibió la muestra que del grupo que no la recibió. Para una
prueba de dos colas de dos proporciones:
H0: p1 - p2 = p0 versus H1: p1 - p2 ≠ p0
Cuando p1 y p2 son las proporciones de eventos en las poblaciones 1 y 2,
respectivamente, y p0 es la diferencia hipotética entre las dos proporciones.
Para probar una proporción utilice Estadísticas > Estadísticas básicas > 2
Proporciones.
31. Elementos del cuadro de diálogo
Muestras en una columna: Elija esta opción si ha ingresado datos sin procesar
en una columna individual con una segunda columna de subíndices que
identifican la muestra.
Muestras: Ingrese la columna que contiene los datos sin procesar.
Subíndices: Ingrese la columna que contiene los subíndices de la muestra.
Muestras en diferentes columnas: Elija esta opción si introdujo datos sin
procesar en las columnas individuales para cada muestra.
Primero: Ingrese la columna que contiene los datos sin procesar para la primera
muestra.
Segundo: Ingrese la columna que contiene los datos sin procesar para la
segunda muestra.
Datos resumidos: Elija esta opción si tiene valores de resumen para los
números de ensayos y eventos.
Nombre
Eventos: Ingrese el número de eventos en la primera muestra.
Ensayos: Ingrese el número de ensayos en la primera muestra.
Segundo
Eventos: Ingrese el número de eventos en la segunda muestra.
Ensayos: Ingrese el número de ensayos en la segunda muestra.
32. Para calcular un intervalo de confianza de prueba para la diferencia en
proporciones
1 Elija Estadísticas > Estadísticas básicas > 2 Proporciones.
2 Realice uno de los siguientes procedimientos:
Si sus datos sin procesar están apilados en una columna individual:
1 Elija Muestras en una columna.
2 En Muestras, ingrese la columna que contenga los datos sin procesar.
3 En Subíndices, ingrese la columna que contiene los códigos de grupo o
población.
Si sus datos sin procesar no están apilados, es decir, cada muestra se
encuentra en una columna separada:
1 Elija Muestras en diferentes columnas.
2 En Primera, ingrese la columna que contiene la primera muestra.
3 En Segunda, ingrese la columna que contiene la otra muestra.
Si tiene datos resumidos:
1 Elija Datos resumidos.
2 En Primera muestra, ingrese los valores numéricos en Ensayos y en
Eventos.
3 En Segunda muestra, ingrese los valores numéricos en Ensayos y en
Eventos.
3 Si lo desea, utilice cualquiera de las opciones del cuadro de diálogo y haga
clic en Aceptar.
33. EJEMPLO:
1.- Como gerente de compras de su corporación, usted debe autorizar la
adquisición de veinte máquinas fotocopiadoras nuevas. Después de comparar
numerosas marcas en términos de precio, calidad de la copia, garantía y
funciones, usted ha reducido sus opciones a dos: Marca X y Marca Y. Usted
decide que el factor determinante será la confiabilidad de las marcas definida por
la proporción de servicio requerido dentro de un año a partir de la compra.
Debido a que su corporación ya utiliza ambas marcas, usted pudo obtener
información acerca del historial de servicio de 50 máquinas de cada marca
seleccionadas aleatoriamente. Los registros indican que seis máquinas de la
Marca X y ocho de la Marca Y requirieron servicio. Utilice esta información para
orientar su elección de la marca a comprar.
1 Elija Estadísticas > Estadísticas básicas > 2 Proporciones.
2 Elija Datos resumidos.
3 En Primera muestra, en Eventos, ingrese 44. En Ensayos, ingrese 50.
4 En Segunda muestra, en Eventos, ingrese 42. En Ensayos, ingrese 50.
Haga clic en Aceptar.
Salida de la ventana Sesión
Prueba e IC para dos proporciones
Muestra X N Muestra p
1 44 50 0.880000
2 42 50 0.840000
Diferencia = p (1) - p (2)
Estimado de la diferencia: 0.04
IC de 95% para la diferencia: (-0.0957903, 0.175790)
Prueba para la diferencia = 0 vs. no = 0: Z = 0.58 Valor P = 0.564
Prueba exacta de Fisher: Valor P = 0.774
34. Interpretación de los resultados
En este ejemplo, la prueba de aproximación normal es válida porque, para
ambas muestras, el número de eventos es mayor que cuatro y la diferencia entre
los números de ensayos y eventos es mayor que cuatro. La prueba de
aproximación normal indica un valor p de 0.564, y la prueba exacta de Fisher
señala un valor p de 0.774. Ambos valores p son mayores que los niveles a
comúnmente elegidos. Por lo tanto, los datos concuerdan con la hipótesis nula
de que las proporciones de población son iguales. En otras palabras, la
proporción de máquinas fotocopiadoras que necesitaron servicio en el primer año
no difiere dependiendo de la marca. Como gerente de compras, usted debe
hallar un criterio diferente para orientar su decisión sobre cuál marca comprar.
Debido a que la aproximación normal es válida, usted puede sacar la misma
conclusión del intervalo de confianza de 95%. Debido a que cero se ubica en el
a 0.175790) usted puede concluir que los
datos coinciden con la hipótesis nula. Si considera que el intervalo de confianza
es demasiado amplio y no provee información precisa con respecto al valor de p1
fin de obtener un mejor
estimado de la diferencia.
Una compañía asegura que el mercado para su producto X tiene una aceptación
de iguales proporciones en la ciudad A que en la ciudad B. Un especialista en
mercado pone en duda dicha afirmación y para tal fin tomó una muestra aleatoria
de 500 amas de casa en la ciudad A y encontró que el 59.6% de las mismas
prefería el artículo X. Por otra parte tomó una muestra aleatoria de 300 amas de
casa en la ciudad B y encontró que el 50% de las mismas preferían el artículo X.
¿Existe una diferencia real entre las dos ciudades? Nivel de significación 5%
pero n1=500>30 y n2=300>30, por lo cual según el teorema central del límite, las
diferencias de las proporciones muestrales se distribuirán aproximadamente
como una distribución normal.
Hipótesis nula e hipótesis alternativa: H0: PA=PB, Ha: PA≠PB. La prueba es
bilateral, puesto que el especialista en mercado no está afirmando que ciudad
tiene más proporción que la otra.
Nivel de significación: α=0. 05
z es: ±96.1 . Por lo tanto, el criterio dedecisión será el siguiente: “Si el valor de Z
calculado es mayor que +1.96 ó menor que –1.96, se rechaza la hipótesis nula
de que la proporción es idéntica en ambas ciudades.
35. Cálculo del estadístico sobre el cual se basará la decisión: n1=500, p1=0.596,
n2=300, p2 =0.50. Según la fórmula 6.14 de la página 174 en la distribución en el
muestreo de la diferencia de proporciones, el correspondiente valor de z será: