MANUAL

276 visualizaciones

Publicado el

0 comentarios
0 recomendaciones
Estadísticas
Notas
  • Sé el primero en comentar

  • Sé el primero en recomendar esto

Sin descargas
Visualizaciones
Visualizaciones totales
276
En SlideShare
0
De insertados
0
Número de insertados
85
Acciones
Compartido
0
Descargas
4
Comentarios
0
Recomendaciones
0
Insertados 0
No insertados

No hay notas en la diapositiva.

MANUAL

  1. 1. Universidad Tecnológica de Torreón Organismo Público Descentralizado del Gobierno de Coahuila Manual Minitab: Prueba de Hipótesis Ing. Tecnologías de la producción Estadística Aplicada a la Ingeniería Alumno Víctor Hugo Franco García 7° ``A´´ Profesor Lic. Gerardo Edgar Mata Ortiz A Martes 22 de Octubre de 2013 Página 1
  2. 2. Universidad Tecnológica de Torreón Organismo Público Descentralizado del Gobierno de Coahuila Índice Revisión general…………………………...3 Z de 1 muestra………………….................7 t de 1 muestra…………………………….11 t de 2 muestras……………………………14 t pareada………………………………….20 1 proporción………………………………24 2 proporciones……………………………27 Página 2
  3. 3. Universidad Tecnológica de Torreón Organismo Público Descentralizado del Gobierno de Coahuila Revisión general de estadísticas básicas Utilice las capacidades de estadísticas básicas de Minitab para calcular estadísticas básicas y para realizar estimaciones simples y pruebas de hipótesis con una o dos muestras. Las capacidades de estadísticas básicas incluyen procedimientos para:  Calcular o almacenar estadísticas descriptivas  Pruebas de hipótesis e intervalos de confianza de la media o la diferencia en las medias  Pruebas de hipótesis e intervalos de confianza para una proporción o la diferencia en proporciones  Pruebas de hipótesis e intervalos de confianza de la tasa de ocurrencias, la media del número de ocurrencias y las diferencias entre ellas para los procesos de Poisson.  Pruebas de hipótesis e intervalos de confianza para una varianza y para la diferencia entre dos varianzas  Medición de asociaciones  Pruebas de normalidad de una distribución  Pruebas para determinar si los datos siguen una distribución de Poisson Cálculo y almacenamiento de estadísticas descriptivas  Mostrar estadísticas descriptivas genera estadísticas descriptivas para cada columna o subconjunto dentro de una columna. Puede mostrar las estadísticas en la ventana Sesión y/o mostrarlas en una gráfica.  Almacenar estadísticas descriptivas almacena estadísticas descriptivas para cada columna o subconjunto dentro de una columna.  Resumen gráfico genera cuatro gráficas y una tabla de salida en una ventana de gráfica. Para obtener una lista de las estadísticas descriptivas disponibles para mostrar o almacenar, véase Estadísticas descriptivas disponibles para mostrar o almacenar. Para calcular estadísticas descriptivas de forma individual y almacenarlas como constantes, véase Estadísticas de columnas. Intervalos de confianza y pruebas de hipótesis de medias Página 3
  4. 4. Universidad Tecnológica de Torreón Organismo Público Descentralizado del Gobierno de Coahuila Los cuatro procedimientos de las pruebas de hipótesis e intervalos de confianza para las medias de la población o la diferencia entre las medias se basan en que la distribución de la media de la muestra siga una distribución normal . De acuerdo con el Teorema del límite central , la distribución normal se convierte en una aproximación cada vez mejor para la distribución de la media de la muestra extraída de cualquier distribución a medida que aumenta el tamaño de la muestra.  Z de 1 muestra calcula un intervalo de confianza o realiza una prueba de hipótesis de la media cuando la desviación estándar de la población, , es conocida. Este procedimiento se basa en una distribución normal, de manera que para las muestras pequeñas, este procedimiento funciona mejor si sus datos fueron extraídos de una distribución normal o una distribución cercana a normal. A partir del Teorema del límite central , usted puede utilizar este procedimiento si tiene una muestra grande, sustituyendo la desviación estándar de la muestra por . Una regla de oro común consiste en considerar que las muestras con un tamaño de 30 o más son muestras grandes. Muchos analistas eligen el procedimiento t y no el procedimiento Z cuando  es desconocida.  t de 1 muestra calcula un intervalo de confianza o realiza una prueba de hipótesis de la media cuando  es desconocida. Este procedimiento se basa en la distribución t, que se deriva de una distribución normal con  desconocida. Para el caso de muestras pequeñas, este procedimiento funciona mejor si sus datos fueron extraídos de una distribución que es normal o cercana a normal. Este procedimiento es más conservador que el procedimiento Z y siempre deberá tener preferencia sobre el procedimiento Z cuando se trata de muestras pequeñas y  es desconocida. Muchos analistas eligen el procedimiento t y no el procedimiento Z cada vez que  es desconocida. De acuerdo con el Teorema del límite central , mientras mayor sea el tamaño de la muestra, usted podrá tener mayor confianza en los resultados de este procedimiento, porque la distribución de la media de la muestra se comporta cada vez más como una distribución normal.  t de 2 muestras calcula un intervalo de confianza y realiza una prueba de hipótesis de la diferencia entre las medias de dos poblaciones cuando las  son desconocidas y las muestras han sido extraídas independientemente. Este procedimiento se basa en la distribución t y, en el caso de muestras pequeñas, funciona mejor si sus datos se extraen de distribuciones que son normales o cercanas a normales. A medida que el tamaño de la muestra aumenta, usted puede tener mayor confianza en los resultados.  t pareada calcula un intervalo de confianza y realiza una prueba de hipótesis de la diferencia entre las medias de dos poblaciones cuando las observaciones son pareadas (coinciden). Cuando los datos son pareados, tal como ocurre en las mediciones "antes y después", el procedimiento de t pareada produce una varianza menor y mayor potencia para detectar diferencias en comparación con el procedimiento de t de 2 muestras anterior, el cual presupone que las muestras fueron extraídas de manera independiente. Página 4
  5. 5. Universidad Tecnológica de Torreón Organismo Público Descentralizado del Gobierno de Coahuila Intervalos de confianza y pruebas de hipótesis de proporciones  1 Proporción calcula un intervalo de confianza y somete a una prueba de hipótesis una proporción de la población.  2 proporciones calcula un intervalo de confianza y somete a una prueba de hipótesis la diferencia entre 2 proporciones de la población. Intervalos de confianza y pruebas de hipótesis de tasas de Poisson  Tasa de Poisson de 1 muestra calcula un intervalo de confianza y somete a una prueba de hipótesis la tasa de ocurrencias y la media del número de ocurrencias en un proceso de Poisson.  Tasa de Poisson de 2 muestras calcula un intervalo de confianza y somete a una prueba de hipótesis la diferencia en las tasas de ocurrencias y la diferencia en la media del número de ocurrencias en dos procesos de Poisson. Intervalos de confianza y pruebas de hipótesis de varianza  1 varianza calcula un intervalo de confianza y somete a una prueba de hipótesis la varianza de una muestra.  2 varianzas calcula un intervalo de confianza y somete a una prueba de hipótesis la calidad u homogeneidad de la varianza de dos muestras. Medidas de asociación  Correlación calcula el coeficiente de correlación producto-momento de Pearson (también denominado coeficiente de correlación o correlación) para pares de variables. El coeficiente de correlación es una de medida del grado de relación lineal entre dos variables. Puede obtener un valor p para probar si hay suficiente evidencia de que el coeficiente de correlación no es cero. Utilizando una combinación de comandos de Minitab, también puede calcular la correlación de Spearman y un coeficiente de correlación parcial. La correlación de Spearman es simplemente la correlación calculada en las clasificaciones de las dos muestras. Un coeficiente de correlación parcial es el coeficiente de correlación entre dos variables mientras se ajusta para los efectos de otras variables. Página 5
  6. 6. Universidad Tecnológica de Torreón Organismo Público Descentralizado del Gobierno de Coahuila  Covarianza calcula la covarianza para pares de variables. La covarianza es una medida de la relación entre dos variables, pero no ha sido estandarizada, tal como se hace con el coeficiente de correlación, dividiendo entre la desviación estándar de ambas variables. Prueba de distribución La Prueba de normalidad genera una gráfica de probabilidad normal y realiza una prueba de hipótesis para examinar si las observaciones siguen o no una distribución normal . Algunos procedimientos estadísticos, como una prueba t o Z, presuponen que las muestras provienen de una distribución normal. Utilice este procedimiento para poner a prueba el supuesto de normalidad. Prueba de bondad de ajuste Prueba de bondad de ajuste para Poisson evalúa si sus datos siguen una distribución de Poisson. Algunos procedimientos estadísticos, como la gráfica U, parten del supuesto de que los datos siguen una distribución de Poisson. Utilice este procedimiento para poner a prueba este supuesto. Página 6
  7. 7. Universidad Tecnológica de Torreón Organismo Público Descentralizado del Gobierno de Coahuila Z de una muestra Utilice Z de 1 muestra para calcular un intervalo de confianza o realizar una prueba de hipótesis de la media cuando no se conoce . Para una prueba Z de una muestra de dos colas, las hipótesis son: H :  =  versus H :  ≠  0 0 1 0 donde  es la media de la población y  es la media de la población hipotética. 0 Elementos del cuadro de diálogo Muestras en columnas: Elija esta opción si ha ingresado datos sin procesar en columnas. Ingrese las columnas que contienen los datos de muestra. Datos resumidos: Elija esta opción si tiene valores de resumen para el tamaño de la muestra y la media. Tamaño de la muestra: Ingrese el valor para el tamaño de la muestra . Media: Ingrese el valor para la media de la muestra. Desviación estándar: Ingrese el valor de la desviación estándar de población. Realizar prueba de hipótesis: Marque esta opción para realizar una prueba de hipótesis. Media hipotética: Ingrese la media de la prueba  . 0 Para calcular una prueba Z e intervalo de confianza de la media 1 Elija Estadísticas > Estadísticas básicas > Z de 1 muestra. 2 En Muestras en columnas, ingrese las columnas que contienen las muestras. 3 En Desviación estándar, ingrese un valor para . 4 Si lo desea, utilice cualquier opción del cuadro de diálogo y luego haga clic en Aceptar. Página 7
  8. 8. Universidad Tecnológica de Torreón Organismo Público Descentralizado del Gobierno de Coahuila Ejemplo de una prueba Z de 1 muestra e intervalo de confianza Z Las mediciones se tomaron en nueve artefactos. Usted sabe que la distribución de las mediciones históricamente ha estado cerca de una distribución normal con  = 0.2. Puesto que usted conoce el valor de  y desea probar si la media de población es 5 y obtener un intervalo de confianza de 90% para la media, usted utiliza el procedimiento Z. 1 Abra la hoja de trabajo EJA_ESTAD.MTW. 2 Elija Estadísticas > Estadísticas básicas > Z de 1 muestra. 3 En Muestras en columnas, ingrese Valores. 4 En Desviación estándar, ingrese 0.2. 5 Marque Realizar prueba de hipótesis. En Media hipotética, ingrese 5. 6 Haga clic en Opciones. En Nivel de confianza, ingrese 90. Haga clic en Aceptar. 7 Haga clic en Gráficas. Marque Gráfica de valores individuales. Haga clic en Aceptar en cada cuadro de diálogo. Salida de la ventana Sesión Salida de la ventana Gráfica Página 8
  9. 9. Universidad Tecnológica de Torreón Organismo Público Descentralizado del Gobierno de Coahuila Interpretación de los resultados La estadística de prueba, Z, para probar si la media de población es igual a 5 es 3.17. El valor p , o la probabilidad de rechazar la hipótesis nula cuando es verdadera, es 0.002. Esto se denomina un nivel de significancia obtenido, valor p o  obtenido de la prueba. Debido a que el valor p de 0.002 es más pequeño que los niveles  comúnmente elegidos, existe evidencia significativa de que  no es igual a 5, de manera que usted puede rechazar H0 en favor de que el valor de  no es 5. Una prueba de hipótesis en  = 0.1 también puede realizarse al observar una gráfica de valores individuales. El valor hipotético se ubica fuera del intervalo de confianza de 90% para la media de población (4.6792, 4.8985) y de este modo puede rechazar la hipótesis nula. Ejemplos: Página 9
  10. 10. Universidad Tecnológica de Torreón Organismo Público Descentralizado del Gobierno de Coahuila Página 10
  11. 11. Universidad Tecnológica de Torreón Organismo Público Descentralizado del Gobierno de Coahuila t de 1 muestra Realiza una prueba t de una muestra o intervalo de confianza t para la media. Utilice t de 1 muestra para calcular un intervalo de confianza y realice una prueba de hipótesis de la media cuando no se conoce la desviación estándar de la población , . Para una t de una muestra con dos colas, H :  =  versus H :  ≠  0 0 1 0 donde  es la media de la población y  es la media de la población hipotética. 0 Elementos del cuadro de diálogo Muestras en columnas: Elija esta opción si ha ingresado datos sin procesar en columnas. Ingrese las columnas que contienen los datos de muestra. Datos resumidos: Elija si tiene valores de resumen para el tamaño de la muestra, media y desviación estándar. Tamaño de la muestra: Ingrese el valor para el tamaño de la muestra . Media: Ingrese el valor para la media de la muestra. Desviación estándar: Ingrese el valor para la desviación estándar de la muestra. Realizar prueba de hipótesis: Marque esta opción para realizar una prueba de hipótesis. Media hipotética: Ingrese la media de la prueba  . 0 Para calcular una prueba t y un intervalo de confianza de la media 1 Elija Estadísticas > Estadísticas básicas > t de 1 muestra. 2 En Muestras en columnas, ingrese las columnas que contienen las muestras. 3 Si lo desea, utilice cualquier opción del cuadro de diálogo y luego haga clic en Aceptar. Página 11
  12. 12. Universidad Tecnológica de Torreón Organismo Público Descentralizado del Gobierno de Coahuila Ejemplo de una prueba t de 1 muestra y un intervalo de confianza t Las mediciones se tomaron en nueve artefactos. Usted sabe que la distribución de las mediciones de los artefactos históricamente ha estado cerca de una distribución normal, pero supongamos que usted no conoce . Para probar si la media de población es 5 y para obtener un intervalo de confianza de 90% para la media, usted utiliza un procedimiento t. 1 Abra la hoja de trabajo EJA_ESTAD.MTW. 2 Elija Estadísticas > Estadísticas básicas > t de 1 muestra. 3 En Muestras en columnas, ingrese Valores. 4 Marque Realizar prueba de hipótesis. En Media hipotética, ingrese 5. 5 Haga clic en Opciones. En Nivel de confianza, ingrese 90. Haga clic en Aceptar en cada cuadro de diálogo. Salida de la ventana Sesión Interpretación de los resultados La estadística de prueba, T, para H0 :  = 5 se calcula como 2.56. El valor p de esta prueba, o la probabilidad de obtener más valores extremos de la estadística de prueba en virtud de las probabilidades si la hipótesis nula fuera verdadera, es de 0.034. Esto se denomina nivel de significancia obtenido o valor p. Por lo tanto, rechace H0 si su nivel  aceptable es mayor que el valor p o 0.034. Un intervalo de confianza de 90% para la media de población, , es (4.6357,4.9421). Este intervalo es ligeramente más amplio que el intervalo Z correspondiente que se muestra en Ejemplo de Z de 1 muestra. Página 12
  13. 13. Universidad Tecnológica de Torreón Organismo Público Descentralizado del Gobierno de Coahuila Ejemplos: Página 13
  14. 14. Universidad Tecnológica de Torreón Organismo Público Descentralizado del Gobierno de Coahuila t de 2 muestras Estadísticas > Estadísticas básicas > t de 2 muestras Realiza una prueba t de 2 muestras independientes y genera un intervalo de confianza . Cuando tenga muestras dependientes , utilice Estadísticas > Estadísticas básicas > t pareada. Utilice t de 2 muestras para realizar una prueba de hipótesis y calcular un intervalo de confianza o la diferencia entre dos medias de población cuando las desviaciones estándar de las poblaciones, , sean desconocidas. Para una prueba t de 2 muestras con dos colas H :   =  0 1 2 0 versus H :   ≠  1 1 2 0 donde  y  son las medias de población y  es la diferencia hipotética entre las dos medias de población. 1 2 0 Elementos del cuadro de diálogo Muestras en una columna: Elija esta opción si los datos de la muestra se encuentran en una columna individual, diferenciados por los valores de subíndice (códigos de grupo) en una segunda columna. Muestras: Ingrese la columna que contiene los datos. Subíndices: Ingrese la columna que contiene los subíndices de la muestra. Muestras en diferentes columnas: Elija esta opción si los datos de las dos muestras están en columnas separadas. Primero: Ingrese la columna que contiene una muestra. Segundo: Ingrese la columna que contiene la otra muestra. Datos resumidos (diferencias): Elija esta opción si tiene valores de resumen para el tamaño de la muestra , media y desviación estándar para cada muestra. Nombre Tamaño de la muestra: Ingrese el valor para el tamaño de la muestra. Media: Ingrese el valor de la media. Página 14
  15. 15. Universidad Tecnológica de Torreón Organismo Público Descentralizado del Gobierno de Coahuila Desviación estándar: Ingrese el valor de la desviación estándar. Segundo Tamaño de la muestra: Ingrese el valor del tamaño de la muestra. Media: Ingrese el valor de la media. Desviación estándar: Ingrese el valor de la desviación estándar. Asumir varianzas iguales: Marque esta opción para presuponer que las poblaciones tienen varianzas iguales. La opción predeterminada es presuponer varianzas desiguales. Véase Varianzas iguales o desiguales. Para calcular un intervalo de confianza t de dos muestras y una prueba 1 Elija Estadísticas > Estadísticas básicas > t de 2 muestra. 2 Elija una de las siguientes opciones:  Si sus datos están apilados en una columna individual:  Elija Muestras en una columna.  En Muestras, ingrese la columna que contiene los datos numéricos.  En Subíndices, ingrese la columna que contiene los códigos de grupo o población.  Si sus datos no están apilados, es decir, cada muestra se encuentra en una columna separada:  Elija Muestras en diferentes columnas.  En Primera, ingrese la columna que contiene la primera muestra.  En Segunda, ingrese la columna que contiene la otra muestra. 3 Si lo desea, utilice cualquiera de las opciones del cuadro de diálogo y haga clic en Aceptar. Página 15
  16. 16. Universidad Tecnológica de Torreón Organismo Público Descentralizado del Gobierno de Coahuila Ejemplo de una t de 2 muestras con las Muestras en una columna Se llevó a cabo un estudio para evaluar la efectividad de dos dispositivos para mejorar la eficiencia de sistemas de calefacción domésticos a gas. El consumo de energía en las viviendas se midió después de la instalación de uno de los dos dispositivos. Los dos dispositivos eran: un regulador eléctrico (Regulador=1) y un regulador de activación térmica (Regulador=2). Los datos de consumo de energía (BTU.Con) se apilan en una columna y una columna de agrupación (Regulador) contiene identificadores o subíndices para denotar la población. Supongamos que realizó una prueba de varianza y no encontró evidencia de que las varianzas no sean iguales (véase Ejemplo de 2 varianzas). Ahora, usted desea comparar la efectividad de estos dos dispositivos al determinar si existe o no evidencia de que la diferencia entre los dispositivos es diferente de cero. 1 2 Abra la hoja de trabajo HORNO.MTW. Elija Estadísticas > Estadísticas básicas > t de 2 muestras. 3 4 5 Elija Muestras en una columna. En Muestras, ingrese 'BTU.Con'. En Subíndices, ingrese Regulador. 6 Marque la opción Asumir varianzas iguales. Haga clic en Aceptar. Salida de la ventana Sesión Página 16
  17. 17. Universidad Tecnológica de Torreón Organismo Público Descentralizado del Gobierno de Coahuila Interpretación de los resultados Minitab muestra una tabla de los tamaños de muestras, las medias de muestras, las desviaciones estándar y los errores estándar de las dos muestras. Debido a que anteriormente no se encontró evidencia de que las varianzas sean desiguales, decidimos utilizar la desviación estándar agrupada al elegir Asumir varianzas iguales. La desviación estándar agrupada, 2.8818, se utiliza para calcular la estadística de prueba y los intervalos de confianza . Una segunda tabla ofrece un nivel de confianza para la diferencia en las medias de poblaciones. Para este ejemplo, un intervalo de confianza de 95% es (1.450, 0.980), el cual incluye cero, lo que sugiere que no existe diferencia. El siguiente es el resultado de la prueba de hipótesis . La estadística de prueba es 0.38, con un valor p de 0.701 y 88 grados de libertad . Debido a que el valor p es mayor que los niveles  normalmente elegidos, no existe evidencia de que haya diferencia en uso de energía cuando se utiliza un regulador eléctrico versus un regulador de activación térmica. Ejemplos: Página 17
  18. 18. Universidad Tecnológica de Torreón Organismo Público Descentralizado del Gobierno de Coahuila Página 18
  19. 19. Universidad Tecnológica de Torreón Organismo Público Descentralizado del Gobierno de Coahuila Página 19
  20. 20. Universidad Tecnológica de Torreón Organismo Público Descentralizado del Gobierno de Coahuila t pareada Estadísticas > Estadísticas básicas > t pareada Realiza una prueba t pareada. Este procedimiento es apropiado para poner a prueba la diferencia media entre observaciones pareadas cuando las diferencias pareadas siguen una distribución normal. Utilice el comando t pareada para calcular un intervalo de confianza y realizar una prueba de hipótesis de la diferencia media entre las observaciones pareadas de la población. Una prueba t pareada crea correspondencia en pares de respuestas que son dependientes o están relacionadas. Esta correspondencia permite explicar la variabilidad entre los pares que por lo general produce un término de error más pequeño y, de esta manera, se aumenta la sensibilidad de la prueba de hipótesis o intervalo de confianza. Como ejemplos típicos de datos pareados figuran las mediciones hechas en gemelos o mediciones del tipo "antes y después". Para una prueba t pareada: H :  =  0 d 0 versus H :  ≠  1 d 0 donde  es la media de la población de las diferencias y  es la media hipotética de las diferencias. d 0 Cuando las muestras se extraen de manera independiente de dos poblaciones, utilice Estadísticas > Estadísticas básicas > t de 2 muestras. Elementos del cuadro de diálogo Muestra en columnas: Elija esta opción si ha ingresado datos sin procesar en dos columnas. Primera muestra: Ingrese la columna que contiene la primera muestra Segunda muestra: Ingrese la columna que contiene la segunda muestra Datos resumidos (diferencias): Elija si tiene valores de resumen para el tamaño de la muestra , media y desviación estándar de la media. Tamaño de muestra: Ingrese el valor del tamaño de la muestra. Media: Ingrese el valor de la media. Desviación estándar: Ingrese el valor de la desviación estándar. Página 20
  21. 21. Universidad Tecnológica de Torreón Organismo Público Descentralizado del Gobierno de Coahuila Para calcular una prueba t pareada y un intervalo de confianza 1 Elija Estadísticas > Estadísticas básicas > t pareada. 2 En Primera muestra, ingrese la columna que contiene la primera muestra. 3 En Segunda muestra, ingrese la columna que contiene la segunda muestra. 4 Si lo desea, utilice cualquiera de las opciones del cuadro de diálogo y haga clic en Aceptar. Ejemplo de t pareada Una empresa fabricante de zapatos desea comparar dos materiales, A y B, para utilizar en las suelas de los zapatos para niños varones. En este ejemplo, cada uno de diez niños en un estudio usó un par especial de zapatos con la suela de un zapato hecha con el material A y con la suela del otro zapato hecha con el material B. El tipo de suela fue asignado de forma aleatoria para explicar las diferencias sistemáticas en el desgaste entre el pie izquierdo y el derecho. Después de tres meses, los zapatos se miden para su uso. Para estos datos, usted utilizaría un diseño pareado en vez de un diseño no pareado. Un procedimiento t pareado probablemente tendría un término de error más pequeño que el que correspondería a un procedimiento no pareado porque éste elimina la variabilidad causada por diferencias entre los pares. Por ejemplo, es posible que uno de los niños viva en la ciudad y camine sobre pavimento la mayor parte del día, mientras que otro niño pudiera vivir en el campo y pasar gran parte del día sobre superficies no pavimentadas. 1 Abra la hoja de trabajo EJA_ESTAD.MTW. 2 Elija Estadísticas > Estadísticas básicas > t pareada. 3 Elija Muestras en columnas. 4 En Primera muestra, ingrese Mat-A. En Segunda muestra, ingrese Mat-B. Haga clic en Aceptar. Salida de la ventana Sesión Página 21
  22. 22. Universidad Tecnológica de Torreón Organismo Público Descentralizado del Gobierno de Coahuila Interpretación de los resultados El intervalo de confianza para la media de la diferencia entre los dos materiales no incluye cero, lo cual sugiere una diferencia entre ellos. El valor p pequeño (p = 0.009) también sugiere que los datos no concuerdan con H0 : d = 0, es decir, los dos materiales no tienen el mismo rendimiento. Específicamente, el Material B (media = 11.04) tuvo mejor rendimiento que el Material A (media = 10.63) en lo que respecta a desgaste a lo largo del período de prueba de tres meses. Compare los resultados del procedimiento pareado con los resultados del no pareado, prueba t de dos muestras (Estadísticas > Estadísticas básicas > t de 2 muestras). Los resultados del procedimiento pareado nos inducen a creer que los datos no concuerdan con H0 (t = 3.35; p = 0.009). Sin embargo, los resultados del procedimiento no pareado (no se muestran) son totalmente diferentes. Una prueba t no pareada produce un valor t de 0.37, y un valor p de 0.72. Con base en estos resultados, no sería posible rechazar la hipótesis nula y podríamos concluir que no existe diferencia en el rendimiento de los dos materiales. En el procedimiento no pareado, la gran cantidad de varianza en el desgaste de los zapatos entre los niños (el desgaste promedio para un niño fue de 6.50 y para otro de 14.25) oculta la diferencia, hasta cierto punto menos drástica, en el desgaste entre los zapatos izquierdo y derecho (la diferencia más grande entre zapatos fue de 1.10). Esta es la razón por la cual un diseño experimental pareado y un análisis subsiguiente con una prueba t pareada, cuando corresponda, es con frecuencia mucho más potente que un enfoque no pareado. Página 22
  23. 23. Universidad Tecnológica de Torreón Organismo Público Descentralizado del Gobierno de Coahuila Ejemplos: Página 23
  24. 24. Universidad Tecnológica de Torreón Organismo Público Descentralizado del Gobierno de Coahuila 1 Proporción Estadísticas > Estadísticas básicas > 1 Proporción Realiza una prueba de una proporción binomial. Utilice 1 Proporción para calcular un intervalo de confianza y realizar una prueba de hipótesis de la proporción . Por ejemplo, una fábrica de repuestos para vehículos afirma que menos del 2% de sus bujías son defectuosas. Usted podría tomar una muestra aleatoria de las bujías y determinar si la proporción defectuosa real coincide o no con la afirmación. Para una prueba de dos colas de una proporción: H : p = p versus H : p ≠ p hipotético. 0 0 1 0 donde p es la proporción de población y p es el valor 0 Para comparar dos proporciones, utilice Estadísticas > Estadísticas básicas > 2 proporciones. Elementos del cuadro de diálogo Muestras en columnas: Elija esta opción si usted tiene datos en las columnas, luego, ingrese las columnas que contienen los datos de muestra. Cada celda de estas columnas debe tener uno de dos valores posibles y corresponder a un elemento o sujeto. Los valores posibles en las columnas deben ser idénticos si usted ingresa columnas múltiples. Datos resumidos: Elija esta opción si tiene valores de resumen para los números de ensayos y eventos. Número de eventos: Ingrese el número de eventos observados. Si usted ingresa más de un valor; el valor entero que ingrese en Número de ensayos se aplicará a todos. Número de ensayos: Ingrese un valor individual para el número de ensayos. Realizar prueba de hipótesis: Marque esta opción para realizar la prueba de hipótesis de que la proporción de población es igual a un valor especificado. Proporción hipotética: Ingrese el valor de la proporción para la hipótesis nula de la prueba. Página 24
  25. 25. Universidad Tecnológica de Torreón Organismo Público Descentralizado del Gobierno de Coahuila Para calcular una prueba y un intervalo de confianza para una proporción 1 Elija Estadísticas > Estadísticas básicas > 1 Proporción. 2 Realice uno de los siguientes procedimientos:  Si tiene datos sin procesar, elija Muestras en columnas, e ingrese las columnas que contienen los datos sin procesar.  Si tiene datos resumidos: 1 Elija Datos resumidos. 2 En Número de ensayos, ingrese un valor entero numérico simple para el número de ensayos. Con frecuencia, el número de ensayos será su tamaño de muestra.. 3 En Número de eventos, ingrese uno o más valores enteros numéricos como el número observado de eventos. 3 Si lo desea, utilice cualquiera de las opciones del cuadro de diálogo y haga clic en Aceptar. Ejemplo de 1 proporción A una fiscal de condado le gustaría postularse para la fiscalía del estado. Ella decide que renunciará a su cargo en la oficina del condado y postularse para la fiscalía del estado si más del 65% de los miembros de su partido la respaldan. Usted necesita probar H0 : p = .65 versus H1 : p > .65 Como su director de campaña, usted recopiló información de 950 miembros del partido seleccionados de manera aleatoria y observa que 560 miembros del partido apoyan a la candidata. Una prueba de proporción se realizó para determinar si la proporción de los partidarios era o no mayor que la proporción requerida de 0.65. Además, se construyó un límite de confianza del 95% para determinar el límite inferior para la proporción de partidarios. 1 Elija Estadísticas > Estadísticas básicas > 1 Proporción. 2 Elija Datos resumidos. 3 En Número de eventos, ingrese 560. En Número de ensayos, ingrese 950. 4 Marque Realizar prueba de hipótesis. En Proporción hipotética, ingrese 0.65. Página 25
  26. 26. Universidad Tecnológica de Torreón Organismo Público Descentralizado del Gobierno de Coahuila 5 Haga clic en Opciones. En Hipótesis alterna, elija Mayor que. Haga clic en Aceptar en cada cuadro de diálogo. Salida de la ventana Sesión Interpretación de los resultados El valor p de 1.0 sugiere que los datos son consistentes con la hipótesis nula (H0 : p = 0.65), es decir, la proporción de los miembros del partido que apoyan a la candidata no es mayor que la proporción requerida de 0.65. Como su director de campaña, usted le aconsejaría no postularse para la fiscalía del estado. Página 26
  27. 27. Universidad Tecnológica de Torreón Organismo Público Descentralizado del Gobierno de Coahuila 2 proporciones Realiza una prueba de dos proporciones binomiales. Utilice el comando 2 proporciones para calcular un intervalo de confianza y realizar una prueba de hipótesis de la diferencia entre dos proporciones. Minitab ofrece dos pruebas de hipótesis para la diferencia entre dos proporciones: La prueba exacta de Fisher y una prueba basada en una aproximación normal. La prueba de aproximación normal puede ser inexacta para muestras en las cuales el número de eventos de cada muestra es menor que cinco o si la diferencia entre el número de ensayos y eventos de cada muestra es menor que cinco. La prueba exacta de Fisher es exacta para todos los tamaños de muestra , pero sólo se puede calcular cuando la hipótesis nula establece que las proporciones de población son iguales. En otras palabras, Minitab sólo realiza la prueba exacta de Fisher cuando usted especifica una diferencia de la prueba de cero en el cuadro de diálogo secundario Opciones. Por ejemplo, supongamos que usted desea saber si la proporción de consumidores que responden a una encuesta pudiera incrementarse al ofrecer un incentivo tal como una muestra del producto. Usted puede incluir la muestra del producto en la mitad de sus correos y determinar si obtiene más repuestas del grupo que recibió la muestra que del grupo que no la recibió. Para una prueba de dos colas de dos proporciones: H : p - p = p versus H : p - p ≠ p 0 1 0 2 1 1 2 0 cuando p y p son las proporciones de eventos en las poblaciones 1 y 2, respectivamente, y p es la diferencia hipotética entre las dos proporciones. 1 2 0 Para probar una proporción utilice Estadísticas > Estadísticas básicas > 2 Proporciones. Elementos del cuadro de diálogo Muestras en una columna: Elija esta opción si ha ingresado datos sin procesar en una columna individual con una segunda columna de subíndices que identifican la muestra. Muestras: Ingrese la columna que contiene los datos sin procesar. Subíndices: Ingrese la columna que contiene los subíndices de la muestra. Muestras en diferentes columnas: Elija esta opción si introdujo datos sin procesar en las columnas individuales para cada muestra. Primero: Ingrese la columna que contiene los datos sin procesar para la primera muestra. Segundo: Ingrese la columna que contiene los datos sin procesar para la segunda muestra. Página 27
  28. 28. Universidad Tecnológica de Torreón Organismo Público Descentralizado del Gobierno de Coahuila Datos resumidos: Elija esta opción si tiene valores de resumen para los números de ensayos y eventos. Nombre Eventos: Ingrese el número de eventos en la primera muestra. Ensayos: Ingrese el número de ensayos en la primera muestra. Segundo Eventos: Ingrese el número de eventos en la segunda muestra. Ensayos: Ingrese el número de ensayos en la segunda muestra. Para calcular un intervalo de confianza de prueba para la diferencia en proporciones 1 Elija Estadísticas > Estadísticas básicas > 2 Proporciones. 2 Realice uno de los siguientes procedimientos:  Si sus datos sin procesar están apilados en una columna individual: 1 Elija Muestras en una columna. 2 En Muestras, ingrese la columna que contenga los datos sin procesar. 3 En Subíndices, ingrese la columna que contiene los códigos de grupo o población.  Si sus datos sin procesar no están apilados, es decir, cada muestra se encuentra en una columna separada: 1 Elija Muestras en diferentes columnas. 2 En Primera, ingrese la columna que contiene la primera muestra. 3 En Segunda, ingrese la columna que contiene la otra muestra.  Si tiene datos resumidos: 1 Elija Datos resumidos. 2 En Primera muestra, ingrese los valores numéricos en Ensayos y en Eventos. Página 28
  29. 29. Universidad Tecnológica de Torreón Organismo Público Descentralizado del Gobierno de Coahuila 3 En Segunda muestra, ingrese los valores numéricos en Ensayos y en Eventos. 3 Si lo desea, utilice cualquiera de las opciones del cuadro de diálogo y haga clic en Aceptar. Ejemplo de 2 proporciones Como gerente de compras de su corporación, usted debe autorizar la adquisición de veinte máquinas fotocopiadoras nuevas. Después de comparar numerosas marcas en términos de precio, calidad de la copia, garantía y funciones, usted ha reducido sus opciones a dos: Marca X y Marca Y. Usted decide que el factor determinante será la confiabilidad de las marcas definida por la proporción de servicio requerido dentro de un año a partir de la compra. Debido a que su corporación ya utiliza ambas marcas, usted pudo obtener información acerca del historial de servicio de 50 máquinas de cada marca seleccionadas aleatoriamente. Los registros indican que seis máquinas de la Marca X y ocho de la Marca Y requirieron servicio. Utilice esta información para orientar su elección de la marca a comprar. 1 Elija Estadísticas > Estadísticas básicas > 2 Proporciones. 2 Elija Datos resumidos. 3 En Primera muestra, en Eventos, ingrese 44. En Ensayos, ingrese 50. 4 En Segunda muestra, en Eventos, ingrese 42. En Ensayos, ingrese 50. Haga clic en Aceptar. Salida de la ventana Sesión Página 29
  30. 30. Universidad Tecnológica de Torreón Organismo Público Descentralizado del Gobierno de Coahuila Interpretación de los resultados En este ejemplo, la prueba de aproximación normal es válida porque, para ambas muestras, el número de eventos es mayor que cuatro y la diferencia entre los números de ensayos y eventos es mayor que cuatro. La prueba de aproximación normal indica un valor p de 0.564, y la prueba exacta de Fisher señala un valor p de 0.774. Ambos valores p son mayores que los niveles  comúnmente elegidos. Por lo tanto, los datos concuerdan con la hipótesis nula de que las proporciones de población son iguales. En otras palabras, la proporción de máquinas fotocopiadoras que necesitaron servicio en el primer año no difiere dependiendo de la marca. Como gerente de compras, usted debe hallar un criterio diferente para orientar su decisión sobre cuál marca comprar. Debido a que la aproximación normal es válida, usted puede sacar la misma conclusión del intervalo de confianza de 95%. Debido a que cero se ubica en el intervalo de confianza de (0.0957903 a 0.175790) usted puede concluir que los datos coinciden con la hipótesis nula. Si considera que el intervalo de confianza es demasiado amplio y no provee información precisa con respecto al valor de p 1  p2 , es recomendable que recolecte más datos con el fin de obtener un mejor estimado de la diferencia. Víctor Hugo Franco García https://www.facebook.com/victorhugo.francogarcia.7 andruss_hugo1453@hotmail.com http://www.slideshare.net/Hugo_Franco/newsfeed hugofranco.bligoo.com.mx victor-garcia.bligoo.com.mx Página 30

×