Manual MinitaB.

530 visualizaciones

Publicado el

0 comentarios
0 recomendaciones
Estadísticas
Notas
  • Sé el primero en comentar

  • Sé el primero en recomendar esto

Sin descargas
Visualizaciones
Visualizaciones totales
530
En SlideShare
0
De insertados
0
Número de insertados
23
Acciones
Compartido
0
Descargas
21
Comentarios
0
Recomendaciones
0
Insertados 0
No insertados

No hay notas en la diapositiva.

Manual MinitaB.

  1. 1. Ingeniería en Tecnologías de la Producción. “Manual Minitab” Estadística Aplicada a la Ingeniería. Lic. Edgar Mata Ortiz Daniel Aguilera Muñoz 30/10/2013
  2. 2. Z de una muestra Primeramente abrimos minitab que se puede encontrar el icono en el escritorio u en los programas e inicio, damos click en la opción estadística básica, luego seleccionamos 1de z, z de 1, al instante nos aparecerá un recuadro con diferentes opciones, le damos valores lógicos en la tabla tanto en el recuadro, pero antes escribe los valores en la tabla de Excel que te proporciona minitab, para que este programa puea hacer sus cálculos. Si se desea también puedes darle algún valor a la prueba hipotética pero para esto tendrá que ser algún valor lógico porque si no te aparecerá error en la pantalla.
  3. 3. Revisión general Utilice las capacidades de estadísticas básicas de Minitab para calcular estadísticas básicas y para realizar estimaciones simples y pruebas de hipótesis con una o dos muestras. Las capacidades de estadísticas básicas incluyen procedimientos para:  Calcular o almacenar estadísticas descriptivas  Pruebas de hipótesis e intervalos de confianza de la media o la diferencia en las medias  Pruebas de hipótesis e intervalos de confianza para una proporción o la diferencia en proporciones  Pruebas de hipótesis e intervalos de confianza de la tasa de ocurrencias, la media del número de ocurrencias y las diferencias entre ellas para los procesos de Poisson.  Pruebas de hipótesis e intervalos de confianza para una varianza y para la diferencia entre dos varianzas  Medición de asociaciones  Pruebas de normalidad de una distribución  Pruebas para determinar si los datos siguen una distribución de Poisson Cálculo y almacenamiento de estadísticas descriptivas  Mostrar estadísticas descriptivas genera estadísticas descriptivas para cada columna o subconjunto dentro de una columna. Puede mostrar las estadísticas en la ventana Sesión y/o mostrarlas en una gráfica.  Almacenar estadísticas descriptivas almacena estadísticas descriptivas para cada columna o subconjunto dentro de una columna.  Resumen gráfico genera cuatro gráficas y una tabla de salida en una ventana de gráfica. Para obtener una lista de las estadísticas descriptivas disponibles para mostrar o almacenar, véase Estadísticas descriptivas disponibles para mostrar o almacenar. Para calcular estadísticas descriptivas de forma individual y almacenarlas como constantes, véase Estadísticas de columnas. Intervalos de confianza y pruebas de hipótesis de medias
  4. 4. Los cuatro procedimientos de las pruebas de hipótesis e intervalos de confianza para las medias de la población o la diferencia entre las medias se basan en que la distribución de la media de la muestra siga una distribución normal. De acuerdo con el Teorema del límite central, la distribución normal se convierte en una aproximación cada vez mejor para la distribución de la media de la muestra extraída de cualquier distribución a medida que aumenta el tamaño de la muestra.  Z de 1 muestra calcula un intervalo de confianza o realiza una prueba de hipótesis de la media cuando la desviación estándar de la población, , es conocida. Este procedimiento se basa en una distribución normal, de manera que para las muestras pequeñas, este procedimiento funciona mejor si sus datos fueron extraídos de una distribución normal o una distribución cercana a normal. A partir del Teorema del límite central, usted puede utilizar este procedimiento si tiene una muestra grande, sustituyendo la desviación estándar de la muestra por . Una regla de oro común consiste en considerar que las muestras con un tamaño de 30 o más son muestras grandes. Muchos analistas eligen el procedimiento t y no el procedimiento Z cuando  es desconocida.  t de 1 muestra calcula un intervalo de confianza o realiza una prueba de hipótesis de la media cuando  es desconocida. Este procedimiento se basa en la distribución t, que se deriva de una distribución normal con  desconocida. Para el caso de muestras pequeñas, este procedimiento funciona mejor si sus datos fueron extraídos de una distribución que es normal o cercana a normal. Este procedimiento es más conservador que el procedimiento Z y siempre deberá tener preferencia sobre el procedimiento Z cuando se trata de muestras pequeñas y  es desconocida. Muchos anali eligen el procedimiento stas t y no el procedimiento Z cada vez que  es desconocida. De acuerdo con el Teorema del límite central, mientras mayor sea el tamaño de la muestra, usted podrá tener mayor confianza en los resultados de este procedimiento, porque la distribución de la media de la muestra se comporta cada vez más como una distribución normal.  t de 2 muestras calcula un intervalo de confianza y realiza una prueba de hipótesis de la diferencia entre las medias de dos poblaciones cuando las  son desconocidas y las muestras han sido extraídas independientemente. Este procedimiento se basa en la distribución t y, en el caso de muestras pequeñas, funciona mejor si sus datos se extraen de distribuciones que son normales o cercanas a normales. A medida que el tamaño de la muestra aumenta, usted puede tener mayor confianza en los resultados.  t pareada calcula un intervalo de confianza y realiza una prueba de hipótesis de la diferencia entre las medias de dos poblaciones cuando las observaciones son pareadas (coinciden). Cuando los datos son pareados, tal como ocurre en las mediciones "antes y después", el procedimiento de t pareada produce una varianza menor y mayor potencia para detectar diferencias en comparación con el procedimiento de t de 2 muestras anterior, el cual presupone que las muestras fueron extraídas de manera independiente. Intervalos de confianza y pruebas de hipótesis de proporciones
  5. 5.  1 Proporción calcula un intervalo de confianza y somete a una prueba de hipótesis una proporción de la población.  2 proporciones calcula un intervalo de confianza y somete a una prueba de hipótesis la diferencia entre 2 proporciones de la población. Intervalos de confianza y pruebas de hipótesis de tasas de Poisson  Tasa de Poisson de 1 muestra calcula un intervalo de confianza y somete a una prueba de hipótesis la tasa de ocurrencias y la media del número de ocurrencias en un proceso de Poisson.  Tasa de Poisson de 2 muestras calcula un intervalo de confianza y somete a una prueba de hipótesis la diferencia en las tasas de ocurrencias y la diferencia en la media del número de ocurrencias en dos procesos de Poisson. Intervalos de confianza y pruebas de hipótesis de varianza  1 varianza calcula un intervalo de confianza y somete a una prueba de hipótesis la varianza de una muestra.  2 varianzas calcula un intervalo de confianza y somete a una prueba de hipótesis la calidad u homogeneidad de la varianza de dos muestras. Medidas de asociación  Correlación calcula el coeficiente de correlación producto-momento de Pearson (también denominado coeficiente de correlación o correlación) para pares de variables. El coeficiente de correlación es una de medida del grado de relación lineal entre dos variables. Puede obtener un valor p para probar si hay suficiente evidencia de que el coeficiente de correlación no es cero. Utilizando una combinación de comandos de Minitab, también puede calcular la correlación de Spearman y un coeficiente de correlación parcial. La correlación de Spearman es simplemente la correlación calculada en las clasificaciones de las dos muestras. Un coeficiente de correlación parcial es el coeficiente de correlación entre dos variables mientras se ajusta para los efectos de otras variables.  Covarianza calcula la covarianza para pares de variables. La covarianza es una medida de la relación entre dos variables, pero no ha sido estandarizada, tal como se hace con el coeficiente de correlación, dividiendo entre la desviación estándar de ambas variables. Prueba de distribución
  6. 6. La Prueba de normalidad genera una gráfica de probabilidad normal y realiza una prueba de hipótesis para examinar si las observaciones siguen o no una distribución normal. Algunos procedimientos estadísticos, como una prueba t o Z, presuponen que las muestras provienen de una distribución normal. Utilice este procedimiento para poner a prueba el supuesto de normalidad. Prueba de bondad de ajuste Prueba de bondad de ajuste para Poisson evalúa si sus datos siguen una distribución de Poisson. Algunos procedimientos estadísticos, como la gráfica U, parten del supuesto de que los datos siguen una distribución de Poisson. Utilice este procedimiento para poner a prueba este supuesto. Procedimiento 1 Elija Estadísticas > Estadísticas básicas > Z de 1 muestra. 2 En Muestras en columnas, ingrese las columnas que contienen las muestras. 3 En Desviación estándar, ingrese un valor para . 4 Si lo desea, utilice cualquier opción del cuadro de diálogo y luego haga clic en Aceptar. Ejemplo Las mediciones se tomaron en nueve artefactos. Usted sabe que la distribución de las mediciones históricamente ha estado cerca de una distribución normal con  = 0.2. Puesto que usted conoce el valor de  y desea probar si la media de población es 5 y obtener un intervalo de confianza de 90% para la media, usted utiliza el procedimiento Z. 1 Abra la hoja de trabajo EJA_ESTAD.MTW. 2 Elija Estadísticas > Estadísticas básicas > Z de 1 muestra. 3 En Muestras en columnas, ingrese Valores. 4 En Desviación estándar, ingrese 0.2. 5 Marque Realizar prueba de hipótesis.En Media hipotética, ingrese 5. 6 Haga clic en Opciones. En Nivel de confianza, ingrese 90. Haga clic en Aceptar.
  7. 7. 7 Haga clic en Gráficas. Marque Gráfica de valores individuales. Haga clic en Aceptar en cada cuadro de diálogo. Salida de la ventana Sesión Interpretación de los resultados La estadística de prueba, Z, para probar si la media de población es igual a 5 es  3.17. El valor p, o la probabilidad de rechazar la hipótesis nula cuando es verdadera, es 0.002. Esto se denomina un nivel de significancia obtenido, valor p o  obtenido de la prueba. Debido a que el valor p de 0.002 es más pequeño que los niveles a comúnmente elegidos, existe evidencia significativa de que  no es igual a 5, de manera que usted puede rechazar H0 en favor de que el valor de  no es 5.
  8. 8. Una prueba de hipótesis en  = 0.1 también puede realizarse al observar una gráfica de valores individuales. El valor hipotético se ubica fuera del intervalo de confianza de 90% para la media de población (4.6792, 4.8985) y de este modo puede rechazar la hipótesis nula. t de una muestra Para resolver este tipo de problema con 1t t de muestra, son los mismos pasos que hemos llevado a cabo desde la primera parte, solo que el recuadro que nos aparece es muy diferente al anterior, ya que son otros tipos e calculo pero con el mismo fin de resolver problemas de hipótesis.
  9. 9. En Revisión general Estadísticas > Estadísticas básicas > t de 1 muestra Realiza una prueba t de una muestra o intervalo de confianza t para la media. Utilice t de 1 muestra para calcular un intervalo de confianza y realice una prueba de hipótesis de la media cuando no se conoce la desviación estándar de la población , . Para una t de una muestra con dos colas, H0:  = versus H1:  ≠  0 0 donde  es la media de la población y  es la media de la población hipotética.  0 Elementos del cuadro de diálogo Muestras en columnas: Elija esta opción si ha ingresado datos sin procesar en columnas. Ingrese las columnas que contienen los datos de muestra. Datos resumidos: Elija si tiene valores de resumen para el tamaño de la muestra, media y desviación estándar.
  10. 10. Tamaño de la muestra: Ingrese el valor para el tamaño de la muestra . Media: Ingrese el valor para la media de la muestra. Desviación estándar: Ingrese el valor para la desviación estándar de la muestra. Realizar prueba de hipótesis: Marque esta opción para realizar una prueba de hipótesis. Media hipotética: Ingrese la media de la prueba 0.  Procedimiento 1 Elija Estadísticas > Estadísticas básicas > t de 1 muestra. 2 En Muestras en columnas, ingrese las columnas que contienen las muestras. 3 Si lo desea, utilice cualquier opción del cuadro de diálogo y luego haga clic en Aceptar. Ejemplo Las mediciones se tomaron en nueve artefactos. Usted sabe que la distribución de las mediciones de los artefactos históricamente ha estado cerca de una distribución normal, pero supongamos que usted no conoce . Para probar si la media de población es 5 y para obtener un intervalo de confianza de 90% para la media, usted utiliza un procedimiento t. 1 Abra la hoja de trabajo EJA_ESTAD.MTW. 2 Elija Estadísticas > Estadísticas básicas > t de 1 muestra. 3 En Muestras en columnas, ingrese Valores. 4 Marque Realizar prueba de hipótesis.En Media hipotética, ingrese 5. 5 Haga clic en Opciones. En Nivel de confianza, ingrese 90. Haga clic en Aceptar en cada cuadro de diálogo.
  11. 11. t de 2 muestras En esta parte del manual de minitab 16, te mostraremos como trabajar con la opción 2t de t de 2 muestras, ya que en esta opción, puede resultar un poco complicado para empezar a trabajar. Primero hacemos el mismo trabajo que hemos hecho con las opciones anteriores, estadísticas, estadística básica y 2t, t de 2 muestras. Así como se muestra en a imagen de abajo.
  12. 12. Revisión general Realiza una prueba t de 2 muestras independientes y genera un intervalo de confianza . Cuando tenga muestras dependientes , utilice Estadísticas > Estadísticas básicas > t pareada. Utilice t de 2 muestras para realizar una prueba de hipótesis y calcular un intervalo de confianza o la diferencia entre dos medias de población cuando las desviaciones estándar de las poblaciones, , sean desconocidas. Para una prueba t de 2 muestras con dos colas H0:    2 = 0   1 versus H1: 1    ≠ 0   2 donde  y 2 son las medias de población y 0 es la diferencia hipotética entre las dos   1 medias de población. Elementos del cuadro de diálogo Muestras en una columna: Elija esta opción si los datos de la muestra se encuentran en una columna individual, diferenciados por los valores de subíndice (códigos de grupo) en una segunda columna. Muestras: Ingrese la columna que contiene los datos. Subíndices: Ingrese la columna que contiene los subíndices de la muestra. Muestras en diferentes columnas: Elija esta opción si los datos de las dos muestras están en columnas separadas. Primero: Ingrese la columna que contiene una muestra. Segundo: Ingrese la columna que contiene la otra muestra. Datos resumidos (diferencias): Elija esta opción si tiene valores de resumen para el tamaño de la muestra , media y desviación estándar para cada muestra. Nombre Tamaño de la muestra: Ingrese el valor para el tamaño de la muestra. Media: Ingrese el valor de la media. Desviación estándar: Ingrese el valor de la desviación estándar. Segundo
  13. 13. Tamaño de la muestra: Ingrese el valor del tamaño de la muestra. Media: Ingrese el valor de la media. Desviación estándar: Ingrese el valor de la desviación estándar. Asumir varianzas iguales: Marque esta opción para presuponer que las poblaciones tienen varianzas iguales. La opción predeterminada es presuponer varianzas desiguales. Véase Varianzas iguales o desiguales. Procedimiento 1 Elija Estadísticas > Estadísticas básicas > t de 2 muestra. 2 Elija una de las siguientes opciones:  Si sus datos están apilados en una columna individual:  Elija Muestras en una columna.  En Muestras, ingrese la columna que contiene los datos numéricos.  En Subíndices, ingrese la columna que contiene los códigos de grupo o población.  Si sus datos no están apilados, es decir, cada muestra se encuentra en una columna separada:  Elija Muestras en diferentes columnas.  En Primera, ingrese la columna que contiene la primera muestra.  En Segunda, ingrese la columna que contiene la otra muestra. 3 Si lo desea, utilice cualquiera de las opciones del cuadro de diálogo y haga clic en Aceptar. Ejemplo Se llevó a cabo un estudio para evaluar la efectividad de dos dispositivos para mejorar la eficiencia de sistemas de calefacción domésticos a gas. El consumo de energía en las viviendas se midió después de la instalación de uno de los dos dispositivos. Los dos
  14. 14. dispositivos eran: un regulador eléctrico (Regulador=1) y un regulador de activación térmica (Regulador=2). Los datos de consumo de energía (BTU.Con) se apilan en una columna y una columna de agrupación (Regulador) contiene identificadores o subíndices para denotar la población. Supongamos que realizó una prueba de varianza y no encontró evidencia de que las varianzas no sean iguales (véase Ejemplo de 2 varianzas). Ahora, usted desea comparar la efectividad de estos dos dispositivos al determinar si existe o no evidencia de que la diferencia entre los dispositivos es diferente de cero. 1 Abra la hoja de trabajo HORNO.MTW. 2 Elija Estadísticas > Estadísticas básicas > t de 2 muestras. 3 Elija Muestras en una columna. 4 En Muestras, ingrese 'BTU.Con'. 5 En Subíndices, ingrese Regulador. 6 Marque la opción Asumir varianzas iguales. Haga clic en Aceptar. Salida de la ventana Sesión Prueba T e IC de dos muestras: BTU.Con, Regulador T de dos muestras para BTU.Con Error estándar de la Regulador N Media Desv.Est. 1 40 9.91 3.02 0.48 2 50 10.14 2.77 0.39 Diferencia = mu (1) - mu (2) Estimado de la diferencia: -0.235 media
  15. 15. IC de 95% para la diferencia: (-1.450, 0.980) Prueba T de diferencia = 0 (vs. no =): Valor T = -0.38 Valor P = 0.701 GL = 88 Ambos utilizan Desv.Est. agrupada = 2.8818 Interpretación de los resultados Minitab muestra una tabla de los tamaños de muestras, las medias de muestras, las desviaciones estándar y los errores estándar de las dos muestras. Debido a que anteriormente no se encontró evidencia de que las varianzas sean desiguales, decidimos utilizar la desviación estándar agrupada al elegir Asumir varianzas iguales. La desviación estándar agrupada, 2.8818, se utiliza para calcular la estadística de prueba y los intervalos de confianza . Una segunda tabla ofrece un nivel de confianza para la diferencia en las medias de poblaciones. Para este ejemplo, un intervalo de confianza de 95% es ( 1.450, 0.980), el cual incluye cero, lo que sugiere que no existe diferencia. El siguiente es el resultado de la prueba de hipótesis . La estadística de prueba es  0.38, con un valor p de 0.701 y 88 grados de libertad . Debido a que el valor p es mayor que los niveles a normalmente elegidos, no existe evidencia de que haya diferencia en uso de energía cuando se utiliza un regulador eléctrico versus un regulador de activación térmica. t pareada En esta parte de minitab, volvemos a seleccionar la opción estadística, oso que esta vez abriremos la opción t pareada, para comenzar a trabajar conoceremos por primera vez como se trabaja con este inciso. A diferencia de la prueba de T para muestras independientes, la prueba de T pareada se utiliza para muestras o variables que pertenecen a un mismo individuo o entidad en estudio (por ejemplo, la altura de los niños de la guardería "gotita de gente" (viva el ICBF) antes y después de un tratamiento con bienes tarina durante 6 meses). Entonces, por obvias razones las columnas deben tener el mismo número de casillas porque esto representaría medidas antes y después de "algo".
  16. 16. Revisión general Realiza una prueba t pareada . Este procedimiento es apropiado para poner a prueba la diferencia media entre observaciones pareadas cuando las diferencias pareadas siguen una distribución normal. Utilice el comando t pareada para calcular un intervalo de confianza y realizar una prueba de hipótesis de la diferencia media entre las observaciones pareadas de la población. Una
  17. 17. prueba t pareada crea correspondencia en pares de respuestas que son dependientes o están relacionadas. Esta correspondencia permite explicar la variabilidad entre los pares que por lo general produce un término de error más pequeño y, de esta manera, se aumenta la sensibilidad de la prueba de hipótesis o intervalo de confianza. Como ejemplos típicos de datos pareados figuran las mediciones hechas en gemelos o mediciones del tipo "antes y después". Para una prueba t pareada: H0: m d = m0 versus H1: m d ≠ m 0 donde m d es la media de la población de las diferencias y m 0 es la media hipotética de las diferencias. Cuando las muestras se extraen de manera independiente de dos poblaciones, utilice Estadísticas > Estadísticas básicas > t de 2 muestras. Elementos del cuadro de diálogo Muestra en columnas: Elija esta opción si ha ingresado datos sin procesar en dos columnas. Primera muestra: Ingrese la columna que contiene la primera muestra Segunda muestra: Ingrese la columna que contiene la segunda muestra Datos resumidos (diferencias): Elija si tiene valores de resumen para el tamaño de la muestra , media y desviación estándar de la media. Tamaño de muestra: Ingrese el valor del tamaño de la muestra. Media: Ingrese el valor de la media. Desviación estándar: Ingrese el valor de la desviación estándar. Procedimiento 1 Elija Estadísticas > Estadísticas básicas > t pareada. 2 En Primera muestra, ingrese la columna que contiene la primera muestra. 3 En Segunda muestra, ingrese la columna que contiene la segunda muestra.
  18. 18. 4 Si lo desea, utilice cualquiera de las opciones del cuadro de diálogo y haga clic en Aceptar. Ejemplo Una empresa fabricante de zapatos desea comparar dos materiales, A y B, para utilizar en las suelas de los zapatos para niños varones. En este ejemplo, cada uno de diez niños en un estudio usó un par especial de zapatos con la suela de un zapato hecha con el material A y con la suela del otro zapato hecha con el material B. El tipo de suela fue asignado de forma aleatoria para explicar las diferencias sistemáticas en el desgaste entre el pie izquierdo y el derecho. Después de tres meses, los zapatos se miden para su uso. Para estos datos, usted utilizaría un diseño pareado en vez de un diseño no pareado. Un procedimiento t pareado probablemente tendría un término de error más pequeño que el que correspondería a un procedimiento no pareado porque éste elimina la variabilidad causada por diferencias entre los pares. Por ejemplo, es posible que uno de los niños viva en la ciudad y camine sobre pavimento la mayor parte del día, mientras que otro niño pudiera vivir en el campo y pasar gran parte del día sobre superficies no pavimentadas. 1 Abra la hoja de trabajo EJA_ESTAD.MTW. 2 Elija Estadísticas > Estadísticas básicas > t pareada. 3 Elija Muestras en columnas. 4 En Primera muestra, ingrese Mat-A. En Segunda muestra, ingrese Mat-B. Haga clic en Aceptar. Salida de la ventana Sesión IC y Prueba T pareada: Mat-A, Mat-B T pareada para Mat-A - Mat-B Error estándar
  19. 19. de la N Media Desv.Est. media Mat-A 10 10.630 2.451 0.775 Mat-B 10 11.040 2.518 0.796 Diferencia 10 -0.410 0.387 0.122 IC de 95% para la diferencia media:: (-0.687, -0.133) Prueba t de diferencia media = 0 (vs. no = 0): Valor T = -3.35 Valor P = 0.009 Interpretación de los resultados El intervalo de confianza para la media de la diferencia entre los dos materiales no incluye cero, lo cual sugiere una diferencia entre ellos. El valor p pequeño (p = 0.009) también sugiere que los datos no concuerdan con H0: m d = 0, es decir, los dos materiales no tienen el mismo rendimiento. Específicamente, el Material B (media = 11.04) tuvo mejor rendimiento que el Material A (media = 10.63) en lo que respecta a desgaste a lo largo del período de prueba de tres meses. Compare los resultados del procedimiento pareado con los resultados del no pareado, prueba t de dos muestras (Estadísticas > Estadísticas básicas > t de 2 muestras). Los resultados del procedimiento pareado nos inducen a creer que los datos no concuerdan con H0 (t = -3.35; p = 0.009). Sin embargo, los resultados del procedimiento no pareado (no se muestran) son totalmente diferentes. Una prueba t no pareada produce un valor t de -0.37, y un valor p de 0.72. Con base en estos resultados, no sería posible rechazar la hipótesis nula y podríamos concluir que no existe diferencia en el rendimiento de los dos materiales. En el procedimiento no pareado, la gran cantidad de varianza en el desgaste de los zapatos entre los niños (el desgaste promedio para un niño fue de 6.50 y para otro de 14.25) oculta la diferencia, hasta cierto punto menos drástica, en el desgaste entre los zapatos izquierdo y derecho (la diferencia más grande entre zapatos fue de 1.10). Esta es la razón por la cual un diseño experimental pareado y un análisis subsiguiente con una prueba t pareada, cuando corresponda, es con frecuencia mucho más potente que un enfoque no pareado.
  20. 20. 1 Proporción Revisión general Realiza una prueba de una proporción binomial. Utilice 1 Proporción para calcular un intervalo de confianza y realizar una prueba de hipótesis de la proporción . Por ejemplo, una fábrica de repuestos para vehículos afirma que menos del 2% de sus bujías son defectuosas. Usted podría tomar una muestra aleatoria de las bujías y determinar si la proporción defectuosa real coincide o no con la afirmación. Para una prueba de dos colas de una proporción: H0: p = p0 versus H1: p ≠ p0 donde p es la proporción de población y p0 es el valor hipotético. Para comparar dos proporciones, utilice Estadísticas > Estadísticas básicas > 2 proporciones. Elementos del cuadro de diálogo Muestras en columnas: Elija esta opción si usted tiene datos en las columnas, luego, ingrese las columnas que contienen los datos de muestra. Cada celda de estas columnas debe tener uno de dos valores posibles y corresponder a un elemento o sujeto. Los valores posibles en las columnas deben ser idénticos si usted ingresa columnas múltiples. Datos resumidos: Elija esta opción si tiene valores de resumen para los números de ensayos y eventos. Número de eventos: Ingrese el número de eventos observados. Si usted ingresa más de un valor; el valor entero que ingrese en Número de ensayos se aplicará a todos. Número de ensayos: Ingrese un valores individuales para el número de ensayos. Realizar prueba de hipótesis: Marque esta opción para realizar la prueba de hipótesis de que la proporción de población es igual a un valor especificado. Proporción hipotética: Ingrese el valor de la proporción para la hipótesis nula de la prueba. Procedimiento
  21. 21. 1 Elija Estadísticas > Estadísticas básicas > 1 Proporción. 2 Realice uno de los siguientes procedimientos: · Si tiene datos sin procesar, elija Muestras en columnas, e ingrese las columnas que contienen los datos sin procesar. · Si tiene datos resumidos: 1 Elija Datos resumidos. 2 En Número de ensayos, ingrese un valor entero numérico simple para el número de ensayos. Con frecuencia, el número de ensayos será su tamaño de muestra.. 3 En Número de eventos, ingrese uno o más valores enteros numéricos como el número observado de eventos. 3 Si lo desea, utilice cualquiera de las opciones del cuadro de diálogo y haga clic en Aceptar. Ejemplo A una fiscal de condado le gustaría postularse para la fiscalía del estado. Ella decide que renunciará a su cargo en la oficina del condado y postularse para la fiscalía del estado si más del 65% de los miembros de su partido la respaldan. Usted necesita probar H0: p = .65 versus H1: p > .65 Como su director de campaña, usted recopiló información de 950 miembros del partido seleccionados de manera aleatoria y observa que 560 miembros del partido apoyan a la candidata. Una prueba de proporción se realizó para determinar si la proporción de los partidarios era o no mayor que la proporción requerida de 0.65. Además, se construyó un límite de confianza del 95% para determinar el límite inferior para la proporción de partidarios. 1 Elija Estadísticas > Estadísticas básicas > 1 Proporción. 2 Elija Datos resumidos. 3 En Número de eventos, ingrese 560. En Número de ensayos, ingrese 950. 4 Marque Realizar prueba de hipótesis.En Proporción hipotética, ingrese 0.65. 5 Haga clic en Opciones. En Hipótesis alterna, elija Mayor que. Haga clic en Aceptar en cada cuadro de diálogo.
  22. 22. Salida de la ventana Sesión Prueba e IC para una proporción Prueba de p = 0.65 vs. p > 0.65 95% Límite Valor P Muestra X N Muestra p inferior exacto 1 560 950 0.589474 0.562515 1.000 Interpretación de los resultados El valor p de 1.0 sugiere que los datos son consistentes con la hipótesis nula (H0: p = 0.65), es decir, la proporción de los miembros del partido que apoyan a la candidata no es mayor que la proporción requerida de 0.65. Como su director de campaña, usted le aconsejaría no postularse para la fiscalía del estado. A una fiscal de condado le gustaría postularse para la fiscalía del estado. Ella decide que renunciará a su cargo en la oficina del condado y postularse para la fiscalía del estado si más del 65% de los miembros de su partido la respaldan. Usted necesita probar H0: p = .65 versus H1: p > .65 Como su director de campaña, usted recopiló información de 950 miembros del partido seleccionados de manera aleatoria y observa que 560 miembros del partido apoyan a la candidata. Una prueba de proporción se realizó para determinar si la proporción de los partidarios era o no mayor que la proporción requerida de 0.65. Además, se construyó un límite de confianza del 95% para determinar el límite inferior para la proporción de partidarios. 1 Elija Estadísticas > Estadísticas básicas > 1 Proporción. 2 Elija Datos resumidos.
  23. 23. 3 En Número de eventos, ingrese 560. En Número de ensayos, ingrese 950. 4 Marque Realizar prueba de hipótesis.En Proporción hipotética, ingrese 0.65. 5 Haga clic en Opciones. En Hipótesis alterna, elija Mayor que. Haga clic en Aceptar en cada cuadro de diálogo. Salida de la ventana Sesión Prueba e IC para una proporción Prueba de p = 0.65 vs. p > 0.65 95% Límite Valor P Muestra X N Muestra p inferior exacto 1 560 950 0.589474 0.562515 1.000 Interpretación de los resultados El valor p de 1.0 sugiere que los datos son consistentes con la hipótesis nula (H0: p = 0.65), es decir, la proporción de los miembros del partido que apoyan a la candidata no es mayor que la proporción requerida de 0.65. Como su director de campaña, usted le aconsejaría no postularse para la fiscalía del estado.
  24. 24. 2 Proporciones Revisión general Realiza una prueba de dos proporciones binomiales . Utilice el comando 2 proporciones para calcular un intervalo de confianza y realizar una prueba de hipótesis de la diferencia entre dos proporciones. Minitab ofrece dos pruebas de hipótesis para la diferencia entre dos proporciones: La prueba exacta de Fisher y una prueba basada en una aproximación normal. La prueba de aproximación normal puede ser inexacta para muestras en las cuales el número de eventos de cada muestra es menor que cinco o si la diferencia entre el número de ensayos y eventos de cada muestra es menor que cinco. La prueba exacta de Fisher es exacta para todos los tamaños de muestra , pero sólo se puede calcular cuando la hipótesis nula establece que las proporciones de población son iguales. En otras palabras, Minitab sólo realiza la prueba exacta de Fisher cuando usted especifica una diferencia de la prueba de cero en el cuadro de diálogo secundario Opciones. Por ejemplo, supongamos que usted desea saber si la proporción de consumidores que responden a una encuesta pudiera incrementarse al ofrecer un incentivo tal como una muestra del producto. Usted puede incluir la muestra del producto en la mitad de sus correos y determinar si obtiene más repuestas del grupo que recibió la muestra que del grupo que no la recibió. Para una prueba de dos colas de dos proporciones: H0: p1 - p2 = p0 versus H1: p1 - p2 ≠ p0 cuando p1 y p2 son las proporciones de eventos en las poblaciones 1 y 2, respectivamente, y p0 es la diferencia hipotética entre las dos proporciones. Para probar una proporción utilice Estadísticas > Estadísticas básicas > 2 Proporciones. Elementos del cuadro de diálogo Muestras en una columna: Elija esta opción si ha ingresado datos sin procesar en una columna individual con una segunda columna de subíndices que identifican la muestra. Muestras: Ingrese la columna que contiene los datos sin procesar. Subíndices: Ingrese la columna que contiene los subíndices de la muestra. Muestras en diferentes columnas: Elija esta opción si introdujo datos sin procesar en las columnas individuales para cada muestra. Primero: Ingrese la columna que contiene los datos sin procesar para la primera muestra.
  25. 25. Segundo: Ingrese la columna que contiene los datos sin procesar para la segunda muestra. Datos resumidos: Elija esta opción si tiene valores de resumen para los números de ensayos y eventos. Nombre Eventos: Ingrese el número de eventos en la primera muestra. Ensayos: Ingrese el número de ensayos en la primera muestra. Segundo Eventos: Ingrese el número de eventos en la segunda muestra. Ensayos: Ingrese el número de ensayos en la segunda muestra. Procedimiento 1 Elija Estadísticas > Estadísticas básicas > 2 Proporciones. 2 Realice uno de los siguientes procedimientos: · Si sus datos sin procesar están apilados en una columna individual: 1 Elija Muestras en una columna. 2 En Muestras, ingrese la columna que contenga los datos sin procesar. 3 En Subíndices, ingrese la columna que contiene los códigos de grupo o población. · Si sus datos sin procesar no están apilados, es decir, cada muestra se encuentra en una columna separada: 1 Elija Muestras en diferentes columnas. 2 En Primera, ingrese la columna que contiene la primera muestra. 3 En Segunda, ingrese la columna que contiene la otra muestra. · Si tiene datos resumidos: 1 Elija Datos resumidos. 2 En Primera muestra, ingrese los valores numéricos en Ensayos y en Eventos.
  26. 26. 3 En Segunda muestra, ingrese los valores numéricos en Ensayos y en Eventos. 3 Si lo desea, utilice cualquiera de las opciones del cuadro de diálogo y haga clic en Aceptar. Ejemplo Como gerente de compras de su corporación, usted debe autorizar la adquisición de veinte máquinas fotocopiadoras nuevas. Después de comparar numerosas marcas en términos de precio, calidad de la copia, garantía y funciones, usted ha reducido sus opciones a dos: Marca X y Marca Y. Usted decide que el factor determinante será la confiabilidad de las marcas definida por la proporción de servicio requerido dentro de un año a partir de la compra. Debido a que su corporación ya utiliza ambas marcas, usted pudo obtener información acerca del historial de servicio de 50 máquinas de cada marca seleccionadas aleatoriamente. Los registros indican que seis máquinas de la Marca X y ocho de la Marca Y requirieron servicio. Utilice esta información para orientar su elección de la marca a comprar. 1 Elija Estadísticas > Estadísticas básicas > 2 Proporciones. 2 Elija Datos resumidos. 3 En Primera muestra, en Eventos, ingrese 44. En Ensayos, ingrese 50. 4 En Segunda muestra, en Eventos, ingrese 42. En Ensayos, ingrese 50. Haga clic en Aceptar. Salida de la ventana Sesión Prueba e IC para dos proporciones Muestra X N Muestra p 1 44 50 0.880000
  27. 27. 2 42 50 0.840000 Diferencia = p (1) - p (2) Estimado de la diferencia: 0.04 IC de 95% para la diferencia: (-0.0957903, 0.175790) Prueba para la diferencia = 0 vs. no = 0: Z = 0.58 Valor P = 0.564 Prueba exacta de Fisher: Valor P = 0.774 Interpretación de los resultados En este ejemplo, la prueba de aproximación normal es válida porque, para ambas muestras, el número de eventos es mayor que cuatro y la diferencia entre los números de ensayos y eventos es mayor que cuatro. La prueba de aproximación normal indica un valor p de 0.564, y la prueba exacta de Fisher señala un valor p de 0.774. Ambos valores p son mayores que los niveles a comúnmente elegidos. Por lo tanto, los datos concuerdan con la hipótesis nula de que las proporciones de población son iguales. En otras palabras, la proporción de máquinas fotocopiadoras que necesitaron servicio en el primer año no difiere dependiendo de la marca. Como gerente de compras, usted debe hallar un criterio diferente para orientar su decisión sobre cuál marca comprar. Debido a que la aproximación normal es válida, usted puede sacar la misma conclusión del intervalo de confianza de 95%. Debido a que cero se ubica en el intervalo de confianza de (-0.0957903 a 0.175790) usted puede concluir que los datos coinciden con la hipótesis nula. Si considera que el intervalo de confianza es demasiado amplio y no provee información precisa con respecto al valor de p1 - p2, es recomendable que recolecte más datos con el fin de obtener un mejor estimado de la diferencia.

×