Se hace una breve descripción de la estadística y los diferentes parámetros que esta contempla. Se manejan otros conceptos de variables, tipos, población, muestra y diversos ejemplos para su mejor entendimiento.
El análisis de la confiabilidad, en la práctica, parece reducirse a la estimación de la consistencia interna como el más relevante indicador del monto de error de medición de los puntajes de un test psicológico; y el cálculo del coeficiente alfa (Cronbach, 1951) ha pasado a ser una práctica ubicua en las investigaciones aplicadas. Sin embargo, existen otros aportes en ésta área que complementarían eficazmente en análisis de la confiabilidad. Esta comunicación presentará procedimientos que mejoran el análisis de la confiabilidad y que convergen con las actuales recomendaciones en el reporte de investigaciones cuantitativas. Estos métodos se refieren a la estimación por intervalos de confianza, la aplicación de pruebas de hipótesis para las diferencias entre-grupos e intragrupos, la evaluación del modelo de medición subyacente a los ítems, la cualificación de su magnitud y los procedimientos meta-analíticos aplicados. Se discute la importancia de la aplicación de estos métodos en la investigación, así como su consideración en la evaluación por pares durante la revisión de artículos científicos.
Se hace una breve descripción de la estadística y los diferentes parámetros que esta contempla. Se manejan otros conceptos de variables, tipos, población, muestra y diversos ejemplos para su mejor entendimiento.
El análisis de la confiabilidad, en la práctica, parece reducirse a la estimación de la consistencia interna como el más relevante indicador del monto de error de medición de los puntajes de un test psicológico; y el cálculo del coeficiente alfa (Cronbach, 1951) ha pasado a ser una práctica ubicua en las investigaciones aplicadas. Sin embargo, existen otros aportes en ésta área que complementarían eficazmente en análisis de la confiabilidad. Esta comunicación presentará procedimientos que mejoran el análisis de la confiabilidad y que convergen con las actuales recomendaciones en el reporte de investigaciones cuantitativas. Estos métodos se refieren a la estimación por intervalos de confianza, la aplicación de pruebas de hipótesis para las diferencias entre-grupos e intragrupos, la evaluación del modelo de medición subyacente a los ítems, la cualificación de su magnitud y los procedimientos meta-analíticos aplicados. Se discute la importancia de la aplicación de estos métodos en la investigación, así como su consideración en la evaluación por pares durante la revisión de artículos científicos.
Actividad de 20% de Distribucion Muestral realizada por el grupo numero 6, cuyos integrantes son: Felipe Salazar, Greylen Acuña, Katherine Malave, Andres Maica, Mayerling Vargas.
Medidas de dispersión: Concepto. Características y usos. Rango. Desviaciones típicas. Varianza y coeficiente de variación. De c/u Concepto, Características y utilidad
1. ESCUELA SUPERIOR POLITECNICA DEL LITORAL Facultad de Ingeniería en Mecánica y Ciencias de la Producción Carrera de Ingeniería en Alimentos
2. Análisis Estadístico de los Datos Obtenidos en la Producción de Rosquitas Empresa PUNCALSA-SUPAN Integrantes: Diana Coello Montoya Gabriela Guevara Veliz Adriana Soriano Huayamave Diego Valenzuela Cobos Carolina Villavicencio Peralta MÉTODOS ESTADÍSTICOS PARA LA INDUSTRIA II
15. Diagrama de caja Descripción de la gráfica: Permite identificar datos atípicos presentes en la muestra, observamos tres datos menores al mínimo 123 mm y siete mayores al máximo que es 141 mm. Conclusión de la gráfica por grupo: En ambos gráficos logramos ver la mediana de los grupos es igual, lo que cabe suponer que la cantidad de datos está distribuida igual sin depender de la forma, sin embargo el máximo es diferente de un grupo a otro.
16.
17. Las medidas de dispersión muestran la variabilidad de una distribución. Varianza grande media no homogénea Llanas (L) n=55 Trenzadas (T) n=65 Las medidas de tendencia central de ambas muestras son similares, lo que apoya lo observado en el histograma por grupos.
18.
19. Pequeño sesgo a la izquierda, el coeficiente de asimetría da un valor negativo pero cercano a cero corroborando el sesgo a la izquierda.
22. Diagrama de caja Descripción de la gráfica: La dispersión de los datos alrededor de la mediana es similar, lo que lleva a pensar que los datos están distribuidos de una manera simétrica alrededor de la mediana. Existe un dato atípico presente menor al mínimo 2,68%. Conclusión de la gráfica por grupo: En los gráficos podemos ver que no hay una gran diferencia entre los valores de los cuartiles, pero sí vemos diferencia en cuanto al valor mínimo y máximo. Logramos identificar que el dato atípico corresponde a la variable cualitativa llana.
23.
24. Tenemos una varianza de 0,32 la cual no es muy grande por lo que se puede decir que tratamos con una media homogénea.Llanas (L) n=55 Trenzadas (T) n=65 Existe una mínima diferencia en cuanto a la media y mediana, apoyando lo visto en las gráficas anteriores. Las medidas de dispersión varían, lo que le da a una mayor variabilidad con respecto a la otra.
25.
26. Sesgada a la izquierda. Coeficiente de asimetría negativo de -1,28.
27. El coeficiente kurtosis nos dice cuan puntiaguda es nuestra distribución respecto de un estándar normal, coeficiente mayor a 3, gráfica leptocútica.
28.
29. Diagrama de caja Descripción de la gráfica: Encontramos en esta muestra dos datos atípicos que son menores al mínimo 5,7 g que son 5,6 g y 5,3 g. Notamos además que la dispersión de los datos alrededor de la mediana 5,99 es similar . Conclusión de la gráfica por grupo: Los dos datos atípicos identificados anteriormente pertenecen uno a cada tipo de forma. La dispersión de los datos alrededor de la mediana en la forma trenzada difieren más que en la forma llana, esto da indicios para sospechar que la varianza de las trenzadas es mayor a la de llanas.
30.
31. La variabilidad de los datos es pequeña, ya que la varianza de la muestra es de 0,018 l.Llanas (L) n=55 Trenzadas (T) n=65 Ambas muestras tienen sus medidas de tendencia central muy similares, por lo que no hay diferencia significativa en la distribución de los datos de las llanas en comparación con las trenzadas.
33. Intervalo de Confianza para la Media Trabajaremos bajo el supuesto: El diámetro del producto tiene una distribución normal. Caso 2 Muestra tomada de población normal con desconocida N Media Desv.Est. IC de 95% 120 132,46 5,44 (131,47 – 133,44) Conclusión del gráfico: Según las especificaciones del producto, el diámetro debe ser en promedio 132mm, y de acuerdo al intervalo obtenido dicho valor se encuentra incluido dentro del mismo, lo que nos hace suponer que el producto llegaría a cumplir con la especificación.
34. Intervalo de Confianza para la Diferencia de Medias entre L y T Observación: Contraste de hipótesis para ver si las varianzas de las poblaciones son iguales o diferentes. H0 : La varianza del diámetro de las rosquitas llanas es igual a la varianza del diámetro de las rosquitas trenzadas. vs. H1 : La varianza del diámetro de las rosquitas llanas no es igual a la varianza del diámetro de las rosquitas trenzadas. Variable N Varianza Diámetro llanas 55 32,925 Diámetro trenzadas 65 27,163 Estadística Método GL1 GL2 de prueba Valor P Prueba F (normal) 54 64 1,21 0,458 Conclusión: El valor p obtenido es mayor a 0,1 por lo tanto no rechazo la hipótesis nula. Concluimos así, que existe evidencia estadística que demuestra que las varianzas de las poblaciones son iguales.
35. Caso 2 Muestras tomadas de poblaciones independientes normales con y desconocidos e iguales. N Media Desv.Est. Diametro llanas 55 132,76 5,74 Diametro trenzadas 65 132,20 5,21 IC de 95% para la diferencia: (-1,42. 2,54) Conclusión: El límites positivo es mayor, por lo que podemos decir que las rosquitas llanas van a tener en promedio un diámetro un poco mayor en comparación con las trenzadas; esta afirmación es apoyada también por el gráfico del histograma por grupos. Además podríamos empezar a sospechar que los diámetros de las rosquitas en promedio son iguales, debido a que en comparación con los valores de las variables la diferencia es pequeña.
36. Intervalo de Confianza para la Varianza Variable N Desv.Est. Varianza Diámetro 120 5,443 29,6 Conclusión: Con 95% de confianza, decimos que la desviación estándar del diámetro de las rosquitas se encuentra entre 4,83mm y 6,23mm. Para la varianza del diámetro se va a encontrar en un intervalo de 23,3mm a 38,9mm.
37. Prueba de Hipótesis para la Media Trabajaremos bajo el supuesto: El diámetro del producto tiene una distribución normal. Caso 2 Muestra tomada de población normal con desconocida H0: El diámetro promedio del producto es igual a 132 mm vs. H1 : El diámetro promedio del producto es diferente a 132 mm N Media Desv.Est. T P 120 132,46 5,44 0,93 0,356 Conclusión: De acuerdo al valor p obtenido, no rechazamos la hipótesis nula. Esto quiere decir que existe evidencia estadística que demuestra que el diámetro promedio del producto es 132 mm. Podemos concluir entonces que las rosquitas si cumplen con las especificaciones del diámetro.
38. Prueba de Hipótesis para la Varianza H0 : La varianza del diámetro es igual a 25 vs. H1 : La varianza del diámetro no es igual a 25 Estadística Método de prueba GL Valor P Chi-cuadrada 141,03 119 0,164 Conclusión: El valor p obtenido es mayor a 0,1 lo que significa que no se rechaza la hipótesis nula. Por lo tanto concluimos que existe evidencia que respalda la afirmación de que la varianza del diámetro de la población es 25.
39. Prueba de Hipótesis para la Diferencia de Medias Caso 2 Muestras tomadas de poblaciones independientes normales con y desconocidos e iguales. H0 : La diferencia de los diámetros promedios entre las rosquitas llanas y las rosquitas trenzadas es igual a cero vs. H1: La diferencia de los diámetros promedios entre las rosquitas llanas y las rosquitas trenzadas no es igual a cero N Media Desv.Est. Diámetro llanas 55 132,76 5,74 Diámetro trenzadas 65 132,20 5,21 Prueba T de diferencia = 0 (vs. no =): Valor T = 0,56 Valor P = 0,574 GL = 118 Conclusión: De acuerdo al valor p obtenido de 0,574 no se rechaza la hipótesis nula, ya que es mayor a 0,1. Por lo tanto no hay evidencia estadística que demuestre que la diferencia de medias no sea igual a cero. Al concluir que la diferencia de los diámetros promedios es igual a cero, estamos diciendo también que se cumple con la condición de que el diámetro en promedio debe ser el mismo ya sea una rosquita llana o una trenzada.
41. Intervalo de Confianza para la Media Trabajaremos bajo el supuesto: La humedad del producto tiene una distribución normal. Caso 2 Muestra tomada de población normal con desconocida N Media Desv.Est. IC de 95% 120 3,8495 0,5620 (3,7479. 3,9511) Conclusión del gráfico: Según las especificaciones para el producto la humedad debe estar en promedio en 3,8%, y según nuestro intervalo nos encontramos en un rango en el cual se encuentra inmerso dicho valor, lo que nos lleva a suponer que se cumple con la especificación requerida.
42. Intervalo de Confianza para la Diferencia de Medias entre L y T Observación: Contraste de hipótesis para ver si las varianzas de las poblaciones son iguales o diferentes. H0: La varianza de la humedad de las rosquitas llanas es igual a la varianza de la humedad de las rosquitas trenzadas vs. H1: La varianza de la humedad de las rosquitas llanas es diferente a la varianza de la humedad de las rosquitas trenzadas Variable N Varianza Humedad llanas 55 0,393 Humedad trenzadas 65 0,253 Estadística Método GL1 GL2 de prueba Valor P Prueba F (normal) 54 64 1,55 0,041 Conclusión: El valor p obtenido es menor a 0,05 por lo tanto rechazo la hipótesis nula. Concluimos así, que no existe evidencia estadística que pruebe que las varianzas sean iguales.
43. Caso 3 Muestras tomadas de poblaciones independientes normales con y desconocidos y diferentes. N Media Desv.Est. Humedad llanas 55 3,888 0,627 Humedad trenzadas 65 3,817 0,503 IC de 95% para la diferencia: (-0,138. 0,279) Conclusión: Existe una mínima diferencia en cuanto al promedio de la humedad en ambas poblaciones, ya que el intervalo de diferencias está un poco cercano a cero
44. Intervalo de Confianza para la Varianza Variable N Desv.Est. Varianza Humedad 120 0,562 0,316 Conclusión: Podemos decir, con un 95% de confianza, que la varianza de la humedad de las rosquitas de la marca SUPAN se encuentra entre 0,249 y 0,414.
45. Prueba de Hipótesis para la Media Trabajaremos bajo el supuesto: La humedad del producto tiene una distribución normal. Caso 2 Muestra tomada de población normal con desconocida H0: La humedad promedio del producto es igual a 3,8% vs. H1: La humedad promedio del producto es diferente de 3,8% Variable N Media Desv.Est. T P Humedad 120 3,8495 0,5620 0,96 0,337 Conclusión: De acuerdo al valor p obtenido, no rechazamos la hipótesis nula. Es decir, que existe evidencia estadística que demuestra que la humedad promedio de las rosquitas de la marca SUPAN es igual a 3,8%, por lo que concluimos que se están cumpliendo las especificaciones del producto.
46. Prueba de Hipótesis para la Varianza H0: La varianza de la humedad es igual a 0,3 vs. H1: La varianza de la humedad no es igual a 0,3 Estadística Método de prueba GL Valor P Chi-cuadrada 125,28 119 0,658 Conclusión: El valor p obtenido es mayor a 0,1 lo que significa que no se rechaza la hipótesis nula. Por lo tanto concluimos que existe evidencia que respalda la afirmación de que la varianza de la humedad de la población es 0,3.
47. Prueba de Hipótesis para la Diferencia de Medias Caso 3 Muestras tomadas de poblaciones independientes normales con y desconocidos y diferentes. H0: La diferencia de la humedad promedio entre las rosquitas llanas y las rosquitas trenzadas es igual a cero vs. H1: La diferencia de la humedad promedio entre las rosquitas llanas y las rosquitas trenzadas es diferente de cero N Media Desv.Est. Humedad llanas 55 3,888 0,627 Humedad trenzadas 65 3,817 0,503 Prueba T de diferencia = 0 (vs. no =): Valor T = 0,67 Valor P = 0,502 GL = 103 Conclusión: No se rechaza la hipótesis nula ya que el valor p obtenido es mayor a 0,1. Por lo tanto no hay evidencia estadística que demuestre que la diferencia de medias sea diferente de cero. Concluimos así que en promedio la humedad de ambos tipos de rosquitas es la misma; esto significa que el producto, sin importar su forma, tiene una humedad promedio que cumple con el parámetro establecido.
49. Intervalo de confianza para la Media Trabajaremos bajo el supuesto: La humedad del producto tiene una distribución normal. Caso 2 Muestra tomada de población normal con desconocida N Media Desv.Est. IC de 95% 120 5,97640 0,13520 (5,95196; 6,00084) Conclusión del gráfico: Según las especificaciones para el producto, el peso debe estar en promedio en 6 g por lo que según nuestro intervalo nos encontramos en un rango en el cual se cumple dicho parámetro, pero no de una manera tan clara como en el caso de las anteriores variables, por lo que habría que comprobar si cumple o no con la especificación mediante el uso de pruebas de hipótesis.
50. Intervalo de Confianza para la Diferencia de Medias entre L y T Observación: Contraste de hipótesis para ver si las varianzas de las poblaciones son iguales o diferentes. H0: La varianza del peso de las rosquitas llanas es igual a la varianza del peso de las rosquitas trenzadas vs. H1: La varianza del peso de las rosquitas llanas es doferente a la varianza del peso de las rosquitas trenzadas Variable N Desv.Est. Varianza Peso llanas 55 0,113 0,013 Peso trenzadas 65 0,152 0,023 Estadística Método GL1 GL2 de prueba Valor P Prueba F (normal) 54 64 0,55 0,025 Conclusión: El valor p obtenido es menor a 0,05 por lo tanto rechazo la hipótesis nula. Concluimos así, que no existe evidencia estadística que pruebe que las varianzas sean iguales.
51. Caso 3 Muestras tomadas de poblaciones independientes normales con y desconocidos y diferentes. N Media Desv.Est. Peso llanas 55 5,980 0,113 Peso trenzadas 65 5,974 0,152 IC de 95% para la diferencia: (-0,0421. 0,0540) Conclusión: Con un 95% de confianza podemos decir que la diferencia de los pesos promedios entre las rosquitas trenzadas y las rosquitas llanas de la marca SUPAN está entre -0,0421 g y 0,054 g, el cual es un intervalo muy cercano a cero y además la magnitud del valor negativo y positivo son muy parecidos, por lo que podemos sospechar que los pesos de las rosquitas en promedio son iguales y esto lo verificaremos más adelante con la prueba de hipótesis correspondiente.
52. Intervalo de Confianza para la Varianza Variable N Desv.Est. Varianza Peso 120 0,562 0,316 Conclusión: Con 95% de confianza, decimos que la varianza del peso de las rosquitas se encuentra entre 0,11 y 0,184. Para la desviación estándar el peso se va a encontrar en un intervalo de 0,332 g a 0,429 g.
53. Prueba de Hipótesis para la Media Trabajaremos bajo el supuesto: La humedad del producto tiene una distribución normal. Caso 2 Muestra tomada de población normal con desconocida H0: El peso promedio del producto es igual a 6 g vs. H1: El peso promedio del producto no es igual a 6 g Variable N Media Desv.Est. T P Peso 120 5,97640 0,13520 -1,91 0,058 Conclusión: Podemos darnos cuenta que el valor p cae en un rango de duda, que es entre 0,05 y 0,09, por lo que lo más recomendable sería volver a tomar una muestra para luego volver a realizar el análisis. Pero nosotros podemos concluir que con este valor p rechazamos la hipótesis nula, quedando entonces que el producto no cumple con el peso promedio según las especificaciones de la empresa.
54. Prueba de Hipótesis para la Varianza H0: La varianza del peso es igual a 0,0225 vs. H1: La varianza del peso no es igual a 0,0225 Estadística Método de prueba GL Valor P Chi-cuadrada 96,64 119 0,132 Conclusión: El valor p obtenido es mayor a 0,1 lo que significa que no se rechaza la hipótesis nula. Por lo tanto concluimos que no hay evidencia que indique que la varianza no sea 0,0225, por lo tanto existe también evidencia que demuestre que la afirmación de que la desviación estándar es 0,15g es correcta.
55. Prueba de Hipótesis para la diferencia de medias Caso 3 Muestras tomadas de poblaciones independientes normales con y desconocidos y diferentes. H0: La diferencia del peso promedio entre las rosquitas llanas y las rosquitas trenzadas es diferente de cero vs. H1: La diferencia del peso promedio entre las rosquitas llanas y las rosquitas trenzadas es igual a cero N Media Desv.Est. Peso llanas 55 5,980 0,113 Peso trenzadas 65 5,974 0,152 Prueba T de diferencia = 0 (vs. no =): Valor T = 0,24 Valor P = 0,807 GL = 116 Conclusión: El valor p calculado cae en el rango de no rechazar la hipótesis nula. Por lo tanto no hay evidencia estadística que indique que la diferencia de pesos promedios sea diferente de cero. Concluimos así que no importa la forma de la rosquita, sea llana o trenzada igual van a tener en promedio el mismo peso.
56. Prueba de Hipótesis para la Distribución del Diámetro de las Rosquitas de la Marca SUPAN (Bondad de Ajuste) H0: El diámetro de las rosquitas tiene distribución normal con 132mm y 29,51 vs. H1: ¬ H0 Conclusión: Como el valor p es menor a 0,05 rechazo la hipótesis nula. Por lo tanto no hay evidencia de que el diámetro tenga distribución normal con 132 y 29,51.
57. Prueba de hipótesis para la distribución de la humedad de las rosquitas de la marca SUPAN (Bondad de Ajuste) H0 : La humedad tiene distribución normal con 3,849% y 0,3158 vs. H1 : ¬ H0 Conclusión: Como el valor p es mayor a 0,150 no rechazo la hipótesis nula. Por lo tanto se puede concluir que no existe evidencia de que la humedad de las rosquitas de la marca SUPAN no tiene distribución normal con 3,849% y 0,3158.
58. Tablas DE Contingencia Diámetro - Humedad H0 : El diámetro de las rosquitas es independiente de la humedad que esta contenga vs. H1: ¬ H0 HUMEDAD D I A M E T R O X2= 3.85 Valor p = P(X 20.05 (1) > 3.85) Valor p < 0.05 Conclusión: Rechazo Ho. El diámetro depende de la humedad del producto.
59. Tablas de Contingencia Diámetro - Peso H0: El diámetro de las rosquitas es independiente del peso de las mismas vs. H1: ¬ H0 PESO D I A M E T R O X2= 1,36 Valor p = P(X 2 (2) > 1.36) 0,1<Valor p < 0,9 Conclusión: No rechazo Ho. El diámetro es independiente del peso del producto.
60. Tablas de Contingencia Humedad - Peso H0: El peso de las rosquitas no depende de la humedad vs. H1: ¬ H0 HUMEDAD P E S O X2= 2.41 Valor p = P(X 2(1) > 2.41) 0.1 < Valor p < 0.9 Conclusión: No rechazo Ho. El peso no es dependiente de la humedad del producto.
61. Regresión Diámetro vs. Humedad Modelo de Regresión de Lineal Simple Para este caso nuestro modelo de regresión sería: Diámetro = 129 + 1,02 Humedad S = 5,43576 R-cuad. = 1,1% R-cuad.(ajustado) = 0,3% Observación: Como podemos observar el poder de explicación del modelo lineal es muy bajo ya que solo se reduce en un 1,1% la variabilidad de las respuestas.
62. Comprobación de los Supuestos Análisis de la Normalidad de Residuos Histograma de Probabilidad de Residuos Conclusión: Al observar el histograma nos damos cuenta que la mayoría de los datos, es decir el pico más alto no se encuentra en el valor de 0 como debería ser para poder decir que la media del error es cero, Esto lo comprobaremos con una prueba de hipótesis para la distribución del error.
63. Prueba de Hipótesis para la Distribución del Error H0 : El error tiene distribución normal con 0 y 29,55 vs. H1 : ¬ H0 Conclusión: Debido a que el valor p es menor a 0,01 rechazamos la hipótesis nula, por lo que concluimos que el error no tiene distribución normal con 0 ni 29,5.
64. Comprobación de los Supuestos Relación entre los residuos y las observaciones Independencia de error Conclusión: No existe homogeneidad en cuanto a los valores de la varianza, dado que según lo observado en la gráfica la dispersión de los datos es amplia. Conclusión: No se encuentra evidencia de que exista un patrón que se repita a través del tiempo, por lo que se puede decir que los errores son independientes.
65. Explicación de la variabilidad del modelo H0 : β1 = 0 vs. H1 : β1 0 Estadístico de prueba F = 1,33 Valor p = > 0,15 Conclusión: De acuerdo al valor p obtenido no rechazo la hipótesis nula, por lo que se concluye que β1 es igual a 0. Tabla ANOVA Conclusión de la regresión: Una vez realizado el análisis del modelo de regresión lineal entre diámetro y humedad, no existen las condiciones necesarias para aprobar dicho modelo, ya que los supuestos con los cuales partimos no son verdaderos como es el caso del error que no tiene distribución normal, y la varianza que no es constante. De igual manera no se cumple la condición de que β1 sea diferente de cero, por lo que concluimos que el modelo de regresión lineal simple obtenido para explicar la variable diámetro en función de la variable humedad no es válido.