El documento explica el análisis de varianza (ANOVA), un método estadístico para determinar si las diferencias entre las medias de tres o más poblaciones son significativas. El ANOVA divide la variación total de los datos en componentes debidos a la variación entre grupos y dentro de los grupos, usando la suma de cuadrados. Si la variación entre grupos es mayor que lo esperado por azar, es probable que al menos un par de medias poblacionales sean diferentes, lo que llevaría a rechazar la hipótesis nula de que todas las medi
2. PLANTEAMIENTO DE HIPÓTESIS EN MÁS DE DOS POBLACIONES Algunas veces se consideran problemas en que debemos decidir si las diferencias observadas entre más de dos medias se pueden atribuir al azar o si existen diferencias reales entre las medias de las poblaciones de las que se obtuvieron las muestras. Y esto se estudia cuando por ejemplo lo que queremos conocer sobre la base de datos muéstrales, si en realidad existe alguna diferencia: en la efectividad de 3 métodos de enseñanza de una lengua extranjera, o quizás queremos comparar la producción promedio por caballería de distintas variedades de arroz. Un investigador agrícola pudiera estar interesado en saber que tipo de fertilizante da mejores rendimientos, ó sí en determinado laboratorio médico se desea evaluar el efecto de diferentes medicamentos en la presión sanguínea. El método que utilizamos para este propósito es un instrumento estadístico poderoso conocido como ANALISIS DE VARIANZA.
5. INTRODUCCION Una hipótesis estadística es una asunción relativa a una o varias poblaciones, que puede ser cierta o no. Las hipótesis estadísticas se pueden contrastar con la información extraída de las muestras y tanto si se aceptan como si se rechazan se puede cometer un error. Student y Ronald Fisher iniciaron una nueva era en el estudio de las distribuciones muéstrales. Ronald Aylmer Fisher encontró en muestras procedentes de una población normal, la distribución del coeficiente de correlación, los coeficientes de regresión, los coeficientes de correlación múltiple y de proporción de variables conocida por el nombre de F. Esta distribución de probabilidad se usa como estadística prueba en varias situaciones. Se emplea para probar si dos muestras provienen de poblaciones que poseen varianzas iguales. Esta prueba es útil para determinar si una población normal tiene una mayor variación que la otra y también se aplica cuando se trata de comparar simultáneamente varias medias poblacionales. La comparación simultánea de varias medias poblacionales se conoce como análisis de varianza (ANOVA). En ambas situaciones, las poblaciones deben ser normales y los datos tener al menos la escala de intervalos.
6. ANÁLISIS DE VARIANZA El análisis de varianza, como técnica de lo que trata es: si se está estudiando la característica cuyos valores dependen de varias clases de efectos que operan simultáneamente, poder decidir si tales efectos son debido al azar o si realmente son diferentes. Esta técnica de lo que trata es de expresar una medida de la variación total de un conjunto de datos como una suma de términos, que se pueden atribuir a fuentes o causas específicas de variación; pues bien esta descomposición de la varianza total se denomina: Identidad fundamental. Ella junto a la formación del estadístico de prueba, se refleja en una tabla llamada “Tabla de Análisis de Varianza”, que resume los principales aspectos teóricos prácticos de la técnica. Hay un corolario que plantea que: Si “k” poblaciones se unen y las varianzas de las “k” poblaciones son iguales a2 se tiene que:
7.
8.
9.
10.
11. Si estamos en caso de H0 falsa, y se nos presenta esta situación se diferencia en la suma de cuadrado entre grupo esta diferencia, mientras que si estamos en el caso de H0 cierta la diferencia entre los grupos es mínima. En el caso de la SC, dentro de los grupos lo que hace es comparar cada elemento de la muestra con la media de su propio grupo, para una u otra conclusión de la hipótesis nula, su cálculo no se refleja, el valor es el mismo. Como ya dijimos, el análisis de varianza consiste en dividir la suma de cuadrado total en dos fuentes de variación y proceder al análisis de las mismas, estas son la variación dentro del grupo y la variación entre grupos. Como son variaciones la vamos a expresar como sumas de cuadrados, es decir: SCT = SCD + SCE __ __ __ __ (Yij - Y) = (Yij - Yi) + (Yi – Y) Representando estas la variación total que es igual a la variación dentro del grupo más la variación entre grupos, gráficamente se representa de la siguiente forma:
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22. UTILIDAD Esta distribución de probabilidad se usa en estadística como prueba en varias situaciones. Se emplea para probar si dos muestras provienen de poblaciones que poseen varianzas iguales. Esta prueba es útil para determinar si una población normal tiene una mayor variación que la otra y también se aplica cuando se trata de comparar simultáneamente varias medias poblacionales. La comparación simultánea de varias medias poblacionales se conoce como análisis de varianza (ANOVA). En ambas situaciones, las poblaciones deben ser normales y los datos tener al menos la escala de intervalos.