SlideShare una empresa de Scribd logo
1 de 44
UNIVERSIDAD DE ORIENTE 
NÚCLEO DE SUCRE 
ESCUELA DE HUMANIDADES Y EDUCACIÓN 
DPTO. DE PSICOLOGÍA E INVESTIGACIÓN EDUCATIVA 
ALTERNATIVA DE GRADO: ESTADÍSTICA II 
ANÁLISIS DE VARIANZA 
Prof. : INTEGRANTES: 
MONDRAGÓN J. CARIACO, JESUS 
1 
MARVAL, MARIA 
RUIZ, JOAN 
RATIA, ANA 
ESPINOZA, EDGAR 
HENRÍQUEZ, LUISA 
SEC: 2 
CUMANÁ, ABRIL DE 2012
ÍNDICE 
2 
PÁG. 
Introducción…………………………………………………………………… iii 
Análisis de varianza (ANOVA)……………………………………………….. 5 
¿Por qué utilizamos el análisis de varianza en vez de la t de student?............... 5 
Procedimiento de ANOVA…………………………………………………… 6 
Diseño completamente aleatorizado (DCA).…………….………...………….. 7 
Características Principales….……..…………………………………….. 8 
ANOVA unilateral…………………………………………..………….. 9 
Pasos para la prueba de hipótesis en un diseño completamente aleatorizado… 10 
Diseño en bloques completamente aleatorizado………………………………. 20 
Objetivos………………………………………………………………… 21 
Ventajas………………………………………………………………….. 21 
Para la prueba de hipótesis se siguen diez pasos……………………....... 22 
Diseño de mediciones repetidas…………………………………………….… 24 
Ventajas…………………….……………………………………….… 25 
Desventajas…………..………………………………………………… 25 
Diseño de mediciones repetidas con un solo factor ………………………….. 27 
Experimento factorial………………………………………………………… 29 
Ventajas. ……………………………………..………………………… 29 
Desventajas. …………………………….……………………………… 30 
Conclusión ………………………….………………………………………… 42 
Bibliografía………………………………………………………………….…. 43
INTRODUCCIÓN 
La varianza es una constante que representa una medida de dispersión media 
de una variable aleatoria X, respecto a su valor medio o esperado. Puede interpretarse 
como medida de “variabilidad” de la variable. 
Las técnicas englobadas bajo la denominación de análisis de la varianza o 
abreviadamente ANOVA (del inglés analysis of variance) han jugado un papel crucial 
en la metodología estadística moderna, desde que fueran ideadas por Sir Ronald 
Fisher en la década de los años veinte. 
Casi siempre se introduce el tema del análisis de la varianza como respuesta a 
la necesidad de utilizar una técnica de comparación de más de dos grupos, es decir 
como un método para comparar más de dos tratamientos: si disponemos de medidas 
cuantitativas continuas, que se puede suponer como procedentes de una distribución 
de probabilidad normal, y queremos comparar dos grupos −dos tratamientos−, la 
prueba estadística que se utiliza es un contraste de medias basado en la t de Student, y 
cuando se dispone de más de dos grupos, la prueba a emplear es el análisis de la 
varianza. 
El análisis de variancia es una técnica que se usa para probar hipótesis acerca 
de las medias de diferentes tratamientos que se ensayan (Daniel 1984). Para que esto 
sea posible, las medias que se determinan tienen que provenir de mediciones sobre 
muestras independientes. Además permite el control de α a un nivel predeterminado 
cuando se prueba la igualdad de J medias del grupo, donde J ≥ 2. En ANOVA, las 
medias se examinan simultáneamente para evaluar la posibilidad de que todas las J 
medias de muestreo provengan de la misma población (es decir, poblaciones con 
idénticos parámetros). En otras palabras, los procedimientos ANOVA se pueden usar 
para determinar si es o no razonable concluir que no todas la J medias del muestreo 
provienen de la misma población. 
3
Para ANOVA, la hipótesis nula es una sola pero incluye todas las hipótesis: 
Ho: μ1=μ2=…=μJ 
En otras palabras, el análisis de varianza lo vamos a utilizar para verificar si 
hay diferencias estadísticamente significativas entre medias cuando tenemos más de 
dos muestras o grupos en el mismo planteamiento. En estos casos no utilizamos la t 
de Student que solamente es un procedimiento válido cuando comparamos 
únicamente las medias de dos muestras. 
4
ANÁLISIS DE VARIANZA (ANOVA) 
El análisis de la varianza tiene amplias aplicaciones en el análisis de datos 
derivados de experimentos, este se utiliza también, para cumplir 2 objetivos: 
 Estimar y probar hipótesis respecto a las varianzas de las poblaciones. 
 Estimar y probar hipótesis respecto a las medidas de las poblaciones. 
La hipótesis nula que se prueba en el ANOVA es que la mayoría de las 
poblaciones que se estudian (al menos tres) tienen el mismo valor de la media para la 
variable dependiente. Las hipótesis nulas y alternativa en ANOVA son: 
5 
H0: X1 = X2 = X3 =... = X c 
HA: No todas las poblaciones tienen la misma media. 
¿POR QUÉ UTILIZAMOS EL ANÁLISIS DE VARIANZA EN VEZ DE LA T 
DE STUDENT? 
Cuando tenemos dos muestras y queremos comprobar si difieren 
significativamente (si proceden de la misma población con una única media) 
utilizamos la t de Student. Cuando tenemos más de dos grupos utilizamos el análisis 
de varianza: ¿No podríamos comparar todos los grupos de dos en dos con la t de 
Student? A primera vista parecería lo más lógico, sin embargo no se hace así por una 
serie de razones que exponemos a continuación: 
1º La razón más importante (y suficiente) para no utilizar la t de Student con más de 
dos grupos es que, al hacer muchas comparaciones de dos en dos, aumenta la 
probabilidad de que algunas diferencias resulten significativas por azar y entonces 
cabe la posibilidad de afirmar que hay una diferencia (de no aceptar la hipótesis nula) 
cuando realmente no la hay.
Si por ejemplo tenemos tres grupos podríamos hacer tres comparaciones: entre el 1º y 
el 2º, entre el 1º y el 3º y entre el 2º y el 3º. Operando con un nivel de confianza de α 
=0.05, la probabilidad de encontrar al menos una diferencia significativa por azar es 
de hecho del 9.75% y no del 5%. Como se evidencia, se incrementa dramáticamente 
la probabilidad (α) de cometer un error de tipo I. Cuando se realiza más de una 
prueba t, la probabilidad de uno o más errores de tipo I es mayor que el nivel α 
establecido. 
2º Otra razón adicional es que una prueba estadística basada en todos los datos 
utilizados simultáneamente, es más estable que la prueba o análisis que parcializa los 
datos y no los examina todos juntos. El error típico (que expresa la variación en las 
medias que podemos encontrar en diversas muestras) es menor cuando el número de 
sujetos es mayor, como sucede cuando se analizan todos los datos de todos los grupos 
simultáneamente. En principio es preferible utilizar un método de análisis global que 
abarque todos los datos que se quieren examinar. 
3º El ahorro de tiempo es otra razón muy importante, aunque en sí misma no es una 
razón válida. El número de comparaciones de dos en dos de k elementos es igual a k 
por lo cual se ahorraría mucho tiempo al trabajar con el ANOVA. 
PROCEDIMIENTO DE ANOVA. 
Para aplicar el análisis de varianza a un estudio se siguen diez pasos: 
1. Descripción de datos. 
2. Supuestos. 
3. Hipótesis. 
4. Estadística de prueba. 
5. Distribución de la estadística de prueba. 
6. Regla de decisión. 
7. Calculo de la estadística de prueba. 
6
7 
8. Decisión de estadística. 
9. Conclusión. 
10. Cálculo del valor p (Probabilidad) 
DISEÑO COMPLETAMENTE ALEATORIZADO (DCA) 
Este diseño consiste en la asignación de los tratamientos en forma 
completamente aleatoria a las unidades experimentales (individuos, grupos, parcelas, 
jaulas, animales, insectos, entre otros). Debido a su aleatorización irrestricta, es 
conveniente que se utilicen unidades experimentales de lo más homogéneas posibles: 
animales de la misma edad, del mismo peso, similar estado fisiológico; parcelas de 
igual tamaño, entre otros, de manera de disminuir la magnitud del error experimental, 
ocasionado por la variación intrínseca de las unidades experimentales. Este diseño es 
apropiado para experimentos de laboratorio, invernadero, animales de bioterio, aves, 
conejos, cerdos, entre otros, es decir, situaciones experimentales como de las 
condiciones ambientales que rodean el experimento. 
En este diseño, los tratamientos en estudio se distribuyen al azar en todas las 
unidades experimentales; siendo el número de repeticiones por tratamiento igual o 
diferente. Este diseño se emplea cuando la variabilidad en todo el material 
experimental es relativamente pequeña y uniformemente distribuida. 
Se debe tener presente que la aleatorización estadística es un procedimiento 
puntual, en el cual se les asigna a las unidades observadas un grupo de control 
o tratamiento de una manera que toma en consideración la influencia potencial de las 
variables confundidas. Esto permite cuantificar la influencia de estas variables 
confundidas al observarlas en ambos grupos de control y de tratamiento. La 
aleatorización se lleva a cabo mediante una tabla de números aleatorios.
CARACTERÍSTICAS PRINCIPALES 
1. Es aplicable sólo cuando las unidades experimentales son homogéneas (verificar si 
existe tal homogeneidad de los datos, todos provienen de la misma distribución y no 
hay datos atípicos). 
2. Los tratamientos pueden tener igual o diferente número de unidades 
experimentales. 
3. La distribución de los tratamientos es al azar en las unidades experimentales. 
El número de tratamientos está en función del número de unidades experimentales 
que se dispone. Es conveniente tener pocos tratamientos y más 
unidades experimentales que muchos tratamientos con pocas unidades 
experimentales. 
8 
VENTAJAS 
Fácil de planear y analizar; además es flexible en el empleo del número de 
tratamientos y repeticiones, solo está limitado por el número de unidades 
experimentales disponibles. 
Permite verificar si hay diferencias estadísticamente significativas entre 
medias cuando tenemos más de dos muestras o grupos en el mismo planteamiento. 
DESVENTAJA 
La principal desventaja que presenta este diseño está relacionada a la 
homogeneidad del material experimental; el cual es difícil de encontrar en 
experimentos de campo, por lo que su uso se restringe con mucha frecuencia a 
experimentos de laboratorio o donde se pueda tener control de los efectos no 
considerados en el estudio (ambiente, temperatura, luz, entre otros)
9 
OBJETIVO 
El objetivo de un diseño completamente aleatorio es estudiar si existen 
diferencias significativas en la variable dependiente para cada nivel de la variable 
independiente o tratamiento. Específicamente, lo que nos interesa es hacer un "Test 
de Singularidad de Medias". El procedimiento a utilizar para alcanzar este objetivo 
(la singularidad de medias) es el análisis de la varianza (ANOVA), técnica muy útil 
en el campo de la inferencia estadística, que toma como referencia el modelo lineal 
estadístico. En concreto, en este diseño se toma como referencia el siguiente modelo 
lineal estadístico: 
Yij = EG + ETj + EA 
Yij: Valor observado de la variable dependiente en la unidad de prueba i con el 
tratamiento j. 
EG: Es el efecto global, que se refiere al promedio de la variable dependiente 
para el total o conjunto de las unidades de prueba. 
ETj: Es el efecto del tratamiento j, es decir, la variación en la variable 
dependiente con relación al promedio debido a la influencia del tratamiento j. 
EA: Es el efecto aleatorio, el cual recoge el efecto de todas las restantes 
causas posibles de variabilidad del experimento no debidas al tratamiento, es decir, al 
efecto aleatorio se le podría llamar también "otras causas de variabilidad del 
experimento". 
ETj + EA: La suma de estos dos efectos refleja las fuentes de dispersión. 
Concretamente, el análisis de la varianza (ANOVA) va a consistir en el análisis de 
esa dispersión, es decir, en el estudio de los componentes de la dispersión total. 
ANOVA UNILATERAL: El tipo más simple de análisis de varianza es el que se 
conoce como análisis de varianza unilateral, en el cual se investiga una sola fuente de 
variación o factor. Esto es una extensión a 3 o más muestras del procedimiento de la 
prueba, para utilizarlo en 2 muestras independiente. Dicho de otra forma, se puede
afirmar que utiliza la prueba t con dos muestras independientes en un caso específico 
del análisis de la varianza unilateral. 
PASOS PARA LA PRUEBA DE HIPÓTESIS EN UN DISEÑO 
COMPLETAMENTE ALEATORIZADO 
1. Descripción de los datos. Las mediciones (u observaciones) que resultan de 
un diseño experimental completamente aleatorizado, junto con las medias y 
los totales que puedan calcularse a partir de los datos, pueden presentarse si 
así conviene a través de las siguientes fórmulas: 
Xij = la i – ésima observación resultante a partir del j – ésimo tratamiento (en 
total existen k tratamientos) 
2. Supuestos. Antes de establecer las suposiciones, es necesario especificar el 
modelo. Para escribir el modelo para el diseño experimental completamente 
aleatorizado, se utiliza el símbolo xij. 
El análisis de la varianza unilateral puede escribirse como sigue: 
xij = μ + Ƭj + eij 
Los términos de este modelo se describen de la siguiente forma: 
10
1. μ representa la media de toda las k - medias poblacionales, y se le conoce 
11 
como la gran media. 
2. Ƭj representa la diferencia entre la media de la j – ésima población y la gran 
media. Se le conoce como efecto del tratamiento. 
3. ejj representa la cantidad en que difieren una medición individual de la media 
poblacional a la que pertenece. Se le conoce como termino del error. 
Supuestos de modelo 
Las suposiciones para el modelo de efectos fijos son las siguientes: 
a) Los k conjuntos de datos observados forman k muestras aleatorias 
simples a partir de las poblaciones respectivas. 
b) Cada una de las poblaciones de las que se extraen las muestras siguen 
2 
una distribución normal con media μj variancia σj 
2 = σ2 
c) Cada una de las poblaciones tiene la misma variancia. Es decir, σ j 
2 
= …. = σk 
2 = σ2, variancia común. 
d) Las Ƭj son constantes desconocidas y ΣƮj = 0, puesto que la suma de 
todas las desviaciones de μj a partir de su medía, μ, es cero. 
e) Las eij tienen una media igual a cero, porque la media de xij, es μj. 
f) Las eij tienen una variancia igual a la variancia de las xij porque las eij y 
las xij difieren sólo por una constante; es decir, la variancia del error es 
igual a σ2, la variancia común, especificada en el inciso c. 
g) Las eij siguen una distribución normal (e independiente). 
3. Hipótesis. En un Diseño Completamente Aleatorizado, frecuentemente 
estamos interesados en contrastar la hipótesis nula de que todas las 
poblaciones o tratamientos tienen medias iguales, contra la hipótesis 
alternativa, que dice que al menos un par de poblaciones no tienen medias 
iguales. Las hipótesis se redactan de la siguiente forma:
Ho: 1 = 2 =...= k (Todos los tratamientos tienen el mismo efecto sobre la variable 
en estudio). 
HA: 1  2  ... k (No todos los tratamientos tienen el mismo efecto sobre la 
variable en estudio). 
Si las medias de las poblaciones son iguales, y el efecto de cada tratamiento es 
igual a cero, de tal manera que alternativamente, la hipótesis puede escribirse como 
sigue: 
H0: Ʈj = 0, j = 1, 2,……,k 
HA: no todas las Ʈj = 0 
12 
Nivel de significancia:  (0  1) 
4. Estadística de prueba. La estadística de prueba para el análisis de la 
variancia unilateral es el cálculo de la razón, designada como R.V, Las dos 
variancias con las que se calcula la R.V. son las mismas variancias 
calculadas a partir de los datos de la muestra. 
5. Distribución de la estadística de prueba. R.V. sigue una distribución F 
cuando Ho es verdadera y se cumplen las suposiciones. 
6. Regla decisión. En general, la regla de decisión es rechazar la hipótesis nula 
si el valor calculado para R.V. es mayor o igual que el valor crítico de F con 
nivel α. 
7. Calculo del estadístico de prueba. Se definió al análisis de la variancia 
como un proceso por el que la variación total presente en el conjunto de 
datos se divide en componentes que son atribuibles a diferentes fuentes. El
término variación se utiliza en este contexto para referirse a la suma de 
desviaciones al cuadrado de las observaciones de su media o suma de 
cuadrados. 
Suma total de cuadrados. La suma total de cuadrados es la suma de los cuadrados 
de las desviaciones de las observaciones individuales a partir de la media de todas las 
observaciones tomadas juntas. La suma total de cuadrados (SCtotal) se define como: 
푆퐶푡표푡푎푙 = Σ Σ(푋푖푗 − 푋̅. . ) 
13 
2 
푛푗 
푖 =1 
푘 
푗=1 
Donde Σ푛푗 
푖= 1 indica que hay que sumar las desviaciones al cuadrado para cada 
grupo de tratamiento, y Σ푘푗 
=1 indica que hay que sumar los totales de los k grupos 
que se obtienen al aplicar Σ푛푗 
푖=1 . 
Suma de cuadrado dentro de los grupos. El primer paso para calcular estos 
componentes es realizar ciertos cálculos dentro de cada grupo. Estos cálculos 
implican realizar dentro de cada grupo, la suma de las desviaciones al cuadrado de las 
observaciones individuales, a partir de su media. Después de realizar estos cálculos 
dentro de cada grupo, se obtiene la suma de los resultados individuales del grupo. A 
este componente de variación se le llama suma de cuadrados dentro de los grupos y 
se le designa como SCdentro. La fórmula para calcular es la siguiente: 
푆퐶푑푒푛푡푟표 = Σ Σ(푋푖푗 − 푋̅. 푗) 
2 
푛푗 
푖 =1 
푘 
푗=1 
Suma de cuadrados entre los grupos. Se calcula para cada grupo la desviación al 
cuadrado de la media del grupo a partir de la gran media, y se multiplica el resultado 
por el tamaño del grupo y se suman los resultados de todos los grupos. Esta cantidad 
es una medida de la variación entre los grupos y se conoce como suma de cuadrados 
entre los grupos o SCent re. La fórmula para calcular esta cantidad es como sigue:
푆퐶푒푛푡푟푒 = Σ 푛푗 (푋̅.푗 − 푋̅. . ) 
.푗) 푛푗 
푖 =1 
14 
푘 
푗=1 
La suma total de cuadrados es igual a la suma de cuadrados entre los grupos más la 
suma de los cuadrados dentro de los grupos: 
SCtotal = SCentre + SCdentro 
Primera estimación de σ2. La expresión matemática: 
Σ (̅푋 
푖푗 
− 푋̅ 
푛푗 − 1 
Proporciona una estimación insesgada de la variancia real para la población de la cual 
proviene la muestra. Bajo la suposición de que todas las variancias de la población 
son iguales, es posible continuar las k estimaciones para obtener: 
Segunda estimación de σ2 
. La segunda estimación de σ2 se puede obtener a partir de 
la fórmula ya conocida para la variancia de las medias de las muestras, σ2/x = σ2. Si la 
ecuación es resuelta para σ2, la variancia de la población a partir de la cual se 
extrajeron las muestras, se tiene
Una estimación insesgada de σ2/x, calculada a partir de los datos de la muestra, es 
proporcionada por: 
Cuando no todos los tamaños de las muestras son iguales, una estimación σ2 con base 
en la variabilidad entre las medias de las muestras se obtiene mediante la fórmula: 
La razón de variancias. Se calcula mediante la siguiente fórmula: 
15 
푹. 푽 = 
푪풖풂풅풓풂풅풐 풎풆풅풊풐 풆풏풕풕풓풆 풍풐풔 품풓풖풑풐풔 
푪풖풂풅풓풂풅풐 풎풆풅풊풐 풅풆풏풕풓풐 풅풆 풍풐풔 품풓풖풑풐풔 
Si las dos estimaciones son aproximadamente iguales, la R.V será casi igual a 1. 
Una razón próxima a 1 tiende a poyar la hipótesis de que las medias son iguales para 
las poblaciones. Si el cuadrado medio entre los grupos es considerablemente mayor 
que el cuadro medio dentro de los grupos, la R.V será, a su vez, considerablemente 
mayor que 1. 
Prueba F: Es una distribución f cuando las varianzas de las muestras se calculan a 
partir de muestras extraídas de forma independiente y aleatoria de una población que 
sigue una distribución normal. Esta se usa en la construcción de intervalos de 
confianza para la varianza de la población y para probar hipótesis acerca de esta.
CONSTRUCCIÓN DE LA TABLA DEL ANOVA. Los cálculos que se han 
efectuado se pueden resumir y mostrar en una tabla conocida como tabla ANOVA. 
8. Decisión estadística. Para tomar una decisión es necesario comparar la R.V 
calculada contra el valor crítico de F, con los correspondientes grados de 
libertad k – 1 en el numerador y N - k en el denominador. Si el valor 
calculado para R.V. es mayor o igual que el valor crítico F, la hipótesis nula 
es rechazada; pero si es menor que el valor crítico de F, no se rechaza la 
hipótesis nula. 
9. Conclusión. Cuando se rechaza H0 se concluye que no todas las medias 
poblacionales son iguales. Cuando no se rechaza H0 se concluye que proba-blemente 
todas las medias poblacionales son iguales. 
10. Calculo del valor de p. El valor p para la prueba de una hipótesis es la 
probabilidad de obtener, cuando Ho es verdadera, un valor de la estadística 
de prueba tan extremo o más (en la dirección adecuada para HA) que el valor 
calculado en la realidad. 
16
EJERCICIO 
En el siguiente ejercicio aplique el procedimiento de los diez pasos de la prueba 
de hipótesis para analizar las varianzas y ver si es posible concluir que existen 
diferencias entre las medias de las poblaciones. Sea α = 0.05. Utilice el mismo 
valor α de para la prueba F. elabore la tabla ANOVA. 
Szádóczky et al. (A-4) examinaron las características de los sitios de unión de la 
H-imipramina en pacientes permanentes deprimidos (SAD) y pacientes 
deprimidos por corto tiempo (no-SAD), así como en individuos sanos (grupo 
control). Una de las variables en las que se hicieron las mediciones es la densidad 
de los sitios de unión para la H-imipramina en las plaquetas sanguíneas (Bmáx.). 
Los resultados son los siguientes: 
SAD No- SAD CONTROL 
634 771 1067 
585 546 1176 
520 552 1040 
525 557 1218 
693 976 942 
660 204 845 
520 807 
573 526 
731 
788 
736 
1007 
846 
701 
584 
867 
691 
1. Datos. Los datos corresponden a los sitios de unión de la H-imipramina en 
pacientes permanentes deprimidos (SAD) y pacientes deprimidos por 
17
corto tiempo (no-SAD), así como en individuos sanos (grupo control). 
Junto con los totales del tratamiento y las medias. 
SAD NO-SAD Control Total 
Total 11661 4939 6288 22888 
X 685.94 617.375 1048 2351.315 
2. Supuestos. Se supone que los tres grupos de datos forman muestras 
aleatorias simples e independientes, extraídas de tres poblaciones que son 
similares excepto por la condición estudiada. Se supone que las tres 
poblaciones siguen una distribución normal con varianza conocida. 
18 
3. Hipótesis. Sea α=0.05 
Ho: μ1=μ2=μ3 
HA: μ1≠μ2≠μ3 
4. Estadística de prueba. La estadística de prueba es: 
푅. 푉 = 퐶푀푒푛푡푟푒 
퐶푀푑푒푛푡푟표 
5. Distribución de la estadística de prueba. Si Ho es verdadera y se 
cumplen las condiciones, entonces R.V sigue una distribución F con los 
grados de libertad correspondientes, respectivamente, del numerador y 
denominador (K-1) 3-1=2 y (n-K) 31-3=28. 
6. Regla de decisión. Sea α=0.05
0.975 
0 4.22 
(2,28)F(0.975) 
Región de aceptación Región de rechazo 
Regla: Se rechaza la Ho si el valor calculado para R.V es mayor o igual que 
4.22 
7. Calculo de la estadística de prueba. 
Comenzamos calculando los totales y los cuadrados de los totales divididos por el 
número de observaciones: 
SAD NO-SAD Control Total Σ2⁄푛 
Total 11661 4939 6288 22888 16898727.23 
푥̅ 685.94 617.375 1048 2351.315 
Σ2⁄푛 7998760.059 3049215.125 10589824 17637799.18 
Σ푥2 8293177 3429627 6687978 18410782 
SCent re= 17637799.18 - 16898727.23= 739072.18 
SCdent ro= 18410782 - 17637799.18= 772982.82 
19 
SCtotal= SCentre+ SCdentro= 1512055 
CMent re= SCentre/k-1= 739072.18 / 3-1 
739072.18 / 2= 369536.09 
CMdent ro= SCdentro/n-1= 772982.82 / 31-3 
772982.82 / 28= 26395.435 
R.V= CMent re/CMdentro= 369536.09 / 26395.435 = 14
20 
TABLA ANOVA 
FUENTE SC 
g.l CM R.V 
Entre 
muestras 
739072.18 2 369536.09 14 
Dentro de 
muestras 
772982.82 28 26395.435 
Total 1512055 30 
8. Decisión Estadística. Debido a que el valor calculado para R.V., 14, es 
mayor que el valor crítico F, 4.22, se rechaza Ho. 
9. Conclusión. Dado que se rechazó Ho, se concluye que la hipótesis alternativa 
es verdadera. Es decir, se concluye que no todas las medias son iguales. 
DISEÑO EN BLOQUES COMPLETAMENTE ALEATORIZADO 
Es aquél en el que: 
1.- Las unidades experimentales se distribuyen en grupos o bloques, de manera tal 
que las unidades experimentales dentro de un bloque sean relativamente homogéneas 
y que el número de unidades experimentales dentro de un bloque sea igual al número 
de tratamientos por investigar, y 
2.- Los tratamientos se asignan al azar a las unidades experimentales dentro de cada 
bloque. En lo anterior, la formación de los bloques refleja el criterio del investigador 
Respecto a las respuestas diferenciales potenciales de las diversas unidades 
experimentales, mientras que el procedimiento de aleatorización actúa como una 
justificación de la suposición de independencia. 
Modelo: Y ij =  i + B i +  j + e ij 
Suma de  
2 Y = M yy + Byy + T yy + E yy
Donde: Yij = Valor observado en la i-ésima repetición para el i-ésimo tratamiento.= 
Efecto de la media general. 
Bi = Efecto del i-ésimo bloque. 
j = Efecto del j-ésimo tratamiento 
eij = Efecto aleatorio del error experimental 
t = Número de tratamientos. 
n = Número de repeticiones del í-ésimo tratamiento. 
OBJETIVO: es aislar y eliminar el término de error la variación atribuible a los 
bloques, y asegurar que las medias del tratamiento estén libres de los efectos del 
bloque. La eficacia del diseño depende de la capacidad de conseguir bloques 
homogéneos de unidades de experimentación. 
VENTAJAS: se comprende fácilmente, además, algunas complicaciones que podrían 
surgir en el transcurso de un experimento son fáciles de controlar cuando se utiliza 
este diseño. 
EJEMPLO: 
Un grupo de especialistas en motivación, en un hospital psiquiátrico, condujo un 
experimento para comparar tres métodos para motivar a los pacientes. Estos fueron 
agrupados de acuerdo con el nivel de motivación inicial. En cada grupo, los 
pacientes fueron asignados al azar a los tres métodos. Al final del periodo 
experimental, un equipo de trabajo formado por un psiquiatra, un psicólogo, una 
enfermera y un trabajador social evaluaron a los pacientes. Ningún miembro del 
equipo de evaluación sabía de los métodos que fueron asignados a los pacientes. El 
equipo asignó a cada paciente una calificación como medida de su nivel de 
motivación, los resultados son los siguientes: 
21
Método de motivación 
A B C TOTAL MEDIA 
NULO 58 68 60 186 62,00 
MUY BAJO 62 70 65 197 65,67 
BAJO 67 78 68 213 71,00 
PROMEDIO 70 81 70 221 73,67 
TOTAL 257 297 263 817 
MEDIA 64,25 74,25 65,75 68,08 
22 
nivel de 
motivación 
inicial 
1. DATOS: Escogieron al azar a los pacientes de acuerdo con el nivel de 
motivación inicial los cuales participaran en el experimento. Los métodos de 
motivación forman tres tratamientos y los cuatro niveles son los bloques. 
2. SUPUESTOS: se supone que cada uno de las 12 observaciones forman una 
muestra aleatoria de tamaño 1 a partir de una de las 12 poblaciones definida por 
la combinación de bloque y tratamientos. se supone que las respuestas en las 12 
poblaciones representadas siguen una distribución normal con variaciones 
iguales. 
3. HIPÓTESIS: 
Ho: j = 0 j = 1,2,3 
HA: no todas las j = 0 
Sea α=0.05 
4. ESTADÍSTICA DE PRUEBA 
푅. 푉 = 퐶푀푡푟푎푡 
퐶푀푟푒푠푖푑푢푎푙
5. DISTRIBUCIÓN DE LA ESTADÍSTICA DE PRUEBA 
Cuando la hipótesis nula es verdadera y las suposiciones se cumplen, 푅. 푉 sigue una 
distribución de F con 2 y 6 grados libertad. 
6. REGLAS DE DECISIÓN 
Rechazar la hipótesis nula si el valor 
calculado de 푅. 푉 es mayor o igual que el 
23 
valor crítico de F. El valor de F es 6,94 
1. 
0.95 
6.94 
0 (2,4)F(0.95) 
Región de aceptación Región de rechazo 
7. CALCULO DE LA ESTADÍSTICA DE PRUEBA 
SCtotal = (58 - 68,08)2 + ( 62 - 68,08)2 +(67 - 68,08)2 +( 70 - 68,08)2 +( 68 - 68,08)2 
+(70 - 68,08)2 +(78 - 68,08)2 + (81- 68,08)2 +(60- 68,08)2 +(65 - 68,08)2 
+( 68- 68,08)2 +( 70- 68,08)2 
= 101.6064 + 36.9664 + 1.1664 + 3.6864 + .0064 + 3.6864 + 98.4064 + 
166.9264 + 65.2864 + 9.4864 + .0077 + 3.6864 
= 494, 60 
SCBloq = 3 [( 62 - 68,08)2 + ( 62 - 68,08)2 + ( 62 - 68,08)2 + ( 62 - 68,08)2 ] 
= 3 (36.9664 + 5.8081 + 8.5264 + 31.2481) 
= 3 (82.549) 
= 247.647 
SCtratam = 4 [(64.25 - 68,08)2 + ( 74.25 - 68,08)2 + ( 65.75 - 68,08)2] 
= 4 (14.6689 + 38.0689 + 5.4289) 
= 4 * 58.1667 
= 232.6668 
SCresid = 494, 60 - 247.647 - 232.6668 
= 14.285 
Los gl son 3 * 4 -1 = 11, bloque 4 – 1 = 3, tratamiento 3 – 1 = 2, (error) residual 
(4 - 1) (3 - 1) = 6
24 
TABLA ANOVA 
FUENTE SC gl CM RV 
TRATAMIENTO 494,6 2 247,3000 6,3774 
BLOQUES 247,647 3 82,5490 
RESIDUALES 232,6668 6 38,7778 
TOTAL 974,9138 11 
푅. 푉 = 247.300 
38.7778 
= 6.3774 
8. DECISIÓN ESTADÍSTICA: 
Puesto que la razón de la varianza 6.3774 es menor que 6.94 se acepta la 
hipótesis nula por lo que no hay evidencia suficiente que indique una 
difere3ncia entre medias. 
9. CONCLUSIÓN 
Se concluye que todos los efectos de los tratamientos son iguales a cero, o 
equivalentes, es decir todos los tratamientos son cero. 
DISEÑOS DE MEDICIONES REPETITIVAS 
Consiste en medir dos variables en dos muestras distintas de sujetos. Sirve 
para estudiar el efecto de uno o más factores cuando al menos uno de ellos. Es un 
factor intra- sujetos; este factor se caracteriza por que todos los niveles del factor se 
aplican a los mismos sujetos. Los datos este diseño se analiza con la prueba t para las 
muestras relacionadas. El diseño de medidas repetitivas puede tener más de una 
medida y de un factor. Para analizar los datos de este diseño podemos utilizar un 
ANOVA de un factor completamente aleatorizado.
El motivo principal para utilizar el diseño de mediciones repetidas es el deseo 
de controlar la variabilidad entre los individuos estudiados. En este diseño cada 
individuo sirve como su propio control. Una de las situaciones más usuales que 
permiten el uso del diseño de mediciones repetidas es cuando el investigador está 
interesado en respuestas sobre el tiempo. 
VENTAJAS 
Requieren menos sujetos que un diseño completamente aleatorizados y Permiten 
eliminar la variación residual debido a las diferencias entre los sujetos (pues se 
utilizan los mismos). 
25 
DESVENTAJAS 
Es necesario vigilar algunos efectos atribuibles precisamente a la utilización de 
los mismos sujetos, tales como: 
Efecto de arrastre: ocurre cuando se administra una condición antes de que haya 
finalizado el efecto de otra administrada previamente. 
Efecto de aprendizaje por la práctica: ocurre cuando las respuestas de los sujetos 
pueden mejorar con la repetición y, como consecuencia de ello, los tratamientos 
administrados en último lugar parecen más efectivos que los administrados en primer 
lugar, sin que haya diferencias reales entre ellos (en estos casos es importante 
controlar el orden de presentación de las condiciones). Obviamente es necesario 
conocer las ventajas e inconvenientes de estos diseños para decidir correctamente 
cuando es apropiado utilizarlos. 
Kabat-zinn. (A-18) diseñaron un estudio para determinar la eficacia de un programa 
de reducción de estrés con base en la meditación en pacientes con trastornos de 
ansiedad. Los individuos estudiados fueron seleccionados de entre los que estaban en 
el programa de relajación y reducción del estrés. Entre los datos que recolectaron los 
investigadores estaban las calificaciones obtenidas con base en la escala de
calificación de la ansiedad de Hamilton, en tres ocasiones diferentes: al momento de 
reclutamiento inicial (RI), antes del tratamiento (Pre), después del tratamiento (Post) 
y a los tres meses de seguimiento (3m). Se obtuvieron los siguientes datos 
correspondientes a los resultados de los 6 individuos. 
26 
INDIVIDUO RI 
Pre POST 3-M 
1 21 21 16 19 
2 30 38 10 21 
3 38 19 15 6 
4 43 33 30 24 
5 35 34 25 10 
6 40 40 31 30 
1. Datos: ver la tabla 
2. Supuestos: se considera que se cumplen los supuestos descritos para el diseño de 
mediciones repetidas con un solo factor. 
3. Hipótesis: Sea α=0.05 
Ho: μ1=μ2=μ3 =μ4 
HA: μ1≠μ2≠μ3≠μ4 
4. Estadística de prueba: la estadística de prueba es: 
푅. 푉 = 
퐶푀푡푟푎푡 
퐶푀푟푒푠푖푑푢푎푙 
5. Distribución de la estadística de prueba: la estadística de prueba sigue una 
distribución F con (k-1) 4-1=3 grados de libertad para el numerador y (n-k) (k-1) 
(n-1) 23-3-5=15 grados de libertad para el denominador. 
1. Regla de decisión: Sea α=0.05 
0.95 
3.29 
0 (3,15)F(0.95) 
Región de aceptación Región de rechazo
El valor crítico de f es 3,29 
Regla: se rechaza la Ho si el valor de R.V es mayor o igual que 3,29 
27 
6. Calculo de la estadística de prueba: 
INDIVIDUO RI 
Pre POST 3-M 
TOTAL 
MEDIAS 
1 21 21 16 19 
77 19,25 
2 30 38 10 21 
99 24,75 
3 38 19 15 6 
78 19,5 
4 43 33 30 24 
180 32,5 
5 35 34 25 10 
104 26 
6 40 40 31 30 
141 35,25 
TOTAL 207 185 127 110 
629 
MEDIAS 34,5 30,8 21,2 18,3 
104,8 
Sctotal=150785,57 
Sctratamiento=149436,18 
Scresidual=1349,39 
푅. 푉 = 퐶푀푡푟푎푡 
퐶푀푟푒푠푖푑 푢푎 푙 
= 149436,18/1349,39=110,74 
7. Decisión estadística: se rechaza la Ho porque el valor de R.V=110,74 y este valor 
es mayor que 3,29 
8. Conclusión: se concluye que la hipótesis alternativa es verdadera dado que se 
rechazó la Ho. Es decir, que no todas las medias son iguales 
DISEÑO DE MEDICIONES REPETIDAS DE UN SOLO FACTOR 
El estudio del ANOVA de medidas repetidas es el caso más simple de todos: el 
modelo de un factor.
Los datos que permite analizar este modelo son los procedentes de un diseño con un 
solo grupo de sujetos y un único factor cuyos niveles se aplican a todos los sujetos. 
Las distintas medidas, tantas como niveles tiene el factor, se toman sobre los mismos 
sujetos. De ahí el nombre de medidas repetidas que reciben estos modelos. 
Supuestos: se deben considerar, los siguientes supuestos en el diseño de mediciones 
repetidas con un solo factor. Al diseño que cumpla con estos supuestos se le llama 
diseño aditivo de efectos fijos. 
1- Los individuos estudiados forman una muestra aleatoria simple extraida de 
una población con individuos similares. 
2- Cada una de las observaciones es una muestra aleatoria simple e 
independiente de tamaño 1 extraida de cada una de las kn poblaciones, donde 
n es el número de individuos y k es el número de tratamientos a los que se 
expone el individuo. 
3- Las kn poblaciones tienen medias potencialmente diferentes, pero todas las 
poblaciones tienen la misma varianza. 
4- Los k tratamientos son fijos, es decir, son los únicos tratamientos respecto a 
los que se tiene interés en la situación actual. No se pretende hacer inferencias 
para un conjunto mayor de tratamientos. 
5- No hay interacción entre los tratamientos y los individuos. Esto es, los 
tratamientos y los efectos en los individuos son aditivos. 
Con frecuencia es posible encontrar que los datos de los experimentos no cumplen 
con las suposiciones de tratamientos fijos y tratamientos aditivos y efectos sobre los 
individuos. 
Modelo: el modelo para el diseño de mediciones repetidas con un solo factor aditivo 
de efectos fijos es el siguiente: 
xij = 
i  + B i +  j + e ij 
i = 1, 2, ..., n; j = 1, 2, ..., k 
28
29 
EXPERIMENTOS FACTORIALES 
Se denomina Experimentos Factoriales, aquellos experimentos en los que se 
estudia simultáneamente dos o más factores, y donde los tratamientos se forman por 
la combinación de los diferentes niveles de cada uno de estos. Las variables de interés 
reciben el nombre de factores, que son características que involucra a dos o más 
modalidades, variantes o niveles diferentes. 
Los experimentos factoriales en si no constituyen un diseño experimental si 
no que ellos deben ser llevados en cualquiera de los diseños tal como D.C.A.; 
D.B.C.A.; D.C.L. 
Los experimentos factoriales se emplean en todos los campos de la 
investigación, son muy útiles en investigaciones exploratorias en las que poco se sabe 
acerca de muchos factores. Estos pueden ser: 
a. Cualitativos: Son aquellos en los cuales los niveles describen o expresan 
una modalidad particular de las cualidades del factor; cada nivel tiene un 
interés intrínseco o independiente de los otros niveles. Estos factores 
responden a las características de las variables cualitativas. 
b. Cuantitativos: Son aquellos cuyos valores corresponden a cantidades 
numéricas, es decir valores inherentes a una variable cuantitativa. 
VENTAJAS 
Se puede estudiar la interacción de factores, efectos simples y efectos 
cruzados.
Todas las unidades experimentales intervienen en la determinación de los 
efectos principales y de los efectos de interacción de los factores, por lo que el 
número de repeticiones es elevado para estos casos. 
El número de grados de libertad para el error experimental es alto, 
comparándolo con los grados de libertad de los experimentos simples de los mismos 
factores, lo que contribuye a disminuir la variancia del error experimental, 
aumentando por este motivo la precisión del experimento. 
30 
DESVENTAJAS 
Se requiere un mayor número de unidades experimentales que los 
experimentos simples y por lo tanto se tendrá un mayor costo y trabajo en la 
ejecución del experimento. 
Como en los experimentos factoriales c/u de los niveles de un factor se 
combinan con los niveles de los otros factores; a fin de que exista un balance en el 
análisis estadístico se tendrá que algunas de las combinaciones no tiene interés 
práctico pero deben incluirse para mantener el balance. 
El análisis estadístico es más complicado que en los experimentos simples y la 
interpretación de los resultados se hace más difícil a medida de que aumenta el 
número de factores y niveles por factor en el experimento. 
En general los diseños factoriales son los más eficientes para este tipo de 
experimentos. Por ejemplo, si existen “a” niveles del factor A y “b” niveles del factor 
B, entonces cada réplica del experimento contiene todas las “ab” combinaciones de
los tratamientos. A menudo, se dice que los factores están cruzados cuando éstos se 
arreglan en un diseño factorial. 
Hay dos razones fundamentales para incluir un factor en un experimento. La 
primera y más obvia es que nos interese conocer y medir su efecto, con el fin de 
mejorar un producto. La segunda es simplemente para reducir la variabilidad no 
explicada. Esta segunda razón nos llevaría a incluir factores en el análisis que en 
principio no nos interesa cuantificar su efecto. A este segundo tipo de factores se les 
denomina bloque, aunque a efectos de cálculo su tratamiento no varía respecto del 
resto de los factores. 
Los factores serán variables discretas, que pueden tomar un número finito de 
estados o niveles. La variable respuesta seguirá siendo una variable aleatoria 
continua. El objetivo es determinar si el valor medio de la variable respuesta cambia 
al cambiar el nivel de un factor. 
A través de las siguientes graficas se pude observar la interacción o no de los 
31 
factores estudiados. 
Figura 2. Un experimento factorial con interacción. 
En el primer nivel del factor B, el efecto de A es: 
A = 50 - 20 = 30 
Mientras que en el segundo nivel de B, el efecto de A es: 
A = 12 - 40 = 28 
Puede observarse que existe una interacción entre los factores A y B porque el 
efecto de A depende del nivel elegido de B.
Estas ideas pueden ilustrarse gráficamente. En la Fig. 1 se muestra una gráfica 
de la respuesta de los datos de la Tabla 1 contra los niveles del factor A para ambos 
niveles del factor B. Se observa que las rectas B1 y B2 son, aproximadamente, 
paralelas. Esto indica que no hay interacción entre los factores. De manera similar, en 
la Fig. 2 se presenta una gráfica de la respuesta de los datos de la Tabla 2. 
60 
50 
40 
30 
20 
B2 
B1 
Figura 1 Un experimento factorial sin interacciones 
B1 
En este caso se ve que las rectas B1 y B2 no son paralelas. Esto muestra que 
existe una interacción entre A y B. Sin embargo, no debe ser la única técnica para 
analizar los datos, porque su interpretación es subjetiva y su apariencia, a menudo, es 
engañosa. 
60 
50 
40 
30 
20 
B1 
Figura 2. Un experimento factorial con interacciones 
32 
10 
A1 A2 
B2 
Respuesta 
Factor A 
10 
A1 A2 
B2 
B1 
B2 
Respuesta 
Factor A
Hay que notar que cuando una interacción es grande los correspondientes 
efectos principales tienen poco significado práctico. Una estimación del efecto 
principal de A de los datos de la Tabla 2 es: 
1 
33 
20 40 
A  
2 
50 12 
2 
 
 
 
 
El cual resulta ser muy pequeño corriéndose el riesgo de concluir que no 
existe un efecto debido a A. Sin embargo, cuando se examinó el efecto de A en 
niveles diferentes de B se concluyó que éste no era el caso. El factor A tiene un 
efecto, pero depende del nivel del factor B. En otras palabras, es más útil conocer la 
interacción AB que el efecto principal. Una interacción significativa oculta a menudo 
el significado de los efectos principales. 
A continuación se señala el análisis de un experimento factorial por medio de un 
diseño completamente aleatorizado por dos factores: 
1. Datos. Estos se presentan en forma tabular. 
2. Supuestos. Para analizar estos datos, se supone un modelo de efectos fijos 
y un diseño completamente aleatorizado para dos factores. Supuestos para 
el modelo: a. Las observaciones en cada una de las ab celdas constituyen 
una muestra aleatoria independiente de tamaño n, extraída de una 
población definida por la combinación particular. b. Cada una de las ab 
poblacionales siguen una distribución normal. c. Todas las poblaciones 
tienen la misma variancia. 
3. Hipótesis. Las siguientes hipótesis pueden ser probarse: 
a) H` 
0 : ∝i= 0
H` 
34 
A : no todas la ∝i= 0 
b) H`` 
0: βj = 0 
H`` 
A : no todas las βj = 0 
c) H``` 
0: (∝ β)ij = 0 
H``` 
A : no todas las (∝ β)ij = 0 
Se da valor a α 
4. Estadística de prueba: la estadística de prueba para cada conjunto de 
hipótesis se obtiene a través de la fórmula de la razón de la varianza 
(R.V), es decir: 
(R. V)A = 
S2 
1 
S2 (R. V)B = 
S2 
2 
S2 (R. V)AB = 
S2 
3 
S2 
5. Distribución de la estadística de prueba: Cuando la hipótesis nula es 
verdadera y se cumplen las suposiciones, cada una de las estadísticas de 
prueba sigue una distribución F. 
6. Regla de decisión. Cuando se rechaza la hipótesis nula si el valor 
calculado de la estadística de prueba es mayor o igual que el valor critico 
de F 
7. Cálculo de la estadística de prueba: 
Mediante una adaptación del procedimiento que se utiliza para dividir la 
suma total de cuadrados en el diseño completamente aleatorizado, se 
puede demostrar que la suma total de cuadrados bajo el presente modelo 
puede dividirse en dos términos: 
Las formulas de cálculos para los diversos componentes son los siguientes:
 푠푐푡표푡푎푙 = Σ Σ Σ 푥 2 
푖푗푘 − 푐 푛푘 
=1 
35 
푏푗 
=1 
푎푖 
=1 
 푠푐 
푡푟푎푡 = 
Σ Σ 푇2 
푖푗 
푏푗 
=1 
푎푖 
=1 
푛 
−C 
 SCA= 
Σ 푇2 
푖 
푎 
푖=1 
푏.푛 
–c 
 SCB= 
Σ 푇2 
푗 
푏 
푗=1 
푎 .푛 
–c 
 SC(AB)= 풔풄풕풓풂풕 − SCA SCB 
 SC푟푒푠푖푑푢푎푙 = 풔풄풕풐풕풂풍 − 풔풄풕풓풂풕 
8. Decisión estadística: si se cumplen las suposiciones establecidas al 
principio, y si cada hipótesis es verdadera, se puede demostrar que la 
variancia sigue una distribución F, con su grado de libertad indicado. Se 
rechaza la hipótesis nula (Ho) si los valores calculados para R.V. son 
mayores o iguales que los valores críticos correspondientes como lo 
determinan los grados de libertad y los niveles de significación 
seleccionados. 
9. Conclusión: si se rechaza Ho, se concluye que HA es verdadera. Si no se 
rechaza Ho, se concluye que Ho puede ser verdadera. 
10. Valor de P. 
Ejercicio: 
Ejemplo: Diseño completamente aleatorizado por dos factores.
En un experimento llevado a cabo con el propósito de evaluar los efectos del 
trabajo de parto en la producción y utilización de glándulas. Los individuos 
estudiados eran 6 mujeres embarazadas. Entre los datos recolectados están las 
siguientes concentraciones de glucosa durante cuatro fases de trabajos de parto: 
latente (A1) y activa (A2) de dilatación cervical, expulsión de fetal (B), y expulsión 
de la placenta (C) que comprende 48 muestras independientes. En el experimento se 
obtuvieron observaciones duplicadas de promedios en cada combinación de los 
tratamientos. Utilícese un nivel de significación de 0,05 para probar las siguientes 
hipótesis: 
1. ¿Existe concentración de glucosa durante las cuatro fases de trabajo de parto? 
2. ¿Bajo concentración de glucosa en las mujeres embarazadas? 
3. ¿Existe interacción entre las mujeres embarazadas en de trabajo de parto y la 
36 
concentración de glucosas? 
Tabla 1: Concentración de glucosa. 
Mujeres 
embarazadas 
A1 A2 B C 
1 1.6 
2.0 
1.2 
3.2 
2.3 
3.0 
4.2 
2.0 
2 2.03 
1.5 
2.1 
1.6 
1.1 
3.0 
1.8 
2.0 
3 2.02 
2.0 
2.6 
2.2 
3.4 
2.0 
2.27 
3.3 
4 1.8 
3.1 
2.33 
3.0 
3.30 
3.0 
4.1 
2.1 
5 2.60 
2.05 
3.05 
3.05 
3.4 
3.5 
2.06 
2.0 
6 1.97 
2.0 
3.2 
2.0 
2.9 
2.0 
2.5 
2.1
퐓퐚퐛퐥퐚 ퟐ : Concentración de Glucosa. 
37 
Mujeres 
embarazadas 
A1 A2 B C TOTALES MEDIAS 
1 3.60 4.40 5.30 6.20 19.50 4.88 
2 3.53 3.70 4.10 3.80 15.13 3.78 
3 4.02 4.80 5.40 5.27 19.49 4.87 
4 4.90 5.33 6.30 6.20 22.73 5.68 
5 4.06 4.65 6.10 6.90 21.71 5.43 
6 3.97 5.20 4.90 4.60 18.67 4.67 
TOTALES. 24.08 28.08 32.10 32.97 117.23 29.31 
MEDIAS 4.01 4.68 5.35 5.50 19.54 4.89 
Solución: 
1. Datos: Los datos acerca de La concentración de glucosa en mujeres 
embarazadas se obtuvieron durante el análisis que se muestra en la 
tabla 1. 
2. Supuestos: 
a) Las observaciones en cada una de los datos constituyen una 
muestra aleatoria independiente de tamaño 48, extraída de una 
población definida por la combinación particular de los 
factores. 
b) Cada una de las a.b sigue una distribución normal. 
c) Todas las poblaciones tienen la misma variancia. 
3. Hipótesis 
d) H` 
0 : ∝1=∝2=∝3=∝4= 0 
H` 
A :Al menos una de las ∝i no es igual a cero
38 
e) H`` 
0: β1 = β2 = β3 = β4 = 0 
H`` 
A : Al menos una de las βi no es igual a cero 
f) H``` 
0: (∝ β)11 = (∝ β)12 = (∝ β)13 = ⋯ . = (∝ β)34 = 0 
H``` 
A : Al menos una de las (∝ β)ij no es igual a cero 
Sea α=0.05 
4. Estadística de prueba: La estadística de prueba para cada conjunto de 
hipótesis se obtiene a través de la fórmula de la razón de la variancia 
(R.V), es decir: 
(R. V)A = 
S2 
1 
S2 (R. V)B = 
S2 
2 
S2 (R. V)AB = 
S2 
3 
S2 
5. Distribución de la estadística de prueba: Cuando la hipótesis nula 
es verdadera y se cumplen las suposiciones, cada una de las estadísticas 
de prueba sigue una distribución F. 
6. Regla de decisión. Cuando se rechaza la hipótesis nula si el valor 
calculado de la estadística de prueba es mayor o igual que el valor 
critico de F, para probar las tres hipótesis nulas donde los valores 
críticos de F son los siguientes: 2.45, 2.84 y 1.92 respectivamente. 
Puesto que los grados de libertad es igual 48 en el denominador y los 
grado de libertad del numerador a-1; 6-1=5, b-1; 4-1=3 y a.b= (a- 
1)(b-1); (6-1)(4-1)= 15. 
7. Cálculo de la estadística de prueba: 
Las formulas de cálculos para los diversos componentes son los siguientes: 
 푠푐푡표푡푎푙 = Σ Σ Σ 푥 2 
푖푗푘 − 푐 푛푘 
=1 
푏푗 
=1 
푎푖 
=1
39 
Donde 푐 = 
푛 
푘=1 
푏 
푗=1 
푎 
푖=1 
(Σ Σ Σ 푥푖푗푘 
2 
) 
푎.푏.푛 
; 푐 = (117 .23)2 
48 
= 286.31 
풄 =286, 31 
n=2; a=6 y b=4 
푠푐푡표푡푎푙 = (1.6)2 + (1.2)2 + (2.3)2 + (4.2)2 + ⋯ + (2.1)2 − 286.31 
푠푐푡표푡푎푙 = 313,74 − 286.31 
풔풄풕풐풕풂풍 = ퟐퟕ, ퟒퟑ 
 푠푐 
푡푟푎푡 = 
Σ Σ 푇2 
푖푗 
푏푗 
=1 
푎푖 
=1 
푛 
−C 
푠푐푡푟푎푡 = 
(3.60)2 + (4.40)2 + (5.30)2 + ⋯ (4.90)2 + (4.60)2 
2 
− 퐶 
푠푐푡푟푎푡 = 
593.80 
2 
− 퐶 = 296.9 − 286.31 = 10.59 
풔풄풕풓풂풕 = ퟏퟎ. ퟓퟗ 
 SCA= 
Σ 푇2 
푖 
푎 
푖=1 
푏.푛 
–c 
SCA= 
(19.50)2+(15.13) 2+(19.49 )2(22.73) 2+(21.71)2+(18,67)2 
8 
_ 286,31 
SCA= 2325 .57 
8 
− 286,31 = 4.39 
SCA= 4.39 
 SCB= 
Σ 푇2 
푗 
푏 
푗=1 
푎 .푛 
–c
40 
SCB= 290.40 − 286,31 = 4.17 
SCB= 4,17 
 SC(AB)= 풔풄풕풓풂풕 − SCA SCB 
SC (AB)= 31,20 − 4,39 − 4,17 
SC (AB)= 22,64 
 SC푟푒푠푖푑푢푎푙 = 풔풄풕풐풕풂풍 − 풔풄풕풓풂풕 
SC푟푒푠푖푑푢푎푙 = 27,43 − 10,59 
퐒퐂풓풆풔풊풅풖풂 풍 = ퟏퟔ, ퟖퟒ 
Para hallar los valores críticos es necesario hacer los siguientes cálculos: 
 s2 = 퐒퐂풓풆풔풊풅풖풂풍 
푎.푏(푛−1) 
푠2 = 
16,84 
48 
= 0,35 
 푠2 
1 = 푆퐶퐴 
푎 −1 
푠2 
1 = 
4,39 
5 
= 0,88 
 푠2 
2 = 푆퐶퐵 
푏−1 
푠2 
2 = 
4.17 
3 
= 1,39 
 푠2 
3 = 푆퐶 (퐴퐵) 
(푎−1)(푏−1) 
푠2 
3 = 
ퟐퟐ, ퟔퟒ 
15 
= 1,51 
Para probar la hipótesis nula, de que los efectos de los factores A, B y AB son todos 
iguales que ceros, se calcula la razón de la varianza.
41 
(R. V)A = 
S2 
1 
S2 (R. V)B = 
S2 
2 
S2 (R. V)AB = 
S2 
3 
S2 
(퐑. 퐕)퐀 = 
ퟎ. ퟖퟖ 
ퟎ, ퟑퟓ 
= ퟐ, ퟓퟏ (퐑. 퐕)퐁 = 
ퟏ, ퟓퟏ 
ퟎ, ퟑퟓ 
= ퟒ. ퟑퟏ 
(퐑. 퐕)퐀퐁 = 
ퟏ, ퟑퟗ 
ퟎ, ퟑퟓ 
= ퟑ, ퟗퟕ 
Conclusión 
De acuerdo con los resultados de la Razón de la Variancia, los valores del estadístico 
de prueba son mayores que los valores críticos de F, por lo tanto, se rechazan las tres 
hipótesis nulas. 
a) Se Rechaza H` 
0. 
b) Se Rechaza H`` 
0. 
c) Se Rechaza l H``` 
0.
CONCLUSIÓN 
Una vez terminado la monografía de análisis de varianza se pudo llegar a las 
siguientes conclusiones: 
 El Análisis de la varianza y sus procedimientos, se aplican en todas las 
ciencias tanto puras como sociales, tales como: en la Geografía, 
Matemática, Economía, Política, Administración, Contaduría, Educación, 
Industrias, Medicinas, Agriculturas, en la Ingeniería y al Gobiernos, entre 
otras. El análisis de la varianza nos permite decidir cuál es la alternativa 
más adecuada que permita llevar a una solución satisfactoria del 
problema de investigación. 
 El ANOVA permite decidir los distintos niveles de factores que se 
establecen en las diferentes poblaciones o analizar, el comportamiento de 
ésta misma para todos los niveles en función de las poblaciones 
estudiadas. 
 El análisis de la varianza permite determinar si existe o no diferencias 
estadísticas significativas entre medias cuando se tiene más de dos 
muestras o más de dos grupos en el mismo planteamiento. 
 El análisis de varianza nos permite comparar el valor crítico de F con los 
resultados del estadístico de prueba y allí poder tomar decisiones de 
rechazar o no la hipótesis nula. 
42
BIBLIOGRAFÍA 
Analisis de Varianza con medidas repetidas. El procedimiento MGL.Medidas 
Repetidas. WWW.ucm.es/...es/analisis-datos y multivariable/16anovar-spss.pdf. 
De Benitez Celia. (2010) ANÁLISIS DE LA VARIANCIA EN EXPERIMENTOS 
FACTORIALES. Extraído de la pagina web: http://fcf.unse.edu.ar/archivos/series-didacticas/ 
sd-21-estadistica.pdf [Consultada: 2012, marzo 15] 
Echeverría, Hernán. Diseños de bloques al azar 8 articulo en línea, consultado en: 
http://es.scribd.com/doc/262706/bloques200601 
Instituto de investigación en matemáticas aplicadas y sistemas. Diseño de 
Experimentos. UNAM. Mtra. Patricia Romero Mares. 
WWW.dpye.iimas.unam.mx/fimalis2003/ayuda academica.ppt.cap.16. 
Pérez de Vargas, Alberto. Proyecto de innovación educativa 2003/4 guión 
electrónico-interactivo de prácticas de la asignatura de bioestadística, consultado en: 
http://e-stadistica.bio.ucm.es/glosario2/anova.html 
Torres, Virena y otros. Modelos de estadísticos para el procesamiento de 
experimentos con mediciones repetidas en la misma unidad experimental. 
Robert G. Steel,(1998). Bioestadística Principio y Procedimientos. Segunda Edición. 
McGraw-HILL/ Interamericana de Mexico, S.A. de C.V 
Ronald, E. Walpole; Raymond, H. Myers. (1992). Probabilidad y Estadística. 
Tercera Edición. Editorial McGraw-HILL/ Interamericana de Mexico , S.A. de C.V 
43
Soto, Lauro. Diseño aleatorizado por bloques completos (articulo en línea) consultado 
en: http://www.mitecnologico.com/Main/Dise%F1osEnBloquesCompletosAlAzar. 
Tamayo, Ignacio Martin. Análisis de varianza con medidas repetidas de un solo 
factor, consultado en: http://www.ugr.es/~imartin/TEMA5_ANOVA.pdf 
Wayne, D. y León, F (2002) Bioestadística: Base para el Análisis de las Ciencias de 
la Salud (4º ed.). México: LIMUSA 
www.ucm.es/info/socivmyt/paginas//analisisdevarianza/16anovar_SPSS.pdf 
www.dm.udc.es/asignaturas/estadistica2/sec5_2.html 
www.slidefinder.net/D/DISE%C3%91O_ANALISIS/30325052 
44

Más contenido relacionado

La actualidad más candente

Prueba De HipóTesis Para Dos Medias De PoblacióN (Muestras Grandes)
Prueba De HipóTesis Para Dos Medias De PoblacióN (Muestras Grandes)Prueba De HipóTesis Para Dos Medias De PoblacióN (Muestras Grandes)
Prueba De HipóTesis Para Dos Medias De PoblacióN (Muestras Grandes)María Isabel Bautista
 
Estadistica ii distribucion muestral
Estadistica ii distribucion muestralEstadistica ii distribucion muestral
Estadistica ii distribucion muestralEliasGoncalves4
 
Equipo 3 "Clasificación de los diseños experimentales"
Equipo 3 "Clasificación de los diseños experimentales"Equipo 3 "Clasificación de los diseños experimentales"
Equipo 3 "Clasificación de los diseños experimentales"RosarioFL
 
Regresión lineal multiple autores grillet montaño rodríguez
Regresión lineal multiple  autores grillet montaño rodríguezRegresión lineal multiple  autores grillet montaño rodríguez
Regresión lineal multiple autores grillet montaño rodríguezthomas669
 
TRABAJO DE DISTRIBUCCION DE PROBABILIDAD
TRABAJO DE DISTRIBUCCION DE PROBABILIDADTRABAJO DE DISTRIBUCCION DE PROBABILIDAD
TRABAJO DE DISTRIBUCCION DE PROBABILIDADjorgemogollon49
 
Diseño factorial de 3 factores
Diseño factorial de 3 factores Diseño factorial de 3 factores
Diseño factorial de 3 factores Oscar Saenz
 
Conceptos de diseño experimental
Conceptos de diseño experimentalConceptos de diseño experimental
Conceptos de diseño experimentalMarisol A
 
AnáLisis De Varianza (Anova)
AnáLisis De Varianza (Anova)AnáLisis De Varianza (Anova)
AnáLisis De Varianza (Anova)Diego
 
Capitulo 4 : Pruebas de Hipótesis
Capitulo 4 : Pruebas de HipótesisCapitulo 4 : Pruebas de Hipótesis
Capitulo 4 : Pruebas de Hipótesisug-dipa
 
Prueba de hipótesis
Prueba de hipótesisPrueba de hipótesis
Prueba de hipótesisCarol Ramos
 
Muestreo doble y muestreo múltiple
Muestreo doble y muestreo múltipleMuestreo doble y muestreo múltiple
Muestreo doble y muestreo múltipleyaz de Zurita
 
Cuadro comparativo distribuciones
Cuadro comparativo distribucionesCuadro comparativo distribuciones
Cuadro comparativo distribucionesAnaGabrielaMiranda
 
Distribucion muestral de proporciones
Distribucion muestral de proporcionesDistribucion muestral de proporciones
Distribucion muestral de proporcioneseraperez
 

La actualidad más candente (20)

Prueba De HipóTesis Para Dos Medias De PoblacióN (Muestras Grandes)
Prueba De HipóTesis Para Dos Medias De PoblacióN (Muestras Grandes)Prueba De HipóTesis Para Dos Medias De PoblacióN (Muestras Grandes)
Prueba De HipóTesis Para Dos Medias De PoblacióN (Muestras Grandes)
 
Estadistica ii distribucion muestral
Estadistica ii distribucion muestralEstadistica ii distribucion muestral
Estadistica ii distribucion muestral
 
Equipo 3 "Clasificación de los diseños experimentales"
Equipo 3 "Clasificación de los diseños experimentales"Equipo 3 "Clasificación de los diseños experimentales"
Equipo 3 "Clasificación de los diseños experimentales"
 
Regresión lineal multiple autores grillet montaño rodríguez
Regresión lineal multiple  autores grillet montaño rodríguezRegresión lineal multiple  autores grillet montaño rodríguez
Regresión lineal multiple autores grillet montaño rodríguez
 
TRABAJO DE DISTRIBUCCION DE PROBABILIDAD
TRABAJO DE DISTRIBUCCION DE PROBABILIDADTRABAJO DE DISTRIBUCCION DE PROBABILIDAD
TRABAJO DE DISTRIBUCCION DE PROBABILIDAD
 
Diseño factorial de 3 factores
Diseño factorial de 3 factores Diseño factorial de 3 factores
Diseño factorial de 3 factores
 
Anova
AnovaAnova
Anova
 
Conceptos de diseño experimental
Conceptos de diseño experimentalConceptos de diseño experimental
Conceptos de diseño experimental
 
AnáLisis De Varianza (Anova)
AnáLisis De Varianza (Anova)AnáLisis De Varianza (Anova)
AnáLisis De Varianza (Anova)
 
ANOVA
ANOVAANOVA
ANOVA
 
Capitulo 4 : Pruebas de Hipótesis
Capitulo 4 : Pruebas de HipótesisCapitulo 4 : Pruebas de Hipótesis
Capitulo 4 : Pruebas de Hipótesis
 
Estadística: Pruebas de Normalidad
Estadística: Pruebas de NormalidadEstadística: Pruebas de Normalidad
Estadística: Pruebas de Normalidad
 
Estadística: Prueba de Medias
Estadística: Prueba de MediasEstadística: Prueba de Medias
Estadística: Prueba de Medias
 
Prueba de hipótesis
Prueba de hipótesisPrueba de hipótesis
Prueba de hipótesis
 
Muestreo doble y muestreo múltiple
Muestreo doble y muestreo múltipleMuestreo doble y muestreo múltiple
Muestreo doble y muestreo múltiple
 
Análisis de Regresión Lineal
Análisis de Regresión LinealAnálisis de Regresión Lineal
Análisis de Regresión Lineal
 
Cuadro comparativo distribuciones
Cuadro comparativo distribucionesCuadro comparativo distribuciones
Cuadro comparativo distribuciones
 
Analisis de la varianza Est ind clase04
Analisis de la varianza Est ind clase04Analisis de la varianza Est ind clase04
Analisis de la varianza Est ind clase04
 
Disenos factoriales
Disenos factorialesDisenos factoriales
Disenos factoriales
 
Distribucion muestral de proporciones
Distribucion muestral de proporcionesDistribucion muestral de proporciones
Distribucion muestral de proporciones
 

Destacado (20)

Análisis de Varianza
Análisis de VarianzaAnálisis de Varianza
Análisis de Varianza
 
Pruebas de bondad de ajuste
Pruebas de bondad de ajustePruebas de bondad de ajuste
Pruebas de bondad de ajuste
 
Análisis de varianza
Análisis de varianzaAnálisis de varianza
Análisis de varianza
 
Diseño completalmente aleatorio 1
Diseño completalmente aleatorio 1Diseño completalmente aleatorio 1
Diseño completalmente aleatorio 1
 
Anova1
Anova1Anova1
Anova1
 
Dca y bca
Dca y bcaDca y bca
Dca y bca
 
Pruebas de bondad de ajuste vfinal
Pruebas de bondad de ajuste vfinalPruebas de bondad de ajuste vfinal
Pruebas de bondad de ajuste vfinal
 
Análisis de Varianza (ANOVA)
Análisis de Varianza (ANOVA)Análisis de Varianza (ANOVA)
Análisis de Varianza (ANOVA)
 
Análisis de varianza con spss
Análisis de varianza con spssAnálisis de varianza con spss
Análisis de varianza con spss
 
Analisis de varianza[1] ponencia.
Analisis de varianza[1] ponencia.Analisis de varianza[1] ponencia.
Analisis de varianza[1] ponencia.
 
Pruebas de hipótesis
Pruebas de hipótesis Pruebas de hipótesis
Pruebas de hipótesis
 
CEMENTOS Y AGREGADOS RECICLADOS
CEMENTOS Y AGREGADOS RECICLADOSCEMENTOS Y AGREGADOS RECICLADOS
CEMENTOS Y AGREGADOS RECICLADOS
 
Truquillos LaTeX
Truquillos LaTeXTruquillos LaTeX
Truquillos LaTeX
 
Pruebas de hipótesis
Pruebas de hipótesisPruebas de hipótesis
Pruebas de hipótesis
 
Bioestadistica ss14
Bioestadistica ss14Bioestadistica ss14
Bioestadistica ss14
 
Diseño de experimentos muestra bloques
Diseño de experimentos muestra bloquesDiseño de experimentos muestra bloques
Diseño de experimentos muestra bloques
 
Ejercicios diseño de bloques completos al azar
Ejercicios diseño de bloques completos al azarEjercicios diseño de bloques completos al azar
Ejercicios diseño de bloques completos al azar
 
Apuntes Clase Estadistica I(Itsz)
Apuntes Clase Estadistica I(Itsz)Apuntes Clase Estadistica I(Itsz)
Apuntes Clase Estadistica I(Itsz)
 
Preguntas Diseno Factoriales
Preguntas Diseno FactorialesPreguntas Diseno Factoriales
Preguntas Diseno Factoriales
 
Hipotesis
HipotesisHipotesis
Hipotesis
 

Similar a Analisis de varianza alternativas1

Unidad #3 Clase 6 Analisis de Varianza ANOVA 1F.pptx
Unidad #3 Clase 6 Analisis de Varianza ANOVA 1F.pptxUnidad #3 Clase 6 Analisis de Varianza ANOVA 1F.pptx
Unidad #3 Clase 6 Analisis de Varianza ANOVA 1F.pptxNicki Nicole
 
Analisis de varianza unam
Analisis de varianza unamAnalisis de varianza unam
Analisis de varianza unamPanchitoguapo1
 
Estadistica descriptiva 2
Estadistica descriptiva 2 Estadistica descriptiva 2
Estadistica descriptiva 2 Paula Diaz
 
Estadistica descriptiva
Estadistica descriptivaEstadistica descriptiva
Estadistica descriptivajennypao39
 
El diseño cuasiexperimental primer trabajo victor[1]
El diseño cuasiexperimental primer trabajo victor[1]El diseño cuasiexperimental primer trabajo victor[1]
El diseño cuasiexperimental primer trabajo victor[1]uabc
 
82253086 unidad-iv-pruebas-de-hipotesis-con-dos-muestras-y-varias-muestras-de...
82253086 unidad-iv-pruebas-de-hipotesis-con-dos-muestras-y-varias-muestras-de...82253086 unidad-iv-pruebas-de-hipotesis-con-dos-muestras-y-varias-muestras-de...
82253086 unidad-iv-pruebas-de-hipotesis-con-dos-muestras-y-varias-muestras-de...Ekthor Daniel R G
 
6. teoria del muestreo
6. teoria del muestreo6. teoria del muestreo
6. teoria del muestreoEblin Ramos
 
ANOVa-dos vias.pdf
ANOVa-dos vias.pdfANOVa-dos vias.pdf
ANOVa-dos vias.pdfAide82
 
[2] tecnics. muestreo
[2] tecnics. muestreo[2] tecnics. muestreo
[2] tecnics. muestreoguestd0c4e2
 
Analisis de datos exploratorios julio 15
Analisis de datos exploratorios julio 15Analisis de datos exploratorios julio 15
Analisis de datos exploratorios julio 15Elfego Lopez
 
Planteamiento de hipótesis en más de dos poblaciones
Planteamiento de hipótesis en más de dos poblacionesPlanteamiento de hipótesis en más de dos poblaciones
Planteamiento de hipótesis en más de dos poblacionesguest91e7e85
 
Generalidades de la estadística
Generalidades de la estadísticaGeneralidades de la estadística
Generalidades de la estadísticaJenny HB
 
Estadistica inferencial expo
Estadistica inferencial expoEstadistica inferencial expo
Estadistica inferencial expoPepe Rodríguez
 
Introduccion Analisis De Varianza
Introduccion Analisis De VarianzaIntroduccion Analisis De Varianza
Introduccion Analisis De VarianzaJavier Araneda
 
Anova un factor-lectura
Anova un factor-lecturaAnova un factor-lectura
Anova un factor-lecturaJoel Rojas
 

Similar a Analisis de varianza alternativas1 (20)

Unidad #3 Clase 6 Analisis de Varianza ANOVA 1F.pptx
Unidad #3 Clase 6 Analisis de Varianza ANOVA 1F.pptxUnidad #3 Clase 6 Analisis de Varianza ANOVA 1F.pptx
Unidad #3 Clase 6 Analisis de Varianza ANOVA 1F.pptx
 
Analisis de varianza_2012
Analisis de varianza_2012Analisis de varianza_2012
Analisis de varianza_2012
 
Analisis de varianza unam
Analisis de varianza unamAnalisis de varianza unam
Analisis de varianza unam
 
Estadistica descriptiva 2
Estadistica descriptiva 2 Estadistica descriptiva 2
Estadistica descriptiva 2
 
Estadistica descriptiva
Estadistica descriptivaEstadistica descriptiva
Estadistica descriptiva
 
El diseño cuasiexperimental primer trabajo victor[1]
El diseño cuasiexperimental primer trabajo victor[1]El diseño cuasiexperimental primer trabajo victor[1]
El diseño cuasiexperimental primer trabajo victor[1]
 
82253086 unidad-iv-pruebas-de-hipotesis-con-dos-muestras-y-varias-muestras-de...
82253086 unidad-iv-pruebas-de-hipotesis-con-dos-muestras-y-varias-muestras-de...82253086 unidad-iv-pruebas-de-hipotesis-con-dos-muestras-y-varias-muestras-de...
82253086 unidad-iv-pruebas-de-hipotesis-con-dos-muestras-y-varias-muestras-de...
 
6. teoria del muestreo
6. teoria del muestreo6. teoria del muestreo
6. teoria del muestreo
 
ANOVa-dos vias.pdf
ANOVa-dos vias.pdfANOVa-dos vias.pdf
ANOVa-dos vias.pdf
 
[2] tecnics. muestreo
[2] tecnics. muestreo[2] tecnics. muestreo
[2] tecnics. muestreo
 
Analisis de varianza.doc
Analisis de varianza.docAnalisis de varianza.doc
Analisis de varianza.doc
 
Analisis de datos exploratorios julio 15
Analisis de datos exploratorios julio 15Analisis de datos exploratorios julio 15
Analisis de datos exploratorios julio 15
 
Estadistica ecologia(3)
Estadistica ecologia(3)Estadistica ecologia(3)
Estadistica ecologia(3)
 
Planteamiento de hipótesis en más de dos poblaciones
Planteamiento de hipótesis en más de dos poblacionesPlanteamiento de hipótesis en más de dos poblaciones
Planteamiento de hipótesis en más de dos poblaciones
 
Generalidades de la estadística
Generalidades de la estadísticaGeneralidades de la estadística
Generalidades de la estadística
 
Estadistica inferencial expo
Estadistica inferencial expoEstadistica inferencial expo
Estadistica inferencial expo
 
Prueba T student.pdf
Prueba T student.pdfPrueba T student.pdf
Prueba T student.pdf
 
Tamaño de muestra revisado
Tamaño de muestra revisadoTamaño de muestra revisado
Tamaño de muestra revisado
 
Introduccion Analisis De Varianza
Introduccion Analisis De VarianzaIntroduccion Analisis De Varianza
Introduccion Analisis De Varianza
 
Anova un factor-lectura
Anova un factor-lecturaAnova un factor-lectura
Anova un factor-lectura
 

Último

SESION DE PERSONAL SOCIAL. La convivencia en familia 22-04-24 -.doc
SESION DE PERSONAL SOCIAL.  La convivencia en familia 22-04-24  -.docSESION DE PERSONAL SOCIAL.  La convivencia en familia 22-04-24  -.doc
SESION DE PERSONAL SOCIAL. La convivencia en familia 22-04-24 -.docRodneyFrankCUADROSMI
 
6.-Como-Atraer-El-Amor-01-Lain-Garcia-Calvo.pdf
6.-Como-Atraer-El-Amor-01-Lain-Garcia-Calvo.pdf6.-Como-Atraer-El-Amor-01-Lain-Garcia-Calvo.pdf
6.-Como-Atraer-El-Amor-01-Lain-Garcia-Calvo.pdfMiNeyi1
 
2024 KIT DE HABILIDADES SOCIOEMOCIONALES.pdf
2024 KIT DE HABILIDADES SOCIOEMOCIONALES.pdf2024 KIT DE HABILIDADES SOCIOEMOCIONALES.pdf
2024 KIT DE HABILIDADES SOCIOEMOCIONALES.pdfMiguelHuaman31
 
2 REGLAMENTO RM 0912-2024 DE MODALIDADES DE GRADUACIÓN_.pptx
2 REGLAMENTO RM 0912-2024 DE MODALIDADES DE GRADUACIÓN_.pptx2 REGLAMENTO RM 0912-2024 DE MODALIDADES DE GRADUACIÓN_.pptx
2 REGLAMENTO RM 0912-2024 DE MODALIDADES DE GRADUACIÓN_.pptxRigoTito
 
Caja de herramientas de inteligencia artificial para la academia y la investi...
Caja de herramientas de inteligencia artificial para la academia y la investi...Caja de herramientas de inteligencia artificial para la academia y la investi...
Caja de herramientas de inteligencia artificial para la academia y la investi...Lourdes Feria
 
proyecto de mayo inicial 5 añitos aprender es bueno para tu niño
proyecto de mayo inicial 5 añitos aprender es bueno para tu niñoproyecto de mayo inicial 5 añitos aprender es bueno para tu niño
proyecto de mayo inicial 5 añitos aprender es bueno para tu niñotapirjackluis
 
CALENDARIZACION DE MAYO / RESPONSABILIDAD
CALENDARIZACION DE MAYO / RESPONSABILIDADCALENDARIZACION DE MAYO / RESPONSABILIDAD
CALENDARIZACION DE MAYO / RESPONSABILIDADauxsoporte
 
Registro Auxiliar - Primaria 2024 (1).pptx
Registro Auxiliar - Primaria  2024 (1).pptxRegistro Auxiliar - Primaria  2024 (1).pptx
Registro Auxiliar - Primaria 2024 (1).pptxFelicitasAsuncionDia
 
5.- Doerr-Mide-lo-que-importa-DESARROLLO PERSONAL
5.- Doerr-Mide-lo-que-importa-DESARROLLO PERSONAL5.- Doerr-Mide-lo-que-importa-DESARROLLO PERSONAL
5.- Doerr-Mide-lo-que-importa-DESARROLLO PERSONALMiNeyi1
 
Prueba libre de Geografía para obtención título Bachillerato - 2024
Prueba libre de Geografía para obtención título Bachillerato - 2024Prueba libre de Geografía para obtención título Bachillerato - 2024
Prueba libre de Geografía para obtención título Bachillerato - 2024Juan Martín Martín
 
Dinámica florecillas a María en el mes d
Dinámica florecillas a María en el mes dDinámica florecillas a María en el mes d
Dinámica florecillas a María en el mes dstEphaniiie
 
Qué es la Inteligencia artificial generativa
Qué es la Inteligencia artificial generativaQué es la Inteligencia artificial generativa
Qué es la Inteligencia artificial generativaDecaunlz
 
TIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptx
TIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptxTIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptx
TIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptxlclcarmen
 
Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.
Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.
Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.Alejandrino Halire Ccahuana
 
Curso = Metodos Tecnicas y Modelos de Enseñanza.pdf
Curso = Metodos Tecnicas y Modelos de Enseñanza.pdfCurso = Metodos Tecnicas y Modelos de Enseñanza.pdf
Curso = Metodos Tecnicas y Modelos de Enseñanza.pdfFrancisco158360
 
Programacion Anual Matemática5 MPG 2024 Ccesa007.pdf
Programacion Anual Matemática5    MPG 2024  Ccesa007.pdfProgramacion Anual Matemática5    MPG 2024  Ccesa007.pdf
Programacion Anual Matemática5 MPG 2024 Ccesa007.pdfDemetrio Ccesa Rayme
 
origen y desarrollo del ensayo literario
origen y desarrollo del ensayo literarioorigen y desarrollo del ensayo literario
origen y desarrollo del ensayo literarioELIASAURELIOCHAVEZCA1
 
ACERTIJO DE POSICIÓN DE CORREDORES EN LA OLIMPIADA. Por JAVIER SOLIS NOYOLA
ACERTIJO DE POSICIÓN DE CORREDORES EN LA OLIMPIADA. Por JAVIER SOLIS NOYOLAACERTIJO DE POSICIÓN DE CORREDORES EN LA OLIMPIADA. Por JAVIER SOLIS NOYOLA
ACERTIJO DE POSICIÓN DE CORREDORES EN LA OLIMPIADA. Por JAVIER SOLIS NOYOLAJAVIER SOLIS NOYOLA
 

Último (20)

SESION DE PERSONAL SOCIAL. La convivencia en familia 22-04-24 -.doc
SESION DE PERSONAL SOCIAL.  La convivencia en familia 22-04-24  -.docSESION DE PERSONAL SOCIAL.  La convivencia en familia 22-04-24  -.doc
SESION DE PERSONAL SOCIAL. La convivencia en familia 22-04-24 -.doc
 
6.-Como-Atraer-El-Amor-01-Lain-Garcia-Calvo.pdf
6.-Como-Atraer-El-Amor-01-Lain-Garcia-Calvo.pdf6.-Como-Atraer-El-Amor-01-Lain-Garcia-Calvo.pdf
6.-Como-Atraer-El-Amor-01-Lain-Garcia-Calvo.pdf
 
2024 KIT DE HABILIDADES SOCIOEMOCIONALES.pdf
2024 KIT DE HABILIDADES SOCIOEMOCIONALES.pdf2024 KIT DE HABILIDADES SOCIOEMOCIONALES.pdf
2024 KIT DE HABILIDADES SOCIOEMOCIONALES.pdf
 
2 REGLAMENTO RM 0912-2024 DE MODALIDADES DE GRADUACIÓN_.pptx
2 REGLAMENTO RM 0912-2024 DE MODALIDADES DE GRADUACIÓN_.pptx2 REGLAMENTO RM 0912-2024 DE MODALIDADES DE GRADUACIÓN_.pptx
2 REGLAMENTO RM 0912-2024 DE MODALIDADES DE GRADUACIÓN_.pptx
 
Caja de herramientas de inteligencia artificial para la academia y la investi...
Caja de herramientas de inteligencia artificial para la academia y la investi...Caja de herramientas de inteligencia artificial para la academia y la investi...
Caja de herramientas de inteligencia artificial para la academia y la investi...
 
proyecto de mayo inicial 5 añitos aprender es bueno para tu niño
proyecto de mayo inicial 5 añitos aprender es bueno para tu niñoproyecto de mayo inicial 5 añitos aprender es bueno para tu niño
proyecto de mayo inicial 5 añitos aprender es bueno para tu niño
 
Tema 8.- PROTECCION DE LOS SISTEMAS DE INFORMACIÓN.pdf
Tema 8.- PROTECCION DE LOS SISTEMAS DE INFORMACIÓN.pdfTema 8.- PROTECCION DE LOS SISTEMAS DE INFORMACIÓN.pdf
Tema 8.- PROTECCION DE LOS SISTEMAS DE INFORMACIÓN.pdf
 
CALENDARIZACION DE MAYO / RESPONSABILIDAD
CALENDARIZACION DE MAYO / RESPONSABILIDADCALENDARIZACION DE MAYO / RESPONSABILIDAD
CALENDARIZACION DE MAYO / RESPONSABILIDAD
 
Registro Auxiliar - Primaria 2024 (1).pptx
Registro Auxiliar - Primaria  2024 (1).pptxRegistro Auxiliar - Primaria  2024 (1).pptx
Registro Auxiliar - Primaria 2024 (1).pptx
 
5.- Doerr-Mide-lo-que-importa-DESARROLLO PERSONAL
5.- Doerr-Mide-lo-que-importa-DESARROLLO PERSONAL5.- Doerr-Mide-lo-que-importa-DESARROLLO PERSONAL
5.- Doerr-Mide-lo-que-importa-DESARROLLO PERSONAL
 
Prueba libre de Geografía para obtención título Bachillerato - 2024
Prueba libre de Geografía para obtención título Bachillerato - 2024Prueba libre de Geografía para obtención título Bachillerato - 2024
Prueba libre de Geografía para obtención título Bachillerato - 2024
 
Dinámica florecillas a María en el mes d
Dinámica florecillas a María en el mes dDinámica florecillas a María en el mes d
Dinámica florecillas a María en el mes d
 
Qué es la Inteligencia artificial generativa
Qué es la Inteligencia artificial generativaQué es la Inteligencia artificial generativa
Qué es la Inteligencia artificial generativa
 
Supuestos_prácticos_funciones.docx
Supuestos_prácticos_funciones.docxSupuestos_prácticos_funciones.docx
Supuestos_prácticos_funciones.docx
 
TIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptx
TIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptxTIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptx
TIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptx
 
Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.
Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.
Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.
 
Curso = Metodos Tecnicas y Modelos de Enseñanza.pdf
Curso = Metodos Tecnicas y Modelos de Enseñanza.pdfCurso = Metodos Tecnicas y Modelos de Enseñanza.pdf
Curso = Metodos Tecnicas y Modelos de Enseñanza.pdf
 
Programacion Anual Matemática5 MPG 2024 Ccesa007.pdf
Programacion Anual Matemática5    MPG 2024  Ccesa007.pdfProgramacion Anual Matemática5    MPG 2024  Ccesa007.pdf
Programacion Anual Matemática5 MPG 2024 Ccesa007.pdf
 
origen y desarrollo del ensayo literario
origen y desarrollo del ensayo literarioorigen y desarrollo del ensayo literario
origen y desarrollo del ensayo literario
 
ACERTIJO DE POSICIÓN DE CORREDORES EN LA OLIMPIADA. Por JAVIER SOLIS NOYOLA
ACERTIJO DE POSICIÓN DE CORREDORES EN LA OLIMPIADA. Por JAVIER SOLIS NOYOLAACERTIJO DE POSICIÓN DE CORREDORES EN LA OLIMPIADA. Por JAVIER SOLIS NOYOLA
ACERTIJO DE POSICIÓN DE CORREDORES EN LA OLIMPIADA. Por JAVIER SOLIS NOYOLA
 

Analisis de varianza alternativas1

  • 1. UNIVERSIDAD DE ORIENTE NÚCLEO DE SUCRE ESCUELA DE HUMANIDADES Y EDUCACIÓN DPTO. DE PSICOLOGÍA E INVESTIGACIÓN EDUCATIVA ALTERNATIVA DE GRADO: ESTADÍSTICA II ANÁLISIS DE VARIANZA Prof. : INTEGRANTES: MONDRAGÓN J. CARIACO, JESUS 1 MARVAL, MARIA RUIZ, JOAN RATIA, ANA ESPINOZA, EDGAR HENRÍQUEZ, LUISA SEC: 2 CUMANÁ, ABRIL DE 2012
  • 2. ÍNDICE 2 PÁG. Introducción…………………………………………………………………… iii Análisis de varianza (ANOVA)……………………………………………….. 5 ¿Por qué utilizamos el análisis de varianza en vez de la t de student?............... 5 Procedimiento de ANOVA…………………………………………………… 6 Diseño completamente aleatorizado (DCA).…………….………...………….. 7 Características Principales….……..…………………………………….. 8 ANOVA unilateral…………………………………………..………….. 9 Pasos para la prueba de hipótesis en un diseño completamente aleatorizado… 10 Diseño en bloques completamente aleatorizado………………………………. 20 Objetivos………………………………………………………………… 21 Ventajas………………………………………………………………….. 21 Para la prueba de hipótesis se siguen diez pasos……………………....... 22 Diseño de mediciones repetidas…………………………………………….… 24 Ventajas…………………….……………………………………….… 25 Desventajas…………..………………………………………………… 25 Diseño de mediciones repetidas con un solo factor ………………………….. 27 Experimento factorial………………………………………………………… 29 Ventajas. ……………………………………..………………………… 29 Desventajas. …………………………….……………………………… 30 Conclusión ………………………….………………………………………… 42 Bibliografía………………………………………………………………….…. 43
  • 3. INTRODUCCIÓN La varianza es una constante que representa una medida de dispersión media de una variable aleatoria X, respecto a su valor medio o esperado. Puede interpretarse como medida de “variabilidad” de la variable. Las técnicas englobadas bajo la denominación de análisis de la varianza o abreviadamente ANOVA (del inglés analysis of variance) han jugado un papel crucial en la metodología estadística moderna, desde que fueran ideadas por Sir Ronald Fisher en la década de los años veinte. Casi siempre se introduce el tema del análisis de la varianza como respuesta a la necesidad de utilizar una técnica de comparación de más de dos grupos, es decir como un método para comparar más de dos tratamientos: si disponemos de medidas cuantitativas continuas, que se puede suponer como procedentes de una distribución de probabilidad normal, y queremos comparar dos grupos −dos tratamientos−, la prueba estadística que se utiliza es un contraste de medias basado en la t de Student, y cuando se dispone de más de dos grupos, la prueba a emplear es el análisis de la varianza. El análisis de variancia es una técnica que se usa para probar hipótesis acerca de las medias de diferentes tratamientos que se ensayan (Daniel 1984). Para que esto sea posible, las medias que se determinan tienen que provenir de mediciones sobre muestras independientes. Además permite el control de α a un nivel predeterminado cuando se prueba la igualdad de J medias del grupo, donde J ≥ 2. En ANOVA, las medias se examinan simultáneamente para evaluar la posibilidad de que todas las J medias de muestreo provengan de la misma población (es decir, poblaciones con idénticos parámetros). En otras palabras, los procedimientos ANOVA se pueden usar para determinar si es o no razonable concluir que no todas la J medias del muestreo provienen de la misma población. 3
  • 4. Para ANOVA, la hipótesis nula es una sola pero incluye todas las hipótesis: Ho: μ1=μ2=…=μJ En otras palabras, el análisis de varianza lo vamos a utilizar para verificar si hay diferencias estadísticamente significativas entre medias cuando tenemos más de dos muestras o grupos en el mismo planteamiento. En estos casos no utilizamos la t de Student que solamente es un procedimiento válido cuando comparamos únicamente las medias de dos muestras. 4
  • 5. ANÁLISIS DE VARIANZA (ANOVA) El análisis de la varianza tiene amplias aplicaciones en el análisis de datos derivados de experimentos, este se utiliza también, para cumplir 2 objetivos:  Estimar y probar hipótesis respecto a las varianzas de las poblaciones.  Estimar y probar hipótesis respecto a las medidas de las poblaciones. La hipótesis nula que se prueba en el ANOVA es que la mayoría de las poblaciones que se estudian (al menos tres) tienen el mismo valor de la media para la variable dependiente. Las hipótesis nulas y alternativa en ANOVA son: 5 H0: X1 = X2 = X3 =... = X c HA: No todas las poblaciones tienen la misma media. ¿POR QUÉ UTILIZAMOS EL ANÁLISIS DE VARIANZA EN VEZ DE LA T DE STUDENT? Cuando tenemos dos muestras y queremos comprobar si difieren significativamente (si proceden de la misma población con una única media) utilizamos la t de Student. Cuando tenemos más de dos grupos utilizamos el análisis de varianza: ¿No podríamos comparar todos los grupos de dos en dos con la t de Student? A primera vista parecería lo más lógico, sin embargo no se hace así por una serie de razones que exponemos a continuación: 1º La razón más importante (y suficiente) para no utilizar la t de Student con más de dos grupos es que, al hacer muchas comparaciones de dos en dos, aumenta la probabilidad de que algunas diferencias resulten significativas por azar y entonces cabe la posibilidad de afirmar que hay una diferencia (de no aceptar la hipótesis nula) cuando realmente no la hay.
  • 6. Si por ejemplo tenemos tres grupos podríamos hacer tres comparaciones: entre el 1º y el 2º, entre el 1º y el 3º y entre el 2º y el 3º. Operando con un nivel de confianza de α =0.05, la probabilidad de encontrar al menos una diferencia significativa por azar es de hecho del 9.75% y no del 5%. Como se evidencia, se incrementa dramáticamente la probabilidad (α) de cometer un error de tipo I. Cuando se realiza más de una prueba t, la probabilidad de uno o más errores de tipo I es mayor que el nivel α establecido. 2º Otra razón adicional es que una prueba estadística basada en todos los datos utilizados simultáneamente, es más estable que la prueba o análisis que parcializa los datos y no los examina todos juntos. El error típico (que expresa la variación en las medias que podemos encontrar en diversas muestras) es menor cuando el número de sujetos es mayor, como sucede cuando se analizan todos los datos de todos los grupos simultáneamente. En principio es preferible utilizar un método de análisis global que abarque todos los datos que se quieren examinar. 3º El ahorro de tiempo es otra razón muy importante, aunque en sí misma no es una razón válida. El número de comparaciones de dos en dos de k elementos es igual a k por lo cual se ahorraría mucho tiempo al trabajar con el ANOVA. PROCEDIMIENTO DE ANOVA. Para aplicar el análisis de varianza a un estudio se siguen diez pasos: 1. Descripción de datos. 2. Supuestos. 3. Hipótesis. 4. Estadística de prueba. 5. Distribución de la estadística de prueba. 6. Regla de decisión. 7. Calculo de la estadística de prueba. 6
  • 7. 7 8. Decisión de estadística. 9. Conclusión. 10. Cálculo del valor p (Probabilidad) DISEÑO COMPLETAMENTE ALEATORIZADO (DCA) Este diseño consiste en la asignación de los tratamientos en forma completamente aleatoria a las unidades experimentales (individuos, grupos, parcelas, jaulas, animales, insectos, entre otros). Debido a su aleatorización irrestricta, es conveniente que se utilicen unidades experimentales de lo más homogéneas posibles: animales de la misma edad, del mismo peso, similar estado fisiológico; parcelas de igual tamaño, entre otros, de manera de disminuir la magnitud del error experimental, ocasionado por la variación intrínseca de las unidades experimentales. Este diseño es apropiado para experimentos de laboratorio, invernadero, animales de bioterio, aves, conejos, cerdos, entre otros, es decir, situaciones experimentales como de las condiciones ambientales que rodean el experimento. En este diseño, los tratamientos en estudio se distribuyen al azar en todas las unidades experimentales; siendo el número de repeticiones por tratamiento igual o diferente. Este diseño se emplea cuando la variabilidad en todo el material experimental es relativamente pequeña y uniformemente distribuida. Se debe tener presente que la aleatorización estadística es un procedimiento puntual, en el cual se les asigna a las unidades observadas un grupo de control o tratamiento de una manera que toma en consideración la influencia potencial de las variables confundidas. Esto permite cuantificar la influencia de estas variables confundidas al observarlas en ambos grupos de control y de tratamiento. La aleatorización se lleva a cabo mediante una tabla de números aleatorios.
  • 8. CARACTERÍSTICAS PRINCIPALES 1. Es aplicable sólo cuando las unidades experimentales son homogéneas (verificar si existe tal homogeneidad de los datos, todos provienen de la misma distribución y no hay datos atípicos). 2. Los tratamientos pueden tener igual o diferente número de unidades experimentales. 3. La distribución de los tratamientos es al azar en las unidades experimentales. El número de tratamientos está en función del número de unidades experimentales que se dispone. Es conveniente tener pocos tratamientos y más unidades experimentales que muchos tratamientos con pocas unidades experimentales. 8 VENTAJAS Fácil de planear y analizar; además es flexible en el empleo del número de tratamientos y repeticiones, solo está limitado por el número de unidades experimentales disponibles. Permite verificar si hay diferencias estadísticamente significativas entre medias cuando tenemos más de dos muestras o grupos en el mismo planteamiento. DESVENTAJA La principal desventaja que presenta este diseño está relacionada a la homogeneidad del material experimental; el cual es difícil de encontrar en experimentos de campo, por lo que su uso se restringe con mucha frecuencia a experimentos de laboratorio o donde se pueda tener control de los efectos no considerados en el estudio (ambiente, temperatura, luz, entre otros)
  • 9. 9 OBJETIVO El objetivo de un diseño completamente aleatorio es estudiar si existen diferencias significativas en la variable dependiente para cada nivel de la variable independiente o tratamiento. Específicamente, lo que nos interesa es hacer un "Test de Singularidad de Medias". El procedimiento a utilizar para alcanzar este objetivo (la singularidad de medias) es el análisis de la varianza (ANOVA), técnica muy útil en el campo de la inferencia estadística, que toma como referencia el modelo lineal estadístico. En concreto, en este diseño se toma como referencia el siguiente modelo lineal estadístico: Yij = EG + ETj + EA Yij: Valor observado de la variable dependiente en la unidad de prueba i con el tratamiento j. EG: Es el efecto global, que se refiere al promedio de la variable dependiente para el total o conjunto de las unidades de prueba. ETj: Es el efecto del tratamiento j, es decir, la variación en la variable dependiente con relación al promedio debido a la influencia del tratamiento j. EA: Es el efecto aleatorio, el cual recoge el efecto de todas las restantes causas posibles de variabilidad del experimento no debidas al tratamiento, es decir, al efecto aleatorio se le podría llamar también "otras causas de variabilidad del experimento". ETj + EA: La suma de estos dos efectos refleja las fuentes de dispersión. Concretamente, el análisis de la varianza (ANOVA) va a consistir en el análisis de esa dispersión, es decir, en el estudio de los componentes de la dispersión total. ANOVA UNILATERAL: El tipo más simple de análisis de varianza es el que se conoce como análisis de varianza unilateral, en el cual se investiga una sola fuente de variación o factor. Esto es una extensión a 3 o más muestras del procedimiento de la prueba, para utilizarlo en 2 muestras independiente. Dicho de otra forma, se puede
  • 10. afirmar que utiliza la prueba t con dos muestras independientes en un caso específico del análisis de la varianza unilateral. PASOS PARA LA PRUEBA DE HIPÓTESIS EN UN DISEÑO COMPLETAMENTE ALEATORIZADO 1. Descripción de los datos. Las mediciones (u observaciones) que resultan de un diseño experimental completamente aleatorizado, junto con las medias y los totales que puedan calcularse a partir de los datos, pueden presentarse si así conviene a través de las siguientes fórmulas: Xij = la i – ésima observación resultante a partir del j – ésimo tratamiento (en total existen k tratamientos) 2. Supuestos. Antes de establecer las suposiciones, es necesario especificar el modelo. Para escribir el modelo para el diseño experimental completamente aleatorizado, se utiliza el símbolo xij. El análisis de la varianza unilateral puede escribirse como sigue: xij = μ + Ƭj + eij Los términos de este modelo se describen de la siguiente forma: 10
  • 11. 1. μ representa la media de toda las k - medias poblacionales, y se le conoce 11 como la gran media. 2. Ƭj representa la diferencia entre la media de la j – ésima población y la gran media. Se le conoce como efecto del tratamiento. 3. ejj representa la cantidad en que difieren una medición individual de la media poblacional a la que pertenece. Se le conoce como termino del error. Supuestos de modelo Las suposiciones para el modelo de efectos fijos son las siguientes: a) Los k conjuntos de datos observados forman k muestras aleatorias simples a partir de las poblaciones respectivas. b) Cada una de las poblaciones de las que se extraen las muestras siguen 2 una distribución normal con media μj variancia σj 2 = σ2 c) Cada una de las poblaciones tiene la misma variancia. Es decir, σ j 2 = …. = σk 2 = σ2, variancia común. d) Las Ƭj son constantes desconocidas y ΣƮj = 0, puesto que la suma de todas las desviaciones de μj a partir de su medía, μ, es cero. e) Las eij tienen una media igual a cero, porque la media de xij, es μj. f) Las eij tienen una variancia igual a la variancia de las xij porque las eij y las xij difieren sólo por una constante; es decir, la variancia del error es igual a σ2, la variancia común, especificada en el inciso c. g) Las eij siguen una distribución normal (e independiente). 3. Hipótesis. En un Diseño Completamente Aleatorizado, frecuentemente estamos interesados en contrastar la hipótesis nula de que todas las poblaciones o tratamientos tienen medias iguales, contra la hipótesis alternativa, que dice que al menos un par de poblaciones no tienen medias iguales. Las hipótesis se redactan de la siguiente forma:
  • 12. Ho: 1 = 2 =...= k (Todos los tratamientos tienen el mismo efecto sobre la variable en estudio). HA: 1  2  ... k (No todos los tratamientos tienen el mismo efecto sobre la variable en estudio). Si las medias de las poblaciones son iguales, y el efecto de cada tratamiento es igual a cero, de tal manera que alternativamente, la hipótesis puede escribirse como sigue: H0: Ʈj = 0, j = 1, 2,……,k HA: no todas las Ʈj = 0 12 Nivel de significancia:  (0  1) 4. Estadística de prueba. La estadística de prueba para el análisis de la variancia unilateral es el cálculo de la razón, designada como R.V, Las dos variancias con las que se calcula la R.V. son las mismas variancias calculadas a partir de los datos de la muestra. 5. Distribución de la estadística de prueba. R.V. sigue una distribución F cuando Ho es verdadera y se cumplen las suposiciones. 6. Regla decisión. En general, la regla de decisión es rechazar la hipótesis nula si el valor calculado para R.V. es mayor o igual que el valor crítico de F con nivel α. 7. Calculo del estadístico de prueba. Se definió al análisis de la variancia como un proceso por el que la variación total presente en el conjunto de datos se divide en componentes que son atribuibles a diferentes fuentes. El
  • 13. término variación se utiliza en este contexto para referirse a la suma de desviaciones al cuadrado de las observaciones de su media o suma de cuadrados. Suma total de cuadrados. La suma total de cuadrados es la suma de los cuadrados de las desviaciones de las observaciones individuales a partir de la media de todas las observaciones tomadas juntas. La suma total de cuadrados (SCtotal) se define como: 푆퐶푡표푡푎푙 = Σ Σ(푋푖푗 − 푋̅. . ) 13 2 푛푗 푖 =1 푘 푗=1 Donde Σ푛푗 푖= 1 indica que hay que sumar las desviaciones al cuadrado para cada grupo de tratamiento, y Σ푘푗 =1 indica que hay que sumar los totales de los k grupos que se obtienen al aplicar Σ푛푗 푖=1 . Suma de cuadrado dentro de los grupos. El primer paso para calcular estos componentes es realizar ciertos cálculos dentro de cada grupo. Estos cálculos implican realizar dentro de cada grupo, la suma de las desviaciones al cuadrado de las observaciones individuales, a partir de su media. Después de realizar estos cálculos dentro de cada grupo, se obtiene la suma de los resultados individuales del grupo. A este componente de variación se le llama suma de cuadrados dentro de los grupos y se le designa como SCdentro. La fórmula para calcular es la siguiente: 푆퐶푑푒푛푡푟표 = Σ Σ(푋푖푗 − 푋̅. 푗) 2 푛푗 푖 =1 푘 푗=1 Suma de cuadrados entre los grupos. Se calcula para cada grupo la desviación al cuadrado de la media del grupo a partir de la gran media, y se multiplica el resultado por el tamaño del grupo y se suman los resultados de todos los grupos. Esta cantidad es una medida de la variación entre los grupos y se conoce como suma de cuadrados entre los grupos o SCent re. La fórmula para calcular esta cantidad es como sigue:
  • 14. 푆퐶푒푛푡푟푒 = Σ 푛푗 (푋̅.푗 − 푋̅. . ) .푗) 푛푗 푖 =1 14 푘 푗=1 La suma total de cuadrados es igual a la suma de cuadrados entre los grupos más la suma de los cuadrados dentro de los grupos: SCtotal = SCentre + SCdentro Primera estimación de σ2. La expresión matemática: Σ (̅푋 푖푗 − 푋̅ 푛푗 − 1 Proporciona una estimación insesgada de la variancia real para la población de la cual proviene la muestra. Bajo la suposición de que todas las variancias de la población son iguales, es posible continuar las k estimaciones para obtener: Segunda estimación de σ2 . La segunda estimación de σ2 se puede obtener a partir de la fórmula ya conocida para la variancia de las medias de las muestras, σ2/x = σ2. Si la ecuación es resuelta para σ2, la variancia de la población a partir de la cual se extrajeron las muestras, se tiene
  • 15. Una estimación insesgada de σ2/x, calculada a partir de los datos de la muestra, es proporcionada por: Cuando no todos los tamaños de las muestras son iguales, una estimación σ2 con base en la variabilidad entre las medias de las muestras se obtiene mediante la fórmula: La razón de variancias. Se calcula mediante la siguiente fórmula: 15 푹. 푽 = 푪풖풂풅풓풂풅풐 풎풆풅풊풐 풆풏풕풕풓풆 풍풐풔 품풓풖풑풐풔 푪풖풂풅풓풂풅풐 풎풆풅풊풐 풅풆풏풕풓풐 풅풆 풍풐풔 품풓풖풑풐풔 Si las dos estimaciones son aproximadamente iguales, la R.V será casi igual a 1. Una razón próxima a 1 tiende a poyar la hipótesis de que las medias son iguales para las poblaciones. Si el cuadrado medio entre los grupos es considerablemente mayor que el cuadro medio dentro de los grupos, la R.V será, a su vez, considerablemente mayor que 1. Prueba F: Es una distribución f cuando las varianzas de las muestras se calculan a partir de muestras extraídas de forma independiente y aleatoria de una población que sigue una distribución normal. Esta se usa en la construcción de intervalos de confianza para la varianza de la población y para probar hipótesis acerca de esta.
  • 16. CONSTRUCCIÓN DE LA TABLA DEL ANOVA. Los cálculos que se han efectuado se pueden resumir y mostrar en una tabla conocida como tabla ANOVA. 8. Decisión estadística. Para tomar una decisión es necesario comparar la R.V calculada contra el valor crítico de F, con los correspondientes grados de libertad k – 1 en el numerador y N - k en el denominador. Si el valor calculado para R.V. es mayor o igual que el valor crítico F, la hipótesis nula es rechazada; pero si es menor que el valor crítico de F, no se rechaza la hipótesis nula. 9. Conclusión. Cuando se rechaza H0 se concluye que no todas las medias poblacionales son iguales. Cuando no se rechaza H0 se concluye que proba-blemente todas las medias poblacionales son iguales. 10. Calculo del valor de p. El valor p para la prueba de una hipótesis es la probabilidad de obtener, cuando Ho es verdadera, un valor de la estadística de prueba tan extremo o más (en la dirección adecuada para HA) que el valor calculado en la realidad. 16
  • 17. EJERCICIO En el siguiente ejercicio aplique el procedimiento de los diez pasos de la prueba de hipótesis para analizar las varianzas y ver si es posible concluir que existen diferencias entre las medias de las poblaciones. Sea α = 0.05. Utilice el mismo valor α de para la prueba F. elabore la tabla ANOVA. Szádóczky et al. (A-4) examinaron las características de los sitios de unión de la H-imipramina en pacientes permanentes deprimidos (SAD) y pacientes deprimidos por corto tiempo (no-SAD), así como en individuos sanos (grupo control). Una de las variables en las que se hicieron las mediciones es la densidad de los sitios de unión para la H-imipramina en las plaquetas sanguíneas (Bmáx.). Los resultados son los siguientes: SAD No- SAD CONTROL 634 771 1067 585 546 1176 520 552 1040 525 557 1218 693 976 942 660 204 845 520 807 573 526 731 788 736 1007 846 701 584 867 691 1. Datos. Los datos corresponden a los sitios de unión de la H-imipramina en pacientes permanentes deprimidos (SAD) y pacientes deprimidos por 17
  • 18. corto tiempo (no-SAD), así como en individuos sanos (grupo control). Junto con los totales del tratamiento y las medias. SAD NO-SAD Control Total Total 11661 4939 6288 22888 X 685.94 617.375 1048 2351.315 2. Supuestos. Se supone que los tres grupos de datos forman muestras aleatorias simples e independientes, extraídas de tres poblaciones que son similares excepto por la condición estudiada. Se supone que las tres poblaciones siguen una distribución normal con varianza conocida. 18 3. Hipótesis. Sea α=0.05 Ho: μ1=μ2=μ3 HA: μ1≠μ2≠μ3 4. Estadística de prueba. La estadística de prueba es: 푅. 푉 = 퐶푀푒푛푡푟푒 퐶푀푑푒푛푡푟표 5. Distribución de la estadística de prueba. Si Ho es verdadera y se cumplen las condiciones, entonces R.V sigue una distribución F con los grados de libertad correspondientes, respectivamente, del numerador y denominador (K-1) 3-1=2 y (n-K) 31-3=28. 6. Regla de decisión. Sea α=0.05
  • 19. 0.975 0 4.22 (2,28)F(0.975) Región de aceptación Región de rechazo Regla: Se rechaza la Ho si el valor calculado para R.V es mayor o igual que 4.22 7. Calculo de la estadística de prueba. Comenzamos calculando los totales y los cuadrados de los totales divididos por el número de observaciones: SAD NO-SAD Control Total Σ2⁄푛 Total 11661 4939 6288 22888 16898727.23 푥̅ 685.94 617.375 1048 2351.315 Σ2⁄푛 7998760.059 3049215.125 10589824 17637799.18 Σ푥2 8293177 3429627 6687978 18410782 SCent re= 17637799.18 - 16898727.23= 739072.18 SCdent ro= 18410782 - 17637799.18= 772982.82 19 SCtotal= SCentre+ SCdentro= 1512055 CMent re= SCentre/k-1= 739072.18 / 3-1 739072.18 / 2= 369536.09 CMdent ro= SCdentro/n-1= 772982.82 / 31-3 772982.82 / 28= 26395.435 R.V= CMent re/CMdentro= 369536.09 / 26395.435 = 14
  • 20. 20 TABLA ANOVA FUENTE SC g.l CM R.V Entre muestras 739072.18 2 369536.09 14 Dentro de muestras 772982.82 28 26395.435 Total 1512055 30 8. Decisión Estadística. Debido a que el valor calculado para R.V., 14, es mayor que el valor crítico F, 4.22, se rechaza Ho. 9. Conclusión. Dado que se rechazó Ho, se concluye que la hipótesis alternativa es verdadera. Es decir, se concluye que no todas las medias son iguales. DISEÑO EN BLOQUES COMPLETAMENTE ALEATORIZADO Es aquél en el que: 1.- Las unidades experimentales se distribuyen en grupos o bloques, de manera tal que las unidades experimentales dentro de un bloque sean relativamente homogéneas y que el número de unidades experimentales dentro de un bloque sea igual al número de tratamientos por investigar, y 2.- Los tratamientos se asignan al azar a las unidades experimentales dentro de cada bloque. En lo anterior, la formación de los bloques refleja el criterio del investigador Respecto a las respuestas diferenciales potenciales de las diversas unidades experimentales, mientras que el procedimiento de aleatorización actúa como una justificación de la suposición de independencia. Modelo: Y ij =  i + B i +  j + e ij Suma de  2 Y = M yy + Byy + T yy + E yy
  • 21. Donde: Yij = Valor observado en la i-ésima repetición para el i-ésimo tratamiento.= Efecto de la media general. Bi = Efecto del i-ésimo bloque. j = Efecto del j-ésimo tratamiento eij = Efecto aleatorio del error experimental t = Número de tratamientos. n = Número de repeticiones del í-ésimo tratamiento. OBJETIVO: es aislar y eliminar el término de error la variación atribuible a los bloques, y asegurar que las medias del tratamiento estén libres de los efectos del bloque. La eficacia del diseño depende de la capacidad de conseguir bloques homogéneos de unidades de experimentación. VENTAJAS: se comprende fácilmente, además, algunas complicaciones que podrían surgir en el transcurso de un experimento son fáciles de controlar cuando se utiliza este diseño. EJEMPLO: Un grupo de especialistas en motivación, en un hospital psiquiátrico, condujo un experimento para comparar tres métodos para motivar a los pacientes. Estos fueron agrupados de acuerdo con el nivel de motivación inicial. En cada grupo, los pacientes fueron asignados al azar a los tres métodos. Al final del periodo experimental, un equipo de trabajo formado por un psiquiatra, un psicólogo, una enfermera y un trabajador social evaluaron a los pacientes. Ningún miembro del equipo de evaluación sabía de los métodos que fueron asignados a los pacientes. El equipo asignó a cada paciente una calificación como medida de su nivel de motivación, los resultados son los siguientes: 21
  • 22. Método de motivación A B C TOTAL MEDIA NULO 58 68 60 186 62,00 MUY BAJO 62 70 65 197 65,67 BAJO 67 78 68 213 71,00 PROMEDIO 70 81 70 221 73,67 TOTAL 257 297 263 817 MEDIA 64,25 74,25 65,75 68,08 22 nivel de motivación inicial 1. DATOS: Escogieron al azar a los pacientes de acuerdo con el nivel de motivación inicial los cuales participaran en el experimento. Los métodos de motivación forman tres tratamientos y los cuatro niveles son los bloques. 2. SUPUESTOS: se supone que cada uno de las 12 observaciones forman una muestra aleatoria de tamaño 1 a partir de una de las 12 poblaciones definida por la combinación de bloque y tratamientos. se supone que las respuestas en las 12 poblaciones representadas siguen una distribución normal con variaciones iguales. 3. HIPÓTESIS: Ho: j = 0 j = 1,2,3 HA: no todas las j = 0 Sea α=0.05 4. ESTADÍSTICA DE PRUEBA 푅. 푉 = 퐶푀푡푟푎푡 퐶푀푟푒푠푖푑푢푎푙
  • 23. 5. DISTRIBUCIÓN DE LA ESTADÍSTICA DE PRUEBA Cuando la hipótesis nula es verdadera y las suposiciones se cumplen, 푅. 푉 sigue una distribución de F con 2 y 6 grados libertad. 6. REGLAS DE DECISIÓN Rechazar la hipótesis nula si el valor calculado de 푅. 푉 es mayor o igual que el 23 valor crítico de F. El valor de F es 6,94 1. 0.95 6.94 0 (2,4)F(0.95) Región de aceptación Región de rechazo 7. CALCULO DE LA ESTADÍSTICA DE PRUEBA SCtotal = (58 - 68,08)2 + ( 62 - 68,08)2 +(67 - 68,08)2 +( 70 - 68,08)2 +( 68 - 68,08)2 +(70 - 68,08)2 +(78 - 68,08)2 + (81- 68,08)2 +(60- 68,08)2 +(65 - 68,08)2 +( 68- 68,08)2 +( 70- 68,08)2 = 101.6064 + 36.9664 + 1.1664 + 3.6864 + .0064 + 3.6864 + 98.4064 + 166.9264 + 65.2864 + 9.4864 + .0077 + 3.6864 = 494, 60 SCBloq = 3 [( 62 - 68,08)2 + ( 62 - 68,08)2 + ( 62 - 68,08)2 + ( 62 - 68,08)2 ] = 3 (36.9664 + 5.8081 + 8.5264 + 31.2481) = 3 (82.549) = 247.647 SCtratam = 4 [(64.25 - 68,08)2 + ( 74.25 - 68,08)2 + ( 65.75 - 68,08)2] = 4 (14.6689 + 38.0689 + 5.4289) = 4 * 58.1667 = 232.6668 SCresid = 494, 60 - 247.647 - 232.6668 = 14.285 Los gl son 3 * 4 -1 = 11, bloque 4 – 1 = 3, tratamiento 3 – 1 = 2, (error) residual (4 - 1) (3 - 1) = 6
  • 24. 24 TABLA ANOVA FUENTE SC gl CM RV TRATAMIENTO 494,6 2 247,3000 6,3774 BLOQUES 247,647 3 82,5490 RESIDUALES 232,6668 6 38,7778 TOTAL 974,9138 11 푅. 푉 = 247.300 38.7778 = 6.3774 8. DECISIÓN ESTADÍSTICA: Puesto que la razón de la varianza 6.3774 es menor que 6.94 se acepta la hipótesis nula por lo que no hay evidencia suficiente que indique una difere3ncia entre medias. 9. CONCLUSIÓN Se concluye que todos los efectos de los tratamientos son iguales a cero, o equivalentes, es decir todos los tratamientos son cero. DISEÑOS DE MEDICIONES REPETITIVAS Consiste en medir dos variables en dos muestras distintas de sujetos. Sirve para estudiar el efecto de uno o más factores cuando al menos uno de ellos. Es un factor intra- sujetos; este factor se caracteriza por que todos los niveles del factor se aplican a los mismos sujetos. Los datos este diseño se analiza con la prueba t para las muestras relacionadas. El diseño de medidas repetitivas puede tener más de una medida y de un factor. Para analizar los datos de este diseño podemos utilizar un ANOVA de un factor completamente aleatorizado.
  • 25. El motivo principal para utilizar el diseño de mediciones repetidas es el deseo de controlar la variabilidad entre los individuos estudiados. En este diseño cada individuo sirve como su propio control. Una de las situaciones más usuales que permiten el uso del diseño de mediciones repetidas es cuando el investigador está interesado en respuestas sobre el tiempo. VENTAJAS Requieren menos sujetos que un diseño completamente aleatorizados y Permiten eliminar la variación residual debido a las diferencias entre los sujetos (pues se utilizan los mismos). 25 DESVENTAJAS Es necesario vigilar algunos efectos atribuibles precisamente a la utilización de los mismos sujetos, tales como: Efecto de arrastre: ocurre cuando se administra una condición antes de que haya finalizado el efecto de otra administrada previamente. Efecto de aprendizaje por la práctica: ocurre cuando las respuestas de los sujetos pueden mejorar con la repetición y, como consecuencia de ello, los tratamientos administrados en último lugar parecen más efectivos que los administrados en primer lugar, sin que haya diferencias reales entre ellos (en estos casos es importante controlar el orden de presentación de las condiciones). Obviamente es necesario conocer las ventajas e inconvenientes de estos diseños para decidir correctamente cuando es apropiado utilizarlos. Kabat-zinn. (A-18) diseñaron un estudio para determinar la eficacia de un programa de reducción de estrés con base en la meditación en pacientes con trastornos de ansiedad. Los individuos estudiados fueron seleccionados de entre los que estaban en el programa de relajación y reducción del estrés. Entre los datos que recolectaron los investigadores estaban las calificaciones obtenidas con base en la escala de
  • 26. calificación de la ansiedad de Hamilton, en tres ocasiones diferentes: al momento de reclutamiento inicial (RI), antes del tratamiento (Pre), después del tratamiento (Post) y a los tres meses de seguimiento (3m). Se obtuvieron los siguientes datos correspondientes a los resultados de los 6 individuos. 26 INDIVIDUO RI Pre POST 3-M 1 21 21 16 19 2 30 38 10 21 3 38 19 15 6 4 43 33 30 24 5 35 34 25 10 6 40 40 31 30 1. Datos: ver la tabla 2. Supuestos: se considera que se cumplen los supuestos descritos para el diseño de mediciones repetidas con un solo factor. 3. Hipótesis: Sea α=0.05 Ho: μ1=μ2=μ3 =μ4 HA: μ1≠μ2≠μ3≠μ4 4. Estadística de prueba: la estadística de prueba es: 푅. 푉 = 퐶푀푡푟푎푡 퐶푀푟푒푠푖푑푢푎푙 5. Distribución de la estadística de prueba: la estadística de prueba sigue una distribución F con (k-1) 4-1=3 grados de libertad para el numerador y (n-k) (k-1) (n-1) 23-3-5=15 grados de libertad para el denominador. 1. Regla de decisión: Sea α=0.05 0.95 3.29 0 (3,15)F(0.95) Región de aceptación Región de rechazo
  • 27. El valor crítico de f es 3,29 Regla: se rechaza la Ho si el valor de R.V es mayor o igual que 3,29 27 6. Calculo de la estadística de prueba: INDIVIDUO RI Pre POST 3-M TOTAL MEDIAS 1 21 21 16 19 77 19,25 2 30 38 10 21 99 24,75 3 38 19 15 6 78 19,5 4 43 33 30 24 180 32,5 5 35 34 25 10 104 26 6 40 40 31 30 141 35,25 TOTAL 207 185 127 110 629 MEDIAS 34,5 30,8 21,2 18,3 104,8 Sctotal=150785,57 Sctratamiento=149436,18 Scresidual=1349,39 푅. 푉 = 퐶푀푡푟푎푡 퐶푀푟푒푠푖푑 푢푎 푙 = 149436,18/1349,39=110,74 7. Decisión estadística: se rechaza la Ho porque el valor de R.V=110,74 y este valor es mayor que 3,29 8. Conclusión: se concluye que la hipótesis alternativa es verdadera dado que se rechazó la Ho. Es decir, que no todas las medias son iguales DISEÑO DE MEDICIONES REPETIDAS DE UN SOLO FACTOR El estudio del ANOVA de medidas repetidas es el caso más simple de todos: el modelo de un factor.
  • 28. Los datos que permite analizar este modelo son los procedentes de un diseño con un solo grupo de sujetos y un único factor cuyos niveles se aplican a todos los sujetos. Las distintas medidas, tantas como niveles tiene el factor, se toman sobre los mismos sujetos. De ahí el nombre de medidas repetidas que reciben estos modelos. Supuestos: se deben considerar, los siguientes supuestos en el diseño de mediciones repetidas con un solo factor. Al diseño que cumpla con estos supuestos se le llama diseño aditivo de efectos fijos. 1- Los individuos estudiados forman una muestra aleatoria simple extraida de una población con individuos similares. 2- Cada una de las observaciones es una muestra aleatoria simple e independiente de tamaño 1 extraida de cada una de las kn poblaciones, donde n es el número de individuos y k es el número de tratamientos a los que se expone el individuo. 3- Las kn poblaciones tienen medias potencialmente diferentes, pero todas las poblaciones tienen la misma varianza. 4- Los k tratamientos son fijos, es decir, son los únicos tratamientos respecto a los que se tiene interés en la situación actual. No se pretende hacer inferencias para un conjunto mayor de tratamientos. 5- No hay interacción entre los tratamientos y los individuos. Esto es, los tratamientos y los efectos en los individuos son aditivos. Con frecuencia es posible encontrar que los datos de los experimentos no cumplen con las suposiciones de tratamientos fijos y tratamientos aditivos y efectos sobre los individuos. Modelo: el modelo para el diseño de mediciones repetidas con un solo factor aditivo de efectos fijos es el siguiente: xij = i  + B i +  j + e ij i = 1, 2, ..., n; j = 1, 2, ..., k 28
  • 29. 29 EXPERIMENTOS FACTORIALES Se denomina Experimentos Factoriales, aquellos experimentos en los que se estudia simultáneamente dos o más factores, y donde los tratamientos se forman por la combinación de los diferentes niveles de cada uno de estos. Las variables de interés reciben el nombre de factores, que son características que involucra a dos o más modalidades, variantes o niveles diferentes. Los experimentos factoriales en si no constituyen un diseño experimental si no que ellos deben ser llevados en cualquiera de los diseños tal como D.C.A.; D.B.C.A.; D.C.L. Los experimentos factoriales se emplean en todos los campos de la investigación, son muy útiles en investigaciones exploratorias en las que poco se sabe acerca de muchos factores. Estos pueden ser: a. Cualitativos: Son aquellos en los cuales los niveles describen o expresan una modalidad particular de las cualidades del factor; cada nivel tiene un interés intrínseco o independiente de los otros niveles. Estos factores responden a las características de las variables cualitativas. b. Cuantitativos: Son aquellos cuyos valores corresponden a cantidades numéricas, es decir valores inherentes a una variable cuantitativa. VENTAJAS Se puede estudiar la interacción de factores, efectos simples y efectos cruzados.
  • 30. Todas las unidades experimentales intervienen en la determinación de los efectos principales y de los efectos de interacción de los factores, por lo que el número de repeticiones es elevado para estos casos. El número de grados de libertad para el error experimental es alto, comparándolo con los grados de libertad de los experimentos simples de los mismos factores, lo que contribuye a disminuir la variancia del error experimental, aumentando por este motivo la precisión del experimento. 30 DESVENTAJAS Se requiere un mayor número de unidades experimentales que los experimentos simples y por lo tanto se tendrá un mayor costo y trabajo en la ejecución del experimento. Como en los experimentos factoriales c/u de los niveles de un factor se combinan con los niveles de los otros factores; a fin de que exista un balance en el análisis estadístico se tendrá que algunas de las combinaciones no tiene interés práctico pero deben incluirse para mantener el balance. El análisis estadístico es más complicado que en los experimentos simples y la interpretación de los resultados se hace más difícil a medida de que aumenta el número de factores y niveles por factor en el experimento. En general los diseños factoriales son los más eficientes para este tipo de experimentos. Por ejemplo, si existen “a” niveles del factor A y “b” niveles del factor B, entonces cada réplica del experimento contiene todas las “ab” combinaciones de
  • 31. los tratamientos. A menudo, se dice que los factores están cruzados cuando éstos se arreglan en un diseño factorial. Hay dos razones fundamentales para incluir un factor en un experimento. La primera y más obvia es que nos interese conocer y medir su efecto, con el fin de mejorar un producto. La segunda es simplemente para reducir la variabilidad no explicada. Esta segunda razón nos llevaría a incluir factores en el análisis que en principio no nos interesa cuantificar su efecto. A este segundo tipo de factores se les denomina bloque, aunque a efectos de cálculo su tratamiento no varía respecto del resto de los factores. Los factores serán variables discretas, que pueden tomar un número finito de estados o niveles. La variable respuesta seguirá siendo una variable aleatoria continua. El objetivo es determinar si el valor medio de la variable respuesta cambia al cambiar el nivel de un factor. A través de las siguientes graficas se pude observar la interacción o no de los 31 factores estudiados. Figura 2. Un experimento factorial con interacción. En el primer nivel del factor B, el efecto de A es: A = 50 - 20 = 30 Mientras que en el segundo nivel de B, el efecto de A es: A = 12 - 40 = 28 Puede observarse que existe una interacción entre los factores A y B porque el efecto de A depende del nivel elegido de B.
  • 32. Estas ideas pueden ilustrarse gráficamente. En la Fig. 1 se muestra una gráfica de la respuesta de los datos de la Tabla 1 contra los niveles del factor A para ambos niveles del factor B. Se observa que las rectas B1 y B2 son, aproximadamente, paralelas. Esto indica que no hay interacción entre los factores. De manera similar, en la Fig. 2 se presenta una gráfica de la respuesta de los datos de la Tabla 2. 60 50 40 30 20 B2 B1 Figura 1 Un experimento factorial sin interacciones B1 En este caso se ve que las rectas B1 y B2 no son paralelas. Esto muestra que existe una interacción entre A y B. Sin embargo, no debe ser la única técnica para analizar los datos, porque su interpretación es subjetiva y su apariencia, a menudo, es engañosa. 60 50 40 30 20 B1 Figura 2. Un experimento factorial con interacciones 32 10 A1 A2 B2 Respuesta Factor A 10 A1 A2 B2 B1 B2 Respuesta Factor A
  • 33. Hay que notar que cuando una interacción es grande los correspondientes efectos principales tienen poco significado práctico. Una estimación del efecto principal de A de los datos de la Tabla 2 es: 1 33 20 40 A  2 50 12 2     El cual resulta ser muy pequeño corriéndose el riesgo de concluir que no existe un efecto debido a A. Sin embargo, cuando se examinó el efecto de A en niveles diferentes de B se concluyó que éste no era el caso. El factor A tiene un efecto, pero depende del nivel del factor B. En otras palabras, es más útil conocer la interacción AB que el efecto principal. Una interacción significativa oculta a menudo el significado de los efectos principales. A continuación se señala el análisis de un experimento factorial por medio de un diseño completamente aleatorizado por dos factores: 1. Datos. Estos se presentan en forma tabular. 2. Supuestos. Para analizar estos datos, se supone un modelo de efectos fijos y un diseño completamente aleatorizado para dos factores. Supuestos para el modelo: a. Las observaciones en cada una de las ab celdas constituyen una muestra aleatoria independiente de tamaño n, extraída de una población definida por la combinación particular. b. Cada una de las ab poblacionales siguen una distribución normal. c. Todas las poblaciones tienen la misma variancia. 3. Hipótesis. Las siguientes hipótesis pueden ser probarse: a) H` 0 : ∝i= 0
  • 34. H` 34 A : no todas la ∝i= 0 b) H`` 0: βj = 0 H`` A : no todas las βj = 0 c) H``` 0: (∝ β)ij = 0 H``` A : no todas las (∝ β)ij = 0 Se da valor a α 4. Estadística de prueba: la estadística de prueba para cada conjunto de hipótesis se obtiene a través de la fórmula de la razón de la varianza (R.V), es decir: (R. V)A = S2 1 S2 (R. V)B = S2 2 S2 (R. V)AB = S2 3 S2 5. Distribución de la estadística de prueba: Cuando la hipótesis nula es verdadera y se cumplen las suposiciones, cada una de las estadísticas de prueba sigue una distribución F. 6. Regla de decisión. Cuando se rechaza la hipótesis nula si el valor calculado de la estadística de prueba es mayor o igual que el valor critico de F 7. Cálculo de la estadística de prueba: Mediante una adaptación del procedimiento que se utiliza para dividir la suma total de cuadrados en el diseño completamente aleatorizado, se puede demostrar que la suma total de cuadrados bajo el presente modelo puede dividirse en dos términos: Las formulas de cálculos para los diversos componentes son los siguientes:
  • 35.  푠푐푡표푡푎푙 = Σ Σ Σ 푥 2 푖푗푘 − 푐 푛푘 =1 35 푏푗 =1 푎푖 =1  푠푐 푡푟푎푡 = Σ Σ 푇2 푖푗 푏푗 =1 푎푖 =1 푛 −C  SCA= Σ 푇2 푖 푎 푖=1 푏.푛 –c  SCB= Σ 푇2 푗 푏 푗=1 푎 .푛 –c  SC(AB)= 풔풄풕풓풂풕 − SCA SCB  SC푟푒푠푖푑푢푎푙 = 풔풄풕풐풕풂풍 − 풔풄풕풓풂풕 8. Decisión estadística: si se cumplen las suposiciones establecidas al principio, y si cada hipótesis es verdadera, se puede demostrar que la variancia sigue una distribución F, con su grado de libertad indicado. Se rechaza la hipótesis nula (Ho) si los valores calculados para R.V. son mayores o iguales que los valores críticos correspondientes como lo determinan los grados de libertad y los niveles de significación seleccionados. 9. Conclusión: si se rechaza Ho, se concluye que HA es verdadera. Si no se rechaza Ho, se concluye que Ho puede ser verdadera. 10. Valor de P. Ejercicio: Ejemplo: Diseño completamente aleatorizado por dos factores.
  • 36. En un experimento llevado a cabo con el propósito de evaluar los efectos del trabajo de parto en la producción y utilización de glándulas. Los individuos estudiados eran 6 mujeres embarazadas. Entre los datos recolectados están las siguientes concentraciones de glucosa durante cuatro fases de trabajos de parto: latente (A1) y activa (A2) de dilatación cervical, expulsión de fetal (B), y expulsión de la placenta (C) que comprende 48 muestras independientes. En el experimento se obtuvieron observaciones duplicadas de promedios en cada combinación de los tratamientos. Utilícese un nivel de significación de 0,05 para probar las siguientes hipótesis: 1. ¿Existe concentración de glucosa durante las cuatro fases de trabajo de parto? 2. ¿Bajo concentración de glucosa en las mujeres embarazadas? 3. ¿Existe interacción entre las mujeres embarazadas en de trabajo de parto y la 36 concentración de glucosas? Tabla 1: Concentración de glucosa. Mujeres embarazadas A1 A2 B C 1 1.6 2.0 1.2 3.2 2.3 3.0 4.2 2.0 2 2.03 1.5 2.1 1.6 1.1 3.0 1.8 2.0 3 2.02 2.0 2.6 2.2 3.4 2.0 2.27 3.3 4 1.8 3.1 2.33 3.0 3.30 3.0 4.1 2.1 5 2.60 2.05 3.05 3.05 3.4 3.5 2.06 2.0 6 1.97 2.0 3.2 2.0 2.9 2.0 2.5 2.1
  • 37. 퐓퐚퐛퐥퐚 ퟐ : Concentración de Glucosa. 37 Mujeres embarazadas A1 A2 B C TOTALES MEDIAS 1 3.60 4.40 5.30 6.20 19.50 4.88 2 3.53 3.70 4.10 3.80 15.13 3.78 3 4.02 4.80 5.40 5.27 19.49 4.87 4 4.90 5.33 6.30 6.20 22.73 5.68 5 4.06 4.65 6.10 6.90 21.71 5.43 6 3.97 5.20 4.90 4.60 18.67 4.67 TOTALES. 24.08 28.08 32.10 32.97 117.23 29.31 MEDIAS 4.01 4.68 5.35 5.50 19.54 4.89 Solución: 1. Datos: Los datos acerca de La concentración de glucosa en mujeres embarazadas se obtuvieron durante el análisis que se muestra en la tabla 1. 2. Supuestos: a) Las observaciones en cada una de los datos constituyen una muestra aleatoria independiente de tamaño 48, extraída de una población definida por la combinación particular de los factores. b) Cada una de las a.b sigue una distribución normal. c) Todas las poblaciones tienen la misma variancia. 3. Hipótesis d) H` 0 : ∝1=∝2=∝3=∝4= 0 H` A :Al menos una de las ∝i no es igual a cero
  • 38. 38 e) H`` 0: β1 = β2 = β3 = β4 = 0 H`` A : Al menos una de las βi no es igual a cero f) H``` 0: (∝ β)11 = (∝ β)12 = (∝ β)13 = ⋯ . = (∝ β)34 = 0 H``` A : Al menos una de las (∝ β)ij no es igual a cero Sea α=0.05 4. Estadística de prueba: La estadística de prueba para cada conjunto de hipótesis se obtiene a través de la fórmula de la razón de la variancia (R.V), es decir: (R. V)A = S2 1 S2 (R. V)B = S2 2 S2 (R. V)AB = S2 3 S2 5. Distribución de la estadística de prueba: Cuando la hipótesis nula es verdadera y se cumplen las suposiciones, cada una de las estadísticas de prueba sigue una distribución F. 6. Regla de decisión. Cuando se rechaza la hipótesis nula si el valor calculado de la estadística de prueba es mayor o igual que el valor critico de F, para probar las tres hipótesis nulas donde los valores críticos de F son los siguientes: 2.45, 2.84 y 1.92 respectivamente. Puesto que los grados de libertad es igual 48 en el denominador y los grado de libertad del numerador a-1; 6-1=5, b-1; 4-1=3 y a.b= (a- 1)(b-1); (6-1)(4-1)= 15. 7. Cálculo de la estadística de prueba: Las formulas de cálculos para los diversos componentes son los siguientes:  푠푐푡표푡푎푙 = Σ Σ Σ 푥 2 푖푗푘 − 푐 푛푘 =1 푏푗 =1 푎푖 =1
  • 39. 39 Donde 푐 = 푛 푘=1 푏 푗=1 푎 푖=1 (Σ Σ Σ 푥푖푗푘 2 ) 푎.푏.푛 ; 푐 = (117 .23)2 48 = 286.31 풄 =286, 31 n=2; a=6 y b=4 푠푐푡표푡푎푙 = (1.6)2 + (1.2)2 + (2.3)2 + (4.2)2 + ⋯ + (2.1)2 − 286.31 푠푐푡표푡푎푙 = 313,74 − 286.31 풔풄풕풐풕풂풍 = ퟐퟕ, ퟒퟑ  푠푐 푡푟푎푡 = Σ Σ 푇2 푖푗 푏푗 =1 푎푖 =1 푛 −C 푠푐푡푟푎푡 = (3.60)2 + (4.40)2 + (5.30)2 + ⋯ (4.90)2 + (4.60)2 2 − 퐶 푠푐푡푟푎푡 = 593.80 2 − 퐶 = 296.9 − 286.31 = 10.59 풔풄풕풓풂풕 = ퟏퟎ. ퟓퟗ  SCA= Σ 푇2 푖 푎 푖=1 푏.푛 –c SCA= (19.50)2+(15.13) 2+(19.49 )2(22.73) 2+(21.71)2+(18,67)2 8 _ 286,31 SCA= 2325 .57 8 − 286,31 = 4.39 SCA= 4.39  SCB= Σ 푇2 푗 푏 푗=1 푎 .푛 –c
  • 40. 40 SCB= 290.40 − 286,31 = 4.17 SCB= 4,17  SC(AB)= 풔풄풕풓풂풕 − SCA SCB SC (AB)= 31,20 − 4,39 − 4,17 SC (AB)= 22,64  SC푟푒푠푖푑푢푎푙 = 풔풄풕풐풕풂풍 − 풔풄풕풓풂풕 SC푟푒푠푖푑푢푎푙 = 27,43 − 10,59 퐒퐂풓풆풔풊풅풖풂 풍 = ퟏퟔ, ퟖퟒ Para hallar los valores críticos es necesario hacer los siguientes cálculos:  s2 = 퐒퐂풓풆풔풊풅풖풂풍 푎.푏(푛−1) 푠2 = 16,84 48 = 0,35  푠2 1 = 푆퐶퐴 푎 −1 푠2 1 = 4,39 5 = 0,88  푠2 2 = 푆퐶퐵 푏−1 푠2 2 = 4.17 3 = 1,39  푠2 3 = 푆퐶 (퐴퐵) (푎−1)(푏−1) 푠2 3 = ퟐퟐ, ퟔퟒ 15 = 1,51 Para probar la hipótesis nula, de que los efectos de los factores A, B y AB son todos iguales que ceros, se calcula la razón de la varianza.
  • 41. 41 (R. V)A = S2 1 S2 (R. V)B = S2 2 S2 (R. V)AB = S2 3 S2 (퐑. 퐕)퐀 = ퟎ. ퟖퟖ ퟎ, ퟑퟓ = ퟐ, ퟓퟏ (퐑. 퐕)퐁 = ퟏ, ퟓퟏ ퟎ, ퟑퟓ = ퟒ. ퟑퟏ (퐑. 퐕)퐀퐁 = ퟏ, ퟑퟗ ퟎ, ퟑퟓ = ퟑ, ퟗퟕ Conclusión De acuerdo con los resultados de la Razón de la Variancia, los valores del estadístico de prueba son mayores que los valores críticos de F, por lo tanto, se rechazan las tres hipótesis nulas. a) Se Rechaza H` 0. b) Se Rechaza H`` 0. c) Se Rechaza l H``` 0.
  • 42. CONCLUSIÓN Una vez terminado la monografía de análisis de varianza se pudo llegar a las siguientes conclusiones:  El Análisis de la varianza y sus procedimientos, se aplican en todas las ciencias tanto puras como sociales, tales como: en la Geografía, Matemática, Economía, Política, Administración, Contaduría, Educación, Industrias, Medicinas, Agriculturas, en la Ingeniería y al Gobiernos, entre otras. El análisis de la varianza nos permite decidir cuál es la alternativa más adecuada que permita llevar a una solución satisfactoria del problema de investigación.  El ANOVA permite decidir los distintos niveles de factores que se establecen en las diferentes poblaciones o analizar, el comportamiento de ésta misma para todos los niveles en función de las poblaciones estudiadas.  El análisis de la varianza permite determinar si existe o no diferencias estadísticas significativas entre medias cuando se tiene más de dos muestras o más de dos grupos en el mismo planteamiento.  El análisis de varianza nos permite comparar el valor crítico de F con los resultados del estadístico de prueba y allí poder tomar decisiones de rechazar o no la hipótesis nula. 42
  • 43. BIBLIOGRAFÍA Analisis de Varianza con medidas repetidas. El procedimiento MGL.Medidas Repetidas. WWW.ucm.es/...es/analisis-datos y multivariable/16anovar-spss.pdf. De Benitez Celia. (2010) ANÁLISIS DE LA VARIANCIA EN EXPERIMENTOS FACTORIALES. Extraído de la pagina web: http://fcf.unse.edu.ar/archivos/series-didacticas/ sd-21-estadistica.pdf [Consultada: 2012, marzo 15] Echeverría, Hernán. Diseños de bloques al azar 8 articulo en línea, consultado en: http://es.scribd.com/doc/262706/bloques200601 Instituto de investigación en matemáticas aplicadas y sistemas. Diseño de Experimentos. UNAM. Mtra. Patricia Romero Mares. WWW.dpye.iimas.unam.mx/fimalis2003/ayuda academica.ppt.cap.16. Pérez de Vargas, Alberto. Proyecto de innovación educativa 2003/4 guión electrónico-interactivo de prácticas de la asignatura de bioestadística, consultado en: http://e-stadistica.bio.ucm.es/glosario2/anova.html Torres, Virena y otros. Modelos de estadísticos para el procesamiento de experimentos con mediciones repetidas en la misma unidad experimental. Robert G. Steel,(1998). Bioestadística Principio y Procedimientos. Segunda Edición. McGraw-HILL/ Interamericana de Mexico, S.A. de C.V Ronald, E. Walpole; Raymond, H. Myers. (1992). Probabilidad y Estadística. Tercera Edición. Editorial McGraw-HILL/ Interamericana de Mexico , S.A. de C.V 43
  • 44. Soto, Lauro. Diseño aleatorizado por bloques completos (articulo en línea) consultado en: http://www.mitecnologico.com/Main/Dise%F1osEnBloquesCompletosAlAzar. Tamayo, Ignacio Martin. Análisis de varianza con medidas repetidas de un solo factor, consultado en: http://www.ugr.es/~imartin/TEMA5_ANOVA.pdf Wayne, D. y León, F (2002) Bioestadística: Base para el Análisis de las Ciencias de la Salud (4º ed.). México: LIMUSA www.ucm.es/info/socivmyt/paginas//analisisdevarianza/16anovar_SPSS.pdf www.dm.udc.es/asignaturas/estadistica2/sec5_2.html www.slidefinder.net/D/DISE%C3%91O_ANALISIS/30325052 44