Este documento describe diferentes diseños de análisis de varianza (ANOVA) como el diseño completamente aleatorizado y el diseño en bloques completamente aleatorizado. Explica los pasos para realizar la prueba de hipótesis en un diseño completamente aleatorizado y sus características principales. También cubre conceptos como diseños de mediciones repetidas y experimentos factoriales, resaltando sus ventajas y desventajas.
Descripción de los estadísticos de prueba para diferentes casos de hipótesis en una y dos poblaciones. Para casos de varianzas conocidas y casos de varianzas desconocidas. Para casos de muestra dependientes y muestras independientes.
Solucionario estadistica descriptiva iv Albert Rojas
LIBRO: ESTADISTICA PARA LA ADMINISTRACION
AUTOR: DAVID M. LEVINE
CAPITULO 9: FUNDAMENTOS DE LA PRUEBA DE HIPOTESIS
* 9.1 Metodologia de de la prueba de hipotesis
* 9.2 Prueba Z hipotesis para la media
* 9.3 Pruebas de una cola
* 9.4 Prueba T de hipotesis para la media
* 9.5 Prueba Z de hipotesis para la proporcion
Trabajo de ESTADISTICA APLICADA ULADECH III CICLO
La oficina de investigación de mercados S.A., basa sus tarifas en la hipótesis de que las preguntas de una encuesta telefónica se pueden contestar en un tiempo medio de 15 minutos o menos. Si es necesario un mayor tiempo de encuesta, se aplica una tarifa adicional. Suponga que en una muestra de 35 conferencias se obtiene una media de 17 minutos y una desviación estándar de 4 minutos. ¿Se justifica a tarifa adicional?
a) Formule las hipótesis nula y alternativa para esta aplicación
b) Calcule el valor del estadístico de prueba
c) ¿Cuál es el valor de P?
d) Con α = 0.01, ¿cuál es su conclusión?
Un dispensador de gaseosas está diseñado para descargar 7 onzas. Si se selecciona una muestra de 16 vasos para medir su llenado, observando que el promedio es de 5.8 con uns desviación de 1.6 onzas ¿se puede concluir que la máquina no funciona correctamente?
Una distribuidora de gas ofrece a sus clientes el servicio de un máximo de espera de 48 horas. Se toma una muestra de seis hogares que hicieron pedidos y se encontró lo siguiente: 24, 20, 60, 72, 40, 30, ¿se puede creer lo ofrecido por la distribuidora?
Descripción de los estadísticos de prueba para diferentes casos de hipótesis en una y dos poblaciones. Para casos de varianzas conocidas y casos de varianzas desconocidas. Para casos de muestra dependientes y muestras independientes.
Solucionario estadistica descriptiva iv Albert Rojas
LIBRO: ESTADISTICA PARA LA ADMINISTRACION
AUTOR: DAVID M. LEVINE
CAPITULO 9: FUNDAMENTOS DE LA PRUEBA DE HIPOTESIS
* 9.1 Metodologia de de la prueba de hipotesis
* 9.2 Prueba Z hipotesis para la media
* 9.3 Pruebas de una cola
* 9.4 Prueba T de hipotesis para la media
* 9.5 Prueba Z de hipotesis para la proporcion
Trabajo de ESTADISTICA APLICADA ULADECH III CICLO
La oficina de investigación de mercados S.A., basa sus tarifas en la hipótesis de que las preguntas de una encuesta telefónica se pueden contestar en un tiempo medio de 15 minutos o menos. Si es necesario un mayor tiempo de encuesta, se aplica una tarifa adicional. Suponga que en una muestra de 35 conferencias se obtiene una media de 17 minutos y una desviación estándar de 4 minutos. ¿Se justifica a tarifa adicional?
a) Formule las hipótesis nula y alternativa para esta aplicación
b) Calcule el valor del estadístico de prueba
c) ¿Cuál es el valor de P?
d) Con α = 0.01, ¿cuál es su conclusión?
Un dispensador de gaseosas está diseñado para descargar 7 onzas. Si se selecciona una muestra de 16 vasos para medir su llenado, observando que el promedio es de 5.8 con uns desviación de 1.6 onzas ¿se puede concluir que la máquina no funciona correctamente?
Una distribuidora de gas ofrece a sus clientes el servicio de un máximo de espera de 48 horas. Se toma una muestra de seis hogares que hicieron pedidos y se encontró lo siguiente: 24, 20, 60, 72, 40, 30, ¿se puede creer lo ofrecido por la distribuidora?
Se resalta la importancia de las pruebas de bondad de ajuste en la selección de la distirbución que mejor representa la serie histórica de datos, de modo de seleccionarla para la estimación de valores extremos. Se revisa en detalle las pruebas de Chi-Cuadrado y Kolmogorov-Smirnov
productos de construcción ecológico fabricado con materiales reciclados como: residuo de escombros de construcciones , sedimento de Chavimochic , tecnopor, pajilla de arroz, ceniza de bagazo de caña de azúcar entre otros y otros agregados.
El ANOVA es un método muy flexible que permite construir modelos estadísticos para el análisis de los datos experimentales cuyo valor ha sido constatado en muy diversas circunstancias. Básicamente es un procedimiento que permite dividir la varianza de la variable dependiente en dos o más componentes, cada uno de los cuales puede ser atribuido a una fuente (variable o factor) identificable.
La prueba estadística Análisis de Varianza es una extensión de la Prueba T de Student, cuando se tiene más de dos grupos a los que se quiere comparar los promedios. Cuando solo interviene una variable independiente en el estudio se denomina ANOVA de un factor. Se realiza una prueba estadística que permite determinar si existe una diferencia significante de rendimiento entre más de dos técnicas de enseñanza, el procedimiento aporta pruebas de comparaciones múltiples o “post hoc” para establecer entre cuales pares de promedios se encuentran la diferencia significativa.
Caracteristicas de la prueba ANOVA.
1. Mide la fuente de variación entre los datos y compara sus tamaños. Variación entre grupos.
2. Para cada valor evalúa la diferencia entre las media de sus grupo y la media global.
Variación dentro de los grupos .
3. Para cada valor se evalúa la diferencia entre ese valor y la media de sus grupo.
4. Cada conjunto de datos debe ser independiente del resto.
5. Los resultados obtenidos para cada conjunto deben seguir una distribución normal.
6. Las varianzas de cada conjunto de datos no deben diferir de forma significativa
Procedimiento de análisis de varianza.
1. Si se muestrean k poblaciones, entonces los gl (numerador) = k – 1
2. Si hay un total de N puntos en la muestra, entonces los gl (denominador) = N – k
3. El estadístico de prueba se calcula con: F = CM inter grupos / CM intra grupos.
CM son los cuadrados medios o media cuadrática.
4. Los CM se obtienen dividiendo la suma de cuadrados entre sus grados de libertad respectivos
5. Hipótesis nula: las medias de las poblaciones son iguales. H0: μ1 = μ2=…
6. Hipótesis alterna: al menos una de las medias es diferente. H0: μ1≠μ2
7. Estadístico de prueba: F = (variancia entre muestras)/(variancia dentro de muestras).
8. Regla de decisión: para un nivel de significancia α, la hipótesis nula se rechaza si F es mayor
Supuestos del modelo del análisis de varianza:
Para aplicar la técnica del análisis de varianza es necesario que se cumplan las siguientes suposiciones sobre los datos investigados:
1. Las varianzas de las k poblaciones son iguales. (supuesto de homocedasticidad)
2. Las características medibles se distribuyen normalmente en cada población.
3. Las características medibles son estadísticamente independientes de una población a
otra.
4. Las muestras n1, n2,...,nk de los k grupos poblacionales son seleccionadas mediante un muestreo aleatorio simple.
De estos supuestos el más importante es el citado en primer lugar, el cual asume que las varianzas poblacionales son iguales para todos l
IMÁGENES SUBLIMINALES EN LAS PUBLICACIONES DE LOS TESTIGOS DE JEHOVÁClaude LaCombe
Recuerdo perfectamente la primera vez que oí hablar de las imágenes subliminales de los Testigos de Jehová. Fue en los primeros años del foro de religión “Yahoo respuestas” (que, por cierto, desapareció definitivamente el 30 de junio de 2021). El tema del debate era el “arte religioso”. Todos compartíamos nuestros puntos de vista sobre cuadros como “La Mona Lisa” o el arte apocalíptico de los adventistas, cuando repentinamente uno de los participantes dijo que en las publicaciones de los Testigos de Jehová se ocultaban imágenes subliminales demoniacas.
Lo que pasó después se halla plasmado en la presente obra.
1. UNIVERSIDAD DE ORIENTE
NÚCLEO DE SUCRE
ESCUELA DE HUMANIDADES Y EDUCACIÓN
DPTO. DE PSICOLOGÍA E INVESTIGACIÓN EDUCATIVA
ALTERNATIVA DE GRADO: ESTADÍSTICA II
ANÁLISIS DE VARIANZA
Prof. : INTEGRANTES:
MONDRAGÓN J. CARIACO, JESUS
1
MARVAL, MARIA
RUIZ, JOAN
RATIA, ANA
ESPINOZA, EDGAR
HENRÍQUEZ, LUISA
SEC: 2
CUMANÁ, ABRIL DE 2012
2. ÍNDICE
2
PÁG.
Introducción…………………………………………………………………… iii
Análisis de varianza (ANOVA)……………………………………………….. 5
¿Por qué utilizamos el análisis de varianza en vez de la t de student?............... 5
Procedimiento de ANOVA…………………………………………………… 6
Diseño completamente aleatorizado (DCA).…………….………...………….. 7
Características Principales….……..…………………………………….. 8
ANOVA unilateral…………………………………………..………….. 9
Pasos para la prueba de hipótesis en un diseño completamente aleatorizado… 10
Diseño en bloques completamente aleatorizado………………………………. 20
Objetivos………………………………………………………………… 21
Ventajas………………………………………………………………….. 21
Para la prueba de hipótesis se siguen diez pasos……………………....... 22
Diseño de mediciones repetidas…………………………………………….… 24
Ventajas…………………….……………………………………….… 25
Desventajas…………..………………………………………………… 25
Diseño de mediciones repetidas con un solo factor ………………………….. 27
Experimento factorial………………………………………………………… 29
Ventajas. ……………………………………..………………………… 29
Desventajas. …………………………….……………………………… 30
Conclusión ………………………….………………………………………… 42
Bibliografía………………………………………………………………….…. 43
3. INTRODUCCIÓN
La varianza es una constante que representa una medida de dispersión media
de una variable aleatoria X, respecto a su valor medio o esperado. Puede interpretarse
como medida de “variabilidad” de la variable.
Las técnicas englobadas bajo la denominación de análisis de la varianza o
abreviadamente ANOVA (del inglés analysis of variance) han jugado un papel crucial
en la metodología estadística moderna, desde que fueran ideadas por Sir Ronald
Fisher en la década de los años veinte.
Casi siempre se introduce el tema del análisis de la varianza como respuesta a
la necesidad de utilizar una técnica de comparación de más de dos grupos, es decir
como un método para comparar más de dos tratamientos: si disponemos de medidas
cuantitativas continuas, que se puede suponer como procedentes de una distribución
de probabilidad normal, y queremos comparar dos grupos −dos tratamientos−, la
prueba estadística que se utiliza es un contraste de medias basado en la t de Student, y
cuando se dispone de más de dos grupos, la prueba a emplear es el análisis de la
varianza.
El análisis de variancia es una técnica que se usa para probar hipótesis acerca
de las medias de diferentes tratamientos que se ensayan (Daniel 1984). Para que esto
sea posible, las medias que se determinan tienen que provenir de mediciones sobre
muestras independientes. Además permite el control de α a un nivel predeterminado
cuando se prueba la igualdad de J medias del grupo, donde J ≥ 2. En ANOVA, las
medias se examinan simultáneamente para evaluar la posibilidad de que todas las J
medias de muestreo provengan de la misma población (es decir, poblaciones con
idénticos parámetros). En otras palabras, los procedimientos ANOVA se pueden usar
para determinar si es o no razonable concluir que no todas la J medias del muestreo
provienen de la misma población.
3
4. Para ANOVA, la hipótesis nula es una sola pero incluye todas las hipótesis:
Ho: μ1=μ2=…=μJ
En otras palabras, el análisis de varianza lo vamos a utilizar para verificar si
hay diferencias estadísticamente significativas entre medias cuando tenemos más de
dos muestras o grupos en el mismo planteamiento. En estos casos no utilizamos la t
de Student que solamente es un procedimiento válido cuando comparamos
únicamente las medias de dos muestras.
4
5. ANÁLISIS DE VARIANZA (ANOVA)
El análisis de la varianza tiene amplias aplicaciones en el análisis de datos
derivados de experimentos, este se utiliza también, para cumplir 2 objetivos:
Estimar y probar hipótesis respecto a las varianzas de las poblaciones.
Estimar y probar hipótesis respecto a las medidas de las poblaciones.
La hipótesis nula que se prueba en el ANOVA es que la mayoría de las
poblaciones que se estudian (al menos tres) tienen el mismo valor de la media para la
variable dependiente. Las hipótesis nulas y alternativa en ANOVA son:
5
H0: X1 = X2 = X3 =... = X c
HA: No todas las poblaciones tienen la misma media.
¿POR QUÉ UTILIZAMOS EL ANÁLISIS DE VARIANZA EN VEZ DE LA T
DE STUDENT?
Cuando tenemos dos muestras y queremos comprobar si difieren
significativamente (si proceden de la misma población con una única media)
utilizamos la t de Student. Cuando tenemos más de dos grupos utilizamos el análisis
de varianza: ¿No podríamos comparar todos los grupos de dos en dos con la t de
Student? A primera vista parecería lo más lógico, sin embargo no se hace así por una
serie de razones que exponemos a continuación:
1º La razón más importante (y suficiente) para no utilizar la t de Student con más de
dos grupos es que, al hacer muchas comparaciones de dos en dos, aumenta la
probabilidad de que algunas diferencias resulten significativas por azar y entonces
cabe la posibilidad de afirmar que hay una diferencia (de no aceptar la hipótesis nula)
cuando realmente no la hay.
6. Si por ejemplo tenemos tres grupos podríamos hacer tres comparaciones: entre el 1º y
el 2º, entre el 1º y el 3º y entre el 2º y el 3º. Operando con un nivel de confianza de α
=0.05, la probabilidad de encontrar al menos una diferencia significativa por azar es
de hecho del 9.75% y no del 5%. Como se evidencia, se incrementa dramáticamente
la probabilidad (α) de cometer un error de tipo I. Cuando se realiza más de una
prueba t, la probabilidad de uno o más errores de tipo I es mayor que el nivel α
establecido.
2º Otra razón adicional es que una prueba estadística basada en todos los datos
utilizados simultáneamente, es más estable que la prueba o análisis que parcializa los
datos y no los examina todos juntos. El error típico (que expresa la variación en las
medias que podemos encontrar en diversas muestras) es menor cuando el número de
sujetos es mayor, como sucede cuando se analizan todos los datos de todos los grupos
simultáneamente. En principio es preferible utilizar un método de análisis global que
abarque todos los datos que se quieren examinar.
3º El ahorro de tiempo es otra razón muy importante, aunque en sí misma no es una
razón válida. El número de comparaciones de dos en dos de k elementos es igual a k
por lo cual se ahorraría mucho tiempo al trabajar con el ANOVA.
PROCEDIMIENTO DE ANOVA.
Para aplicar el análisis de varianza a un estudio se siguen diez pasos:
1. Descripción de datos.
2. Supuestos.
3. Hipótesis.
4. Estadística de prueba.
5. Distribución de la estadística de prueba.
6. Regla de decisión.
7. Calculo de la estadística de prueba.
6
7. 7
8. Decisión de estadística.
9. Conclusión.
10. Cálculo del valor p (Probabilidad)
DISEÑO COMPLETAMENTE ALEATORIZADO (DCA)
Este diseño consiste en la asignación de los tratamientos en forma
completamente aleatoria a las unidades experimentales (individuos, grupos, parcelas,
jaulas, animales, insectos, entre otros). Debido a su aleatorización irrestricta, es
conveniente que se utilicen unidades experimentales de lo más homogéneas posibles:
animales de la misma edad, del mismo peso, similar estado fisiológico; parcelas de
igual tamaño, entre otros, de manera de disminuir la magnitud del error experimental,
ocasionado por la variación intrínseca de las unidades experimentales. Este diseño es
apropiado para experimentos de laboratorio, invernadero, animales de bioterio, aves,
conejos, cerdos, entre otros, es decir, situaciones experimentales como de las
condiciones ambientales que rodean el experimento.
En este diseño, los tratamientos en estudio se distribuyen al azar en todas las
unidades experimentales; siendo el número de repeticiones por tratamiento igual o
diferente. Este diseño se emplea cuando la variabilidad en todo el material
experimental es relativamente pequeña y uniformemente distribuida.
Se debe tener presente que la aleatorización estadística es un procedimiento
puntual, en el cual se les asigna a las unidades observadas un grupo de control
o tratamiento de una manera que toma en consideración la influencia potencial de las
variables confundidas. Esto permite cuantificar la influencia de estas variables
confundidas al observarlas en ambos grupos de control y de tratamiento. La
aleatorización se lleva a cabo mediante una tabla de números aleatorios.
8. CARACTERÍSTICAS PRINCIPALES
1. Es aplicable sólo cuando las unidades experimentales son homogéneas (verificar si
existe tal homogeneidad de los datos, todos provienen de la misma distribución y no
hay datos atípicos).
2. Los tratamientos pueden tener igual o diferente número de unidades
experimentales.
3. La distribución de los tratamientos es al azar en las unidades experimentales.
El número de tratamientos está en función del número de unidades experimentales
que se dispone. Es conveniente tener pocos tratamientos y más
unidades experimentales que muchos tratamientos con pocas unidades
experimentales.
8
VENTAJAS
Fácil de planear y analizar; además es flexible en el empleo del número de
tratamientos y repeticiones, solo está limitado por el número de unidades
experimentales disponibles.
Permite verificar si hay diferencias estadísticamente significativas entre
medias cuando tenemos más de dos muestras o grupos en el mismo planteamiento.
DESVENTAJA
La principal desventaja que presenta este diseño está relacionada a la
homogeneidad del material experimental; el cual es difícil de encontrar en
experimentos de campo, por lo que su uso se restringe con mucha frecuencia a
experimentos de laboratorio o donde se pueda tener control de los efectos no
considerados en el estudio (ambiente, temperatura, luz, entre otros)
9. 9
OBJETIVO
El objetivo de un diseño completamente aleatorio es estudiar si existen
diferencias significativas en la variable dependiente para cada nivel de la variable
independiente o tratamiento. Específicamente, lo que nos interesa es hacer un "Test
de Singularidad de Medias". El procedimiento a utilizar para alcanzar este objetivo
(la singularidad de medias) es el análisis de la varianza (ANOVA), técnica muy útil
en el campo de la inferencia estadística, que toma como referencia el modelo lineal
estadístico. En concreto, en este diseño se toma como referencia el siguiente modelo
lineal estadístico:
Yij = EG + ETj + EA
Yij: Valor observado de la variable dependiente en la unidad de prueba i con el
tratamiento j.
EG: Es el efecto global, que se refiere al promedio de la variable dependiente
para el total o conjunto de las unidades de prueba.
ETj: Es el efecto del tratamiento j, es decir, la variación en la variable
dependiente con relación al promedio debido a la influencia del tratamiento j.
EA: Es el efecto aleatorio, el cual recoge el efecto de todas las restantes
causas posibles de variabilidad del experimento no debidas al tratamiento, es decir, al
efecto aleatorio se le podría llamar también "otras causas de variabilidad del
experimento".
ETj + EA: La suma de estos dos efectos refleja las fuentes de dispersión.
Concretamente, el análisis de la varianza (ANOVA) va a consistir en el análisis de
esa dispersión, es decir, en el estudio de los componentes de la dispersión total.
ANOVA UNILATERAL: El tipo más simple de análisis de varianza es el que se
conoce como análisis de varianza unilateral, en el cual se investiga una sola fuente de
variación o factor. Esto es una extensión a 3 o más muestras del procedimiento de la
prueba, para utilizarlo en 2 muestras independiente. Dicho de otra forma, se puede
10. afirmar que utiliza la prueba t con dos muestras independientes en un caso específico
del análisis de la varianza unilateral.
PASOS PARA LA PRUEBA DE HIPÓTESIS EN UN DISEÑO
COMPLETAMENTE ALEATORIZADO
1. Descripción de los datos. Las mediciones (u observaciones) que resultan de
un diseño experimental completamente aleatorizado, junto con las medias y
los totales que puedan calcularse a partir de los datos, pueden presentarse si
así conviene a través de las siguientes fórmulas:
Xij = la i – ésima observación resultante a partir del j – ésimo tratamiento (en
total existen k tratamientos)
2. Supuestos. Antes de establecer las suposiciones, es necesario especificar el
modelo. Para escribir el modelo para el diseño experimental completamente
aleatorizado, se utiliza el símbolo xij.
El análisis de la varianza unilateral puede escribirse como sigue:
xij = μ + Ƭj + eij
Los términos de este modelo se describen de la siguiente forma:
10
11. 1. μ representa la media de toda las k - medias poblacionales, y se le conoce
11
como la gran media.
2. Ƭj representa la diferencia entre la media de la j – ésima población y la gran
media. Se le conoce como efecto del tratamiento.
3. ejj representa la cantidad en que difieren una medición individual de la media
poblacional a la que pertenece. Se le conoce como termino del error.
Supuestos de modelo
Las suposiciones para el modelo de efectos fijos son las siguientes:
a) Los k conjuntos de datos observados forman k muestras aleatorias
simples a partir de las poblaciones respectivas.
b) Cada una de las poblaciones de las que se extraen las muestras siguen
2
una distribución normal con media μj variancia σj
2 = σ2
c) Cada una de las poblaciones tiene la misma variancia. Es decir, σ j
2
= …. = σk
2 = σ2, variancia común.
d) Las Ƭj son constantes desconocidas y ΣƮj = 0, puesto que la suma de
todas las desviaciones de μj a partir de su medía, μ, es cero.
e) Las eij tienen una media igual a cero, porque la media de xij, es μj.
f) Las eij tienen una variancia igual a la variancia de las xij porque las eij y
las xij difieren sólo por una constante; es decir, la variancia del error es
igual a σ2, la variancia común, especificada en el inciso c.
g) Las eij siguen una distribución normal (e independiente).
3. Hipótesis. En un Diseño Completamente Aleatorizado, frecuentemente
estamos interesados en contrastar la hipótesis nula de que todas las
poblaciones o tratamientos tienen medias iguales, contra la hipótesis
alternativa, que dice que al menos un par de poblaciones no tienen medias
iguales. Las hipótesis se redactan de la siguiente forma:
12. Ho: 1 = 2 =...= k (Todos los tratamientos tienen el mismo efecto sobre la variable
en estudio).
HA: 1 2 ... k (No todos los tratamientos tienen el mismo efecto sobre la
variable en estudio).
Si las medias de las poblaciones son iguales, y el efecto de cada tratamiento es
igual a cero, de tal manera que alternativamente, la hipótesis puede escribirse como
sigue:
H0: Ʈj = 0, j = 1, 2,……,k
HA: no todas las Ʈj = 0
12
Nivel de significancia: (0 1)
4. Estadística de prueba. La estadística de prueba para el análisis de la
variancia unilateral es el cálculo de la razón, designada como R.V, Las dos
variancias con las que se calcula la R.V. son las mismas variancias
calculadas a partir de los datos de la muestra.
5. Distribución de la estadística de prueba. R.V. sigue una distribución F
cuando Ho es verdadera y se cumplen las suposiciones.
6. Regla decisión. En general, la regla de decisión es rechazar la hipótesis nula
si el valor calculado para R.V. es mayor o igual que el valor crítico de F con
nivel α.
7. Calculo del estadístico de prueba. Se definió al análisis de la variancia
como un proceso por el que la variación total presente en el conjunto de
datos se divide en componentes que son atribuibles a diferentes fuentes. El
13. término variación se utiliza en este contexto para referirse a la suma de
desviaciones al cuadrado de las observaciones de su media o suma de
cuadrados.
Suma total de cuadrados. La suma total de cuadrados es la suma de los cuadrados
de las desviaciones de las observaciones individuales a partir de la media de todas las
observaciones tomadas juntas. La suma total de cuadrados (SCtotal) se define como:
푆퐶푡표푡푎푙 = Σ Σ(푋푖푗 − 푋̅. . )
13
2
푛푗
푖 =1
푘
푗=1
Donde Σ푛푗
푖= 1 indica que hay que sumar las desviaciones al cuadrado para cada
grupo de tratamiento, y Σ푘푗
=1 indica que hay que sumar los totales de los k grupos
que se obtienen al aplicar Σ푛푗
푖=1 .
Suma de cuadrado dentro de los grupos. El primer paso para calcular estos
componentes es realizar ciertos cálculos dentro de cada grupo. Estos cálculos
implican realizar dentro de cada grupo, la suma de las desviaciones al cuadrado de las
observaciones individuales, a partir de su media. Después de realizar estos cálculos
dentro de cada grupo, se obtiene la suma de los resultados individuales del grupo. A
este componente de variación se le llama suma de cuadrados dentro de los grupos y
se le designa como SCdentro. La fórmula para calcular es la siguiente:
푆퐶푑푒푛푡푟표 = Σ Σ(푋푖푗 − 푋̅. 푗)
2
푛푗
푖 =1
푘
푗=1
Suma de cuadrados entre los grupos. Se calcula para cada grupo la desviación al
cuadrado de la media del grupo a partir de la gran media, y se multiplica el resultado
por el tamaño del grupo y se suman los resultados de todos los grupos. Esta cantidad
es una medida de la variación entre los grupos y se conoce como suma de cuadrados
entre los grupos o SCent re. La fórmula para calcular esta cantidad es como sigue:
14. 푆퐶푒푛푡푟푒 = Σ 푛푗 (푋̅.푗 − 푋̅. . )
.푗) 푛푗
푖 =1
14
푘
푗=1
La suma total de cuadrados es igual a la suma de cuadrados entre los grupos más la
suma de los cuadrados dentro de los grupos:
SCtotal = SCentre + SCdentro
Primera estimación de σ2. La expresión matemática:
Σ (̅푋
푖푗
− 푋̅
푛푗 − 1
Proporciona una estimación insesgada de la variancia real para la población de la cual
proviene la muestra. Bajo la suposición de que todas las variancias de la población
son iguales, es posible continuar las k estimaciones para obtener:
Segunda estimación de σ2
. La segunda estimación de σ2 se puede obtener a partir de
la fórmula ya conocida para la variancia de las medias de las muestras, σ2/x = σ2. Si la
ecuación es resuelta para σ2, la variancia de la población a partir de la cual se
extrajeron las muestras, se tiene
15. Una estimación insesgada de σ2/x, calculada a partir de los datos de la muestra, es
proporcionada por:
Cuando no todos los tamaños de las muestras son iguales, una estimación σ2 con base
en la variabilidad entre las medias de las muestras se obtiene mediante la fórmula:
La razón de variancias. Se calcula mediante la siguiente fórmula:
15
푹. 푽 =
푪풖풂풅풓풂풅풐 풎풆풅풊풐 풆풏풕풕풓풆 풍풐풔 품풓풖풑풐풔
푪풖풂풅풓풂풅풐 풎풆풅풊풐 풅풆풏풕풓풐 풅풆 풍풐풔 품풓풖풑풐풔
Si las dos estimaciones son aproximadamente iguales, la R.V será casi igual a 1.
Una razón próxima a 1 tiende a poyar la hipótesis de que las medias son iguales para
las poblaciones. Si el cuadrado medio entre los grupos es considerablemente mayor
que el cuadro medio dentro de los grupos, la R.V será, a su vez, considerablemente
mayor que 1.
Prueba F: Es una distribución f cuando las varianzas de las muestras se calculan a
partir de muestras extraídas de forma independiente y aleatoria de una población que
sigue una distribución normal. Esta se usa en la construcción de intervalos de
confianza para la varianza de la población y para probar hipótesis acerca de esta.
16. CONSTRUCCIÓN DE LA TABLA DEL ANOVA. Los cálculos que se han
efectuado se pueden resumir y mostrar en una tabla conocida como tabla ANOVA.
8. Decisión estadística. Para tomar una decisión es necesario comparar la R.V
calculada contra el valor crítico de F, con los correspondientes grados de
libertad k – 1 en el numerador y N - k en el denominador. Si el valor
calculado para R.V. es mayor o igual que el valor crítico F, la hipótesis nula
es rechazada; pero si es menor que el valor crítico de F, no se rechaza la
hipótesis nula.
9. Conclusión. Cuando se rechaza H0 se concluye que no todas las medias
poblacionales son iguales. Cuando no se rechaza H0 se concluye que proba-blemente
todas las medias poblacionales son iguales.
10. Calculo del valor de p. El valor p para la prueba de una hipótesis es la
probabilidad de obtener, cuando Ho es verdadera, un valor de la estadística
de prueba tan extremo o más (en la dirección adecuada para HA) que el valor
calculado en la realidad.
16
17. EJERCICIO
En el siguiente ejercicio aplique el procedimiento de los diez pasos de la prueba
de hipótesis para analizar las varianzas y ver si es posible concluir que existen
diferencias entre las medias de las poblaciones. Sea α = 0.05. Utilice el mismo
valor α de para la prueba F. elabore la tabla ANOVA.
Szádóczky et al. (A-4) examinaron las características de los sitios de unión de la
H-imipramina en pacientes permanentes deprimidos (SAD) y pacientes
deprimidos por corto tiempo (no-SAD), así como en individuos sanos (grupo
control). Una de las variables en las que se hicieron las mediciones es la densidad
de los sitios de unión para la H-imipramina en las plaquetas sanguíneas (Bmáx.).
Los resultados son los siguientes:
SAD No- SAD CONTROL
634 771 1067
585 546 1176
520 552 1040
525 557 1218
693 976 942
660 204 845
520 807
573 526
731
788
736
1007
846
701
584
867
691
1. Datos. Los datos corresponden a los sitios de unión de la H-imipramina en
pacientes permanentes deprimidos (SAD) y pacientes deprimidos por
17
18. corto tiempo (no-SAD), así como en individuos sanos (grupo control).
Junto con los totales del tratamiento y las medias.
SAD NO-SAD Control Total
Total 11661 4939 6288 22888
X 685.94 617.375 1048 2351.315
2. Supuestos. Se supone que los tres grupos de datos forman muestras
aleatorias simples e independientes, extraídas de tres poblaciones que son
similares excepto por la condición estudiada. Se supone que las tres
poblaciones siguen una distribución normal con varianza conocida.
18
3. Hipótesis. Sea α=0.05
Ho: μ1=μ2=μ3
HA: μ1≠μ2≠μ3
4. Estadística de prueba. La estadística de prueba es:
푅. 푉 = 퐶푀푒푛푡푟푒
퐶푀푑푒푛푡푟표
5. Distribución de la estadística de prueba. Si Ho es verdadera y se
cumplen las condiciones, entonces R.V sigue una distribución F con los
grados de libertad correspondientes, respectivamente, del numerador y
denominador (K-1) 3-1=2 y (n-K) 31-3=28.
6. Regla de decisión. Sea α=0.05
19. 0.975
0 4.22
(2,28)F(0.975)
Región de aceptación Región de rechazo
Regla: Se rechaza la Ho si el valor calculado para R.V es mayor o igual que
4.22
7. Calculo de la estadística de prueba.
Comenzamos calculando los totales y los cuadrados de los totales divididos por el
número de observaciones:
SAD NO-SAD Control Total Σ2⁄푛
Total 11661 4939 6288 22888 16898727.23
푥̅ 685.94 617.375 1048 2351.315
Σ2⁄푛 7998760.059 3049215.125 10589824 17637799.18
Σ푥2 8293177 3429627 6687978 18410782
SCent re= 17637799.18 - 16898727.23= 739072.18
SCdent ro= 18410782 - 17637799.18= 772982.82
19
SCtotal= SCentre+ SCdentro= 1512055
CMent re= SCentre/k-1= 739072.18 / 3-1
739072.18 / 2= 369536.09
CMdent ro= SCdentro/n-1= 772982.82 / 31-3
772982.82 / 28= 26395.435
R.V= CMent re/CMdentro= 369536.09 / 26395.435 = 14
20. 20
TABLA ANOVA
FUENTE SC
g.l CM R.V
Entre
muestras
739072.18 2 369536.09 14
Dentro de
muestras
772982.82 28 26395.435
Total 1512055 30
8. Decisión Estadística. Debido a que el valor calculado para R.V., 14, es
mayor que el valor crítico F, 4.22, se rechaza Ho.
9. Conclusión. Dado que se rechazó Ho, se concluye que la hipótesis alternativa
es verdadera. Es decir, se concluye que no todas las medias son iguales.
DISEÑO EN BLOQUES COMPLETAMENTE ALEATORIZADO
Es aquél en el que:
1.- Las unidades experimentales se distribuyen en grupos o bloques, de manera tal
que las unidades experimentales dentro de un bloque sean relativamente homogéneas
y que el número de unidades experimentales dentro de un bloque sea igual al número
de tratamientos por investigar, y
2.- Los tratamientos se asignan al azar a las unidades experimentales dentro de cada
bloque. En lo anterior, la formación de los bloques refleja el criterio del investigador
Respecto a las respuestas diferenciales potenciales de las diversas unidades
experimentales, mientras que el procedimiento de aleatorización actúa como una
justificación de la suposición de independencia.
Modelo: Y ij = i + B i + j + e ij
Suma de
2 Y = M yy + Byy + T yy + E yy
21. Donde: Yij = Valor observado en la i-ésima repetición para el i-ésimo tratamiento.=
Efecto de la media general.
Bi = Efecto del i-ésimo bloque.
j = Efecto del j-ésimo tratamiento
eij = Efecto aleatorio del error experimental
t = Número de tratamientos.
n = Número de repeticiones del í-ésimo tratamiento.
OBJETIVO: es aislar y eliminar el término de error la variación atribuible a los
bloques, y asegurar que las medias del tratamiento estén libres de los efectos del
bloque. La eficacia del diseño depende de la capacidad de conseguir bloques
homogéneos de unidades de experimentación.
VENTAJAS: se comprende fácilmente, además, algunas complicaciones que podrían
surgir en el transcurso de un experimento son fáciles de controlar cuando se utiliza
este diseño.
EJEMPLO:
Un grupo de especialistas en motivación, en un hospital psiquiátrico, condujo un
experimento para comparar tres métodos para motivar a los pacientes. Estos fueron
agrupados de acuerdo con el nivel de motivación inicial. En cada grupo, los
pacientes fueron asignados al azar a los tres métodos. Al final del periodo
experimental, un equipo de trabajo formado por un psiquiatra, un psicólogo, una
enfermera y un trabajador social evaluaron a los pacientes. Ningún miembro del
equipo de evaluación sabía de los métodos que fueron asignados a los pacientes. El
equipo asignó a cada paciente una calificación como medida de su nivel de
motivación, los resultados son los siguientes:
21
22. Método de motivación
A B C TOTAL MEDIA
NULO 58 68 60 186 62,00
MUY BAJO 62 70 65 197 65,67
BAJO 67 78 68 213 71,00
PROMEDIO 70 81 70 221 73,67
TOTAL 257 297 263 817
MEDIA 64,25 74,25 65,75 68,08
22
nivel de
motivación
inicial
1. DATOS: Escogieron al azar a los pacientes de acuerdo con el nivel de
motivación inicial los cuales participaran en el experimento. Los métodos de
motivación forman tres tratamientos y los cuatro niveles son los bloques.
2. SUPUESTOS: se supone que cada uno de las 12 observaciones forman una
muestra aleatoria de tamaño 1 a partir de una de las 12 poblaciones definida por
la combinación de bloque y tratamientos. se supone que las respuestas en las 12
poblaciones representadas siguen una distribución normal con variaciones
iguales.
3. HIPÓTESIS:
Ho: j = 0 j = 1,2,3
HA: no todas las j = 0
Sea α=0.05
4. ESTADÍSTICA DE PRUEBA
푅. 푉 = 퐶푀푡푟푎푡
퐶푀푟푒푠푖푑푢푎푙
23. 5. DISTRIBUCIÓN DE LA ESTADÍSTICA DE PRUEBA
Cuando la hipótesis nula es verdadera y las suposiciones se cumplen, 푅. 푉 sigue una
distribución de F con 2 y 6 grados libertad.
6. REGLAS DE DECISIÓN
Rechazar la hipótesis nula si el valor
calculado de 푅. 푉 es mayor o igual que el
23
valor crítico de F. El valor de F es 6,94
1.
0.95
6.94
0 (2,4)F(0.95)
Región de aceptación Región de rechazo
7. CALCULO DE LA ESTADÍSTICA DE PRUEBA
SCtotal = (58 - 68,08)2 + ( 62 - 68,08)2 +(67 - 68,08)2 +( 70 - 68,08)2 +( 68 - 68,08)2
+(70 - 68,08)2 +(78 - 68,08)2 + (81- 68,08)2 +(60- 68,08)2 +(65 - 68,08)2
+( 68- 68,08)2 +( 70- 68,08)2
= 101.6064 + 36.9664 + 1.1664 + 3.6864 + .0064 + 3.6864 + 98.4064 +
166.9264 + 65.2864 + 9.4864 + .0077 + 3.6864
= 494, 60
SCBloq = 3 [( 62 - 68,08)2 + ( 62 - 68,08)2 + ( 62 - 68,08)2 + ( 62 - 68,08)2 ]
= 3 (36.9664 + 5.8081 + 8.5264 + 31.2481)
= 3 (82.549)
= 247.647
SCtratam = 4 [(64.25 - 68,08)2 + ( 74.25 - 68,08)2 + ( 65.75 - 68,08)2]
= 4 (14.6689 + 38.0689 + 5.4289)
= 4 * 58.1667
= 232.6668
SCresid = 494, 60 - 247.647 - 232.6668
= 14.285
Los gl son 3 * 4 -1 = 11, bloque 4 – 1 = 3, tratamiento 3 – 1 = 2, (error) residual
(4 - 1) (3 - 1) = 6
24. 24
TABLA ANOVA
FUENTE SC gl CM RV
TRATAMIENTO 494,6 2 247,3000 6,3774
BLOQUES 247,647 3 82,5490
RESIDUALES 232,6668 6 38,7778
TOTAL 974,9138 11
푅. 푉 = 247.300
38.7778
= 6.3774
8. DECISIÓN ESTADÍSTICA:
Puesto que la razón de la varianza 6.3774 es menor que 6.94 se acepta la
hipótesis nula por lo que no hay evidencia suficiente que indique una
difere3ncia entre medias.
9. CONCLUSIÓN
Se concluye que todos los efectos de los tratamientos son iguales a cero, o
equivalentes, es decir todos los tratamientos son cero.
DISEÑOS DE MEDICIONES REPETITIVAS
Consiste en medir dos variables en dos muestras distintas de sujetos. Sirve
para estudiar el efecto de uno o más factores cuando al menos uno de ellos. Es un
factor intra- sujetos; este factor se caracteriza por que todos los niveles del factor se
aplican a los mismos sujetos. Los datos este diseño se analiza con la prueba t para las
muestras relacionadas. El diseño de medidas repetitivas puede tener más de una
medida y de un factor. Para analizar los datos de este diseño podemos utilizar un
ANOVA de un factor completamente aleatorizado.
25. El motivo principal para utilizar el diseño de mediciones repetidas es el deseo
de controlar la variabilidad entre los individuos estudiados. En este diseño cada
individuo sirve como su propio control. Una de las situaciones más usuales que
permiten el uso del diseño de mediciones repetidas es cuando el investigador está
interesado en respuestas sobre el tiempo.
VENTAJAS
Requieren menos sujetos que un diseño completamente aleatorizados y Permiten
eliminar la variación residual debido a las diferencias entre los sujetos (pues se
utilizan los mismos).
25
DESVENTAJAS
Es necesario vigilar algunos efectos atribuibles precisamente a la utilización de
los mismos sujetos, tales como:
Efecto de arrastre: ocurre cuando se administra una condición antes de que haya
finalizado el efecto de otra administrada previamente.
Efecto de aprendizaje por la práctica: ocurre cuando las respuestas de los sujetos
pueden mejorar con la repetición y, como consecuencia de ello, los tratamientos
administrados en último lugar parecen más efectivos que los administrados en primer
lugar, sin que haya diferencias reales entre ellos (en estos casos es importante
controlar el orden de presentación de las condiciones). Obviamente es necesario
conocer las ventajas e inconvenientes de estos diseños para decidir correctamente
cuando es apropiado utilizarlos.
Kabat-zinn. (A-18) diseñaron un estudio para determinar la eficacia de un programa
de reducción de estrés con base en la meditación en pacientes con trastornos de
ansiedad. Los individuos estudiados fueron seleccionados de entre los que estaban en
el programa de relajación y reducción del estrés. Entre los datos que recolectaron los
investigadores estaban las calificaciones obtenidas con base en la escala de
26. calificación de la ansiedad de Hamilton, en tres ocasiones diferentes: al momento de
reclutamiento inicial (RI), antes del tratamiento (Pre), después del tratamiento (Post)
y a los tres meses de seguimiento (3m). Se obtuvieron los siguientes datos
correspondientes a los resultados de los 6 individuos.
26
INDIVIDUO RI
Pre POST 3-M
1 21 21 16 19
2 30 38 10 21
3 38 19 15 6
4 43 33 30 24
5 35 34 25 10
6 40 40 31 30
1. Datos: ver la tabla
2. Supuestos: se considera que se cumplen los supuestos descritos para el diseño de
mediciones repetidas con un solo factor.
3. Hipótesis: Sea α=0.05
Ho: μ1=μ2=μ3 =μ4
HA: μ1≠μ2≠μ3≠μ4
4. Estadística de prueba: la estadística de prueba es:
푅. 푉 =
퐶푀푡푟푎푡
퐶푀푟푒푠푖푑푢푎푙
5. Distribución de la estadística de prueba: la estadística de prueba sigue una
distribución F con (k-1) 4-1=3 grados de libertad para el numerador y (n-k) (k-1)
(n-1) 23-3-5=15 grados de libertad para el denominador.
1. Regla de decisión: Sea α=0.05
0.95
3.29
0 (3,15)F(0.95)
Región de aceptación Región de rechazo
27. El valor crítico de f es 3,29
Regla: se rechaza la Ho si el valor de R.V es mayor o igual que 3,29
27
6. Calculo de la estadística de prueba:
INDIVIDUO RI
Pre POST 3-M
TOTAL
MEDIAS
1 21 21 16 19
77 19,25
2 30 38 10 21
99 24,75
3 38 19 15 6
78 19,5
4 43 33 30 24
180 32,5
5 35 34 25 10
104 26
6 40 40 31 30
141 35,25
TOTAL 207 185 127 110
629
MEDIAS 34,5 30,8 21,2 18,3
104,8
Sctotal=150785,57
Sctratamiento=149436,18
Scresidual=1349,39
푅. 푉 = 퐶푀푡푟푎푡
퐶푀푟푒푠푖푑 푢푎 푙
= 149436,18/1349,39=110,74
7. Decisión estadística: se rechaza la Ho porque el valor de R.V=110,74 y este valor
es mayor que 3,29
8. Conclusión: se concluye que la hipótesis alternativa es verdadera dado que se
rechazó la Ho. Es decir, que no todas las medias son iguales
DISEÑO DE MEDICIONES REPETIDAS DE UN SOLO FACTOR
El estudio del ANOVA de medidas repetidas es el caso más simple de todos: el
modelo de un factor.
28. Los datos que permite analizar este modelo son los procedentes de un diseño con un
solo grupo de sujetos y un único factor cuyos niveles se aplican a todos los sujetos.
Las distintas medidas, tantas como niveles tiene el factor, se toman sobre los mismos
sujetos. De ahí el nombre de medidas repetidas que reciben estos modelos.
Supuestos: se deben considerar, los siguientes supuestos en el diseño de mediciones
repetidas con un solo factor. Al diseño que cumpla con estos supuestos se le llama
diseño aditivo de efectos fijos.
1- Los individuos estudiados forman una muestra aleatoria simple extraida de
una población con individuos similares.
2- Cada una de las observaciones es una muestra aleatoria simple e
independiente de tamaño 1 extraida de cada una de las kn poblaciones, donde
n es el número de individuos y k es el número de tratamientos a los que se
expone el individuo.
3- Las kn poblaciones tienen medias potencialmente diferentes, pero todas las
poblaciones tienen la misma varianza.
4- Los k tratamientos son fijos, es decir, son los únicos tratamientos respecto a
los que se tiene interés en la situación actual. No se pretende hacer inferencias
para un conjunto mayor de tratamientos.
5- No hay interacción entre los tratamientos y los individuos. Esto es, los
tratamientos y los efectos en los individuos son aditivos.
Con frecuencia es posible encontrar que los datos de los experimentos no cumplen
con las suposiciones de tratamientos fijos y tratamientos aditivos y efectos sobre los
individuos.
Modelo: el modelo para el diseño de mediciones repetidas con un solo factor aditivo
de efectos fijos es el siguiente:
xij =
i + B i + j + e ij
i = 1, 2, ..., n; j = 1, 2, ..., k
28
29. 29
EXPERIMENTOS FACTORIALES
Se denomina Experimentos Factoriales, aquellos experimentos en los que se
estudia simultáneamente dos o más factores, y donde los tratamientos se forman por
la combinación de los diferentes niveles de cada uno de estos. Las variables de interés
reciben el nombre de factores, que son características que involucra a dos o más
modalidades, variantes o niveles diferentes.
Los experimentos factoriales en si no constituyen un diseño experimental si
no que ellos deben ser llevados en cualquiera de los diseños tal como D.C.A.;
D.B.C.A.; D.C.L.
Los experimentos factoriales se emplean en todos los campos de la
investigación, son muy útiles en investigaciones exploratorias en las que poco se sabe
acerca de muchos factores. Estos pueden ser:
a. Cualitativos: Son aquellos en los cuales los niveles describen o expresan
una modalidad particular de las cualidades del factor; cada nivel tiene un
interés intrínseco o independiente de los otros niveles. Estos factores
responden a las características de las variables cualitativas.
b. Cuantitativos: Son aquellos cuyos valores corresponden a cantidades
numéricas, es decir valores inherentes a una variable cuantitativa.
VENTAJAS
Se puede estudiar la interacción de factores, efectos simples y efectos
cruzados.
30. Todas las unidades experimentales intervienen en la determinación de los
efectos principales y de los efectos de interacción de los factores, por lo que el
número de repeticiones es elevado para estos casos.
El número de grados de libertad para el error experimental es alto,
comparándolo con los grados de libertad de los experimentos simples de los mismos
factores, lo que contribuye a disminuir la variancia del error experimental,
aumentando por este motivo la precisión del experimento.
30
DESVENTAJAS
Se requiere un mayor número de unidades experimentales que los
experimentos simples y por lo tanto se tendrá un mayor costo y trabajo en la
ejecución del experimento.
Como en los experimentos factoriales c/u de los niveles de un factor se
combinan con los niveles de los otros factores; a fin de que exista un balance en el
análisis estadístico se tendrá que algunas de las combinaciones no tiene interés
práctico pero deben incluirse para mantener el balance.
El análisis estadístico es más complicado que en los experimentos simples y la
interpretación de los resultados se hace más difícil a medida de que aumenta el
número de factores y niveles por factor en el experimento.
En general los diseños factoriales son los más eficientes para este tipo de
experimentos. Por ejemplo, si existen “a” niveles del factor A y “b” niveles del factor
B, entonces cada réplica del experimento contiene todas las “ab” combinaciones de
31. los tratamientos. A menudo, se dice que los factores están cruzados cuando éstos se
arreglan en un diseño factorial.
Hay dos razones fundamentales para incluir un factor en un experimento. La
primera y más obvia es que nos interese conocer y medir su efecto, con el fin de
mejorar un producto. La segunda es simplemente para reducir la variabilidad no
explicada. Esta segunda razón nos llevaría a incluir factores en el análisis que en
principio no nos interesa cuantificar su efecto. A este segundo tipo de factores se les
denomina bloque, aunque a efectos de cálculo su tratamiento no varía respecto del
resto de los factores.
Los factores serán variables discretas, que pueden tomar un número finito de
estados o niveles. La variable respuesta seguirá siendo una variable aleatoria
continua. El objetivo es determinar si el valor medio de la variable respuesta cambia
al cambiar el nivel de un factor.
A través de las siguientes graficas se pude observar la interacción o no de los
31
factores estudiados.
Figura 2. Un experimento factorial con interacción.
En el primer nivel del factor B, el efecto de A es:
A = 50 - 20 = 30
Mientras que en el segundo nivel de B, el efecto de A es:
A = 12 - 40 = 28
Puede observarse que existe una interacción entre los factores A y B porque el
efecto de A depende del nivel elegido de B.
32. Estas ideas pueden ilustrarse gráficamente. En la Fig. 1 se muestra una gráfica
de la respuesta de los datos de la Tabla 1 contra los niveles del factor A para ambos
niveles del factor B. Se observa que las rectas B1 y B2 son, aproximadamente,
paralelas. Esto indica que no hay interacción entre los factores. De manera similar, en
la Fig. 2 se presenta una gráfica de la respuesta de los datos de la Tabla 2.
60
50
40
30
20
B2
B1
Figura 1 Un experimento factorial sin interacciones
B1
En este caso se ve que las rectas B1 y B2 no son paralelas. Esto muestra que
existe una interacción entre A y B. Sin embargo, no debe ser la única técnica para
analizar los datos, porque su interpretación es subjetiva y su apariencia, a menudo, es
engañosa.
60
50
40
30
20
B1
Figura 2. Un experimento factorial con interacciones
32
10
A1 A2
B2
Respuesta
Factor A
10
A1 A2
B2
B1
B2
Respuesta
Factor A
33. Hay que notar que cuando una interacción es grande los correspondientes
efectos principales tienen poco significado práctico. Una estimación del efecto
principal de A de los datos de la Tabla 2 es:
1
33
20 40
A
2
50 12
2
El cual resulta ser muy pequeño corriéndose el riesgo de concluir que no
existe un efecto debido a A. Sin embargo, cuando se examinó el efecto de A en
niveles diferentes de B se concluyó que éste no era el caso. El factor A tiene un
efecto, pero depende del nivel del factor B. En otras palabras, es más útil conocer la
interacción AB que el efecto principal. Una interacción significativa oculta a menudo
el significado de los efectos principales.
A continuación se señala el análisis de un experimento factorial por medio de un
diseño completamente aleatorizado por dos factores:
1. Datos. Estos se presentan en forma tabular.
2. Supuestos. Para analizar estos datos, se supone un modelo de efectos fijos
y un diseño completamente aleatorizado para dos factores. Supuestos para
el modelo: a. Las observaciones en cada una de las ab celdas constituyen
una muestra aleatoria independiente de tamaño n, extraída de una
población definida por la combinación particular. b. Cada una de las ab
poblacionales siguen una distribución normal. c. Todas las poblaciones
tienen la misma variancia.
3. Hipótesis. Las siguientes hipótesis pueden ser probarse:
a) H`
0 : ∝i= 0
34. H`
34
A : no todas la ∝i= 0
b) H``
0: βj = 0
H``
A : no todas las βj = 0
c) H```
0: (∝ β)ij = 0
H```
A : no todas las (∝ β)ij = 0
Se da valor a α
4. Estadística de prueba: la estadística de prueba para cada conjunto de
hipótesis se obtiene a través de la fórmula de la razón de la varianza
(R.V), es decir:
(R. V)A =
S2
1
S2 (R. V)B =
S2
2
S2 (R. V)AB =
S2
3
S2
5. Distribución de la estadística de prueba: Cuando la hipótesis nula es
verdadera y se cumplen las suposiciones, cada una de las estadísticas de
prueba sigue una distribución F.
6. Regla de decisión. Cuando se rechaza la hipótesis nula si el valor
calculado de la estadística de prueba es mayor o igual que el valor critico
de F
7. Cálculo de la estadística de prueba:
Mediante una adaptación del procedimiento que se utiliza para dividir la
suma total de cuadrados en el diseño completamente aleatorizado, se
puede demostrar que la suma total de cuadrados bajo el presente modelo
puede dividirse en dos términos:
Las formulas de cálculos para los diversos componentes son los siguientes:
35. 푠푐푡표푡푎푙 = Σ Σ Σ 푥 2
푖푗푘 − 푐 푛푘
=1
35
푏푗
=1
푎푖
=1
푠푐
푡푟푎푡 =
Σ Σ 푇2
푖푗
푏푗
=1
푎푖
=1
푛
−C
SCA=
Σ 푇2
푖
푎
푖=1
푏.푛
–c
SCB=
Σ 푇2
푗
푏
푗=1
푎 .푛
–c
SC(AB)= 풔풄풕풓풂풕 − SCA SCB
SC푟푒푠푖푑푢푎푙 = 풔풄풕풐풕풂풍 − 풔풄풕풓풂풕
8. Decisión estadística: si se cumplen las suposiciones establecidas al
principio, y si cada hipótesis es verdadera, se puede demostrar que la
variancia sigue una distribución F, con su grado de libertad indicado. Se
rechaza la hipótesis nula (Ho) si los valores calculados para R.V. son
mayores o iguales que los valores críticos correspondientes como lo
determinan los grados de libertad y los niveles de significación
seleccionados.
9. Conclusión: si se rechaza Ho, se concluye que HA es verdadera. Si no se
rechaza Ho, se concluye que Ho puede ser verdadera.
10. Valor de P.
Ejercicio:
Ejemplo: Diseño completamente aleatorizado por dos factores.
36. En un experimento llevado a cabo con el propósito de evaluar los efectos del
trabajo de parto en la producción y utilización de glándulas. Los individuos
estudiados eran 6 mujeres embarazadas. Entre los datos recolectados están las
siguientes concentraciones de glucosa durante cuatro fases de trabajos de parto:
latente (A1) y activa (A2) de dilatación cervical, expulsión de fetal (B), y expulsión
de la placenta (C) que comprende 48 muestras independientes. En el experimento se
obtuvieron observaciones duplicadas de promedios en cada combinación de los
tratamientos. Utilícese un nivel de significación de 0,05 para probar las siguientes
hipótesis:
1. ¿Existe concentración de glucosa durante las cuatro fases de trabajo de parto?
2. ¿Bajo concentración de glucosa en las mujeres embarazadas?
3. ¿Existe interacción entre las mujeres embarazadas en de trabajo de parto y la
36
concentración de glucosas?
Tabla 1: Concentración de glucosa.
Mujeres
embarazadas
A1 A2 B C
1 1.6
2.0
1.2
3.2
2.3
3.0
4.2
2.0
2 2.03
1.5
2.1
1.6
1.1
3.0
1.8
2.0
3 2.02
2.0
2.6
2.2
3.4
2.0
2.27
3.3
4 1.8
3.1
2.33
3.0
3.30
3.0
4.1
2.1
5 2.60
2.05
3.05
3.05
3.4
3.5
2.06
2.0
6 1.97
2.0
3.2
2.0
2.9
2.0
2.5
2.1
37. 퐓퐚퐛퐥퐚 ퟐ : Concentración de Glucosa.
37
Mujeres
embarazadas
A1 A2 B C TOTALES MEDIAS
1 3.60 4.40 5.30 6.20 19.50 4.88
2 3.53 3.70 4.10 3.80 15.13 3.78
3 4.02 4.80 5.40 5.27 19.49 4.87
4 4.90 5.33 6.30 6.20 22.73 5.68
5 4.06 4.65 6.10 6.90 21.71 5.43
6 3.97 5.20 4.90 4.60 18.67 4.67
TOTALES. 24.08 28.08 32.10 32.97 117.23 29.31
MEDIAS 4.01 4.68 5.35 5.50 19.54 4.89
Solución:
1. Datos: Los datos acerca de La concentración de glucosa en mujeres
embarazadas se obtuvieron durante el análisis que se muestra en la
tabla 1.
2. Supuestos:
a) Las observaciones en cada una de los datos constituyen una
muestra aleatoria independiente de tamaño 48, extraída de una
población definida por la combinación particular de los
factores.
b) Cada una de las a.b sigue una distribución normal.
c) Todas las poblaciones tienen la misma variancia.
3. Hipótesis
d) H`
0 : ∝1=∝2=∝3=∝4= 0
H`
A :Al menos una de las ∝i no es igual a cero
38. 38
e) H``
0: β1 = β2 = β3 = β4 = 0
H``
A : Al menos una de las βi no es igual a cero
f) H```
0: (∝ β)11 = (∝ β)12 = (∝ β)13 = ⋯ . = (∝ β)34 = 0
H```
A : Al menos una de las (∝ β)ij no es igual a cero
Sea α=0.05
4. Estadística de prueba: La estadística de prueba para cada conjunto de
hipótesis se obtiene a través de la fórmula de la razón de la variancia
(R.V), es decir:
(R. V)A =
S2
1
S2 (R. V)B =
S2
2
S2 (R. V)AB =
S2
3
S2
5. Distribución de la estadística de prueba: Cuando la hipótesis nula
es verdadera y se cumplen las suposiciones, cada una de las estadísticas
de prueba sigue una distribución F.
6. Regla de decisión. Cuando se rechaza la hipótesis nula si el valor
calculado de la estadística de prueba es mayor o igual que el valor
critico de F, para probar las tres hipótesis nulas donde los valores
críticos de F son los siguientes: 2.45, 2.84 y 1.92 respectivamente.
Puesto que los grados de libertad es igual 48 en el denominador y los
grado de libertad del numerador a-1; 6-1=5, b-1; 4-1=3 y a.b= (a-
1)(b-1); (6-1)(4-1)= 15.
7. Cálculo de la estadística de prueba:
Las formulas de cálculos para los diversos componentes son los siguientes:
푠푐푡표푡푎푙 = Σ Σ Σ 푥 2
푖푗푘 − 푐 푛푘
=1
푏푗
=1
푎푖
=1
40. 40
SCB= 290.40 − 286,31 = 4.17
SCB= 4,17
SC(AB)= 풔풄풕풓풂풕 − SCA SCB
SC (AB)= 31,20 − 4,39 − 4,17
SC (AB)= 22,64
SC푟푒푠푖푑푢푎푙 = 풔풄풕풐풕풂풍 − 풔풄풕풓풂풕
SC푟푒푠푖푑푢푎푙 = 27,43 − 10,59
퐒퐂풓풆풔풊풅풖풂 풍 = ퟏퟔ, ퟖퟒ
Para hallar los valores críticos es necesario hacer los siguientes cálculos:
s2 = 퐒퐂풓풆풔풊풅풖풂풍
푎.푏(푛−1)
푠2 =
16,84
48
= 0,35
푠2
1 = 푆퐶퐴
푎 −1
푠2
1 =
4,39
5
= 0,88
푠2
2 = 푆퐶퐵
푏−1
푠2
2 =
4.17
3
= 1,39
푠2
3 = 푆퐶 (퐴퐵)
(푎−1)(푏−1)
푠2
3 =
ퟐퟐ, ퟔퟒ
15
= 1,51
Para probar la hipótesis nula, de que los efectos de los factores A, B y AB son todos
iguales que ceros, se calcula la razón de la varianza.
41. 41
(R. V)A =
S2
1
S2 (R. V)B =
S2
2
S2 (R. V)AB =
S2
3
S2
(퐑. 퐕)퐀 =
ퟎ. ퟖퟖ
ퟎ, ퟑퟓ
= ퟐ, ퟓퟏ (퐑. 퐕)퐁 =
ퟏ, ퟓퟏ
ퟎ, ퟑퟓ
= ퟒ. ퟑퟏ
(퐑. 퐕)퐀퐁 =
ퟏ, ퟑퟗ
ퟎ, ퟑퟓ
= ퟑ, ퟗퟕ
Conclusión
De acuerdo con los resultados de la Razón de la Variancia, los valores del estadístico
de prueba son mayores que los valores críticos de F, por lo tanto, se rechazan las tres
hipótesis nulas.
a) Se Rechaza H`
0.
b) Se Rechaza H``
0.
c) Se Rechaza l H```
0.
42. CONCLUSIÓN
Una vez terminado la monografía de análisis de varianza se pudo llegar a las
siguientes conclusiones:
El Análisis de la varianza y sus procedimientos, se aplican en todas las
ciencias tanto puras como sociales, tales como: en la Geografía,
Matemática, Economía, Política, Administración, Contaduría, Educación,
Industrias, Medicinas, Agriculturas, en la Ingeniería y al Gobiernos, entre
otras. El análisis de la varianza nos permite decidir cuál es la alternativa
más adecuada que permita llevar a una solución satisfactoria del
problema de investigación.
El ANOVA permite decidir los distintos niveles de factores que se
establecen en las diferentes poblaciones o analizar, el comportamiento de
ésta misma para todos los niveles en función de las poblaciones
estudiadas.
El análisis de la varianza permite determinar si existe o no diferencias
estadísticas significativas entre medias cuando se tiene más de dos
muestras o más de dos grupos en el mismo planteamiento.
El análisis de varianza nos permite comparar el valor crítico de F con los
resultados del estadístico de prueba y allí poder tomar decisiones de
rechazar o no la hipótesis nula.
42
43. BIBLIOGRAFÍA
Analisis de Varianza con medidas repetidas. El procedimiento MGL.Medidas
Repetidas. WWW.ucm.es/...es/analisis-datos y multivariable/16anovar-spss.pdf.
De Benitez Celia. (2010) ANÁLISIS DE LA VARIANCIA EN EXPERIMENTOS
FACTORIALES. Extraído de la pagina web: http://fcf.unse.edu.ar/archivos/series-didacticas/
sd-21-estadistica.pdf [Consultada: 2012, marzo 15]
Echeverría, Hernán. Diseños de bloques al azar 8 articulo en línea, consultado en:
http://es.scribd.com/doc/262706/bloques200601
Instituto de investigación en matemáticas aplicadas y sistemas. Diseño de
Experimentos. UNAM. Mtra. Patricia Romero Mares.
WWW.dpye.iimas.unam.mx/fimalis2003/ayuda academica.ppt.cap.16.
Pérez de Vargas, Alberto. Proyecto de innovación educativa 2003/4 guión
electrónico-interactivo de prácticas de la asignatura de bioestadística, consultado en:
http://e-stadistica.bio.ucm.es/glosario2/anova.html
Torres, Virena y otros. Modelos de estadísticos para el procesamiento de
experimentos con mediciones repetidas en la misma unidad experimental.
Robert G. Steel,(1998). Bioestadística Principio y Procedimientos. Segunda Edición.
McGraw-HILL/ Interamericana de Mexico, S.A. de C.V
Ronald, E. Walpole; Raymond, H. Myers. (1992). Probabilidad y Estadística.
Tercera Edición. Editorial McGraw-HILL/ Interamericana de Mexico , S.A. de C.V
43
44. Soto, Lauro. Diseño aleatorizado por bloques completos (articulo en línea) consultado
en: http://www.mitecnologico.com/Main/Dise%F1osEnBloquesCompletosAlAzar.
Tamayo, Ignacio Martin. Análisis de varianza con medidas repetidas de un solo
factor, consultado en: http://www.ugr.es/~imartin/TEMA5_ANOVA.pdf
Wayne, D. y León, F (2002) Bioestadística: Base para el Análisis de las Ciencias de
la Salud (4º ed.). México: LIMUSA
www.ucm.es/info/socivmyt/paginas//analisisdevarianza/16anovar_SPSS.pdf
www.dm.udc.es/asignaturas/estadistica2/sec5_2.html
www.slidefinder.net/D/DISE%C3%91O_ANALISIS/30325052
44