Este documento presenta información sobre el curso de Probabilidad y Estadística II impartido en la Universidad de Lima. Explica los objetivos del análisis de datos experimentales, los términos técnicos clave como experimento, factor, tratamiento y respuesta. Luego describe diseños experimentales como el diseño completamente aleatorio, en bloques completos aleatorios y cuadrado latino. Finalmente resume los pasos para realizar el análisis de varianza en estos diseños experimentales.
4. Razones
Identificar las principales causas de variación en la respuesta
Encontrar las condiciones que permitan alcanzar un valor ideal en la
respuesta
Comparar las respuestas a diferentes niveles de factores controlados por el
investigador
Construir modelos que permitan obtener predicciones de la respuesta.
Diseño de Experimentos
5. Términos técnicos
Experimento:
◦ Ensayo u observación especial hecha para afirmar o negar algo dudoso, y que se lleva a
cabo, bajo condiciones determinadas por el experimentador.Pueden ser Absolutos o
Comparativos.
Diseño:
◦ Es la disposición de los pasos a seguir en una investigación ejerciendo así el control de
la misma, con la finalidad de obtener resultados confiables y su relación con
interrogantes surgidas de las hipótesis. Constituye la mejor estrategia a seguir para
obtener una solución apropiada al problema.
Unidad experimental
◦ Son los objetos, individuos, intervalos de espacio o tiempo sobre los que se experimenta
Respuesta
◦ Variable cuantitativa métrica dependiente, que es afectada por los factores en el
proceso.
◦ Ejemplos: Rendimiento, peso, precio de un producto, etc.
Diseño de Experimentos
6. Términos técnicos
Factor
◦ Variable categórica independiente que influye sobre la Respuesta.
◦ Ejemplos: Marca de motor, Tipo de tecnología, etc.
Tratamientos
◦ Son los diferentes niveles o categorías del factor.
◦ Ejemplos:
Factor = Marca de motor
Tratamientos: Toyota, Nissan, Mitsubishi
Factor = Gasto de consumo
Tratamientos: mas de S/.1000 (gasto alto)
de S/.500 a S/.1000 (gasto medio)
menos de S/.500 (gasto bajo)
Efecto:
◦ Cambio en la respuesta de un tratamiento a otro.
Error Experimental:
◦ Medida de la variación existente entre observaciones sobre unidades experimentales tratadas en forma
similar.
Diseño de Experimentos
7. Diseño completamente aleatorio (Un factor tratamiento): DCA
Cuando se asigna las unidades experimentales a los tratamientos al azar. De hecho si nj es el
número de observaciones en el j-ésimo tratamiento, j = 1,...,a, entonces, los valores n1,n2,...,nj
determinan por completo las propiedades estadísticas del diseño.
Diseño en bloques completos (Un factor tratamiento y un factor bloque): DBCA
Los diseños en bloques pueden ser:
- Diseño en bloques completamente aleatorizado (sin repetición). Cuando se tiene sólo una
observación por cada tratamiento.
- Diseño en bloques completos (con repetición). Cuando se tiene bloques con mas de una
observación por tratamiento, pero el mismo número de observaciones por tratamiento en cada
bloque.
Diseño cuadrado latino (Un factor fila, factor columna y factor tratamiento): DCL
Es el agrupamiento de las unidades experimentales en dos direcciones (filas y columnas) y la
asignación de los tratamientos al azar en las unidades, de tal forma que en cada fila y en cada
columna se encuentren todos los tratamientos.
Algunos DE clásicos
9. Modelo estadístico de un DCA
La respuesta observada para cada tratamiento es una variable aleatoria que puede ser
expresada como la suma de tres componentes.
Se estudia el efecto que tienen los tratamientos de un solo factor sobre una variable
respuesta.
Modelo teórico:
factordelotratamientésimojelpararespuestaladeésimainobservacióijY --
ajni j ,...,2,1,...,2,1
ostratamientdenúmeroa
otratamientésimojelparanesobservaciodenúmeronj -
jotratamientelparalpoblacionamediarespuestajj
ijjijjijY
nobservacióporaleatorioerrorij
Variación causada por los factores no controlados
Efecto del tratamiento j del factor
Media poblacional de la variable respuesta
10. Según los efectos
◦ Modelo de efectos fijos
Cuando los resultados obtenidos sólo son válidos para los tratamientos estudiados.
◦ Modelo de efectos aleatorios
Cuando los tratamientos del factor se constituyen en una muestra aleatoria de tratamientos y los
resultados obtenidos serán válidos para el universo de los tratamientos.
Según el número de las observaciones
◦ Modelo equilibrado (balanceado)
Cuando el número de observaciones por cada tratamiento es el mismo. Esto es, los
nj son iguales para todos los tratamientos estudiados.
◦ Modelo desequilibrado (no balanceado)
Si los nj no son iguales, el modelo es desequilibrado (no balanceado)
Formas del modelo DCA
11. ANOVA de un DCA de efectos fijos
Procedimiento:
1. Organización de los datos
Los datos consisten en nj
observaciones por cada tratamiento j.
Son a tratamientos.
2. Formulación de hipótesis
jjH 0:0 (El factor NO tiene efecto sobre la respuesta)
jjaH 0: algún (El factor SI tiene efecto sobre la respuesta)
Tratamientos
1 2 ……. a
1 Y11 Y12 …… Y1a
2 Y21 Y22 ……. Y2a
……. …… …… ……. ……
nj Yn1,1 Yn2,2 ……. Yna,a
Total Yo1 Yo2 ……. Yoa
Media
12. Tabla ANOVA de un factor de efectos fijos
CME
CM
F tra
0 )( 0);1( FFPP ana
1a traCM
Fuente Grado de
libertad
Suma de
cuadrados
Cuadrados
medios
Estadístico de
prueba F
P-value
Tratamientos
Error SCE CME
Total SCT
traSC
an
a
j
jnn
1
a
j
jjtra YYnSC
1
2
ººº )(
a
j
n
i
jij
j
YYSCE
1 1
2
º )( SCESCSCT tra
1
a
SC
CM tra
tra
an
SCE
CME
Regla de Decisión:
jn
i
ij
j
j Y
n
Y
1
º
1
a
j
n
i
ij
j
Y
n
Y
1 1
ºº
1
1n
)1,,1(0, anaFFsiHorechazaSe
valuepsiHorechazaSe ,
13. 3. Estimación puntual
4. Intervalo de Confianza para la media por tratamientos
5. Intervalo de Confianza para la diferencia de 2 medias de
tratamientos (comparaciones múltiples de Fisher)
j
an
ojj
n
CME
tyI
),
2
1(
)
11
(
),
2
1(
jk
an
ojokjk
nn
CMEtyyI
ooojjojj YYYY oo ˆˆˆ
14. Supuestos del modelo DCA
Los datos deben ser descritos adecuadamente por el modelo:
Donde:
Los errores deben satisfacer lo siguiente:
– Son v.a con distribución normal con media cero (normalidad de residuos)
– Tienen varianza constante (homocedásticidad)
– Son variables aleatorias independientes (no autocorrelación de residuos)
),0( 2
Nij
ijjijY
15. Diseño en Bloques Completos
Aleatorios - DBCA
Análisis de datos experimentales
16. DBCA
Es un diseño de dos factores, uno denominado factor tratamiento y el otro factor bloque.
Consideramos el diseño sin repetición, es decir para cada bloque y tratamiento sólo hay una
observación. Ambos factores son de efectos fijos.
Términos técnicos
Respuesta
Variable cuantitativa métrica dependiente, que es afectada por los factores en el proceso.
Ejemplos: Rendimiento, peso, precio de un producto, etc.
Factor Tratamiento
Variable categórica independiente del que interesa conocer su influencia en la respuesta.
Factor Bloque
Variable categórica independiente en la que no se está interesado en conocer su influencia
en la respuesta pero se supone que ésta existe y se quiere controlar para disminuir la
variabilidad residual (es decir, eliminar su efecto en el análisis).
Tratamientos
Son los diferentes niveles o categorías del factor tratamiento. Son, por tanto, las
condiciones experimentales que se desean comparar en el experimento.
17. Modelo estadístico de un DBCA
Modelo teórico:
bloqueésimoielparaotratamientésimojdelrespuestasijY --
ajbi ,...,2,1,...,2,1
ostratamientdenúmeroabloquesdenúmerob
ijijijjiijY
nobservacióporaleatorioerrorij
Variación causada por los factores no controlados
Efecto del tratamiento j en la respuesta
Media poblacional de la variable respuesta
Efecto del bloque i en la respuesta
ji
18. ANOVA de un DBCA
1. Organización de los datos
Los datos de cada individuo se les denomina bloque y los datos se representan en una tabla
de doble entrada análoga a la del ANOVA de un factor en la que las a columnas son los
tratamientos y las b filas los bloques. Por lo tanto, la matriz de datos consiste de n=ab
observaciones.
Bloques
Tratamientos
1 2 ……. a Media
1 Y11 Y12 …… Y1a
2 Y21 Y22 ……. Y2a
……. …… …… ……. …… ……….
b Yb1 Yb2 ……. Yba
Media
1Y
2Y
bY
a
j
iji Y
a
Y
1
º
1
b
i
a
j
ijY
ab
Y
1 1
ºº
1
b
i
ijj Y
b
Y
1
º
1
19. 2. Formulación de hipótesis
◦ Se prueba la igualdad de los efectos de los tratamientos.
◦ Prueba de importancia del bloqueo.
)...(0: 210 ,...,2,1 aj ajH
(El factor tratamiento NO influye sobre la respuesta)
)j(0: algúnalgún kj kjjaH
(El factor tratamiento SI influye sobre la respuesta)
OJO. Si se rechaza Ho, entonces hay evidencia de que el factor bloque fue importante
en el diseño.
)...(0: 210 ,...,2,1 bi biH
(El factor bloque NO influye sobre la respuesta)
(El factor bloque SI influye sobre la respuesta)
)i(0: algúnalgún ki kiiaH
20. Tabla ANOVA de un DBCA
CME
CM
F traT
0 )( 0)]1)(1(;1[
T
baa FFPP 1a
traCM
Fuente Grado de
libertad
Suma de
cuadrados
Cuadrados
medios
Estadístico
de prueba F
P-value
Tratamientos
Bloques
Error SCE CME
Total SCT
traSC
1b
b
i
a
j
jtra YYSC
1 1
2
ººº )(
b
i
a
j
jiij YYYYSCE
1 1
2
ºººº )(
1
a
SC
CM tra
tra
)1)(1(
ba
SCE
CME
)1)(1( ba
bloSC
bloCM
CME
CM
F bloB
0
)( 0)]1)(1(;1[(
B
bab FFPP
b
i
a
j
ij YYSCT
1 1
2
ºº )(
b
i
a
j
iblo YYSC
1 1
2
ººº )(
1
b
SC
CM blo
blo
1ab
Regla de decisión: )1,,1(0, ana
T
FFsiHorechazaSe
valuepsiHorechazaSe ,
21. Supuestos del modelo DBCA
Los efectos de tratamientos y bloques son aditivos. Es decir no hay interacción entre
tratamientos y bloques.
Los datos deben ser descritos adecuadamente por el modelo:
donde:
Los errores deben satisfacer lo siguiente:
Son v.a con distribución normal con media cero (normalidad de residuos)
Tienen varianza constante (homocedásticidad)
Son variables aleatorias independientes (no autocorrelación de errores)
),0( 2
Nij
ijjiijY