Este documento describe un estudio para determinar si existen diferencias en los diámetros de tubos producidos por 5 máquinas. Se midieron 5 tubos de cada máquina y los datos muestran las medias de diámetros. Se realizó un análisis de varianza que encontró diferencias significativas entre las máquinas. Las comparaciones de Tukey y Duncan indican que la máquina 1 produce los mejores diámetros que cumplen con las especificaciones.
EVIDENCIA 2 EXPOSICIÓN (1).pptx, gestion de cadena de suministros
Solucion taller1 clase
1. Taller No. 1 en Clase Viernes 4 de Septiembre de 2015
Dise˜no de Experimento UnalMed
Cinco m´aquinas fueron dise˜nadas para producir cierto tipo de tubos cuyos di´ametros deben ser aprox-
imadamente 14.0 c.m. En un estudio piloto, se seleccionaron aleatoriamente cinco tubos del total de
los tubos producidos por cada m´aquina y se midieron sus di´ametros ¿Hay alguna diferencia entre los
di´ametros de los tubos producidos por las diferentes m´aquinas?. Usar α = 0.05 en todas las pruebas.
Los datos recolectados son los siguientes:
M´aquinas Di´ametros
1 14.0 14.1 14.2 14.0 14.1
2 13.9 13.8 13.9 14.0 14.0
3 14.1 14.2 14.1 14.0 13.9
4 13.6 13.8 14.0 13.9 13.7
5 13.8 13.6 13.9 13.8 14.0
1. Identifique la variable respuesta, la variable que define el factor y los tratamientos. Realice un
an´alisis de varianza para determinar si existe diferencia significativa entre las m´aquinas, escriba
las respectivas hip´otesis e interprete sus t´erminos. Escriba la expresi´on para el valor P de la prueba.
Soluci´on: La variable respuesta es: Di´ametros de los tubos.
yij : Di´ametro del j-´esimo tubo producido por la ´ı-´esima m´aquina, i = 1, 2, . . . , 5 y j =
1, 2, . . . , 5.
Factor: Tipo de m´aquina
Niveles del Factor o Tratamientos: M´aquinas 1,2,3,4 y 5.
An´alisis de varianza para analizar la significancia del factor.
H0 : µ1 = µ2 = µ3 = µ4 = µ5
Ha : µi = µj , p.a i = j
α = 0.05.
F = SStrat/(a−1)
SSE/(N−a) = MStrat
MSE
∼ Fa−1,N−a = F4,20.
Se rechaza H0 si FCal > F0.05;4,20 = 2.87.
FCal = 5.77, V alorp = P[F4,20 > FCal] = P[F4,20 > 5.77] = 0.002957
Tabla Anova
Fuente de Var Sum Sq Df Mean Sq F value Pr(>F)
Trat. 0.3416 4 0.0854 5.77 0.0030
Error 0.2960 20 0.0148
Total 0.6376 24
1
2. 2. Estime e interprete (signo) los efectos de cada uno de los tratamientos.
Soluci´on:
Medias 1 2 3 4 5 ˆµ = y··
ˆµi = yi· 14.08 13.92 14.06 13.80 13.82 13.94
ˆτi = yi· − y·· 0.14 -0.02 0.12 -0.14 -0.12
S2
i 0.007 0.007 0.013 0.025 0.022
Estos estimadores de los efectos nos dan informaci´on muestral, sin todav´ıa indicar si son significa-
tivos, acerca de qu´e m´aquinas producen di´ametros en los tubos de acero por debajo del promedio
global (M´aquinas 2, 4 y 5) y aquellas que producen di´ametros mayores a la media global, M´aquinas
1 y 3.
Es posible por la magnitud de los efectos estimados y debido a que la prueba F dio significativa,
que las m´aquinas 1, 3, 4 y 5, sean las responsables del rechazo de Ho.
ˆyij = ˆµ + ˆτi
3. Verifique el supuesto de homogeneidad de varianza entre los tratamientos. Use la prueba de Levene
modificada. Haga en forma expl´ıcita la prueba de Bartlett, realice cada uno de los c´alculos.
Soluci´on:
Prueba de Bartlett
H0 : σ2
1 = σ2
2 = σ2
3 = σ2
4 = σ2
5 = σ2
Ha : σ2
i = σ2 , p.a i
α = 0.05.
χ2
0 = 2.3026
q
c
donde:
q = (N − a)Log10S2
p −
a
i=1
(ni − 1)Log10S2
i
= 20Log10S2
p − 4
5
i=1
Log10S2
i
= −36.59 + 37.82 = 1.23
y
c = 1 +
1
3(a − 1)
a
i=1
1
ni − 1
−
1
N − a
= 1 +
1
12
5
i=1
1
4
−
1
20
=
13
12
= 1.083
2
3. con,
S2
p =
5
i=1(ni − 1)S2
i
N − a
=
4 5
i=1 S2
i
20
= 0.0148
y S2
i -es la varianza muestral del i-´esimo tratamiento.
Luego,
χ2
0 = 2.3026
q
c
= 2.3026
1.23
1.083
= 2.615
y
χ2
0.05;a−1 = χ2
0.05;4 = 9.48
luego, como χ2
0 < χα;a−1 = χtabla, entonces no rechazamos H=0, ie. la varianza de los tratamien-
tos se puede considerar iguales a un nivel de significancia del 5%.
Usando R:
Prueba de Bartlett
Bartlett test of homogeneity of variances
data: y by algodon
Bartlett’s K-squared = 2.5689, df = 4, p-value = 0.6323
Prueba de Levene:Modeificada
Levene’s Test for Homogeneity of Variance (center = median)
Df F value Pr(>F)
group 4 0.5667 0.6897
20
4. Verifique el supuesto de normalidad de los errores. Plantee las hip´otesis y concluya.
Soluci´on:
H0 : Los εij se distribuyen normal
Ha : Los εij No-se distribuyen normal
α = 0.05
Prueba de Shapiro-Wilks
Shapiro-Wilk normality test
data: residuales
W = 0.9818, p-value = 0.9186
Conclusi´on. No hay evidencia para rechazar a un nivel de significancia del 5%. Por tanto los
errores tienen distribuci´on normal.
3
4. −2 −1 0 1 2
−0.2−0.10.00.10.2
Gráfico cuantil−cuantil (qq−plot)
Cuantiles teóricos
Cuantilesmuestrales
−0.2−0.10.00.10.2
Gráfico de cajas (Box−Plot)
Residuales
5. ¿Se podr´a afirmar que la m´aquina 5 ofrece los mismos resultados que el promedio de las otras 4
m´aquinas? Plantee un contraste y realice la respectiva prueba de hip´otesis.
Soluci´on:
H0 : µ5 = µ1+µ2+µ3+µ4
4
Ha : µ5 = µ1+µ2+µ3+µ4
4
⇐⇒
H0 : 4µ5 − µ1 − µ2 − µ3 − µ4 = 0
Ha : 4µ5 − µ1 − µ2 − µ3 − µ4 = 0
⇐⇒
H0 : C = 0
Ha : C = 0
α = 0.05
T0 =
a
i=1 ciyi·
MSE a
i=1 c2
i /ni
∼ tN−a.
4
5. T0 =
5
i=1 ciyi·
MSE 5
i=1 c2
i /ni
=
(−1(14.08) − 1(13.92) − 1(14.06) − 1(13.80) + 4(13.82))
0.01
5 (1 + 1 + 1 + 1 + 16)
=
−0.58
0.2
= −2.9
Tα/2;N−a = T0.025;20 = 2.086.
Luego, como |T0| = 2.9 > 2.086 = Ttabla, entonces se rechaza H0, ie. a un nivel del
5%, la m´aquina 5 produce resultados igual al promedio de los di´ametros producidos por las otras
cuatro m´aquinas.
6. Plantee un conjunto de 4-contrastes ortogonales. Realice la prueba de significancia para cada uno
de ellos y verifique la igualdad: SSTrat. = SSC1 + SSC2 + SSC3 + SSC4 .
Soluci´on: Se plantea el siguiente conjunto de contrastes ortogonales:
C1 = µ4 − µ5
C2 = µ1 + µ3 − µ4 − µ5
C3 = µ1 − µ3
C4 = 4µ2 − µ1 − µ3 − µ4 − µ5
En R:
> contraste
1 2 3 4 5
4 vs 5 0 0 0 1 -1
1+3 vs 4+5 1 0 1 -1 -1
1 vs 3 1 0 -1 0 0
4(2) vs 1+3+4+5 -1 4 -1 -1 -1
La estimaci´on de cada contraste es:
General Linear Hypotheses
Multiple Comparisons of Means: User-defined Contrasts
Linear Hypotheses:
Estimate
4 vs 5 == 0 -0.02
1+3 vs 4+5 == 0 0.52
1 vs 3 == 0 0.02
4(2) vs 1+3+4+5 == 0 -0.08
5
6. La PH de cada contraste es:
Simultaneous Tests for General Linear Hypotheses
Multiple Comparisons of Means: User-defined Contrasts
Fit: aov(formula = y ˜ algodon)
Linear Hypotheses:
Estimate Std. Error t value Pr(>|t|)
4 vs 5 == 0 -0.02000 0.07694 -0.260 0.998067
1+3 vs 4+5 == 0 0.52000 0.10881 4.779 0.000463 ***
1 vs 3 == 0 0.02000 0.07694 0.260 0.998073
4(2) vs 1+3+4+5 == 0 -0.08000 0.24331 -0.329 0.995216
---
Signif. codes: 0 ?***? 0.001 ?**? 0.01 ?*? 0.05 ?.? 0.1 ? ? 1
(Adjusted p values reported -- single-step method)
Las sumas de cuadrado de cada contraste es:
SSC =
n [ a
i=1 ciyi·]
2
a
i=1 c2
i
,
luego:
SSC1 =
n 5
i=1 ciyi·
2
5
i=1 c2
i
=
5(0.02)2
2
= 0.001
SSC2 =
n 5
i=1 ciyi·
2
5
i=1 c2
i
=
5(0.52)2
4
= 0.338
SSC3 =
n 5
i=1 ciyi·
2
5
i=1 c2
i
=
5(0.02)2
2
= 0.001
SSC4 =
n 5
i=1 ciyi·
2
5
i=1 c2
i
=
5(0.08)2
20
= 0.0016
de donde,
SSTrat. = SSC1
+ SSC2
+ SSC3
+ SSC4
= 0.3416,
como puede verse de la tabla a nova.
6
7. 7. Suponiendo que la m´aquina 1 es la m´aquina est´andar, ie. un control, determine si conjuntamente
los resultados de las otras m´aquinas difieren del est´andar, use el m´etodo de comparaciones de
Dunnet.
Soluci´on:
Comparaciones con un control (5), M´etodo de Dunnet
Simultaneous Tests for General Linear Hypotheses
Multiple Comparisons of Means: User-defined Contrasts
Fit: aov(formula = y ˜ algodon)
Linear Hypotheses:
Estimate Std. Error t value Pr(>|t|)
1 vs 5 == 0 0.26000 0.07694 3.379 0.0104 *
2 vs 5 == 0 0.10000 0.07694 1.300 0.5145
3 vs 5 == 0 0.24000 0.07694 3.119 0.0184 *
4 vs 5 == 0 -0.02000 0.07694 -0.260 0.9967
---
Signif. codes: 0 ?***? 0.001 ?**? 0.01 ?*? 0.05 ?.? 0.1 ? ? 1
(Adjusted p values reported -- single-step method)
Las m´aquinas que difieren del control (5) son las m´aquinas 1 y 3, a un nivel de significancia del
5%, es decir que los di´ametros promedios de los tubos de acero de estas m´aquinas son diferentes a
los de la m´aquina 5, (est´andar o control).
8. Compare los tratamientos y recomiende el mejor, para ello tenga en cuenta las comparaciones
de Tukey y Duncan, adem´as del an´alisis descriptivo usando los boxplots. Con este dise˜no puede
concluirse ¿cu´al de las m´aquinas da mejores di´ametros que cumplan con las especificaciones?
Soluci´on:
Comparaciones mediante el M´etodo de Tukey
Tukey multiple comparisons of means
95% family-wise confidence level
Fit: aov(formula = y ˜ algodon)
$algodon
diff lwr upr p adj
2-1 -0.16 -0.3902379 0.070237895 0.2669972
3-1 -0.02 -0.2502379 0.210237895 0.9989043
4-1 -0.28 -0.5102379 -0.049762105 0.0125769
5-1 -0.26 -0.4902379 -0.029762105 0.0221607
3-2 0.14 -0.0902379 0.370237895 0.3904049
4-2 -0.12 -0.3502379 0.110237895 0.5382897
5-2 -0.10 -0.3302379 0.130237895 0.6944089
4-3 -0.26 -0.4902379 -0.029762105 0.0221607
5-3 -0.24 -0.4702379 -0.009762105 0.0384679
5-4 0.02 -0.2102379 0.250237895 0.9989043
7
8. −0.4 −0.2 0.0 0.2 0.4
5−45−34−35−24−23−25−14−13−12−1
95% family−wise confidence level
Differences in mean levels of algodon
Soluci´on:
Comparaciones mediante el M´etodo de Duncan
$statistics
Mean CV MSerror
13.936 0.8729567 0.0148
$parameters
Df ntr
20 5
$Duncan
Table CriticalRange
2 2.949998 0.1604972
3 3.096506 0.1684682
4 3.189616 0.1735339
5 3.254648 0.1770720
$means
y std r Min Max
1 14.08 0.0836660 5 14.0 14.2
2 13.92 0.0836660 5 13.8 14.0
3 14.06 0.1140175 5 13.9 14.2
4 13.80 0.1581139 5 13.6 14.0
5 13.82 0.1483240 5 13.6 14.0
8
9. $comparison
NULL
$groups
trt means M
1 1 14.08 a
2 3 14.06 a
3 2 13.92 ab
4 5 13.82 b
5 4 13.80 b
1 2 3 4 5
13.613.713.813.914.014.114.2
Box−Plot para Diámetros (Y) por máquinas
Máquinas
Díametrosdelostubos(Y)
9
10. 13.613.713.813.914.014.114.2
Gráfico de Medias e IC
Máquinas
Díametrosdelostubos(Y)
1 2 3 4 5
n=5 n=5 n=5 n=5 n=5
9. Si se deseara hacer un dise˜no posterior, usando las estimaciones de este dise˜no, determine el
n´umero de r´eplicas que se deber´ıan hacer si se desea observar una LSD de 0.3 cm. Adem´as, cu´antas
r´eplicas ser´ıan necesarias si se desea una potencia de 0.90, con una diferencia entre cualquier par
de medias de tratamientos de a lo sumo 0.3 cm.
Soluci´on:
α = 0.05
n0 = 5 , ˆσ2
= MSE = 0.0148 , DT = 0.3 , a = 5 , N−a = a(n0−1)
luego,
n =
[tα/2;a(n0−1)]2
D2
T
2MSE =
[t0.025;20]2
(0.3)2
2(0.0148) =
(2.086)2
(0.3)2
2(0.0148) = 1.43 =≈ 2
donde, t0.025;20 = 2.086.
Se necesitar´an aproximadamente 2 r´eplicas en cada m´aquina para observar una LSD del orden
de 0, 3 cm y con un nivel de confianza del 95%. ( Nota: la LSD actual, ie. con n=5, es de:
LSD = 0.1605), la cual refleja mayor precisi´on.
Ahora, para una potencia de 0.90, con una diferencia entre cualquier par de medias de tratamientos
de a lo sumo 0.3 cm, se tiene lo siguiente:
Φ2
= n ∗ f2
, es decir,
10
11. f =
D2
2aσ2
=
(0.3)2
2(5)0.0148
= 0.7798,
es decir,
Φ2
= n ∗ f2
= 0.608n,
Balanced one-way analysis of variance power calculation
k = 5
n = 6.102684
f = 0.7798
sig.level = 0.05
power = 0.9
NOTE: n is number in each group
Es decir, el n´umero de observaciones requerido en cada grupo es de 7, para que se rechace H0 al
detectar diferencias muy peque˜nas entre pares de medias, ie. diferencias del orden de D = 0.3 cm
y alcanzar una potencia del 90%.
Nota: Con n = 2 y D = 0.3, la potencia que se tiene es de alrededor del 30%.
10. Suponga que las cinco m´aquinas fueron seleccionadas aleatoriamente de una poblaci´on de varias
m´aquinas disponibles en la empresa. Replantee el modelo junto con sus supuestos y realice la
prueba de hip´otesis respectiva para probar la significancia del tipo m´aquina.
Soluci´on:
Modelo de efectos aleatorios
yij = µ + τi + εij
con i = 1, 2, . . . , 5 y j = 1, 2, . . . 5 y donde τi y εij-son variables aleatorias.
Supuetos:
• τi ∼ N(0, σ2
τ )
• εij ∼ N(0, σ2
)
• τi , εij son independientes, de donde, que V ar(yij) = σ2
τ + σ2.
La prueba de hip´otesis de inter´es es:
H0 : σ2
τ = 0
Ha : σ2
τ > 0
La estad´ıstica de prueba, esta dada por:
F =
SSTrat/(a − 1)
SSE/(N − a)
=
MSTrat
MSE
∼ Fa−1,N−a ∼ F4,20
Se rechaza H0 si FCal > Fα;4,20.
11
12. Tabla Anova
Fuente de Var Sum Sq Df Mean Sq F value Pr(>F)
Trat. 0.34 4 0.09 5.77 0.0030
Error 0.30 20 0.01
Total 0.64 24
de donde, Como
FCal. = 5.77 > 2.87 = F0.05;4,20 = Fα;a−1,N−a
entonces, Se rechaza H0 : σ2
τ = 0, ie. que existe una variabilidad entre los
tratamientos, ie. entre las m´aquinas a un nivel de significancia de 0.05.
Las estimaci´on de las componentes de varianza son:
ˆσ2
τ =
MSTrat − MSE
n
=
0.085 − 0.015
5
= 0.014
y
ˆσ2
= MSE = 0.0148.
La varianza de cualquier observaci´on de la muestra es:
V ar(yij) = ˆσ2
τ + ˆσ2
= 0.014 + 0.0148 = 0.0288,
de donde se observa que aproximadamente el 48% de la variabilidad se
atribuye a diferencias entre las m´aquinas.
Codigo en R:
y<-c(14,14.1,14.2,14,14.1,13.9,13.8,13.9,14,14,14.1,14.2,14.1,14,13.9,
13.6,13.8,14,13.9,13.7,13.8,13.6,13.9,13.8,14)
factor<-c(rep(1,5),rep(2,5),rep(3,5),rep(4,5),rep(5,5))
algodon<-as.factor(factor)
anova.y <- aov(y˜algodon)
summary(anova.y)
#1-pf(5.77,4,20)
# Media Globla y Efectos de tratamientos
grp.means <- tapply(y,algodon,mean)
(global.media <- mean(y))
tapply(y,algodon,function(x) mean(x)-global.media)
tapply(y,algodon,function(x) var(x))
tapply(y,algodon,function(x) sd(x))
# Gr´afico de Medias
stripchart(y˜algodon,vert=T,method="overplot",pch=1,col="red",ylab="")
stripchart(as.numeric(grp.means)˜as.numeric(names(grp.means)),
pch="*",cex=1.5,vert=T,add=T)
title(main="Resistencia a la Tensi´on ", ylab="Resistencia a la tensi´on
Observada(lb/pul2)",
xlab="Porcentajes de Algod´on")
legend("bottomright", "Medias de Grupos o Tratos.",pch="*",bty="n")
12
13. #Validaci´on de Supuestos
par(mfrow=c(1,2),cex=.8)
plot(fitted(anova.y),residuals(anova.y))
qqnorm(residuals(anova.y))
qqline(residuals(anova.y))
################################################################
#prueba de independencia
#require(car)
plot(residuals(anova.y), pch=16, ylab="Residuales", xlab="Orden",
main="Gr´afico de Residuales vs Orden")
abline(h=0)
#############################################################
#pruebas de homogeneidad de varianza
#prueba de Bartlett para homegeneidad de varianza (normalidad bien)
bartlett.test(y˜algodon)
#prueba de Levene para homegeneidad de varianza (sospecha de normalidad)
levene.test(anova.y)
###########################################
install.packages("car")
require(car)
#library(car)
leveneTest(y˜algodon)
bartlett.test(y˜algodon)
#bptest(y˜algodon)
#bptest(anova.y)
#pruebas de normalidad
######################################################################
residuales <- residuals(anova.y)
#valores_ajustados<-(fitted(anova.y))
par(mfrow=c(1,2))
qqnorm(residuales, xlab="Cuantiles te´oricos", ylab="Cuantiles
muestrales",
main="Gr´afico cuantil-cuantil (qq-plot)")
qqline(residuales)
boxplot(residuales, xlab="Residuales", main="Gr´afico de cajas
(Box-Plot)")
###### pruebas an´aliticas
#install.packages("nortest")
######
#require(nortest)
shapiro.test(residuales)
#####################################################################
#Boxplot de Residuales
boxplot(residuals(anova.y)˜algodon)
abline(h=mean(residuals(anova.y)),col="red")
title(main="Gr´afica de Residuos Por Tratameintos",
ylab="Residuos", xlab="Porcentajes de Algod´on")
13
14. ############################################
library(agricolae)
require(agricolae)
mds<-LSD.test(anova.y, "algodon")
mds
tukey<-TukeyHSD(anova.y, "algodon")
tukey
plot(TukeyHSD(anova.y, "algodon"))
duncann<-duncan.test(anova.y, "algodon")
duncann
##################################
# Para realizar el grafico de medias instalamos la librer´ıa gplots
#install.packages("gplots")
# Llamado de la librer´ıa gplots
#require(gplots)
# An´alisis descriptivo y gr´afico
par(mfrow=c(1,2))
boxplot(y˜algodon,main="Box-Plot para Di´ametros (Y) por
m´aquinas",xlab="M´aquinas",ylab="D´ıametros de los tubos (Y)")
# Gr´afico de medias
plotmeans(y˜algodon,p=0.95,main="Gr´afico de Medias e
IC",xlab="M´aquinas",ylab="D´ıametros de los tubos (Y)")
##################################################
#library(mvtnorm)
#library(multcomp)
#library(survival)
#library(splines)
#library(TH.data)
##################################################
contraste <- rbind("4 vs 5"=c(0,0,0,1,-1),"1+3 vs 4+5"
=c(1,0,1,-1,-1), "1 vs 3"=c(1,0,-1,0,0),"4(2) vs 1+3+4+5"=c(-1,4,-1,-1,-1))
filas<-c("4 vs 5","1+3 vs 4+5","1 vs 3","4(2) vs 1+3+4+5" )
columnas<-c("1","2","3","4","5")
dimnames(contraste)<-list(filas,columnas)
contraste
model<- aov(y˜algodon)
compara<-glht(model, linfct = mcp(algodon = contraste))
compara
summary(compara)
######################################
## library(pwr)
######################################
pwr.anova.test(f=0.7798, k=5, power=0.9, sig.level=0.05)
pwr.anova.test(f=0.7798, k=5, power=0.3, sig.level=0.05)
14