SlideShare una empresa de Scribd logo
1 de 62
Descargar para leer sin conexión
ESCUELA MILITAR DE INGENIERIA
UNIDAD ACADÉMICA SANTA CRUZ
UNIDAD DE POSTGRADO
ESTADÍSTICA APLICADA A LA EDUCACIÓN
SUPERIOR
Por: Ing. M.Sc. Francisco Martínez Solaris
Mgs. En Educación Superior
Santa Cruz, Mayo del 2013
Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior
INTRODUCCION
La investigación sobre el aprendizaje y la enseñanza ha avanzada tremendamente, y los
investigadores buscan contribuir a la mejora de la educación. Sin embargo, continúan las quejas
sobre la brecha entre la teoría/investigación por un lado, y las prácticas educativas, por el otro.
Una manera potencial para remediar la brecha entre teoría y práctica es llevar a cabo
experimentos de diseño que:
- Buscan desarrollar una ciencia de diseño de la educación.
- Puedan guiar el desarrollo de ambientes de aprendizaje eficaces novedosos
La experimentación es instrumento de vital importancia para la investigación ya que por medio
de ella, el investigador es capaz de simular un fenómeno de interés, lo que conduce a una
investigación más rápida, efectiva, de menor riesgo y con un rigor científico, siempre y cuando
exista una previa planificación de la investigación.
Existen diferentes tipos de investigaciones que pueden generar conocimientos ya sean básicos o
bien aplicables. Independientemente del tipo de conocimiento que genere una investigación, éste
tiene que someterse a una valoración científica. Para esto la estadística ofrece herramientas
como los DISEÑOS EXPERIMENTALES de los cuales el investigador se vale para demostrar
sus conjeturas, aceptar o no una hipótesis, comparar resultados, emitir conclusiones, etc. acerca
del problema o fenómeno en estudio.
"Las teorías basadas en ideologías carecen de experimentación, y por ello, no son ciencia, lo
que no se demuestra con experimento es política. Lo que se demuestra con experimentación, es
ciencia (Robert Laughlin, Premio Nobel de Física 1998).
Ing. M.Sc. Francisco Martínez Solaris
Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior
1. REGRESION Y CORRELACION LINEAL SIMPLE
1.1 Regresión Lineal Simple
En muchas áreas de la investigación científica, la variación en las mediciones de una
variable en estudio es causada preponderantemente por otras variables relacionadas cuyas
magnitudes cambian en el curso del experimento. La incorporación explícita de los datos de
estas variables que influyen en el análisis estadístico, permite conocer la naturaleza de las
relaciones y utilizar esta información para mejorar la descripción y las inferencias de las
variables de interés primario.
Al probar las relaciones entre variables es importante que el valor de la variable pueda ser
predicha de las observaciones de otra variable o aún controladas y optimizadas
manipulando los factores de influencia.
El análisis de regresión es un conjunto de métodos estadísticos, que tratan con la
formulación de modelos matemáticos que describen las relaciones entre variables y el uso
de estas relaciones modeladas con el propósito de predecir e inferir.
Supuestos del modelo de Regresión Lineal Simple
Al igual que en otros tipos de análisis estadísticos, el modelo de Regresión Lineal Simple
se basa en ciertos supuestos que a continuación se detallan.
Supuesto 1. "Y" es una variable aleatoria cuya distribución probabilística depende de
"X"
Este supuesto quiere decir que para cualquier valor de "X", "Y" es una variable aleatoria
con cierta distribución probabilística con media μy/x y σ²y/x. Note que esta suposición
solamente implica que "Y" es una variable aleatoria que depende de "X", y no toma en
cuenta la forma lineal. Por otra parte, significa que la variable X se mide sin error y fijada
por el investigador.
Supuesto 2. Modelo de la línea recta
Esta suposición requiere que la ecuación para μy/x sea una línea recta, es decir que μy/x = ß0
+ ß1Xi y, por lo tanto, que la ecuación de dependencia sea Y = ß0 + ß1Xi + ε. Con esta
Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior
restricción, la línea que une a μy/x debe de ser una recta, por lo tanto se puede tener una de
las siguientes situaciones:
Puede ser que se tenga una relación positiva entre las variables X y Y, esto quiere decir que
a medida que aumenta X, Y también aumenta.
Otra situación que se puede dar es una relación inversa, es decir, que a medida que aumenta
X, Y disminuye.
En el último caso se recurre al hecho de que regresión también se entiende como la
tangente inversa del ángulo de inclinación de una recta. En los dos primeros casos las rectas
tienen pendiente y en el tercer caso, no hay pendiente lo cual indica que no existe regresión
lineal entre ambas variables.
Supuesto 3. Homogeneidad de varianza
Esta suposición es muy importante en el análisis de regresión. La varianza de la
distribuciones de "Y" son idénticas para todos los valores de "X". En otras palabras, se
supone que σ²y/x1 = σ²y/x2 = σ²y/xn = σ², donde σ² es la varianza común (desconocida) para
todas las distribuciones de "Y", independientemente del valor de "X". Esto quiere decir,
que la media de "Y" se modifica con el valor de "X", pero la varianza se mantiene
constante.
Supuesto 4. Independencia
Los valores de "Y" deberán ser estadísticamente independiente. Un ejemplo donde se viola
este supuesto es cuando se realizan mediciones de peso a un mismo individuo en un lapso
menor a una hora.
Supuesto 5. Normalidad
La distribución de "Y" para cualquier valor de "X" es normal. Esto equivale a suponer que
la variable aleatoria no observable ε es normal y su media es cero ya que "X" se toma
como variable no aleatoria susceptible a ser manipulada por el investigador.
Y
X
Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior
Todos los supuestos anteriores se pueden resumir en los siguientes:
1. "Y" es una variable aleatoria cuya distribución probabilística depende del valor de "X".
2. La ecuación de regresión es una línea recta.
3. Homogeneidad de varianza.
4. Independencia de las observaciones lo que implica que los errores son independientes.
5. Normalidad.
En la Figura 1 se muestran los supuestos de normalidad y homogeneidad de varianza.
1.2. Diagrama de Dispersión
Este diagrama tiene por objetivo dar una idea de la posible relación existente entre la
variable dependiente Y y la independiente X.
Para realizar un diagrama de dispersión se coloca en el eje de las abscisas los valores
correspondiente a la variable independiente X y en el eje de las ordenadas los valores de la
variable dependiente Y. Luego se colocan puntos en la intersección de los valores de ambas
variables. Un ejemplo de lo anterior se muestra en seguida.
Los datos que se muestran a continuación corresponden a la producción en miles de
millones de dólares de 10 empresas y sus costos de producción de las mismas en miles de
millones de dólares.
Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior
Para construir un diagrama de dispersión lo primero que se tiene que hacer es determinar
quién es la variable dependiente y quién es la variable independiente, es decir, establecer la
relación entre dichas variables. Esta relación debe ser lo más natural posible.
En el caso del problema, es de suponerse que a medida que aumenta la producción también
se incrementarán los costos de producción por todo lo concerniente a ello (materia prima,
horas hombres, gastos de energía, etc.). Entonces definimos a X, variable independiente, a
la Producción y a Y, variable dependiente, a los costos de producción. De acuerdo a esto se
tiene lo siguiente:
Producción (X)
(miles de millones de $us)
Costo (Y)
(miles de millones $u)
10 3
18 5
12 4
16 5
22 8
36 12
30 10
32 14
26 12
12 3
El diagrama de dispersión quedaría de la siguiente forma:
De acuerdo a la información que proporciona el diagrama de dispersión se puede observar
que a medida que aumenta la producción de las industrias, aumentan los costos de
0
2
4
6
8
10
12
14
16
0 5 10 15 20 25 30 35 40
Costo(Milesdemillones$us)
Producción (Miles de Millones $us)
Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior
producción de las mismas, es decir, se concluir que existe una relación positiva entre estas
variables y además se puede ver que esta relación tiende a ser lineal.
1.3. Método de Mínimos Cuadrado
Como lo plantea el supuesto 2 del modelo de regresión lineal simple, "Modelo de la Línea
Recta", que de existir una relación entre X y Y, ésta debe ser una línea recta. Entonces a
partir de muestra (x1, y1), (x2, y2),..., (xn, yn), de las variables "X" y "Y", se trata de
obtener una ecuación que represente la relación entre dichas variables. El modelo del cual
se habla es de una ecuación punto pendiente como sigue:
El problema de esta modelo es que sus componentes son parámetros y por lo tanto, son
estados desconocidos de la naturaleza generalmente. Es por ello que es necesario obtener
estimadores de ß0 y ß1 para estimar adecuadamente la recta de regresión μy/xi. El
estimador de μy/xi se denota por: ̂ ̂ ̂
Para llegar a obtener estos estimadores se hace uso de la técnica propuesta por Carl Gauss
(1777-1855). Este método se basa en la idea de obtener estimadores para los componentes
del modelo que minimicen la suma de cuadrados de las distancias entre los valores
observados (Yi) y los estimados (̂ ). Esto significa que se tiene que minimizar la suma de
cuadrados de las longitudes de los segmentos de las líneas verticales que unen los datos
observados con la recta estimada como se muestra en la Figura 3.
A la técnica antes mencionada se le denomina "Técnica de Mínimos Cuadrados". Usando
notación matemática, el método de mínimo cuadrados consiste en encontrar los estimadores
de ß0 y ß1.
Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior
Al aplicar la técnica de mínimos cuadrados se llegan a obtener las ecuaciones de trabajo de
̂ y ̂1^ (en este caso se ha omitido los procesos de derivación mediante el cual se llega a
obtener las fórmulas de trabajo). Estas ecuaciones son las siguientes:
̂
∑
∑ ∑
∑
(∑ )
;
̂ ̂ ̅. Donde:
̂ Coeficiente de Regresión
̂ Intercepto de la recta de estimación
Ejemplo:
Retomando los datos que se utilizaron para construir el diagrama de dispersión y aclarando
que “X” es Producción (miles de millones de $us) y “Y” Costos (miles de millones de $us)
y haciendo uso de las ecuaciones derivadas a través de la técnica de mínimos cuadrados se
tiene lo siguiente:
X Y XY X2
Y2
10 3 30 100 9
18 5 90 324 25
12 4 48 144 16
16 5 80 256 25
22 8 176 484 64
36 12 432 1296 144
30 10 300 900 100
32 14 448 1024 196
26 12 312 676 144
12 3 36 144 9
Totales 214 76 1952 5348 732
Promedio 21.4 7.6
̂
∑
∑ ∑
∑
(∑ )
; ̂
( )
= 0.423738, Coeficiente de regresión
Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior
̂ ̂ ̅; ( ) ; Intercepto, por lo tanto la
ecuación de estimación quedaría de la siguiente manera:
̂ ; o bien se puede decir que:
Costos = 0.423738 (Producción) – 1.46798
Un aspecto que no se debe olvidar es que el propósito de la Regresión Lineal Simple es el
de predecir el comportamiento de una variable dependiente a través del conocimiento de
una variable independiente, es por ello que se debe estar seguro que la ecuación de
estimación sirve para este propósito (que existe regresión lineal simple). Por esta razón es
que la ecuación de estimada debe ser sometida a un proceso de validación.
1.4. Validación de la Ecuación de Estimación
Este proceso se puede realizar de dos maneras a saber:
 A través del Cálculo del Coeficiente de Determinación (R2
)
 Por medio del Análisis de Varianza de la Regresión (ANARE)
Coeficiente de Determinación (R2
) o Variabilidad (varianza explicada)
El Coeficiente de Determinación, R2
, indica el porcentaje de la variabilidad de “Y” que
puede ser explicada o debida a “X”, es por ello que mientras más cerca esté del 100% es
mucho mejor. Esto es debido a que se trata de predecir el comportamiento de “Y” a través
del conocimiento de “X”, es por ello que es deseable que el mayor porcentaje de la
variabilidad de la variable dependiente sea debida a “X”, a tal punto que hay autores que
consideran que la ecuación es buena o sirve para predecir si R2
≥ 70%.
El coeficiente de Determinación se calcula a través de la siguiente ecuación:
⌈
⌈
⌈
⌈
⌈ ∑
(∑ ∑ )
√(∑
(∑ )
) (∑
(∑ )
)
⌉
⌉
⌉
⌉
⌉
Para el caso del ejemplo anterior el R2
es el siguiente:
Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior
⌈
⌈
⌈
⌈
⌈ ( )
√(
( )
) (
( )
)
⌉
⌉
⌉
⌉
⌉
Este dato indica que del 100% de la variabilidad de Y (Costos), el 89.36% es debido a X
(Producción), por lo tanto también se puede concluir que existe un 10.64% de variabilidad
de Y (Costos) que no es debida a X (Producción), a esto se le conoce como variabilidad no
explicada. En este caso se puede concluir también que la ecuación estimada sirve para
predecir (existe regresión lineal simple.
Análisis de Varianza de la Regresión Lineal Simple (ANARE)
De forma general se entienden por análisis de varianza a la partición de la variabilidad total
en fuentes de variación conocidas que en el caso de regresión lineal son las siguientes:
 debida a la regresión
 debida a otras causas (error)
Para tratar de ser un poco más explícito, estas dos fuentes de variación se derivan del
modelo aditivo lineal de la regresión línea simple el cual es:
Esto tiene correspondencia con una tabla de varianza o salida de
varianza que para regresión lineal simple es la siguiente:
FV gl SC CM Fc Ft
Regresión
1
SCRegresión (α, glreg, glerr)
Error
n-2
SCError
Total n-1 SCTotales
La primera columna encabezada por FV (Fuentes de variación) es donde se declara las
fuentes de variación en las que se está partiendo la variabilidad total. Nótese que en esta
tabla no se incluye el efecto de , ya que éste es una constante por lo tanto no es una
fuente de variación.
Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior
La segunda columna encabeza por “gl” (Grados de Libertad). De forma general grados de
libertad es “n-1”, para el caso de la fuente de variación debida a regresión siempre es 1 ya
que son dos los parámetros que se estiman, β0 y β1, por lo tanto, 2-1 = 1. Es por ello que
para el ANARE de regresión lineal simple, esta fuente de variación siempre tiene 1 grado
de libertad y los grados de libertad del error, siempre en este caso, son n-2. Por “n” se
entiendo al conjunto de pares de datos “X” “Y”.
La tercera columna es la de Suma de Cuadrados (SC) que vienen a ser los componentes de
las varianza a estimar cuyas ecuaciones de trabajo son las siguientes:
∑
(∑ )
̂ (∑
∑ ∑
)
La cuarta columna es para los Cuadrados Medios (CM) que viene a ser las estimaciones
propiamente dichas de las varianza de cada una de las fuentes de variación. Estas resultan
de dividir las sumas de cuadrados de éstas entre sus grados de libertad.
La quinta columna denominada como “Fc” se refiere a los “F” calculados que resultan de
dividir el cuadrado medio de regresión entre el cuadrado medio del error, es decir, de la
variabilidad no debida a la regresión. Es por ello que el error se considera como un término
de comparación entre la variabilidad debida a regresión y el mismo. Si el cuadrado medio
del error es mayor que el cuadrado medio de regresión, el resultado que se obtendrá será
pequeño y posiblemente menor que el valor de la siguiente columna “Ft” o “F” de tabla,
valor que se extrae de una tabla de “F” con un nivel de significancia, grados de libertad de
regresión y los grados de libertad del error.
Para entender mejor lo anterior se debe de partir del juego de hipótesis que se prueba en un
ANARE. Este es:
Ho: β1 = 0
Ha: β1  0
La hipótesis nula (Ho) asume el efecto de igual o nulidad de efecto y es la hipótesis que se
somete a prueba. Partiendo del hecho de que asume el efecto de nulidad, en este caso indica
Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior
que no existe regresión lineal simple, y asume que la relación entre X y Y es una línea recta
sin pendiente, es por ello que es igual a cero.
Por hipótesis alternativa se entiende aquella que contradice a la hipótesis nula y que es
aceptada una vez que se rechaza la hipótesis nula. Es por ello que está como β1  0 ya que
una igualdad se contradice con una desigualdad. Esto significa que la recta tiene pendiente,
es decir, que existe regresión lineal simple.
Ahora bien, todo el ANARE se hace para realizar la prueba de hipótesis de que si existe o
no regresión lineal simple.
Se entiende como prueba de hipótesis al proceso a través del cual se prueba la plausibilidad
de una hipótesis.
Al realizar la prueba de hipótesis se debe llegar una decisión de aceptar o rechazar Ho.
¿Cuándo no se rechaza Ho?, cuando el Fc  Ft y se rechaza cuando el Fc  Ft. A lo anterior
se le llama Regla de Decisión la cual es la siguiente:
No Rechazo de Ho si Fc  Ft
Rechazo de Ho si Fc  Ft
Si la hipótesis nula no se rechaza significa que no existe regresión lineal simple, por lo
tanto la ecuación estimada no sirve para predecir, si se rechaza Ho, inmediatamente se
acepta la hipótesis alternativa la que indica que sí existe regresión lineal simple.
Un aspecto que todavía no se ha aclarado es “Nivel de Significancia, α, ” entendido como
la probabilidad de tomar una decisión equivocada (conocido también como Error Tipo I) es
por ello que los valores del α son pequeños  0.1.
Haciendo el ANARE a un α = 0.01 se tiene lo siguiente:
( )
= 154.4
( )
Vaciando esta información en la tabla de ANARE se tiene lo siguiente y obteniendo el
valor de F de la tabla correspondiente a: 0.01, 1 y 8 se tiene que este es: 11.26
Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior
FV gl SC CM Fc Ft
Regresión 1 137.6897 137.6897 67.0389 11.26
Error 8 16.4310 2.053875
Total 9 154.4
De los resultados de la tabla se puede observar que el “Fc” es mayor que el “Ft” lo cual
indica que existe suficiente evidencia para rechazar la hipótesis nula, es decir, que existe
regresión lineal simple y por lo tanto se dice que la ecuación estimada sirve para predecir el
comportamiento de Costos (Y) a través del conocimiento de Producción (X).
Cuando se realiza un análisis de varianza de la regresión se debe emitir una conclusión que
podría ser la siguiente:
“De acuerdo al análisis de varianza realizado se concluye con un 99% de confiabilidad, (1 –
0.01)*100, que existe regresión lineal simple.”
Una vez que se ha comprobado que la ecuación estimada es buena (hay regresión lineal) el
siguiente paso sería interpretar los componentes de la recta de estimación.
1.5. Interpretación de los Componentes de la Ecuación de Estimación
Cuando se hacer una interpretación, ésta debe ser aplicada al problema en cuestión. En el
caso del ejemplo que se ha venido desarrollando sería el siguiente:
̂1: Este es el coeficiente de regresión que indica la cantidad de cambios que experimenta
“Y” por un cambio en “X”. En este caso indica que por Un mil millones de dólares que
se incremente la producción, los costos se incrementarán en 0.423738 miles de
millones de dólares. Esto porque la pendiente encontrada fue positiva, si hubiera sido
negativa, se diría que disminuiría esa cantidad.
̂0: No siempre tienen interpretación aplicada al problema, es decir, una interpretación
lógica, es por ello que comúnmente se le interpreta desde el punto de vista matemático
como el punto donde la recta de estimación corta al eje de las ordenadas cuando “X”
toma el valor de cero. En el caso del ejemplo, ̂0 =-1.46798, esto estaría indicando que
cuando la producción es cero, los costos son de -1.46798 miles de millones de dólares.
Como se ve esta interpretación carece de lógica lo cual hace que se interprete como se
ha mencionado anteriormente.
Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior
Existen casos donde si existe interpretación lógica como lo muestra el trabajo de
investigación realizado por Martínez (1995) donde ajustó pesos de becerros al nacimiento.
1.6. Dibujo de la Recta de Estimación
Cualquier recta se define por dos puntos y en el caso de la recta de regresión lineal simple,
ésta pasa por dos puntos obligados cuyas coordenadas son: ( ) y ( ̂0). La recta de
estimación debe dibujarse dentro del área de exploración, es decir, el área determinada por
el diagrama de dispersión que donde se tiene información de ambas variables.
Para el caso del ejemplo que se ha venido tratando la gráfica de la recta de estimación sería
como se muestra a continuación.
1.7. Regresión no Lineal
Este tipo de regresión no es objeto de desarrollo del presente documento ya que se
consideran para cursos superiores de estadística lo que se trata es dejar plasmado que una
relación entre dos variables no siempre es una línea recta, ésta puede ser logarítmica,
exponencial o bien cuadrática o cúbica. Uno de los criterios para definir el ajuste de modelo
es el R² y además el Cuadrado Medio del Error del análisis de varianza. En estos casos el
diagrama de dispersión es importante para determinar esas posibles relaciones.
y = 0.4237x - 1.468
R² = 0.8936
0
2
4
6
8
10
12
14
16
0 5 10 15 20 25 30 35 40
Costo(milesdemillonesde$us)
Producción (miles de millones de $us)
Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior
Regresión Múltiple
No siempre la dependencia en caso de existir se pueda deber a una sola variable, puede ser
que “Y” como variable dependiente se vea afectada por más de una variable independiente,
en este caso se habla de regresión lineal múltiple, aspecto que no se desarrolla en este
documento.
1.8. Correlación Lineal Simple
Así como existen técnicas que cuantifican los cambios de una variable dependiente por un
único cambio de la variable independiente, existen técnicas que cuantifican la asociación
lineal entre dos variables, esta técnica es llamada Correlación Lineal Simple que se exprese
como el coeficiente de correlación (r). Este coeficiente indica el sentido de la asociación
como también la magnitud de ésta, partiendo del hecho que el coeficiente de correlación
lineal simple toma valores en el rango de: r es 0≤ r ≤ 1. Entre más se acerca a 1 el valor de r
mayor es la asociación entre dichas variables.
De acuerdo a lo anterior algunos autores han determinado lo siguiente rangos:
-1 ≤ r < -0.8 Asociación fuerte y
negativa
0 ≤ r < 0.4 No hay asociación
-0.8 ≤ r < -
0.4
Asociación débil y
negativa
0.4 ≤ r <
0.8
Asociación débil y positiva
-0.4 ≤ r ≤ 0 No hay asociación 0.8 ≤ r ≤ 1 Asociación fuerte y
positiva
El coeficiente de Correlación Lineal Simple se determina a través de la siguiente ecuación:
⌈
∑
(∑ ∑ )
√(∑
(∑ )
)(∑
(∑ )
)
⌉, que para el caso del ejemplo sería el siguiente:
⌈
√(
( )
)(
( )
)
⌉= 0.9452
Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior
Este valor indica que existe una asociación fuerte y positiva entre estas variables, es decir,
entre la producción y los costos de esas empresas.
Diferencias entre Regresión Lineal Simple y Correlación Lineal Simple
Se pueden llegar a establecer las siguientes diferencias:
Regresión Lineal Simple Correlación Lineal Simple
Mide la cantidad de cambios en “Y” por un
único cambio en “X”.
Mide asociación lineal entre dos
variables
Existe una variable dependiente y otra
independiente
Es indistinto x, y ó y, x
β1 puede tomar cualquier valor en la recta
numérica
El coeficiente de correlación
toma valores en el intervalo -1 ≤
r ≤ 1
Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior
2. ASPECTOS GENERALES DE LA EXPERIMENTACIÓN
Antes de ingresar al análisis de los principales diseños experimentales, es necesario
establecer el acervo correspondiente en este campo de la Estadística llamado Diseños
Experimentales que facilite el proceso de aprendizaje que aunado a las bases estadísticas
anteriores conlleven al usuario a un mejor uso el presente material. Es por ello que a
continuación se detalla lo siguiente:
Experimento:
Es todo proceso que consiste en la ejecución de un acto o prueba una o más veces, cuyo
resultado en cada prueba depende del azar y que genera información tanto cualitativa como
cuantitativa según sea el caso. En sí viene a ser aquel proceso intencionado provocado por
el investigador con el fin de estudiar su origen, esencia e interrelación con otros procesos o
fenómenos.
Tratamiento:
Es todo elemento o sujeto sometido a estudio o ensayo de comparación. Viene a ser el
conjunto de condiciones experimentales que el investigador impone a las unidades
experimentales. Ejemplo: diferentes métodos de enseñanza de la matemática, etc.
Unidad Experimental:
Tamaño de la Unidad Experimental. Es el material o lugar sobre el cual se aplican los
tratamientos. Este término se utiliza para representar al conjunto de material experimental
al cual se le aplica un tratamiento. El tamaño de la unidad experimental depende mucho
del tipo de material experimental que se utilice y muchas veces de la esperanza de vida en
el caso de usar seres vivos. Cuando se experimenta con aves, la unidad experimental puede
estar constituida por un grupo de ellas; sin embargo, cuando se puede experimentar con
animales cuya esperanza de vida sea mayor, puede ser que uno solo de ellos pueda ser
considerado como una unidad experimental.
Factor:
Es un tratamiento que genera más tratamiento
Error Experimental:
Es la variación aleatoria (no explicada) ajena al control razonable del investigador. Este
término no es sinónimo de error, si no que forma parte de las características propias e
innatas de la unidad experimental. Este error no se puede evitar pero si se puede reducir
Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior
usando las repeticiones necesarias, usando unidades experimentales los más
homogéneamente posible y manejándolas de manera uniforme.
Testigo
El testigo es el tratamiento de comparación adicional, que no debe faltar en un
experimento; la elección del tratamiento testigo es de gran importancia en cualquier
investigación, éste se constituye como referencial del experimento y sirve para la
comparación de los tratamientos en prueba.
Diseños Experimentales:
Es un método científico de investigación que consiste en hacer operaciones prácticas
destinadas a demostrar, comprobar o descubrir fenómenos o principios básicos. Tiene como
propósito proporcionar la máxima cantidad de información a un costo mínimo.
Diseñar un experimento es planificarlo, qué es lo que se pretende experimentar, es
planearlo de modo que se tenga la secuencia completa de pasos tomados de antemano para
asegurar que la información que se obtendrá permita un análisis objetivo que conduzca a
deducciones (demostración de hipótesis) válidas con respecto al problema de investigación
previamente establecido.
Principios Básicos de la Experimentación:
Los principios básicos de la experimentación son tres: Repetición, Azarización y Control
Local.
Repetición. Es la reproducción del experimento básico llamado también réplica y
solamente a través de ella se pueden obtener conclusiones de un fenómeno. Tiene dos
funciones: Proporcionar una estimación del error experimental y brindar una medición más
precisa de los efectos de los tratamientos, es decir, que hace posible la prueba de
significancia.
Azarización. Es la asignación de los tratamientos a las unidades experimentales de modo
que todas tengan la misma posibilidad de recibir un tratamiento. Tiene la como función
hacer válida la prueba de significancia.
Control Local. Es la cantidad de balanceo, bloqueo o agrupamiento de las unidades
experimentales que se emplean en el diseño adoptado. Tiene la función de hacer más
eficiente el diseño experimental, es decir, hacer más sensitiva la prueba de significancia
Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior
reduciendo con ello la magnitud del error. Los criterios de agrupamiento van a depender del
tipo de ciencia donde se esté experimentando.
Exigencias de la Experimentación:
Las exigencias de la experimentación son: Tipicidad, Uniformidad, Grado de Precisión,
Control efectivo de las medidas y observaciones.
Tipicidad. Llamado también representatividad, hace mención que no se pueden extrapolar
resultados a condiciones diferentes a las que se originaron.
Uniformidad. Indica que todas las unidades experimentales deben ser tratadas
uniformemente y que la única diferencia entre ellos sea los tratamientos que se están
evaluando en ellas. Esto evita tener resultados enmascarados en los experimentos.
Grado de Precisión. Un experimento bien planeado debe permitir al investigador medir
diferencias en los tratamientos con el grado de precisión esperado evitando para ello
comete errores al montar el ensayo y en su misma ejecución. Esto debe ser una tarea de
primer orden por parte del investigador. Es por ello que se debe tener especial cuidado en la
conducción y manejo del experimento.
Control efectivo de las medidas y observaciones. Es necesario hacer anotaciones de las
manifestaciones de las unidades experimentales que permitan explicar ciertos aspectos del
experimento.
Los diseños experimentales como tal se dividen en dos grupos: diseños experimentales
simples y diseños experimentales complejos.
Entre los diseños experimentales simples se tiene al Diseño Completamente al Azar,
Diseño en Bloques Completamente al Azar, Diseño Cuadrado Latino principalmente.
3. DISEÑO COMPLETAMENTE AL AZAR (DCA) O DISEÑO CON UN SOLO
CRITERIO DE CLASIFICACIÓN
Este diseño es el más simple de todos; en él se asigna al azar los tratamientos a grupos de
unidades experimentales previamente determinadas. Asimismo, todas las variables, excepto
las que están en estudio se mantienen constantes.
Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior
3.1. ¿Cuándo utilizar este Diseño?
Este diseño se utiliza cuando las unidades experimentales son homogéneas, o sea, que la
única diferencia que existe son los tratamientos que se aplican a las unidades
experimentales. Este diseño se usa cuando se estudia dos o más tratamientos bajo las
siguientes condiciones:
a.- Lugar y unidades experimentales muy uniformes (suelo homogéneo, en laboratorios,
invernaderos, galpones, aulas, etc.), donde no hay heterogeneidad necesaria de absorber.
b.- Cuando sea probable que una parte del experimento se pierda.
c.- Cuando se tiene un experimento pequeño y donde la mayor precisión de otras
distribuciones no compensan la pérdida de grados de libertad en el error.
Este tipo de diseño proporciona el máximo número de grados de libertad para la estimación
del error experimental; además, no requiere estimar datos faltantes, es decir, puede
analizarse con diferente número de repeticiones por tratamiento (diseño desbalanceado).
3.2. Modelo Aditivo Lineal
El concepto de modelo lineal es una réplica de algo; así como un edificio puede ser
representado en una maqueta. Debe evitarse el error de creer que el modelo lineal es el
mundo real; ya que sólo es una abstracción de una realidad que existe en la mente del
hombre con el objetivo de ayudarse en el análisis de los procesos naturales que afectan por
diversos factores a fuentes de variación y que dichos modelos son de naturaleza transitoria
y son susceptibles a mejorarse.
La consideración básica para un diseño Completamente al Azar es que las observaciones
pueden representarse por medio del modelo estadístico lineal que es el siguiente:
Donde:
Yij = Variable Respuesta
μ = Efecto común a todas las observaciones
Ti = Efecto del i-ésimo tratamiento
Eij = Erro experimental o error del modelo
Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior
3.3. Supuesto del Análisis de Varianza
De forma general, los supuestos en los que se basa el análisis de varianza son:
Homogeneidad de Varianza, Normalidad, Aditividad y Linealidad del Modelo, e
Independencia.
3.3.1. Homogeneidad de Varianza:
Las varianzas de las diferentes medías deben ser homogéneas. Por lo general, en el análisis
de varianza, se utiliza un promedio de n varianza (CME) para obtener la mejor estimación
de la varianza común. Pero, si las varianzas dentro de los tratamientos fuesen de hecho
distintas, no se tendría justificación para combinarlas, ya que el promediar varianzas de
tratamientos mayores y menores podría proporcionar resultados engañosos. La diferencia
entre dos tratamientos con varianzas grandes puede ser considerada significativa cuando en
realidad ésta puede haber ocurrido por casualidad. Por otra parte, la diferencia entre dos
tratamientos con varianzas pequeñas puede ser declarada no significativa cuando en verdad
lo es.
Existen muchas técnicas para probar homogeneidad de varianza, como la prueba de
Bartlett, Prueba de F, propuesta por R.A. Fischer. Por la rapidez de esta última prueba se
propone la misma para efecto del curso, lo cual no desmerece en ninguna otra prueba.
La prueba de F propuesta por Fischer se basa en lo siguiente:
( )
( )
La prueba de hipótesis que se emplea es la siguiente:
Ho:
Ha: 
La regla de decisión es la siguiente:
No Rechazo de Ho si Fc  F (m-1, n-1)gl. Esto quiere decir que las varianzas son
homogéneas.
RHo si Fc > F (m-1, n-1)gl, lo cual indica que las varianza son homogéneas.
Box (S/F; citado por Calzada Benza, 1970) mencionó que si la razón entre la varianza
mayor y la varianza menor es menor de cuatro, se puede considerar que hay suficiente
homogeneidad de varianza, siendo éste posiblemente un criterio más rápido para probar
homogeneidad de varianza.
Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior
3.3.2. Normalidad:
Los términos del error son aleatorios, independientes y normalmente distribuidos. Este
supuesto es de gran importancia ya que cuando los datos no se distribuyen normalmente los
coeficientes de variación son muy elevados. Cuando los datos de una variable no presentan
normalidad, existen algunas tipos de transformaciones en dependencia de la característica
de los datos de la variable en cuestión que la hacen normal.
Para probar normalidad también existen varias técnicas entre las que se pueden mencionar
la prueba de Shapiro-Wilk y la de Lilliefors. Si el lector está interesado en profundizar
sobre estas pruebas se le sugiere consultar a Ramírez y López (1993). (Métodos
Estadísticos no Paramétricos)
3.3.3. Aditividad y Linealidad del Modelo:
Lo anterior se cumple en el modelo aditivo lineal ya que todos los efectos se suman y son
lineales porque cada uno de sus elementos del modelo lineal, están a la potencia "1".
3.3.4. Independencia:
Este supuesto implica que los términos del error son aleatorios, no
correlacionados (independientes) normalmente distribuidos; además, de las varianzas y las
medias de las distintas muestras.
3.4. Análisis de varianza para este Diseño
El análisis de varianza consiste en la partición de la variación total en fuentes de variación
conocidas y la que no es conocida se atribuye al error. El análisis de varianza separa parte de
la varianza causada por efectos accidentales, no sistemáticos (error experimental o
simplemente error) de los causados por efectos sistemáticos conocidos (tratamientos).
Antes de mostrar la tabla de análisis de varianza para este diseño se muestra a
continuación un cuadro de concentración de información (Cuadro 1) y
posteriormente las ecuaciones trabajo para el mismo.
Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior
Cuadro 1. Concentración de los datos para un Diseño Completamente al Azar con “i”
tratamiento y “j” repeticiones.
TRATAMIENTOS
REPETICIONES
ΣYi.
1 2 3 … j
1 Y11 Y12 Y13 Y1j Y1.
2 Y21 Y22 Y23 Y2j Y2.
3 Y31 Y32 Y33 Y3j Y3.
…i Yi1 Yi2 Yi3 Yij Yi.
ΣY.j Y.1 Y.2 Y.3 Y.j Y..
El modelo lineal para este diseño tiene solo dos fuentes de variación y es el siguiente:
El modelo aditivo de un Diseño Completamente al Azar se corresponde con las
salidas de varianza que se muestran en los Cuadro 2 y 3.
Cuadro 2. Salida de varianza para un Diseño Completamente al Azar con igual
número de repeticiones (diseño balanceado).
F.V gl SC CM Fc Ft
Tratamiento t-1 SCTRAT. ( )
Error t(r-1) SCError
( )
Total tr-1 SCTotales
Donde:
F.V = Fuente de variación
gl = Grados de libertad
SC = Suma de Cuadrados
CM = Cuadrado Medio
Fc = “F” calculado
Ft = “F” tabulado que se encuentra en la tabla de “F” a un nivel de significancia “”
(probabilidad de error tipo I), grados de libertad de los tratamientos y grados de libertad del
error
En caso de que los tratamientos tengan diferentes número de repeticiones (diseño
desbalanceado) la salida de varianza es la siguiente:
Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior
Cuadro 3. Salida de varianza para un Diseño Completamente al Azar con desigual
número de repeticiones (diseño desbalanceado).
FV gl SC CM Fc Ft
Tratamiento t-1 SCTRAT. ( )
Error n-t SCError
Total n-1 SCTotales
3.4.1. Ecuaciones de trabajo
; Factor de corrección si el experimento es balanceado
; Factor de corrección si el experimento es desbalanceado
∑ ; Suma de cuadrados totales
∑ ; Suma de cuadrado de tratamiento si el experimento es balanceado
∑ ; Suma de cuadrados si el experimento es desbalanceado
; Suma de cuadrados del error
3.4.2. Prueba de Hipótesis en el Análisis de Varianza de un Diseño Completamente al
Azar
En el análisis de varianza de este diseño se prueba el siguiente juego de hipótesis
estadísticas:
Ho: µ1 = µ2 = µ3 =… µi (T1 = T2 = T3 = …Ti). Esto es lo mismo que:
Ho: µ1 - µ2 - µ3 -… µi = 0 (T1 - T2 - T3 - …Ti = 0).
Ha: µ1 - µ2 - µ3 -… µi  0 (T1  T2 T3  …Ti).
La hipótesis nula asume el efecto de igual, es decir, que los tratamiento ejercen el mismo
efecto sobre la variable respuesta. Esta es la hipótesis que se somete a prueba y, la hipótesis
alternativa, en su esencia, es la que contradice a la hipótesis nula.
Dado que la hipótesis nula es la que se somete a prueba, entonces puede ser aceptada ó
rechazada, si no es rechazada significa que no existe la suficiente evidencia experimental para
Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior
hacerlo, en caso de rechazarse, de inmediato se acepta la hipótesis alternativa. Para saber
cuándo aceptar o rechazar la hipótesis nula se toma en cuenta la siguiente regla de decisión.
No Rechazo de Ho (NRHo) si Fc  Ft (F de tablas)
Rechazo de Ho (Rho) si Fc > Ft (F de tablas)
3.5. Interpretación de Resultados
Para una mejor ilustración de la interpretación de los resultados de un análisis en este
diseño, se muestra a continuación el siguiente ejemplo:
En un estudio del efecto de la glucosa sobre la liberación de insulina, se trataron
especímenes de tejido pancreático de animales experimentales con cinco concentraciones
diferentes de glucosa. Posteriormente se hizo la determinación de la cantidad de insulina
liberada. Se pide realizar el análisis de varianza correspondiente usando una probabilidad
de error Tipo I de (0.01), es decir,  = 0.01. Los datos obtenidos se muestran en el Cuadro
4.
Cuadro 4. Insulina liberada a diferentes concentraciones de glucosa en las unidades
experimentales.
Tratamiento
Repeticiones
1 2 3 4 5 6 7 8
1 1.53 1.61 3.75 2.89 3.26 2.83 2.86 2.59
2 3.15 3.96 3.59 1.89 1.45 3.49 1.56 2.44
3 3.89 4.80 3.69 5.70 5.62 5.79 4.75 5.33
4 8.18 5.64 7.36 5.33 8.82 5.26 8.75 7.10
5 5.86 5.46 5.69 6.49 7.81 9.03 7.49 8.98
Adaptado de Wyane (1970)
En el mismo cuadro de información se pueden incluir los totales de tratamiento como
también sus varianzas por cada uno de ellos como se muestra en el Cuadro 5.
Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior
Cuadro 5. Insulina liberada a diferentes concentraciones de glucosa en las unidades
experimentales, totales y varianza por tratamiento.
Tratamiento
Repeticiones
ΣYi. S²
1 2 3 4 5 6 7 8
1 1.53 1.61 3.75 2.89 3.26 2.83 2.86 2.59 21.32 0.5791
2 3.15 3.96 3.59 1.89 1.45 3.49 1.56 2.44 21.53 0.9702
3 3.89 4.8 3.69 5.7 5.62 5.79 4.75 5.33 39.57 0.6621
4 8.18 5.64 7.36 5.33 8.82 5.26 8.75 7.1 56.44 2.2212
5 5.86 5.46 5.69 6.49 7.81 9.03 7.49 8.98 56.81 2.0718
ΣY.j 22.61 21.47 24.08 22.3 26.96 26.4 25.41 26.44 195.67 Y..
Revisando el supuesto de homogeneidad de varianza y tomando en cuenta lo propuesto por
Box (S/F; citado por Calzada Benza, 1970) se relacionará la varianza mayor con la varianza
menor, en este caso varianza del tratamiento 1 y la del tratamiento 4. Entonces:
= 3.8356
Como la relación entre la varianza mayor y la menor y tomando en cuenta lo propuesto por
Box (S/F) se puede concluir que existe homogeneidad de varianza.
Comenzando a realizar el análisis de varianza se tiene lo siguiente:
( )
( )
Analizando los resultados obtenidos al aplicar las ecuaciones de trabajo para este diseño es
importante señalar que ninguna de estas sumas de cuadrados puede ser negativa ya que son
componentes de varianza y la varianza nunca puede ser negativa. Por otra parte, se puede
observar que la Suma de Cuadrados Totales es la mayor, en verdad ésta es la variación
total y ninguna de las demás puede ser mayor que ésta. Además se puede observar que la
Suma de Cuadrados del Error se obtiene por diferencia entre la Suma de Cuadrados
Totales y la de Tratamiento. Esto es producto de la aplicación misma de lo que es análisis
de varianza.
Una vez obtenidas las sumas de cuadrados correspondientes, el siguiente paso es construir
Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior
la tabla de análisis de varianza (salida de varianza) la cual queda como se muestra en el
Cuadro 6 y además es recomendable que esta tabla vaya acompañada del Coeficiente de
Variación (C.V) el cual se define como la relación entre la raíz cuadrada del Cuadrado
Medio del Error y el Promedio de la Variable respuesta o en estudio.
(
√
)
(
√
)
Cuadro 6. Salida de varianza para los datos del Cuadro 4.
F.V gl SC CM Fc F(0.01, 4, 35)
Tratamiento 4 154.921015 38.7302538 29.7714584 3.908
Error 35 45.5321625 1.30091893
Total 39 200.453178
C.V. = 23.32%
Si se toma en cuenta el juego de hipótesis de este diseño y la regla de decisión se puede
concluir que se rechaza la hipótesis ya que el “Fc” es mayor que el “Ft”. A manera de
conclusión se puede decir lo siguiente:
Con un 99% de confiabilidad se concluye que al menos unos de los tratamientos evaluados
ejercen un efecto distinto (P ˂ 0.01) sobre la liberación de insulina.
Ahora la pregunta es: ¿Cuál es ( o son) ese (esos) tratamiento (s) que hizo (hicieron)
rechazar la hipótesis nula?. Esta interrogante no la responde el análisis de varianza ya que
éste solo prueba si existe o no efecto de las variables dependientes sobre la dependiente. Es
por ello que se deben hacer otros análisis para responder esta interrogante.
Para responder a estas interrogantes existen dos técnicas principalmente que son las
pruebas a priori o Contrastes Ortogonales y las pruebas obligadas por los datos llamadas
también Pruebas de Rangos Múltiples o Separación de Medias. Estas últimas por el grado
de uso que tienen en las investigaciones de índole experimental son las que se desarrollan a
continuación.
3.6. Pruebas obligadas por los Datos o de Rangos Múltiples
Cuando el análisis de varianza de un experimento reporta diferencias significativas y son más
de dos tratamiento, es necesario saber quién “metió el ruido en la prueba de hipótesis” que
Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior
provocó que la hipótesis nula sea rechazada. Para este fin, existen las llamadas pruebas de
Rangos Múltiples. Entre estas pruebas están:
 Diferencia Mínima Significativa (DMS) (LSD)
 Método de Duncan
 Método de Student-Newman-Keuls (SNK)
 Método de Tukey (Diferencia Significativa Honesta)
 Método de Scheffé.
Cada uno de estos procedimientos de comparación de medias está basado en un
conjunto de suposiciones, y son usualmente efectivos para fines específicos.
En cualquiera de los casos la hipótesis nula supone la igualdad de las medias y la
alternativa lo contrario y se utilizan siempre y cuando en el análisis de varianza rechace la
hipótesis nula. Lo anterior indica que la prueba de hipótesis que se hace es la siguiente:
Ho: | |
Ha: | |
La hipótesis nula, que es la que se prueba, asume el efecto de igualdad de los promedios a
comparar es por ello que la diferencia es igual a cero y por lo tanto, la hipótesis alternativa
contradice la hipótesis nula con una desigualdad.
La regla de decisión es la siguiente:
NRHo = Valor crítico de la prueba está dentro de la diferencia:
| |   | |
RHo: Si Valor Crítico de la prueba es  | | o bien
Si el Valor Crítico ˂ | |
3.6.1. Diferencia Mínima Significativa (DMS)
Esta prueba solo debe usarse para comparar medias adyacentes en un arreglo ordenado,
medias por orden de magnitud. Cuando DMS se usa indiscriminadamente para probar todas
las diferencias posibles entre las diversas medias, ciertas diferencias serán significativas,
pero no al nivel de significancia que se ha elegido.
El número posible de comparaciones de medias tomadas de dos en dos a la vez es igual a
( )
. Los especialistas hacen mención que este método es adecuado para comparar un
tratamiento estándar (testigo) con otros tratamientos.
Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior
Esta prueba utiliza un solo comparador y su fórmula es la siguiente:
√ , donde:
DMS = Es el valor crítico de la prueba
t/2 = Valor tabular de “t” de student para los grados de libertad del error obtenido a un
/2.
r = número de repeticiones
3.6.2. Método de Duncan
Esta prueba es ampliamente utilizada entre las diversas pruebas de Rangos
Múltiples. Su método es de naturaleza secuencial, lo que quiere decir, que utiliza un
nuevo valor “estudentizado”, para cada una de las comparaciones de medias adyacentes
ordenadas por magnitud en orden descendente.
Esta prueba incluye el cálculo de las diferencias significativas mínima entre las medias de
tratamiento cuando éstas se encuentran dispuestas en orden de magnitud. La fórmula
es la siguiente:
√
Donde:
Es el valor extraído de una tabla especial de rango “estudentizado”, con los grados de
libertad del error y con la disposición relativa de las medias en el arreglo.
CMError = Cuadrado Medio del Error
r = Número de repeticiones.
3.6.3. Método de Student-Newman-Keuls (SNK)
Es una prueba de carácter secuencial, es decir, que utiliza un nuevo valor “estudentizado”
para cada comparación.
Para el cálculo de esta prueba se requiere determinar la diferencia mínima significativa
entre las medias del tratamiento cuando éstas se encuentran dispuestas en orden de
magnitud. Su fórmula es la siguiente:
Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior
√ ;
Donde:
q = Valor obtenido de tablas especiales de rango “estudentizado”, para los grados de
libertad del error y con la disposición relativa de las medias en el arreglo
CMError = Cuadrado medio del error
r = número de repeticiones
3.6.4. Método de Tukey
Este método es un procedimiento basado en el rango “
estudentizado”
, pero no es secuencial, ya
que utiliza un sólo comparador de “q” ordinario. Sin embargo, el método de Tukey es útil en
situaciones en que se desea hacer un primer énfasis en el uso del experimento con un total para
determinar la significancia de los pares de medias. Esta prueba sólo es exacta cuando los
grupos tienen igual número de elementos y para medias que no han sido ajustadas por
covarianza. Esta prueba se define de la siguiente manera:
√
Donde:
q = Valor obtenido de tablas especiales de rango “estudentizados”, para los grados de
libertad del error y con la disposición relativa de las medias en el arreglo
CMError = Cuadrado medio del error
r = número de repeticiones
3.6.5. Método de Scheffé
Se considera un método bastante general que utiliza la distribución de “F” de Snedecor. El
método de Scheffé puede aplicarse para probar hipótesis generales de que una función
lineal de las medias poblacionales es igual a cero. En contraste con las comparaciones
múltiples basadas en rangos estudentizados, el método de Scheffé es un método exacto para
medias provenientes de medias de igual o desigual tamaño y para medias que han sido
ajustadas por covarianza. Para el cálculo se requiere determinar la mínima diferencia
significativa entre las medias de los tratamientos cuando éstos se encuentran ordenados en
Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior
orden de magnitud. Su valor crítico se determina a través de la siguiente expresión:
√( ) ( )
Donde:
t = Número de tratamientos
F = Valor que se obtiene de la distribución de “F” de Snedecor con t-1 y los grados de
libertad del error.
CError = Cuadrado medio del error, y ri, rj representan el número de observaciones usadas
para calcular cada media muestra
Ejemplo.
A continuación se aplican todas las pruebas de rangos múltiples antes expuestas de manera
que se pueda realizar una comparación entre éstas. Los promedios por tratamiento son los
siguientes:
Cuadro 7. Medias por tratamientos y Medias ordenadas por magnitud descendente.
Tratamiento Promedio Tratamiento Promedios Ordenados
1 2.665 5 7.10125
2 2.69125 4 7.055
3 4.94625 3 4.94625
4 7.055 2 2.69125
5 7.10125 1 2.665
Aplicando DMS a un nivel de significancia  = 0.01 que es el mismo nivel de significancia
que se utilizó para el análisis de varianza, además de la siguiente información:
CMError = 1.30091893
r = 8
t/2(35) = 2.7238
√
Por lo tanto el valor crítico de la prueba es de 1.5534.
A continuación se presentan en el Cuadro 7 las comparaciones a realizar, las diferencias
entre las medias y el resultado de comparar estas diferencias con el valor crítico de la
Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior
prueba de DMS.
Cuadro 7. Resultado de la prueba de DMS para los tratamientos estudiados.
Comparación Diferencia de Medias
Resultado de la
comparación
T5 versus T4 0.04625 ns
T5 versus T3 2.155 *
T5 versus T2 4.41 *
T5 versus T1 4.43625 *
T4 versus T3 2.10875 *
T4 versus T2 4.36375 *
T4 versus T1 4.39 *
T3 versus T2 2.255 *
T3 versus T1 2.28125 *
T2 versus T1 0.02625 ns
ns = No significativo * = significativo
Las comparaciones se pueden resumir de acuerdo al siguiente rango de mérito
Tratamiento Comparación
5 a
4 a
3 b
2 c
1 c
Promedios con literales distintas son estadísticamente diferentes según el método de DMS (P ˂ 0.01).
Interpretando los resultados de la separación o comparación de medias según DMS se
puede decir que las concentraciones de glucosa 5 y 4 producen la misma cantidad de
insulina liberada (P  0.01), pero diferente (P ˂ 0.01) a las demás concentraciones de
glucosa experimentadas. Esto quiere decir que es indistinto utilizar la concentración 5 o 4.
Al comparar el tratamiento 4 (concentración 4) con las demás, ésta tuvo un comportamiento
diferente (P ˂ 0.01) a las demás concentraciones de glucosa, es decir, 3, 2 y 1. Igualmente
mostró la concentración 3 respecto a la 2 y 1, no así la concentración 2 que tuvo el mismo
comportamiento (P > 0.01) con la concentración 1.
Al aplicar el método de Duncan se obtuvo lo siguiente:
Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior
√
Para realizar la prueba de Duncan lo primero que se debe hacer es obtener los valores
estudentizados extraídos de la tabla de Duncan. En este caso se están utilizando valores
interpolados ya que no existen en la tabla grado de libertad igual a 35 solo hay entre 30 y
40 por lo tanto lo que se hizo fue promediar los dos valores. Estos son los siguientes:
Cuadro 8. Valores estudentizado extraído de la tabla de Duncan y valores críticos de
la prueba según el número de medias a comparar.
Medias a comparar 2 3 4 5
R(0.01, 35) 3.855 4.025 4.13 4.195
RMS 1.554549 1.623103 1.665445 1.691656
Aquí se puede ver el efecto secuencial de Duncan ya que utiliza un comparador distinto
según el número de medias a comparar.
Los resultados de aplicar la prueba son los siguientes:
Cuadro 9. Contrastación de las diferencias entre medias adyacentes con los valores
críticos de Duncan.
Promedios
Promedios 7.10125 7.055 4.94625 2.69125 2.665
Tratamientos 5 4 3 2 1
7.10125 5 0 0.04625 ns 2.155 * 4.41* 4.43625 *
7.055 4 0 2.10875* 4.36375* 4.39*
4.94625 3 0 2.255* 2.28125*
2.69125 2 0 0.02625 ns
2.665 1 0
RMS 1.69166 1.66544 1.62310 1.55455
ns = No significativo * = significativo
Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior
Lo anterior se resume en el siguiente rango de mérito:
Tratamiento Comparación
5 a
4 a
3 b
2 c
1 c
Promedios con literales distintas son estadísticamente diferentes según el método de Duncan (P ˂ 0.01).
Como se puede observar, en este caso los resultados obtenidos son los mismos que en la
prueba de DMS, por lo tanto, la interpretación es la misma.
Aplicando SNK:
√
Al igual que la prueba de Duncan, SNK es una prueba secuencial lo que indica que utiliza
un valor diferente para cada comparación de acuerdo al número de medias a comparar. Los
valores q y valores críticos de SNK se muestran en el Cuadro 10.
Cuadro 10. Valores estudentizados de la prueba de SNK de acuerdo al número de
medias adyacentes a comparar y valores críticos de la misma.
Medias a comparar 2 3 4 5
q(0.01, 35) 3.855 4.41 4.75 4.99
SNK 1.55454932 1.778356 1.9154628 2.0122441
Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior
Los resultados al aplicar la prueba de rangos múltiples de SNK se resumen en el Cuadro 11.
Cuadro 11. Resultados de la comparación de medias según el método de SNK.
Promedios
Promedios 7.10125 7.055 4.94625 2.69125 2.665
Tratamientos 5 4 3 2 1
7.10125 5 0 0.04625 ns 2.155 * 4.41* 4.43625 *
7.055 4 0 2.10875* 4.36375* 4.39*
4.94625 3 0 2.255* 2.28125*
2.69125 2 0 0.02625 ns
2.665 1 0
SNK 2.0122441 1.9154628 1.778356 1.554549
ns = No significativo * = significativo
Lo anterior se resume en el siguiente rango de mérito.
Tratamiento Comparación
5 a
4 a
3 b
2 c
1 c
Promedios con literales distintas son estadísticamente diferentes según el método de SNK (P ˂ 0.01)
En este caso, los resultados de aplicación del método de SNK coinciden con el anterior y
por ende, la interpretación es la misma.
Aplicando ahora el método de Tukey o Diferencia Honesta Mínima se tiene lo siguiente:
√
Tukey no es un método secuencial, es decir, que utiliza un solo valor estudentizado para
obtener el valor crítico de prueba, utiliza la misma tabla que SNK pero con el número
máximo de medias a comparar.
q(0,01, 5, 35) = 4.99
√
Los resultados de contrastar la diferencia de medias ordenadas con el valor crítico de la
prueba de Tukey se muestra en el Cuadro 12.
Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior
Cuadro 12. Resultados de la aplicación de la prueba de Tukey a los promedios de los
tratamientos estudiados.
Comparación Diferencia de Medias
Resultado de la
comparación
T5 versus T4 0.04625 ns
T5 versus T3 2.155 *
T5 versus T2 4.41 *
T5 versus T1 4.43625 *
T4 versus T3 2.10875 *
T4 versus T2 4.36375 *
T4 versus T1 4.39 *
T3 versus T2 2.255 *
T3 versus T1 2.28125 *
T2 versus T1 0.02625 ns
ns = No significativo * = significativo
Resumiendo los resultados del Cuadro 12 en un rango de mérito se tiene lo siguiente:
Tratamiento Comparación
5 a
4 a
3 b
2 c
1 c
Promedios con literales distintas son estadísticamente diferentes según el método de Tukey (P ˂ 0.01).
Aplicando ahora la última prueba de separación de medias de las propuestas en este
documento se tiene lo siguiente:
Método de Scheffé
√( ) ( )
La prueba de Scheffé al igual que Tukey no es una prueba secuencial por lo tanto solo
utiliza un valor de “F” de Snedecor que se extrae un nivel de significancia “”, para el caso
del ejemplo  = 0.01, con los grado de libertad de tratamientos y los del error experimental.
De acuerdo a esto se tiene lo siguiente:
Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior
F(0.01, 4, 35) = 3.908
√( ) ( )
Cuadro 13. Resultados de la aplicación de la prueba de Scheffé a los promedios de los
tratamientos estudiados.
Comparación Diferencia de Medias
Resultado de la
comparación
T5 versus T4 0.04625 ns
T5 versus T3 2.155 ns
T5 versus T2 4.41 *
T5 versus T1 4.43625 *
T4 versus T3 2.10875 ns
T4 versus T2 4.36375 *
T4 versus T1 4.39 *
T3 versus T2 2.255 *
T3 versus T1 2.28125 *
T2 versus T1 0.02625 ns
ns = No significativo * = significativo
Resumiendo los resultados del Cuadro 13 en un rango de mérito se tiene lo siguiente:
Tratamiento Comparación
5 a
4 a
3 a
2 b
1 b
Promedios con literales distintas son estadísticamente diferentes según el método de Scheffé (P ˂ 0.01).
3.7. ¿Cuándo, Porqué y Cuál Prueba de Rangos Múltiples Utilizar?
Todas las pruebas de rangos múltiples o separación o comparación de medias se utilizan
siempre y cuando en el análisis de varianza se rechace la hipótesis ya este análisis solo
detecta si existe efecto o no de los tratamientos sometidos a consideración pero no indica
cuál o cuáles son los tratamientos responsables de este rechazo.
Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior
En el Cuadro 14 se resumen los resultados obtenidos por cada una de las pruebas de
separación de medias aplicados.
Cuadro 14. Resumen de los resultados obtenidos al aplicar las pruebas de rangos
múltiples de DMS, Duncan, SNK, Tukey y Scheffé a un nivel de
significancia de  = 0.05.
Tratamiento Promedio DMS Duncan SNK Tukey Scheffé
5 7.10125 a a a a a
4 7.055 a a a a a
3 4.94625 b b b b a
2 2.69125 c c c c b
1 2.665 c c c c b
Promedios con literales distintas son estadísticamente diferentes (P ˂ 0.01).
Según Martínez Garza (1994) el método de Scheffé es más riguroso para detectar
diferencias significativas y esto se demuestra con los resultados expuestos en el Cuadro 14,
es por ello que se recomiendo usarlo a un  = 0.1. Por otra parte se ha podido observar que
tanto SNK como Tukey tiende a no detectar diferencias estadística donde DMS y Duncan
lo han hecho con diferencias mayores.
Una discusión más fundamentada sobre las separaciones de medias puede encontrarse en
Steel y Torrie (1992) en su obra “Bioestadística: Principios y Procedimientos pero sí se
puede deducir que para experimentos en fases exploratorias es recomendable usar pruebas
que no sean tan rigurosas como es DMS, Duncan e inclusive SNK, sin embargo, si este no
es el caso y los promedios no han sido corregidos por efecto de covariable, es
recomendable Tukey y si se requiere una prueba más rigurosa sin importar si el
experimento es balanceado o no, si los promedios ha sido corregido o no por covariable, es
recomendable usar Scheffé.
Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior
4. DISEÑO EN BLOQUES COMPLETAMENTE AL AZAR (BCA) O CON DOS
CRITERIOS DE CLASIFICACIÓN
No siempre el material experimental es homogéneo limitando en este caso el uso del
Diseño Completamente al Azar (DCA). En estos casos es recomendable usar el Diseño en
Bloques Completamente al Azar.
4.1.¿Cuándo utilizar este diseño?
Este diseño se utiliza cuando el material experimental presenta un factor de “estorbo” que
no es de interés estudiar pero que sí puede afectar los resultados conllevando a conclusiones
erradas o bien los llamados efectos enmascarados. Tiene como principio maximizar la
variabilidad entre bloques y minimizar la variabilidad interbloque o variabilidad interna.
Esto se logra ya que las unidades experimentales dentro de cada bloque son homogéneas
pero son heterogéneas entre bloques.
Si se habla de un diseño en Bloques Completamente al Azar, deben existir tantas unidades
experimentales dentro de cada bloque como tratamientos se tenga, de manera que cada
tratamiento tenga una repetición en cada bloque. Esto al mismo tiempo se vuelve una
desventaja para este diseño ya que si se pierde una unidad experimental o más, se rompe el
principio de bloqueo ya que los tratamientos no tendrían el mismo número de repeticiones
dentro de cada bloque. Es por ello que en este caso para analizar este diseño se deben
estimar los datos perdidos conllevando a pérdidas de grados de libertad en el error y por
ende a un aumento del cuadrado medio del error.
El tema de estimación de datos perdidos no se desarrolla en este documento, pero se pueden
consultar las fuentes que citan al final del mismo.
4.2.Modelo Aditivo Lineal de un BCA
El modelo aditivo lineal para este diseño es el siguiente:
Donde:
Yij = Variable respuesta
= Efecto común a todas las observaciones
Bj = Efecto de la j-ésima repetición; j = 1, 2, 3,...r repeticiones
Ti = Efecto del j-ésimo tratamiento; i = 1, 2, 3, …i, tratamiento
Eij = Error experimental
Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior
4.3. Análisis de Varianza para un BCA
Antes de exponer la salida de varianza y las ecuaciones de trabajo, se presenta un cuadro de
concentración o vaciamiento de información.
Cuadro 15. Concentración de los datos para un Diseño en Bloques Completamente al
Azar (BCA).
TRATAMIENTOS
BLOQUES
ΣYi.
1 2 3 … j
1 Y11 Y12 Y13 Y1j Y1.
2 Y21 Y22 Y23 Y2j Y2.
3 Y31 Y32 Y33 Y3j Y3.
…i Yi1 Yi2 Yi3 Yij Yi.
ΣY.j Y.1 Y.2 Y.3 Y.j Y..
La salida de varianza de este diseño y de acuerdo a su modelo aditivo lineal es el siguiente:
Cuadro 15. Salida de varianza para un diseño en Bloques Completamente al Azar.
F.V gl SC CM Fc Ft
Bloque r-1 SCBloque CMBloque ( )
Tratamiento t-1 SCTRAT. CMTRAT. ( )
Error (t-1)(r-1) SCError CMError
Total tr-1 SCTotales
En este diseño se prueban dos juegos de hipótesis uno para bloques y otros para
tratamientos. Estas hipótesis son las siguientes:
Para tratamiento
Ho: µ1 - µ2 - µ3 -… µi = 0 (T1 - T2 - T3 - …Ti = 0)
Ha: µ1 - µ2 - µ3 -… µi  0(T1 - T2 - T3 - …Ti  0).
Para Bloques
Ho: Bµ1 - Bµ2 - Bµ3 -… Bµj = 0 (B1 - B2 - B3 - …Bj = 0)
Ha: Bµ1 - Bµ2 - Bµ3 -… Bµj  0 (B1 - B2 - B3  …Bj  0).
Las ecuaciones de trabajo para realizar el análisis de varianza de este diseño son las
Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior
siguientes:
; Factor de Corrección
∑
∑
∑
( )
Ejemplo:
Un fisioterapeuta deseaba comparar tres métodos para enseñar a los pacientes el uso de
cierto aparato protético. Tenía la sensación de que la rapidez de aprendizaje sería diferente
para pacientes de diferentes edades y deseaba diseñar un experimento en el que pudiera
tomarse en consideración la influencia de la edad. Para ello selección tres pacientes en cada
uno de los cuatros grupos de edades para participar en el experimento y, en cada grupo de
edad se asignó un paciente aleatoriamente a cada uno de los métodos de enseñanza. Los
métodos de instrucción corresponden a los tratamientos y los cinco grupos de edades
corresponden a los bloques. La variable medida fue el tiempo (días) requerido para
aprender el uso de cierto aparato protético. Los datos son los siguientes:
Cuadro 16. Tiempo requerido para el manejo de un aparato protético bajo tres
modalidades de enseñanza en grupos de diferentes edades.
Método de
Enseñanza
Edades (años)
ΣYi.
< a 20 20 a 29 30 a 39 40 a 49 50 y más
A 7 8 9 10 11 45
B 9 9 9 9 12 48
C 10 10 12 12 14 58
ΣY.j 26 27 30 31 37 151
Adaptado de Wyane (1970)
Realice el análisis de varianza correspondiente a un  = 0.01.
Aplicando las ecuaciones de trabajo se tiene lo siguiente:
( )
Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior
(7² + 8² +…14²)-1520.06667 = 46.93333
( )
( )
( )
Cuadro 17. Salida de varianza para el ejemplo de Diseños en Bloques Completamente
a Azar.
F.V gl SC CM Fc F(0.01)
Bloques 4 6.2333 14.38465 7.006
Tratamiento 2 9.26666 21.38458 8.649
Error 8 0.43333
Total 15 46.93333
Interpretación de Resultados
Es necesario recalcar que en un diseño de bloques completamente al azar la variable que se
está bloqueando no es de interés estudiar, en este caso, el fisioterapeuta está interesado en
el manejo del aparato protético sin embargo, el presume que la edad puede estar afectando
esta velocidad de aprendizaje en este tipo de pacientes y por ello que organiza el
experimento y agrupa las unidades experimentales de acuerdo a las edades de los paciente.
Cuando se establece un diseño en bloques completamente al azar, es necesario estar seguro
que en verdad el factor de estorbo existe, caso contrario se pierde grados de libertad en el
error, lo cual hace que las diferencias dentro de los tratamientos (error experimental) sean
mayores con las consecuencias que corresponden.
Para el caso del ejemplo, se puede verificar en la salida de varianza que existe diferencias
significativas (P  0.01) en bloques lo cual indica, que el investigador tenía razón en
realizar el bloqueo por edades de los pacientes. Esto indica también que la velocidad de
aprendizaje (vista como el manejo del aparato protético), se ve afectada por la edad.
Por otra parte, este mismo análisis indica que los métodos de enseñanza afectan o ejercen
efecto significativo en la velocidad de aprendizaje de los pacientes. Esto se puede concluir
a un 99% de confiabilidad.
Dado que el análisis de varianza reportó diferencias significativas en el tiempo de
Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior
aprendizaje, se debe aplicar una prueba de rangos múltiples para verificar cuál de las
técnicas de enseñanza.
Para realizar lo antes expuesto lo primero que hay que hacer es ordenar las medias por
magnitud (descendente) como se muestra en el Cuadro 18.
Cuadro 18. Promedios por método de enseñanza utilizado.
Método de Enseñanza Promedios Método de Enseñanza Promedios Ordenados
A 9 C 11.6
B 9.6 B 9.6
C 11.6 A 9
Aplicando la prueba de Tukey a un  = 0.01
√
√ 1.65742075
Cuadro 19. Resultados de la aplicación de la prueba de Tukey a los promedios de los
Métodos de Enseñanza estudiados.
Comparaciones Diferencias de Medias Resultado de la Comparación
A versus B 2.0 *
A versus C 2.6 *
B versus C 0.6 ns
Medias con literales distintas son diferentes estadísticamente (P  0.01).
Resumiendo los resultados de las comparaciones realizadas se puede resumir a través del
siguiente rango de mérito
Método de Enseñanza Comparación
C a
B b
A b
Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior
Lo anterior indica que el método donde los pacientes tardan menos son el A y el B, ambos
métodos son estadísticamente iguales, es decir, que ejercen el mismo efecto sobre el tiempo
que duran los pacientes para aprender el manejo de aparato protético y el método donde se
tarda más es el método C ya que aquí los pacientes tardan en promedio 11 días y que fue
diferente (P 0.01) a los demás métodos.
5. DISEÑO CUADRADO LATINO (DCL)
Anteriormente se han analizado los casos de los diseños Completamente al Azar
donde el material experimental tiene que ser homogéneo y Bloques al Azar, donde el
material experimental presenta un factor sistemático o de estorbo. Sin embargo, en la
investigación se presentan casos donde el material experimental presenta dos tipos de
efectos no sistemáticos o sea dos factores de estorbo, que no son de interés en la
investigación pero pueden afectar los resultados del experimento. Además, imposibilita el uso
de los diseños antes mencionados.
5.1. ¿Cuándo Utilizar este Diseño?
El diseño Cuadrado Latino, es considerado como una variante del diseño Bloques
al Azar. Este diseño es de gran utilidad cuando el material experimental presenta dos efectos
de estorbo. Permite controlar dos efectos sistemáticos que afectan al material experimental,
además del efecto de tratamiento que es el de interés estudiar. Tiene la característica de
controlar los efectos de estorbo a través de hileras y columna, o sea un doble bloqueo.
Para que los efectos de las hileras y las columnas no se confundan con el de los
tratamientos, éstos se ubican de tal forma que un tratamiento no se repite en la misma
columna y la misma hilera. Por esta razón, la cantidad de tratamiento coincide con el
mismo número de filas y columnas.
La principal restricción de este diseño es que el número de repeticiones es igual al número
de tratamiento, si este último es considerable el número de repeticiones requerido se vuelve
impracticable. Son pocos usados los Cuadros Latinos 12 x 12, mientras que el tamaño más
común es desde 5 x 5 hasta 8 X 8. Este diseño presenta hasta cierto punto la
misma desventaja que los Bloques al Azar de que, el error experimental por
unidad, se aumente con el tamaño del cuadro.
Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior
5.2. Modelo Aditivo Lineal de para un DCL
El modelo aditivo lineal para este diseño es el siguiente:
Yij(k) = µ + Hi + Cj + Tk(ij) + Eijk
Donde:
Yij (k) = Variable respuesta
µ = Efecto común a todas las observaciones
Hi = Efecto de la i - ésima hilera i = 1, 2, 3,... i hileras
Cj = Efecto de la j-ésima columna j = 1, 2, 3,… j columnas
Tk (ij) = Efecto del k-ésimo tratamiento en la i-ésima hilera y j-ésima columna k = 1, 2, 3,…
k tratamientos.
Ejk = Error del modelo
En este diseño se prueban hipótesis para columnas, hileras y tratamiento de la misma forma
que se ha hecho anteriormente, es decir, la hipótesis nula asume el efecto de igualdad en
caso y la alternativa su contradicción.
5.3. Análisis de Varianza para un diseño Cuadrado Latino DCL
Al igual que los casos anteriores, antes de exponer la salida de varianza, se muestra un
cuadro de concentración de información, que es de donde obtiene como tal al análisis de
varianza que se debe corresponder con el modelo aditivo lineal.
Cuadro 20. Cuadro de vaciamiento de información para un diseño Cuadrado Latino.
Hileras
Columnas
ΣYi.
C1 C2 C3 … Cj
H1 Y11 Y12 Y13 Y1j Y1.
H2 Y21 Y22 Y23 Y2j Y2.
H3 Y31 Y32 Y33 Y3j Y3.
… Hi Yi1 Yi2 Yi3 Yij Yi.
ΣY.j Y.1 Y.2 Y.3 Y.j Y..
Los tratamientos están entre las hileras y las columnas bajo las características que se han
mencionado anteriormente, es por ello que hay que hacer un resumen de los tratamientos en
otro cuadrado como se muestra a continuación.
Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior
Cuadro 21. Resumen de la información de los tratamientos extraído de un diseño
Cuadrado Latino.
Tratamiento
Repeticiones
ΣYi.
R1 R2 R3 … Rj
T1 Y11 Y12 Y13 Y1j Y1.
T2 Y21 Y22 Y23 Y2j Y2.
T3 Y31 Y32 Y33 Y3j Y3.
… Tk Yi1 Yi2 Yi3 Yij Y..k
Y..1 Y..2 Y..3 Y..j Y…
La salida de varianza para un DCL es la siguiente:
Cuadro 22. Salida de varianza para un diseño Cuadrado Latino
FV gl SC CM Fc Ft
Hileras t-1 SCHileras CMHileras ( )
Columnas t-1 SCColumn CMColumn ( )
Tratamiento t-1 SCTRAT. CMTRAT. ( )
Error (t-1)(t-2) SCError CMError
Total t²-1 SCTotales
Las ecuaciones de trabajo para el análisis de varianza de este diseño son las siguientes:
(∑ )
∑
∑
∑
∑
( )
Ejemplo:
Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior
Se estudia la eficacia de cuatro fármacos diferentes (F1, F2, F3 y F4) en el tratamiento de
una enfermedad, para ello, se observa el número de días que tardan en curar los enfermos
tratados con estos fármacos. Se considera que el factor edad y el factor peso pueden influir
en el experimento, por ello, se controlan estos factores y se consideran cuatro niveles de
edad (E1, E2, E3 y E4) y cuatro de peso (P1, P2, P3 y P4). Los resultados del experimento
diseñado según la técnica del cuadrado latino se reportan en el Cuadro 23. ¿Qué
conclusiones se deducen del experimento a un nivel de significancia del 5%?”
Cuadro 23. Efecto de cuatro fármacos en los días para una curar una enfermedad en
pacientes de cuatro grupos etáreos y cuatro tipos de peso.
Peso
Grupo Etáreo
E1 E2 E3 E4
P1 10.0 F1 9.5 F2 7.0 F4 11.5 F3
P2 8.0 F2 10.0 F1 8.5 F3 9.0 F4
P3 7.0 F3 6.5 F4 7.0 F1 8.0 F2
P4 6.0 F4 5.0 F3 6.0 F2 9.0 F1
Lo primero que se debe hacer es resumir la información para columnas e hileras. Esta es la
siguiente:
Peso
Grupo Etáreo
ΣYi..
E1 E2 E3 E4
P1 10.0 9.5 7.0 11.5 38.0
P2 8.0 10.0 8.5 9.0 35.5
P3 7.0 6.5 7.0 8.0 28.5
P4 6.0 5.0 6.0 9.0 26.0
ΣY.j. 31.0 31.0 28.5 37.5 128.0
y la de tratamiento quedaría de la siguiente forma:
Fármaco
(Tratamiento)
1 2 3 4 ΣY..k
F1 10.0 10.0 7.0 9.0 36.0
F2 8.0 9.5 6.0 8.0 31.5
F3 7.0 5.0 8.5 11.5 32.0
F4 6.0 6.5 7.0 9.0 28.5
Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior
Con esta información se puede realizar el análisis de varianza
(∑ )
∑ ( )
∑
( )
∑
( )
∑
( )
( )
( )
Resumiendo lo anterior en la salida de varianza correspondiente a este diseño se tiene lo
siguiente:
Cuadro 24. Salida de varianza para el diseño Cuadrado Latino del ejemplo.
F.V gl SC CM FC Ft (0.05)
Peso (Hileras) 3 24.125 8.0416667 10.432432 4.757
Grupo Etáreo (Columnas) 3 11.125 3.7083333 4.8108108 4.757
Fármaco (Tratamiento) 3 7.125 2.375 3.0810811 4.757
Error 6 4.625 0.7708333
Total 15 47.0
De acuerdo al análisis de varianza realizado se concluye al 95% de confiabilidad que existe
efecto significativo del peso en los días que tardan los enfermos en curarse, de igual manera
lo hicieron los grupos etáreos estudiados. Al revisar el efecto de los fármacos (tratamiento)
se observó que éstos ejercieron el mismo efecto en los días para curarse por lo tanto es
indistinto usar uno o el otro.
En este caso, al igual que en los bloques, si existe efecto de hileras o columnas se concluye
nada más que era necesario bloquear en ese sentido. Si se encuentra efecto de tratamiento,
se debe aplicar alguna prueba de rangos múltiples.
Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior
6. DISEÑOS FACTORIALES
Como se mencionó en un principio, todos los diseños hasta ahora desarrollados son diseños
simples donde solo se ha analizado el efecto de tratamiento. Sin embargo, se presentan
situaciones donde la interrogante a investigar se encuentra supeditada por varios factores
controlables, por ejemplo:
 El efecto de diferentes dosis de un desparasitante en niños de diferentes condiciones
sociales.
 El efecto de diferentes productos para reducir triglicéridos en pacientes con distintas
condiciones corporales, etc.
En la parte introductoria de este documento se mencionó que un factor es un tratamiento
que genera más tratamiento (niveles de un factor). Puede ser que la reducción de los
triglicéridos pueda estar relacionada con tipo de producto y una condición corporal
determinada, es decir, puede ser que exista efecto de interacciones de los niveles de los
factores estudiados. Si bien es cierto que en algunos casos se pueden estudiar por separados
tales efectos, el tiempo que se requiere para obtener la repuesta es mayor y además muchas
veces se necesita aplicar ambos factores para ver el comportamiento de las interacciones de
los niveles de éstos.
Es por ello que una de las ventajas de este tipo de diseño es que además de estudiar los
efectos principales, se pueden estudiar las interacciones de los niveles de los factores
reduciendo el tiempo de experimentación y además proporcionando conclusiones más
concretas en el estudio.
Los diseños factoriales se dividen en diseños factoriales simples y diseños factoriales
complejo. Estos pueden ejecutarse en cualquiera de los diseños simples o clásicos hasta
ahora desarrollado, es decir, que se pueden tener diseños factoriales en un diseño
completamente al azar, en bloques completamente al azar y en cuadrado latino. De igual
forma se puede hacer en los diseños factoriales complejos, todo depende de las
características del material experimental que se utilice en el experimento.
A continuación se desarrollan diseños factoriales simples en arreglos completamente al azar
y en bloques completamente al azar.
Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior
6.1. ¿Cuándo utilizar diseños factoriales simples en un arreglo completamente al
azar?
De cuando utilizar estos diseño se ha expuesto anteriormente por lo tanto solo se desarrolla
lo de completamente al azar. Los diseños factoriales simples en arreglo completamente al
azar su utilizan cuando se está interesado estudiar al mismo tiempo el efecto de dos o más
factores al mismo tiempo y el material experimental a usar es homogéneo, es decir, no
presenta factor de estorbo alguna que pueda afectar los resultados del experimento.
De forma general los diseños factoriales simples se puede clasificar de acuerdo al número
de factores que se estudien o bien de acuerdo a que si se estudian todos los niveles de los
factores (factoriales completos) o se estudian cierto niveles de éstos (factoriales
incompletos).
En función del número de factores que se estudien, los diseños factoriales pueden ser
bifactoriales, trifactoriales, etc. Generalmente es recomendable hasta tres por el efecto de
interpretación.
Para el análisis de experimentos factoriales se analizan primero los efectos principales
(factores individuales) y posteriormente las interacciones de los mismos. Hay autores que
mencionan que en caso de existir efecto de las interacciones no tiene sentido estudiar los
factores por separados ya que para ver el efecto en la variable respuesta se requiere de las
interacciones de los niveles de los factores en estudio.
6.2. Arreglo combinatorio
Como se ha mencionado anteriormente, un factor es una clase de tratamiento que genera
más tratamiento llamados niveles. Un nivel se refiere a los diferentes tratamientos dentro de
un factor y arreglo combinatorio se refiere a la combinación de los niveles de los factores
en estudio. Suponga que se tiene un factor A con tres niveles (a1, a2, a3) y un factor B con
cuatro niveles (b1, b2, b3, b4). En este caso se tiene un experimento bifactorial 3 x 4. El
arreglo combinatorio de estos dos factores sería el que se muestra en el Cuadro 25.
Cuadro 25. Arreglo combinatorio bifactorial 3 x 4.
Factor A
Factor B
b1 b2 b3 b4
a1 a1b1 a1b2 a1b3 a1b4
a2 a2b1 a2b2 a2b3 a2b4
a3 a3b1 a3b2 a3b3 a3b4
Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior
6.3.Modelo aditivo lineal
Para representar un experimento factorial se utiliza un modelo lineal que tome en
consideración la suma de una constante general común a todas las observaciones más los
efectos principales de los factores a estudiar así como los efectos secundarios
(interacciones) adicionándole finalmente un efecto aleatorio o error experimental. Además
se tiene que considerar en el modelo la forma de asignación de los tratamientos definidos
(interacciones) a las unidades experimentales. Esto quiere decir, que si el material
experimental es homogéneo, se hará en un arreglo completamente al azar, si hay un factor
de estorbo, entonces se hará en bloques completamente al azar, etc.
Es importante mencionar que en este tipo de experimentos factoriales, todos los factores se
estudian bajo un mismo rigor, cosa que no ocurres en los experimentos factoriales
complejos ya que en éstos se sacrifica precisión en uno para estudiar con mayor precisión el
otro.
Supóngase que en el ejemplo de arreglo combinatorio expuesto líneas arriba, se lleva a
cabo en un diseño o arreglo completamente al azar, entonces su modelo aditivo lineal sería
el siguiente:
( )
Yijk = Variable respuesta
µ = Efecto común a todas las observaciones
Ai = Efecto del i-ésimo nivel del factor A: i = a1, a2, a3 niveles del factor A
Bj = Efecto del j-ésimo nivel del factor B: j = b1, b2, b3, b4 niveles del factor B
(A*B)ij = Interacción del i-ésimo nivel del factor A con el j-ésimo nivel del factor B
Eijk = Error del modelo
En este diseño se prueban hipótesis tanto para el factor A, factor B y para las interacciones,
bajo la misma tipología desarrollada en este documento (hipótesis nula e hipótesis
alternativa). En caso de rechazo de la hipótesis nula, se debe hacer prueba de rangos
múltiples según sea el caso
Un cuadro de vaciamiento de información para un diseño bifactorial un arreglo
completamente al azar se muestra a continuación.
Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior
Cuadro 26. Cuadro de vaciamiento de información para un diseño bifactorial en un
arreglo completamente al azar.
Factor A Factor B
Repeticiones
ΣYij.
1 2 3 …k
a1
b1 Y111 Y112 Y113 Y11k Y11.
b2 Y121 Y122 Y123 Y12k Y12.
b3 Y131 Y132 Y133 Y13k Y13.
bj Y1j1 Y1j2 Y1j3 Y1jk Y1j.
a2
b1 Y211 Y212 Y213 Y21k Y21.
b2 Y221 Y222 Y223 Y22k Y22.
b3 Y231 Y232 Y233 Y23k Y23.
bj Y2j1 Y2j2 Y2j3 Y2jk Y2i.
a3
b1 Y311 Y312 Y313 Y31k Y31.
b2 Y321 Y322 Y323 Y32k Y32.
b3 Y331 Y332 Y333 Y33k Y33.
bj Y3j1 Y3j2 Y3j3 Y3jk Y3j.
ai
b1 Yi11 Yi12 Yi13 Yi1k Yi1.
b2 Yi21 Yi22 Yi23 Yi2k Yi2.
b3 Yi31 Yi32 Yi33 Yi3k Yi3.
…bj Yij1 Yij2 Yij3 Yijk Yij.
De este cuadro se extrae la información de los efectos principales y secundarios
(interacciones) como se muestra en el Cuadro 27.
Cuadro 27. Información de los efectos principales y de las interacciones entre los
mismos.
Factor A
Factor B
ΣYi..
b1 b2 b3 b4 …bj
a1 Y11. Y12. Y13. Y14. Y1j. Y1..
a2 Y21. Y22. Y23. Y24. Y2j. Y2..
a3 Y31. Y32. Y33. Y34. Y3j. Y3..
…ai Yi1. Yi2. Yi3. Yi4. Yij. Yi..
ΣY.j. Y.1. Y.2. Y.3. Y.4. Y.j. Y…
Las ecuaciones de trabajo son las siguientes:
(∑ )
Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior
( )
( )
( )
( )
( )
La salida de varianza de acuerdo al modelo aditivo lineal sería la que se muestra en el
Cuadro 28.
Cuadro 28. Salida de varianza para un diseño bifactorial en un arreglo
completamente al azar.
F.V gl SC CM Fc Ft
Factor A a-1 SCA F(,glA, gl Error)
Factor B b-1 SCB F(,glB, gl Error)
A*B (a-1)(b-1) SCAB
( )( )
F(,glAB, gl Error)
Error ab(r-1) SCError
( )
Total abr-1 SCTotales
Si el diseño bifactorial se hubiera llevado a cabo en arreglo en bloques completamente al
azar el modelo aditivo lineal es el siguiente:
( )
Yijk = Variable respuesta
µ = Efecto común a todas las observaciones
Ai = Efecto del i-ésimo nivel del factor A: i = a1, a2, a3 niveles del factor A
Bj = Efecto del j-ésimo nivel del factor B: j = b1, b2, b3, b4 niveles del factor B
(A*B)ij = Interacción del i-ésimo nivel del factor A con el j-ésimo nivel del factor B
αk = Efecto de k-ésimo bloque: k = 1, 2, 3,… bloques
Eijk = Error del modelo
Y la salida de varianza sería la que se muestra en el Cuadro 29.
Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior
Cuadro 29. Salida de varianza para un diseño bifactorial en un arreglo de bloques
completamente al azar.
F.V gl SC CM Fc Ft
Bloque k-1 SCBloques
F(, glbloque, gl
Error
Factor A a-1 SCA F(,glA, gl Error)
Factor B b-1 SCB F(,glB, gl Error)
A*B (a-1)(b-1) SCAB
( )( )
F(,glAB, gl Error)
Error (ab-1)(r-1) SCError
( )
Total abr-1 SCTotales
En este caso se adicionaría una hipótesis más que sería la de bloque y si hubiera un rechazo
de Ho, la interpretación sería la misma que se ha mencionado anteriormente.
Ejemplo
Un médico está interesado en determinar si tanto el estado nutricional como la edad (grupo
etáreo) de la madre tiene efecto sobre el peso del recién nacido. Los estados nutricionales
de su interés fueron: Normal, Sobrepeso y Obesa, y los grupos etáreos fueron: menores a 15
años, 15 a 18 años, 19 a 30 años y mayores a 30 años. Seleccionó de forma aleatoria cuatro
madres para cada combinación de los niveles de los dos factores, estado nutricional y grupo
etáreo). Los pesos obtenidos en gramos fueron los que se reportan en el Cuadro 30.
En este caso se tiene un experimento bifactorial, Estado Nutricional y Grupo Etáreo, cada
uno con tres y cuatro niveles, respectivamente. Esto hace que se tenga un bifactorial 3 x 4
(esto vendría a ser un factorial completo asimétrico, asimétrico por no tienen el mismo
número de niveles y completo por se estudian todos los niveles que han sido propuestos por
el investigador. Por otra parte se tiene cuatro repeticiones por tratamiento (combinación),
entonces viene a ser un bifactorial 3 x 4 con 4 repeticiones, haciendo un total de 48
unidades experimentales como se muestra en el Cuadro 30.
Para los datos del Cuadro 30 realice lo siguiente:
a. Proponga y describa un modelo aditivo lineal para el experimento.
b. Proponga los juegos de hipótesis a probar.
c. Realice el análisis de varianza correspondiente de acuerdo al modelo aditivo lineal
Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior
propuesto en el inciso a., a una significancia del 1%. Realice conclusiones.
d. Si existe rechazo de Ho en cualquiera de los factores como en las interacciones de
los mismos, realice la prueba de rangos múltiples de Tukey al 99% de confiabilidad.
Emita conclusiones
Cuadro 30. Pesos de los recién nacidos de acuerdo al estado nutricional de la madre y
al grupo etáreo de las mismas.
Estado Nutricional Grupo Etáreo
Repeticiones
1 2 3 4
Normal
Menor de 15 1800 1900 1700 2000
15 a 18 2000 2400 2900 3000
19 a 30 3000 2800 2900 3200
Mayor a 30 3100 3300 2600 2800
Con sobrepeso
Menor de 15 2100 1800 1900 2200
15 a 18 2500 2900 3200 2900
19 a 30 2700 2900 3100 3500
Mayor a 30 2900 2600 3200 2700
Obesa
Menor de 15 3000 2800 2400 2500
15 a 18 3100 3300 2900 3400
19 a 30 2800 2500 3200 3100
Mayor a 30 2800 3100 3400 3500
Dado que este experimento fue realizado en un arreglo completamente al azar no es
necesario totalizar las columnas por lo tanto se procede a continuación a obtener la
información de las interacciones de los niveles de los factores estudiados. Para ello es
necesario totalizar en fila las interacciones como se muestra en el Cuadro 31 posteriormente
hacer en cuadro de las interacciones que conllevaran a los totales de los efectos principales
como se reporta en el Cuadro 32, estos totales se muestran tanto en la suma de las hileras
como de las columnas de acuerdo a como se dispongan los factores (totales marginales) y
los valores de las interacciones están dentro del cuadro.
Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior
Cuadro 31. Datos del experimento con las interacciones totalizadas.
Estado
Nutricional
Grupo
Etáreo
Repeticiones
ΣYij.
1 2 3 4
Normal
Menor de 15 1800 1900 1700 2000 7400
15 a 18 2000 2400 2900 3000 10300
19 a 30 3000 2800 2900 3200 11900
Mayor a 30 3100 3300 2600 2800 11800
Con sobrepeso
Menor de 15 2100 1800 1900 2200 8000
15 a 18 2500 2900 3200 2900 11500
19 a 30 2700 2900 3100 3500 12200
Mayor a 30 2900 2600 3200 2700 11400
Obesa
Menor de 15 3000 2800 2400 2500 10700
15 a 18 3100 3300 2900 3400 12700
19 a 30 2800 2500 3200 3100 11600
Mayor a 30 2800 3100 3400 3500 12800
Cuadro 32. Efectos principales e interacciones de los factores Estado Nutricional y
Grupo Etáreo.
Estado
Nutricional
Grupo Etáreo (años)
ΣYi..
Menor de 15 15 a 18 19 a 30 Mayor a 30
Normal 7400 10300 11900 11800 41400
Con sobrepeso 8000 11500 12200 11400 43100
Obesa 10700 12700 11600 12800 47800
ΣY.j. 26100 34500 35700 36000 132300
Desarrollando las actividades solicitadas para el ejemplo se tiene lo siguiente:
a. Modelo aditivo lineal
( )
Yijk = Variable respuesta (peso de los recién nacidos)
µ = Efecto común a todas las observaciones
Ni = Efecto del i-ésimo estado nutricional; i = Normal, Con sobrepeso y Obesa
Gj = Efecto del j-ésimo grupo etáreo; menores de 15, 15 a 18, 19 a 30 y mayores a 30 años
(N*E)ij = Efecto de la interacción del i-ésimo nivel del factor Estado Nutricional con el j-
ésimo nivel del factor Grupo Etáreo
Eijk = Error del modelo
Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior
b. Juego de Hipótesis
Como existen dos factores y sus interacciones, las hipótesis son las siguientes:
Para el factor Estado Nutricional:
Ho: µNormal- µSobre peso- µObesa = 0
Ha: µNormal- µSobre peso- µObesa  0
Para el factor Grupo Etáreo:
Ho: µmenores de 15 - µ15 a 18 - µ19 a 30 - µmayores 30 años = 0
Ha: µmenores de 15 - µ15 a 18 - µ19 a 30 - µmayores 30 años  0
Para las interacciones:
Ho: µa1b1 - µa1b2 - µa1b3 - µa1b4 - … µa3b4 = 0
Ha: µa1b1 - µa1b2 - µa1b3 - µa1b4 - … µa3b4  0
c. Análisis de varianza
(∑ )
( )
( ) ( )
( )
( )
( )
( )
( )
( )
( )
( )
Con estos cálculos se construye la salida o tabla de varianza como se muestra en el Cuadro
33.
Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior
Cuadro 33. Salida de varianza para el diseño bifactorial en un DCA del ejemplo.
F.V gl SC CM Fc Ft (0.01)
Estado Nutricional 2 1373750 686875 8.3609467 5.248
Grupo Etáreo 3 5510625 1836875 22.359256 4.377
Interacción 6 1196250 199375 2.4268808 3.351
Error 36 2957500 82152.778
Total 47 11038125
De acuerdo a los resultados del análisis de varianza se puede concluir con 99% de
confiabilidad que el peso de los recién nacidos se ve afectado por el Estado Nutricional y
por el Grupo Etáreo de las madres, es decir, que ejercen efectos significativos (P < 0.01) en
el peso de los recién nacidos, no así las interacciones de los niveles estudiados ya que ésta
resultó ser no significativa. Esto indica que los factores estudiados ejercen efectos aditivos
o bien que actúan de forma independiente en la variable respuesta.
d. Separación de media de Tukey al 99% de confiabilidad
Cuando se dan este tipo de resultados hay que determinar el nivel o niveles de cada factor
que provocaron el rechazo de la hipótesis nula en el análisis de varianza. Para ello hay que
hacer los ajustes necesarios como se muestra en el Cuadro 34.
Cuadro 34. Ajuste de los efectos principales y secundarios para la separación de
medias.
Efecto Total Promedio Ajuste
A ΣYi.. √
B ΣY.j. √
AB ΣYij. √
Aplicando estos ajustes para los efectos principales se tiene lo siguiente:
Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior
Estado Nutricional Totales Promedio
Normal 41400 2587.5
Con sobrepeso 43100 2693.75
Obesa 47800 2987.5
Aplicando Tukey para el factor Estado Nutricional se tiene lo siguiente:
√ √
Ordenando los promedios de los niveles del factor Estado Nutricional y estableciendo las
comparaciones correspondiente se tiene lo siguiente:
Estado Nutricional Promedio Comparaciones Diferencias Resultado
Obesa 2987.5 Obesa-Sobrepeso 293.75 ns a
Con sobrepeso 2693.75 Obesa- Normal 400 * ab
Normal 2587.5 Sobrepeso - Normal 106.25 ns b
En este caso se puede decir que de los niveles del factor Estado Nutricional, solo el nivel
Obesa ejerció un efecto distinto (P <0.01) en el peso de los recién nacidos.
Los ajustes para los niveles del factor Grupo Etáreo se tiene lo siguiente:
Grupo Etáreo Totales Promedio
Menor de 15 26100 2175
15 a 18 34500 2875
19 a 30 35700 2975
Mayor a 30 36000 3000
Aplicando la Tukey para los niveles del factor Grupo Etáreo
√ √
Ordenando los promedios de los niveles del factor Grupo Etáreo y estableciendo las
comparaciones correspondiente se tiene lo siguiente:
Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior
Comparaciones Diferencias
Mayor a 30 - 19 a 30 25 ns
Mayor a 30 - 15 a 18 125 ns
Mayor a 30 - Menor a 15 825*
19 a 30 - 15 a 18 100 ns
19 a 30 - Menor a 15 800 *
15 a 18 - Menor a 15 700 *
Grupo Etáreo Promedio Resultado
Mayor a 30 3000 a
19 a 30 2975 a
15 a 18 2875 a
Menor de 15 2175 b
De acuerdo a los resultados de Tukey se puede concluir que de los niveles del factor Grupo
Etáreo, solamente uno de éstos ejerció un efecto distinto el peso de los recién nacidos como
las madres menores de 15 años.
Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior
BIBLIOGRAFIA CONSULTADA PARA ESTRUCTURAR EL DOCUMENTO
COCHRAN, W. y G.M. COX. 1991. Diseños Experimentales. 2da. Edic. Edit. Trillas.
México, D.F.
FREUD, R.J. and R.C. LITTELL. 1991. SAS System for Regression. SAS Institute Inc,
Cary. N.C. USA.
HERRERA HARO, J.G y G. LORENZANA. 1994. Aplicaciones del SAS (Statistical
Analysis System) a los Métodos Estadísticos. Instituto Tecnológico Agropecuario
de Oaxaca. Oaxaca, México.
HILDERBRAND, P.E. y F. POEY. 1989. Ensayos Agronómicos en Fincas según el
Enfoque de Sistemas Agropecuarios. Edit. Agropecuaria Latinoamericana, Inc.
Estados Unidos de Norteamérica.
INFANTE GIL, S. y G. ZARATE DE LARA. 1990. Métodos Estadísticos. Un enfoque
interdiciplinario. 2da. Edic. Edit. Trillas. México, D.F.
LITTLE, T. y F.J. HILLS. 1989. Métodos Estadísticos para la Investigación Agropecuaria.
2da. Edic. Edit. Trillas. México, D.F.
LOPEZ, P.F. 1989. Uso del SAS para análisis estadísticos de datos experimentales. Centro
Agronómico Tropical de Investigación y Enseñanza C.A.T.I.E. Turrialba, Costa
Rica.
MARTINEZ-GARZA, A. 1988. Diseños Experimentales. Métodos y Elementos de Teoría.
Edit. Trillas. México, D.F,
MARTINEZ-GARZA, A. 1994. Experimentación Agrícola. Métodos Estadísticos.
Universidad Autónoma Chapingo. Chapingo, México.
MARTINEZ SOLARIS, F. 2111.
http://cdn.slidesharecdn.com/ss_thumbnails/estadisticaydiseosexperimentales-
110925201348-phpapp02-thumbnail.jpg?1316999785
Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior
MONTGOMERY, D.C. 1991. Diseños y Análisis de Experimentos. Edit. Iberoaméria.
México, D.F.
STEEL, R.G.D. y J.H. TORRIE. 1992. Bioestadística. Principios y Procedimientos. 2da.
Edic. Edit. McGraw-Hill. México, D.F.
RAO, C.R. 1952. Advanced statistical methods in biometric reseach. John Wiley. New
York, USA.
RENDON, S.G. 1992. Métodos Estadísticos (Muestreo, Diseños Experimentales,
Estadística No Paramétrica). Universidad Autónoma de Chapingo. Chapingo,
México.
REYES, C.P. 1992. Diseño de Experimentos Aplicados: Agronomía, Biología, Química,
Industrias, Ciencias Sociales. 3era Edic. Edit. Trillas. México, D.F.
RODRIGUEZ del ANGEL, J.M. 1991. Métodos de Investigación Pecuaria. Edit. Trillas.
México, D.F.
WAYNE W. D. 1977. Estadística con Aplicaciones a las Ciencias Sociales y a la
Educación. Edit. McGraw-Hill. México.

Más contenido relacionado

La actualidad más candente

Tarea 7 de probabilidad y estadistica con respuesta (esperanza matemática o v...
Tarea 7 de probabilidad y estadistica con respuesta (esperanza matemática o v...Tarea 7 de probabilidad y estadistica con respuesta (esperanza matemática o v...
Tarea 7 de probabilidad y estadistica con respuesta (esperanza matemática o v...IPN
 
Informe nro1 ivestigacion_operativa ii
Informe nro1 ivestigacion_operativa iiInforme nro1 ivestigacion_operativa ii
Informe nro1 ivestigacion_operativa iiDavids Vasquez Vasquez
 
Ejercicios diseño de bloques completos al azar ejercicio 2
Ejercicios diseño de bloques completos al azar ejercicio 2Ejercicios diseño de bloques completos al azar ejercicio 2
Ejercicios diseño de bloques completos al azar ejercicio 2Instituto Tecnologico De Pachuca
 
Tarea 8 de probabilidad y estadística con respuestas
Tarea 8 de probabilidad y estadística  con respuestasTarea 8 de probabilidad y estadística  con respuestas
Tarea 8 de probabilidad y estadística con respuestasIPN
 
Probabilidad y estadística descriptiva
Probabilidad y estadística descriptivaProbabilidad y estadística descriptiva
Probabilidad y estadística descriptivaBlanca Parra Campos
 
Regla de simpson un tercio para segmentos multiples
Regla de simpson un tercio para segmentos multiplesRegla de simpson un tercio para segmentos multiples
Regla de simpson un tercio para segmentos multiplesTensor
 
Flujo max 2
Flujo max 2Flujo max 2
Flujo max 2Macogi
 

La actualidad más candente (20)

Optimización. Métodos numéricos
Optimización. Métodos numéricosOptimización. Métodos numéricos
Optimización. Métodos numéricos
 
PRUEBA DE DUNCAN
 PRUEBA DE DUNCAN PRUEBA DE DUNCAN
PRUEBA DE DUNCAN
 
Tarea 7 de probabilidad y estadistica con respuesta (esperanza matemática o v...
Tarea 7 de probabilidad y estadistica con respuesta (esperanza matemática o v...Tarea 7 de probabilidad y estadistica con respuesta (esperanza matemática o v...
Tarea 7 de probabilidad y estadistica con respuesta (esperanza matemática o v...
 
3 variables aleatorias
3 variables aleatorias3 variables aleatorias
3 variables aleatorias
 
Tabla t Student
Tabla t StudentTabla t Student
Tabla t Student
 
Informe nro1 ivestigacion_operativa ii
Informe nro1 ivestigacion_operativa iiInforme nro1 ivestigacion_operativa ii
Informe nro1 ivestigacion_operativa ii
 
Problemas de circuitos electricos
Problemas de circuitos electricosProblemas de circuitos electricos
Problemas de circuitos electricos
 
Ejercicios cuadrados latinos ejercicio 2
Ejercicios cuadrados latinos ejercicio 2Ejercicios cuadrados latinos ejercicio 2
Ejercicios cuadrados latinos ejercicio 2
 
Presentación ANOVA
Presentación ANOVAPresentación ANOVA
Presentación ANOVA
 
Ejercicios diseño de bloques completos al azar ejercicio 2
Ejercicios diseño de bloques completos al azar ejercicio 2Ejercicios diseño de bloques completos al azar ejercicio 2
Ejercicios diseño de bloques completos al azar ejercicio 2
 
Tarea 8 de probabilidad y estadística con respuestas
Tarea 8 de probabilidad y estadística  con respuestasTarea 8 de probabilidad y estadística  con respuestas
Tarea 8 de probabilidad y estadística con respuestas
 
Problemas Disenos Factoriales
Problemas Disenos FactorialesProblemas Disenos Factoriales
Problemas Disenos Factoriales
 
Tabla chi cuadrado
Tabla chi cuadradoTabla chi cuadrado
Tabla chi cuadrado
 
Probabilidad y estadística descriptiva
Probabilidad y estadística descriptivaProbabilidad y estadística descriptiva
Probabilidad y estadística descriptiva
 
V de Cramers.
V de Cramers.V de Cramers.
V de Cramers.
 
Regla de simpson un tercio para segmentos multiples
Regla de simpson un tercio para segmentos multiplesRegla de simpson un tercio para segmentos multiples
Regla de simpson un tercio para segmentos multiples
 
Trabajo de estadistica 2 coorte
Trabajo de estadistica 2 coorteTrabajo de estadistica 2 coorte
Trabajo de estadistica 2 coorte
 
Fisica ii guia EJERCICIOS RESUELTOS
Fisica ii guia EJERCICIOS RESUELTOSFisica ii guia EJERCICIOS RESUELTOS
Fisica ii guia EJERCICIOS RESUELTOS
 
Prueba de hipotesis para dos poblaciones
Prueba de hipotesis para dos poblacionesPrueba de hipotesis para dos poblaciones
Prueba de hipotesis para dos poblaciones
 
Flujo max 2
Flujo max 2Flujo max 2
Flujo max 2
 

Destacado

Destacado (7)

Estadística: Prueba de Tukey
Estadística: Prueba de TukeyEstadística: Prueba de Tukey
Estadística: Prueba de Tukey
 
CONTRASTES - COMPARACIONES DE MEDIAS
CONTRASTES - COMPARACIONES DE MEDIASCONTRASTES - COMPARACIONES DE MEDIAS
CONTRASTES - COMPARACIONES DE MEDIAS
 
Final experimento
Final experimentoFinal experimento
Final experimento
 
Método duncan
Método duncan Método duncan
Método duncan
 
Prueba de tukey
Prueba de tukeyPrueba de tukey
Prueba de tukey
 
ANOVA Prueba de tukey
ANOVA  Prueba de tukeyANOVA  Prueba de tukey
ANOVA Prueba de tukey
 
Capitulo 3 experimentos_con_un_solo_factor
Capitulo 3 experimentos_con_un_solo_factorCapitulo 3 experimentos_con_un_solo_factor
Capitulo 3 experimentos_con_un_solo_factor
 

Similar a Estadistica aplicada a la educación superior

Econometriamoderna.pdf
Econometriamoderna.pdfEconometriamoderna.pdf
Econometriamoderna.pdfcarmenpando1
 
distribuciones muestrales
distribuciones muestralesdistribuciones muestrales
distribuciones muestralesJtonymattey
 
1.6.1.1. regresión lineal
1.6.1.1. regresión lineal1.6.1.1. regresión lineal
1.6.1.1. regresión linealk4rol1n4
 
Estadística y diseños experimentales aplicados a la educación superior
Estadística y diseños experimentales  aplicados a la educación superiorEstadística y diseños experimentales  aplicados a la educación superior
Estadística y diseños experimentales aplicados a la educación superiorEscuela Militar de Ingeniería (EMI)
 
Regresión lineal,ajuste de curva,tipos de regresión lineal
Regresión lineal,ajuste de curva,tipos de regresión linealRegresión lineal,ajuste de curva,tipos de regresión lineal
Regresión lineal,ajuste de curva,tipos de regresión linealmiguelescobarrivero
 
Pruebas de bondad de ajuste
Pruebas de bondad de ajustePruebas de bondad de ajuste
Pruebas de bondad de ajusteCarlos Becerra
 
Paso 4 descripción de la información.
Paso 4 descripción de la información.Paso 4 descripción de la información.
Paso 4 descripción de la información.MarlyTenorio
 

Similar a Estadistica aplicada a la educación superior (20)

Regresion estadistica
Regresion estadisticaRegresion estadistica
Regresion estadistica
 
Statistic for Business
Statistic for BusinessStatistic for Business
Statistic for Business
 
Linear regression correlation coefficient
Linear regression correlation coefficientLinear regression correlation coefficient
Linear regression correlation coefficient
 
Regresion lineal simple
Regresion lineal simpleRegresion lineal simple
Regresion lineal simple
 
Estadística aplicada a la educación superior
Estadística aplicada a la educación superiorEstadística aplicada a la educación superior
Estadística aplicada a la educación superior
 
Analisis grafico
Analisis graficoAnalisis grafico
Analisis grafico
 
Econometriamoderna.pdf
Econometriamoderna.pdfEconometriamoderna.pdf
Econometriamoderna.pdf
 
distribuciones muestrales
distribuciones muestralesdistribuciones muestrales
distribuciones muestrales
 
1.6.1.1. regresión lineal
1.6.1.1. regresión lineal1.6.1.1. regresión lineal
1.6.1.1. regresión lineal
 
Estadística y diseños experimentales aplicados a la educación superior
Estadística y diseños experimentales  aplicados a la educación superiorEstadística y diseños experimentales  aplicados a la educación superior
Estadística y diseños experimentales aplicados a la educación superior
 
Doc medidas
Doc medidasDoc medidas
Doc medidas
 
Tema4 regresionycorrelacion
Tema4 regresionycorrelacionTema4 regresionycorrelacion
Tema4 regresionycorrelacion
 
Regresión lineal,ajuste de curva,tipos de regresión lineal
Regresión lineal,ajuste de curva,tipos de regresión linealRegresión lineal,ajuste de curva,tipos de regresión lineal
Regresión lineal,ajuste de curva,tipos de regresión lineal
 
Presentación regreción lineal
Presentación regreción linealPresentación regreción lineal
Presentación regreción lineal
 
Presentación regreción lineal
Presentación regreción linealPresentación regreción lineal
Presentación regreción lineal
 
Presentación regreción lineal
Presentación regreción linealPresentación regreción lineal
Presentación regreción lineal
 
Pruebasdebondaddeajuste 151127221517-lva1-app6891
Pruebasdebondaddeajuste 151127221517-lva1-app6891Pruebasdebondaddeajuste 151127221517-lva1-app6891
Pruebasdebondaddeajuste 151127221517-lva1-app6891
 
Pruebas de bondad de ajuste
Pruebas de bondad de ajustePruebas de bondad de ajuste
Pruebas de bondad de ajuste
 
Trabajo de informatica
Trabajo de informaticaTrabajo de informatica
Trabajo de informatica
 
Paso 4 descripción de la información.
Paso 4 descripción de la información.Paso 4 descripción de la información.
Paso 4 descripción de la información.
 

Más de Escuela Militar de Ingeniería (EMI)

Más de Escuela Militar de Ingeniería (EMI) (20)

Tamaño de muestra revisado
Tamaño de muestra revisadoTamaño de muestra revisado
Tamaño de muestra revisado
 
Apuntes de estadistica
Apuntes de estadisticaApuntes de estadistica
Apuntes de estadistica
 
Modulo de estadística para la educacion superior
Modulo de estadística para la educacion superiorModulo de estadística para la educacion superior
Modulo de estadística para la educacion superior
 
Modulo de metodologia y estadistica agronomia
Modulo de metodologia y estadistica agronomiaModulo de metodologia y estadistica agronomia
Modulo de metodologia y estadistica agronomia
 
Estadistica aplicada camiri
Estadistica aplicada camiriEstadistica aplicada camiri
Estadistica aplicada camiri
 
Metodologia y Estadistica San Julian
Metodologia y Estadistica San JulianMetodologia y Estadistica San Julian
Metodologia y Estadistica San Julian
 
Modulo de metodologia de la investigacion para Business School
Modulo de metodologia de la investigacion para Business SchoolModulo de metodologia de la investigacion para Business School
Modulo de metodologia de la investigacion para Business School
 
Modulo de investigacion educativa
Modulo de investigacion educativaModulo de investigacion educativa
Modulo de investigacion educativa
 
Modulo de taller de tesis dge
Modulo de taller de tesis dgeModulo de taller de tesis dge
Modulo de taller de tesis dge
 
METODOLOGIA SALUD PUBLICA MAYO2012
METODOLOGIA SALUD PUBLICA MAYO2012METODOLOGIA SALUD PUBLICA MAYO2012
METODOLOGIA SALUD PUBLICA MAYO2012
 
Modulo de metodologia de la investigacion politecnica marzoabril
Modulo de metodologia de la investigacion politecnica marzoabrilModulo de metodologia de la investigacion politecnica marzoabril
Modulo de metodologia de la investigacion politecnica marzoabril
 
Modulo de metodologia y estadistica agronomia mar2012
Modulo de metodologia y estadistica agronomia mar2012Modulo de metodologia y estadistica agronomia mar2012
Modulo de metodologia y estadistica agronomia mar2012
 
Curso de bioestadística y diseños experimentales
Curso de bioestadística y diseños experimentalesCurso de bioestadística y diseños experimentales
Curso de bioestadística y diseños experimentales
 
Estadistica y diseños experimentales
Estadistica y diseños experimentalesEstadistica y diseños experimentales
Estadistica y diseños experimentales
 
Experimentos agronomia
Experimentos agronomiaExperimentos agronomia
Experimentos agronomia
 
Curso de estadistica aplicada julio2010
Curso de estadistica aplicada julio2010Curso de estadistica aplicada julio2010
Curso de estadistica aplicada julio2010
 
Metodologia de la investigacion cumbre 2010
Metodologia de la investigacion cumbre 2010Metodologia de la investigacion cumbre 2010
Metodologia de la investigacion cumbre 2010
 
M E T O D O L O G I A P U E R T O Q U I J A R R O
M E T O D O L O G I A  P U E R T O  Q U I J A R R OM E T O D O L O G I A  P U E R T O  Q U I J A R R O
M E T O D O L O G I A P U E R T O Q U I J A R R O
 
Curso De Estadistica Aplicada 2010
Curso De Estadistica Aplicada 2010Curso De Estadistica Aplicada 2010
Curso De Estadistica Aplicada 2010
 
Presentacion De Metodologia Maga Noviembre 2009
Presentacion De Metodologia Maga Noviembre 2009Presentacion De Metodologia Maga Noviembre 2009
Presentacion De Metodologia Maga Noviembre 2009
 

Último

el CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyz
el CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyzel CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyz
el CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyzprofefilete
 
Día de la Madre Tierra-1.pdf día mundial
Día de la Madre Tierra-1.pdf día mundialDía de la Madre Tierra-1.pdf día mundial
Día de la Madre Tierra-1.pdf día mundialpatriciaines1993
 
Unidad II Doctrina de la Iglesia 1 parte
Unidad II Doctrina de la Iglesia 1 parteUnidad II Doctrina de la Iglesia 1 parte
Unidad II Doctrina de la Iglesia 1 parteJuan Hernandez
 
Uses of simple past and time expressions
Uses of simple past and time expressionsUses of simple past and time expressions
Uses of simple past and time expressionsConsueloSantana3
 
BIOLOGIA_banco de preguntas_editorial icfes examen de estado .pdf
BIOLOGIA_banco de preguntas_editorial icfes examen de estado .pdfBIOLOGIA_banco de preguntas_editorial icfes examen de estado .pdf
BIOLOGIA_banco de preguntas_editorial icfes examen de estado .pdfCESARMALAGA4
 
Procesos Didácticos en Educación Inicial .pptx
Procesos Didácticos en Educación Inicial .pptxProcesos Didácticos en Educación Inicial .pptx
Procesos Didácticos en Educación Inicial .pptxMapyMerma1
 
Metabolismo 3: Anabolismo y Fotosíntesis 2024
Metabolismo 3: Anabolismo y Fotosíntesis 2024Metabolismo 3: Anabolismo y Fotosíntesis 2024
Metabolismo 3: Anabolismo y Fotosíntesis 2024IES Vicent Andres Estelles
 
Mapa Mental de estrategias de articulación de las areas curriculares.pdf
Mapa Mental de estrategias de articulación de las areas curriculares.pdfMapa Mental de estrategias de articulación de las areas curriculares.pdf
Mapa Mental de estrategias de articulación de las areas curriculares.pdfvictorbeltuce
 
OLIMPIADA DEL CONOCIMIENTO INFANTIL 2024.pptx
OLIMPIADA DEL CONOCIMIENTO INFANTIL 2024.pptxOLIMPIADA DEL CONOCIMIENTO INFANTIL 2024.pptx
OLIMPIADA DEL CONOCIMIENTO INFANTIL 2024.pptxjosetrinidadchavez
 
PLANIFICACION ANUAL 2024 - INICIAL UNIDOCENTE.docx
PLANIFICACION ANUAL 2024 - INICIAL UNIDOCENTE.docxPLANIFICACION ANUAL 2024 - INICIAL UNIDOCENTE.docx
PLANIFICACION ANUAL 2024 - INICIAL UNIDOCENTE.docxJUANSIMONPACHIN
 
NARRACIONES SOBRE LA VIDA DEL GENERAL ELOY ALFARO
NARRACIONES SOBRE LA VIDA DEL GENERAL ELOY ALFARONARRACIONES SOBRE LA VIDA DEL GENERAL ELOY ALFARO
NARRACIONES SOBRE LA VIDA DEL GENERAL ELOY ALFAROJosé Luis Palma
 
CIENCIAS NATURALES 4 TO ambientes .docx
CIENCIAS NATURALES 4 TO  ambientes .docxCIENCIAS NATURALES 4 TO  ambientes .docx
CIENCIAS NATURALES 4 TO ambientes .docxAgustinaNuez21
 
LINEAMIENTOS INICIO DEL AÑO LECTIVO 2024-2025.pptx
LINEAMIENTOS INICIO DEL AÑO LECTIVO 2024-2025.pptxLINEAMIENTOS INICIO DEL AÑO LECTIVO 2024-2025.pptx
LINEAMIENTOS INICIO DEL AÑO LECTIVO 2024-2025.pptxdanalikcruz2000
 
5° SEM29 CRONOGRAMA PLANEACIÓN DOCENTE DARUKEL 23-24.pdf
5° SEM29 CRONOGRAMA PLANEACIÓN DOCENTE DARUKEL 23-24.pdf5° SEM29 CRONOGRAMA PLANEACIÓN DOCENTE DARUKEL 23-24.pdf
5° SEM29 CRONOGRAMA PLANEACIÓN DOCENTE DARUKEL 23-24.pdfOswaldoGonzalezCruz
 
VOLUMEN 1 COLECCION PRODUCCION BOVINA . SERIE SANIDAD ANIMAL
VOLUMEN 1 COLECCION PRODUCCION BOVINA . SERIE SANIDAD ANIMALVOLUMEN 1 COLECCION PRODUCCION BOVINA . SERIE SANIDAD ANIMAL
VOLUMEN 1 COLECCION PRODUCCION BOVINA . SERIE SANIDAD ANIMALEDUCCUniversidadCatl
 
Estas son las escuelas y colegios que tendrán modalidad no presencial este lu...
Estas son las escuelas y colegios que tendrán modalidad no presencial este lu...Estas son las escuelas y colegios que tendrán modalidad no presencial este lu...
Estas son las escuelas y colegios que tendrán modalidad no presencial este lu...fcastellanos3
 
La Función tecnológica del tutor.pptx
La  Función  tecnológica  del tutor.pptxLa  Función  tecnológica  del tutor.pptx
La Función tecnológica del tutor.pptxJunkotantik
 
LA ECUACIÓN DEL NÚMERO PI EN LOS JUEGOS OLÍMPICOS DE PARÍS. Por JAVIER SOLIS ...
LA ECUACIÓN DEL NÚMERO PI EN LOS JUEGOS OLÍMPICOS DE PARÍS. Por JAVIER SOLIS ...LA ECUACIÓN DEL NÚMERO PI EN LOS JUEGOS OLÍMPICOS DE PARÍS. Por JAVIER SOLIS ...
LA ECUACIÓN DEL NÚMERO PI EN LOS JUEGOS OLÍMPICOS DE PARÍS. Por JAVIER SOLIS ...JAVIER SOLIS NOYOLA
 
Estrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdf
Estrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdfEstrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdf
Estrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdfAlfredoRamirez953210
 

Último (20)

el CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyz
el CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyzel CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyz
el CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyz
 
Día de la Madre Tierra-1.pdf día mundial
Día de la Madre Tierra-1.pdf día mundialDía de la Madre Tierra-1.pdf día mundial
Día de la Madre Tierra-1.pdf día mundial
 
Unidad II Doctrina de la Iglesia 1 parte
Unidad II Doctrina de la Iglesia 1 parteUnidad II Doctrina de la Iglesia 1 parte
Unidad II Doctrina de la Iglesia 1 parte
 
Uses of simple past and time expressions
Uses of simple past and time expressionsUses of simple past and time expressions
Uses of simple past and time expressions
 
BIOLOGIA_banco de preguntas_editorial icfes examen de estado .pdf
BIOLOGIA_banco de preguntas_editorial icfes examen de estado .pdfBIOLOGIA_banco de preguntas_editorial icfes examen de estado .pdf
BIOLOGIA_banco de preguntas_editorial icfes examen de estado .pdf
 
Procesos Didácticos en Educación Inicial .pptx
Procesos Didácticos en Educación Inicial .pptxProcesos Didácticos en Educación Inicial .pptx
Procesos Didácticos en Educación Inicial .pptx
 
Metabolismo 3: Anabolismo y Fotosíntesis 2024
Metabolismo 3: Anabolismo y Fotosíntesis 2024Metabolismo 3: Anabolismo y Fotosíntesis 2024
Metabolismo 3: Anabolismo y Fotosíntesis 2024
 
Mapa Mental de estrategias de articulación de las areas curriculares.pdf
Mapa Mental de estrategias de articulación de las areas curriculares.pdfMapa Mental de estrategias de articulación de las areas curriculares.pdf
Mapa Mental de estrategias de articulación de las areas curriculares.pdf
 
OLIMPIADA DEL CONOCIMIENTO INFANTIL 2024.pptx
OLIMPIADA DEL CONOCIMIENTO INFANTIL 2024.pptxOLIMPIADA DEL CONOCIMIENTO INFANTIL 2024.pptx
OLIMPIADA DEL CONOCIMIENTO INFANTIL 2024.pptx
 
PLANIFICACION ANUAL 2024 - INICIAL UNIDOCENTE.docx
PLANIFICACION ANUAL 2024 - INICIAL UNIDOCENTE.docxPLANIFICACION ANUAL 2024 - INICIAL UNIDOCENTE.docx
PLANIFICACION ANUAL 2024 - INICIAL UNIDOCENTE.docx
 
NARRACIONES SOBRE LA VIDA DEL GENERAL ELOY ALFARO
NARRACIONES SOBRE LA VIDA DEL GENERAL ELOY ALFARONARRACIONES SOBRE LA VIDA DEL GENERAL ELOY ALFARO
NARRACIONES SOBRE LA VIDA DEL GENERAL ELOY ALFARO
 
CIENCIAS NATURALES 4 TO ambientes .docx
CIENCIAS NATURALES 4 TO  ambientes .docxCIENCIAS NATURALES 4 TO  ambientes .docx
CIENCIAS NATURALES 4 TO ambientes .docx
 
LINEAMIENTOS INICIO DEL AÑO LECTIVO 2024-2025.pptx
LINEAMIENTOS INICIO DEL AÑO LECTIVO 2024-2025.pptxLINEAMIENTOS INICIO DEL AÑO LECTIVO 2024-2025.pptx
LINEAMIENTOS INICIO DEL AÑO LECTIVO 2024-2025.pptx
 
5° SEM29 CRONOGRAMA PLANEACIÓN DOCENTE DARUKEL 23-24.pdf
5° SEM29 CRONOGRAMA PLANEACIÓN DOCENTE DARUKEL 23-24.pdf5° SEM29 CRONOGRAMA PLANEACIÓN DOCENTE DARUKEL 23-24.pdf
5° SEM29 CRONOGRAMA PLANEACIÓN DOCENTE DARUKEL 23-24.pdf
 
Sesión de clase: Defendamos la verdad.pdf
Sesión de clase: Defendamos la verdad.pdfSesión de clase: Defendamos la verdad.pdf
Sesión de clase: Defendamos la verdad.pdf
 
VOLUMEN 1 COLECCION PRODUCCION BOVINA . SERIE SANIDAD ANIMAL
VOLUMEN 1 COLECCION PRODUCCION BOVINA . SERIE SANIDAD ANIMALVOLUMEN 1 COLECCION PRODUCCION BOVINA . SERIE SANIDAD ANIMAL
VOLUMEN 1 COLECCION PRODUCCION BOVINA . SERIE SANIDAD ANIMAL
 
Estas son las escuelas y colegios que tendrán modalidad no presencial este lu...
Estas son las escuelas y colegios que tendrán modalidad no presencial este lu...Estas son las escuelas y colegios que tendrán modalidad no presencial este lu...
Estas son las escuelas y colegios que tendrán modalidad no presencial este lu...
 
La Función tecnológica del tutor.pptx
La  Función  tecnológica  del tutor.pptxLa  Función  tecnológica  del tutor.pptx
La Función tecnológica del tutor.pptx
 
LA ECUACIÓN DEL NÚMERO PI EN LOS JUEGOS OLÍMPICOS DE PARÍS. Por JAVIER SOLIS ...
LA ECUACIÓN DEL NÚMERO PI EN LOS JUEGOS OLÍMPICOS DE PARÍS. Por JAVIER SOLIS ...LA ECUACIÓN DEL NÚMERO PI EN LOS JUEGOS OLÍMPICOS DE PARÍS. Por JAVIER SOLIS ...
LA ECUACIÓN DEL NÚMERO PI EN LOS JUEGOS OLÍMPICOS DE PARÍS. Por JAVIER SOLIS ...
 
Estrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdf
Estrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdfEstrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdf
Estrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdf
 

Estadistica aplicada a la educación superior

  • 1. ESCUELA MILITAR DE INGENIERIA UNIDAD ACADÉMICA SANTA CRUZ UNIDAD DE POSTGRADO ESTADÍSTICA APLICADA A LA EDUCACIÓN SUPERIOR Por: Ing. M.Sc. Francisco Martínez Solaris Mgs. En Educación Superior Santa Cruz, Mayo del 2013
  • 2. Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior INTRODUCCION La investigación sobre el aprendizaje y la enseñanza ha avanzada tremendamente, y los investigadores buscan contribuir a la mejora de la educación. Sin embargo, continúan las quejas sobre la brecha entre la teoría/investigación por un lado, y las prácticas educativas, por el otro. Una manera potencial para remediar la brecha entre teoría y práctica es llevar a cabo experimentos de diseño que: - Buscan desarrollar una ciencia de diseño de la educación. - Puedan guiar el desarrollo de ambientes de aprendizaje eficaces novedosos La experimentación es instrumento de vital importancia para la investigación ya que por medio de ella, el investigador es capaz de simular un fenómeno de interés, lo que conduce a una investigación más rápida, efectiva, de menor riesgo y con un rigor científico, siempre y cuando exista una previa planificación de la investigación. Existen diferentes tipos de investigaciones que pueden generar conocimientos ya sean básicos o bien aplicables. Independientemente del tipo de conocimiento que genere una investigación, éste tiene que someterse a una valoración científica. Para esto la estadística ofrece herramientas como los DISEÑOS EXPERIMENTALES de los cuales el investigador se vale para demostrar sus conjeturas, aceptar o no una hipótesis, comparar resultados, emitir conclusiones, etc. acerca del problema o fenómeno en estudio. "Las teorías basadas en ideologías carecen de experimentación, y por ello, no son ciencia, lo que no se demuestra con experimento es política. Lo que se demuestra con experimentación, es ciencia (Robert Laughlin, Premio Nobel de Física 1998). Ing. M.Sc. Francisco Martínez Solaris
  • 3. Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior 1. REGRESION Y CORRELACION LINEAL SIMPLE 1.1 Regresión Lineal Simple En muchas áreas de la investigación científica, la variación en las mediciones de una variable en estudio es causada preponderantemente por otras variables relacionadas cuyas magnitudes cambian en el curso del experimento. La incorporación explícita de los datos de estas variables que influyen en el análisis estadístico, permite conocer la naturaleza de las relaciones y utilizar esta información para mejorar la descripción y las inferencias de las variables de interés primario. Al probar las relaciones entre variables es importante que el valor de la variable pueda ser predicha de las observaciones de otra variable o aún controladas y optimizadas manipulando los factores de influencia. El análisis de regresión es un conjunto de métodos estadísticos, que tratan con la formulación de modelos matemáticos que describen las relaciones entre variables y el uso de estas relaciones modeladas con el propósito de predecir e inferir. Supuestos del modelo de Regresión Lineal Simple Al igual que en otros tipos de análisis estadísticos, el modelo de Regresión Lineal Simple se basa en ciertos supuestos que a continuación se detallan. Supuesto 1. "Y" es una variable aleatoria cuya distribución probabilística depende de "X" Este supuesto quiere decir que para cualquier valor de "X", "Y" es una variable aleatoria con cierta distribución probabilística con media μy/x y σ²y/x. Note que esta suposición solamente implica que "Y" es una variable aleatoria que depende de "X", y no toma en cuenta la forma lineal. Por otra parte, significa que la variable X se mide sin error y fijada por el investigador. Supuesto 2. Modelo de la línea recta Esta suposición requiere que la ecuación para μy/x sea una línea recta, es decir que μy/x = ß0 + ß1Xi y, por lo tanto, que la ecuación de dependencia sea Y = ß0 + ß1Xi + ε. Con esta
  • 4. Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior restricción, la línea que une a μy/x debe de ser una recta, por lo tanto se puede tener una de las siguientes situaciones: Puede ser que se tenga una relación positiva entre las variables X y Y, esto quiere decir que a medida que aumenta X, Y también aumenta. Otra situación que se puede dar es una relación inversa, es decir, que a medida que aumenta X, Y disminuye. En el último caso se recurre al hecho de que regresión también se entiende como la tangente inversa del ángulo de inclinación de una recta. En los dos primeros casos las rectas tienen pendiente y en el tercer caso, no hay pendiente lo cual indica que no existe regresión lineal entre ambas variables. Supuesto 3. Homogeneidad de varianza Esta suposición es muy importante en el análisis de regresión. La varianza de la distribuciones de "Y" son idénticas para todos los valores de "X". En otras palabras, se supone que σ²y/x1 = σ²y/x2 = σ²y/xn = σ², donde σ² es la varianza común (desconocida) para todas las distribuciones de "Y", independientemente del valor de "X". Esto quiere decir, que la media de "Y" se modifica con el valor de "X", pero la varianza se mantiene constante. Supuesto 4. Independencia Los valores de "Y" deberán ser estadísticamente independiente. Un ejemplo donde se viola este supuesto es cuando se realizan mediciones de peso a un mismo individuo en un lapso menor a una hora. Supuesto 5. Normalidad La distribución de "Y" para cualquier valor de "X" es normal. Esto equivale a suponer que la variable aleatoria no observable ε es normal y su media es cero ya que "X" se toma como variable no aleatoria susceptible a ser manipulada por el investigador. Y X
  • 5. Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior Todos los supuestos anteriores se pueden resumir en los siguientes: 1. "Y" es una variable aleatoria cuya distribución probabilística depende del valor de "X". 2. La ecuación de regresión es una línea recta. 3. Homogeneidad de varianza. 4. Independencia de las observaciones lo que implica que los errores son independientes. 5. Normalidad. En la Figura 1 se muestran los supuestos de normalidad y homogeneidad de varianza. 1.2. Diagrama de Dispersión Este diagrama tiene por objetivo dar una idea de la posible relación existente entre la variable dependiente Y y la independiente X. Para realizar un diagrama de dispersión se coloca en el eje de las abscisas los valores correspondiente a la variable independiente X y en el eje de las ordenadas los valores de la variable dependiente Y. Luego se colocan puntos en la intersección de los valores de ambas variables. Un ejemplo de lo anterior se muestra en seguida. Los datos que se muestran a continuación corresponden a la producción en miles de millones de dólares de 10 empresas y sus costos de producción de las mismas en miles de millones de dólares.
  • 6. Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior Para construir un diagrama de dispersión lo primero que se tiene que hacer es determinar quién es la variable dependiente y quién es la variable independiente, es decir, establecer la relación entre dichas variables. Esta relación debe ser lo más natural posible. En el caso del problema, es de suponerse que a medida que aumenta la producción también se incrementarán los costos de producción por todo lo concerniente a ello (materia prima, horas hombres, gastos de energía, etc.). Entonces definimos a X, variable independiente, a la Producción y a Y, variable dependiente, a los costos de producción. De acuerdo a esto se tiene lo siguiente: Producción (X) (miles de millones de $us) Costo (Y) (miles de millones $u) 10 3 18 5 12 4 16 5 22 8 36 12 30 10 32 14 26 12 12 3 El diagrama de dispersión quedaría de la siguiente forma: De acuerdo a la información que proporciona el diagrama de dispersión se puede observar que a medida que aumenta la producción de las industrias, aumentan los costos de 0 2 4 6 8 10 12 14 16 0 5 10 15 20 25 30 35 40 Costo(Milesdemillones$us) Producción (Miles de Millones $us)
  • 7. Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior producción de las mismas, es decir, se concluir que existe una relación positiva entre estas variables y además se puede ver que esta relación tiende a ser lineal. 1.3. Método de Mínimos Cuadrado Como lo plantea el supuesto 2 del modelo de regresión lineal simple, "Modelo de la Línea Recta", que de existir una relación entre X y Y, ésta debe ser una línea recta. Entonces a partir de muestra (x1, y1), (x2, y2),..., (xn, yn), de las variables "X" y "Y", se trata de obtener una ecuación que represente la relación entre dichas variables. El modelo del cual se habla es de una ecuación punto pendiente como sigue: El problema de esta modelo es que sus componentes son parámetros y por lo tanto, son estados desconocidos de la naturaleza generalmente. Es por ello que es necesario obtener estimadores de ß0 y ß1 para estimar adecuadamente la recta de regresión μy/xi. El estimador de μy/xi se denota por: ̂ ̂ ̂ Para llegar a obtener estos estimadores se hace uso de la técnica propuesta por Carl Gauss (1777-1855). Este método se basa en la idea de obtener estimadores para los componentes del modelo que minimicen la suma de cuadrados de las distancias entre los valores observados (Yi) y los estimados (̂ ). Esto significa que se tiene que minimizar la suma de cuadrados de las longitudes de los segmentos de las líneas verticales que unen los datos observados con la recta estimada como se muestra en la Figura 3. A la técnica antes mencionada se le denomina "Técnica de Mínimos Cuadrados". Usando notación matemática, el método de mínimo cuadrados consiste en encontrar los estimadores de ß0 y ß1.
  • 8. Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior Al aplicar la técnica de mínimos cuadrados se llegan a obtener las ecuaciones de trabajo de ̂ y ̂1^ (en este caso se ha omitido los procesos de derivación mediante el cual se llega a obtener las fórmulas de trabajo). Estas ecuaciones son las siguientes: ̂ ∑ ∑ ∑ ∑ (∑ ) ; ̂ ̂ ̅. Donde: ̂ Coeficiente de Regresión ̂ Intercepto de la recta de estimación Ejemplo: Retomando los datos que se utilizaron para construir el diagrama de dispersión y aclarando que “X” es Producción (miles de millones de $us) y “Y” Costos (miles de millones de $us) y haciendo uso de las ecuaciones derivadas a través de la técnica de mínimos cuadrados se tiene lo siguiente: X Y XY X2 Y2 10 3 30 100 9 18 5 90 324 25 12 4 48 144 16 16 5 80 256 25 22 8 176 484 64 36 12 432 1296 144 30 10 300 900 100 32 14 448 1024 196 26 12 312 676 144 12 3 36 144 9 Totales 214 76 1952 5348 732 Promedio 21.4 7.6 ̂ ∑ ∑ ∑ ∑ (∑ ) ; ̂ ( ) = 0.423738, Coeficiente de regresión
  • 9. Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior ̂ ̂ ̅; ( ) ; Intercepto, por lo tanto la ecuación de estimación quedaría de la siguiente manera: ̂ ; o bien se puede decir que: Costos = 0.423738 (Producción) – 1.46798 Un aspecto que no se debe olvidar es que el propósito de la Regresión Lineal Simple es el de predecir el comportamiento de una variable dependiente a través del conocimiento de una variable independiente, es por ello que se debe estar seguro que la ecuación de estimación sirve para este propósito (que existe regresión lineal simple). Por esta razón es que la ecuación de estimada debe ser sometida a un proceso de validación. 1.4. Validación de la Ecuación de Estimación Este proceso se puede realizar de dos maneras a saber:  A través del Cálculo del Coeficiente de Determinación (R2 )  Por medio del Análisis de Varianza de la Regresión (ANARE) Coeficiente de Determinación (R2 ) o Variabilidad (varianza explicada) El Coeficiente de Determinación, R2 , indica el porcentaje de la variabilidad de “Y” que puede ser explicada o debida a “X”, es por ello que mientras más cerca esté del 100% es mucho mejor. Esto es debido a que se trata de predecir el comportamiento de “Y” a través del conocimiento de “X”, es por ello que es deseable que el mayor porcentaje de la variabilidad de la variable dependiente sea debida a “X”, a tal punto que hay autores que consideran que la ecuación es buena o sirve para predecir si R2 ≥ 70%. El coeficiente de Determinación se calcula a través de la siguiente ecuación: ⌈ ⌈ ⌈ ⌈ ⌈ ∑ (∑ ∑ ) √(∑ (∑ ) ) (∑ (∑ ) ) ⌉ ⌉ ⌉ ⌉ ⌉ Para el caso del ejemplo anterior el R2 es el siguiente:
  • 10. Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior ⌈ ⌈ ⌈ ⌈ ⌈ ( ) √( ( ) ) ( ( ) ) ⌉ ⌉ ⌉ ⌉ ⌉ Este dato indica que del 100% de la variabilidad de Y (Costos), el 89.36% es debido a X (Producción), por lo tanto también se puede concluir que existe un 10.64% de variabilidad de Y (Costos) que no es debida a X (Producción), a esto se le conoce como variabilidad no explicada. En este caso se puede concluir también que la ecuación estimada sirve para predecir (existe regresión lineal simple. Análisis de Varianza de la Regresión Lineal Simple (ANARE) De forma general se entienden por análisis de varianza a la partición de la variabilidad total en fuentes de variación conocidas que en el caso de regresión lineal son las siguientes:  debida a la regresión  debida a otras causas (error) Para tratar de ser un poco más explícito, estas dos fuentes de variación se derivan del modelo aditivo lineal de la regresión línea simple el cual es: Esto tiene correspondencia con una tabla de varianza o salida de varianza que para regresión lineal simple es la siguiente: FV gl SC CM Fc Ft Regresión 1 SCRegresión (α, glreg, glerr) Error n-2 SCError Total n-1 SCTotales La primera columna encabezada por FV (Fuentes de variación) es donde se declara las fuentes de variación en las que se está partiendo la variabilidad total. Nótese que en esta tabla no se incluye el efecto de , ya que éste es una constante por lo tanto no es una fuente de variación.
  • 11. Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior La segunda columna encabeza por “gl” (Grados de Libertad). De forma general grados de libertad es “n-1”, para el caso de la fuente de variación debida a regresión siempre es 1 ya que son dos los parámetros que se estiman, β0 y β1, por lo tanto, 2-1 = 1. Es por ello que para el ANARE de regresión lineal simple, esta fuente de variación siempre tiene 1 grado de libertad y los grados de libertad del error, siempre en este caso, son n-2. Por “n” se entiendo al conjunto de pares de datos “X” “Y”. La tercera columna es la de Suma de Cuadrados (SC) que vienen a ser los componentes de las varianza a estimar cuyas ecuaciones de trabajo son las siguientes: ∑ (∑ ) ̂ (∑ ∑ ∑ ) La cuarta columna es para los Cuadrados Medios (CM) que viene a ser las estimaciones propiamente dichas de las varianza de cada una de las fuentes de variación. Estas resultan de dividir las sumas de cuadrados de éstas entre sus grados de libertad. La quinta columna denominada como “Fc” se refiere a los “F” calculados que resultan de dividir el cuadrado medio de regresión entre el cuadrado medio del error, es decir, de la variabilidad no debida a la regresión. Es por ello que el error se considera como un término de comparación entre la variabilidad debida a regresión y el mismo. Si el cuadrado medio del error es mayor que el cuadrado medio de regresión, el resultado que se obtendrá será pequeño y posiblemente menor que el valor de la siguiente columna “Ft” o “F” de tabla, valor que se extrae de una tabla de “F” con un nivel de significancia, grados de libertad de regresión y los grados de libertad del error. Para entender mejor lo anterior se debe de partir del juego de hipótesis que se prueba en un ANARE. Este es: Ho: β1 = 0 Ha: β1  0 La hipótesis nula (Ho) asume el efecto de igual o nulidad de efecto y es la hipótesis que se somete a prueba. Partiendo del hecho de que asume el efecto de nulidad, en este caso indica
  • 12. Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior que no existe regresión lineal simple, y asume que la relación entre X y Y es una línea recta sin pendiente, es por ello que es igual a cero. Por hipótesis alternativa se entiende aquella que contradice a la hipótesis nula y que es aceptada una vez que se rechaza la hipótesis nula. Es por ello que está como β1  0 ya que una igualdad se contradice con una desigualdad. Esto significa que la recta tiene pendiente, es decir, que existe regresión lineal simple. Ahora bien, todo el ANARE se hace para realizar la prueba de hipótesis de que si existe o no regresión lineal simple. Se entiende como prueba de hipótesis al proceso a través del cual se prueba la plausibilidad de una hipótesis. Al realizar la prueba de hipótesis se debe llegar una decisión de aceptar o rechazar Ho. ¿Cuándo no se rechaza Ho?, cuando el Fc  Ft y se rechaza cuando el Fc  Ft. A lo anterior se le llama Regla de Decisión la cual es la siguiente: No Rechazo de Ho si Fc  Ft Rechazo de Ho si Fc  Ft Si la hipótesis nula no se rechaza significa que no existe regresión lineal simple, por lo tanto la ecuación estimada no sirve para predecir, si se rechaza Ho, inmediatamente se acepta la hipótesis alternativa la que indica que sí existe regresión lineal simple. Un aspecto que todavía no se ha aclarado es “Nivel de Significancia, α, ” entendido como la probabilidad de tomar una decisión equivocada (conocido también como Error Tipo I) es por ello que los valores del α son pequeños  0.1. Haciendo el ANARE a un α = 0.01 se tiene lo siguiente: ( ) = 154.4 ( ) Vaciando esta información en la tabla de ANARE se tiene lo siguiente y obteniendo el valor de F de la tabla correspondiente a: 0.01, 1 y 8 se tiene que este es: 11.26
  • 13. Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior FV gl SC CM Fc Ft Regresión 1 137.6897 137.6897 67.0389 11.26 Error 8 16.4310 2.053875 Total 9 154.4 De los resultados de la tabla se puede observar que el “Fc” es mayor que el “Ft” lo cual indica que existe suficiente evidencia para rechazar la hipótesis nula, es decir, que existe regresión lineal simple y por lo tanto se dice que la ecuación estimada sirve para predecir el comportamiento de Costos (Y) a través del conocimiento de Producción (X). Cuando se realiza un análisis de varianza de la regresión se debe emitir una conclusión que podría ser la siguiente: “De acuerdo al análisis de varianza realizado se concluye con un 99% de confiabilidad, (1 – 0.01)*100, que existe regresión lineal simple.” Una vez que se ha comprobado que la ecuación estimada es buena (hay regresión lineal) el siguiente paso sería interpretar los componentes de la recta de estimación. 1.5. Interpretación de los Componentes de la Ecuación de Estimación Cuando se hacer una interpretación, ésta debe ser aplicada al problema en cuestión. En el caso del ejemplo que se ha venido desarrollando sería el siguiente: ̂1: Este es el coeficiente de regresión que indica la cantidad de cambios que experimenta “Y” por un cambio en “X”. En este caso indica que por Un mil millones de dólares que se incremente la producción, los costos se incrementarán en 0.423738 miles de millones de dólares. Esto porque la pendiente encontrada fue positiva, si hubiera sido negativa, se diría que disminuiría esa cantidad. ̂0: No siempre tienen interpretación aplicada al problema, es decir, una interpretación lógica, es por ello que comúnmente se le interpreta desde el punto de vista matemático como el punto donde la recta de estimación corta al eje de las ordenadas cuando “X” toma el valor de cero. En el caso del ejemplo, ̂0 =-1.46798, esto estaría indicando que cuando la producción es cero, los costos son de -1.46798 miles de millones de dólares. Como se ve esta interpretación carece de lógica lo cual hace que se interprete como se ha mencionado anteriormente.
  • 14. Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior Existen casos donde si existe interpretación lógica como lo muestra el trabajo de investigación realizado por Martínez (1995) donde ajustó pesos de becerros al nacimiento. 1.6. Dibujo de la Recta de Estimación Cualquier recta se define por dos puntos y en el caso de la recta de regresión lineal simple, ésta pasa por dos puntos obligados cuyas coordenadas son: ( ) y ( ̂0). La recta de estimación debe dibujarse dentro del área de exploración, es decir, el área determinada por el diagrama de dispersión que donde se tiene información de ambas variables. Para el caso del ejemplo que se ha venido tratando la gráfica de la recta de estimación sería como se muestra a continuación. 1.7. Regresión no Lineal Este tipo de regresión no es objeto de desarrollo del presente documento ya que se consideran para cursos superiores de estadística lo que se trata es dejar plasmado que una relación entre dos variables no siempre es una línea recta, ésta puede ser logarítmica, exponencial o bien cuadrática o cúbica. Uno de los criterios para definir el ajuste de modelo es el R² y además el Cuadrado Medio del Error del análisis de varianza. En estos casos el diagrama de dispersión es importante para determinar esas posibles relaciones. y = 0.4237x - 1.468 R² = 0.8936 0 2 4 6 8 10 12 14 16 0 5 10 15 20 25 30 35 40 Costo(milesdemillonesde$us) Producción (miles de millones de $us)
  • 15. Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior Regresión Múltiple No siempre la dependencia en caso de existir se pueda deber a una sola variable, puede ser que “Y” como variable dependiente se vea afectada por más de una variable independiente, en este caso se habla de regresión lineal múltiple, aspecto que no se desarrolla en este documento. 1.8. Correlación Lineal Simple Así como existen técnicas que cuantifican los cambios de una variable dependiente por un único cambio de la variable independiente, existen técnicas que cuantifican la asociación lineal entre dos variables, esta técnica es llamada Correlación Lineal Simple que se exprese como el coeficiente de correlación (r). Este coeficiente indica el sentido de la asociación como también la magnitud de ésta, partiendo del hecho que el coeficiente de correlación lineal simple toma valores en el rango de: r es 0≤ r ≤ 1. Entre más se acerca a 1 el valor de r mayor es la asociación entre dichas variables. De acuerdo a lo anterior algunos autores han determinado lo siguiente rangos: -1 ≤ r < -0.8 Asociación fuerte y negativa 0 ≤ r < 0.4 No hay asociación -0.8 ≤ r < - 0.4 Asociación débil y negativa 0.4 ≤ r < 0.8 Asociación débil y positiva -0.4 ≤ r ≤ 0 No hay asociación 0.8 ≤ r ≤ 1 Asociación fuerte y positiva El coeficiente de Correlación Lineal Simple se determina a través de la siguiente ecuación: ⌈ ∑ (∑ ∑ ) √(∑ (∑ ) )(∑ (∑ ) ) ⌉, que para el caso del ejemplo sería el siguiente: ⌈ √( ( ) )( ( ) ) ⌉= 0.9452
  • 16. Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior Este valor indica que existe una asociación fuerte y positiva entre estas variables, es decir, entre la producción y los costos de esas empresas. Diferencias entre Regresión Lineal Simple y Correlación Lineal Simple Se pueden llegar a establecer las siguientes diferencias: Regresión Lineal Simple Correlación Lineal Simple Mide la cantidad de cambios en “Y” por un único cambio en “X”. Mide asociación lineal entre dos variables Existe una variable dependiente y otra independiente Es indistinto x, y ó y, x β1 puede tomar cualquier valor en la recta numérica El coeficiente de correlación toma valores en el intervalo -1 ≤ r ≤ 1
  • 17. Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior 2. ASPECTOS GENERALES DE LA EXPERIMENTACIÓN Antes de ingresar al análisis de los principales diseños experimentales, es necesario establecer el acervo correspondiente en este campo de la Estadística llamado Diseños Experimentales que facilite el proceso de aprendizaje que aunado a las bases estadísticas anteriores conlleven al usuario a un mejor uso el presente material. Es por ello que a continuación se detalla lo siguiente: Experimento: Es todo proceso que consiste en la ejecución de un acto o prueba una o más veces, cuyo resultado en cada prueba depende del azar y que genera información tanto cualitativa como cuantitativa según sea el caso. En sí viene a ser aquel proceso intencionado provocado por el investigador con el fin de estudiar su origen, esencia e interrelación con otros procesos o fenómenos. Tratamiento: Es todo elemento o sujeto sometido a estudio o ensayo de comparación. Viene a ser el conjunto de condiciones experimentales que el investigador impone a las unidades experimentales. Ejemplo: diferentes métodos de enseñanza de la matemática, etc. Unidad Experimental: Tamaño de la Unidad Experimental. Es el material o lugar sobre el cual se aplican los tratamientos. Este término se utiliza para representar al conjunto de material experimental al cual se le aplica un tratamiento. El tamaño de la unidad experimental depende mucho del tipo de material experimental que se utilice y muchas veces de la esperanza de vida en el caso de usar seres vivos. Cuando se experimenta con aves, la unidad experimental puede estar constituida por un grupo de ellas; sin embargo, cuando se puede experimentar con animales cuya esperanza de vida sea mayor, puede ser que uno solo de ellos pueda ser considerado como una unidad experimental. Factor: Es un tratamiento que genera más tratamiento Error Experimental: Es la variación aleatoria (no explicada) ajena al control razonable del investigador. Este término no es sinónimo de error, si no que forma parte de las características propias e innatas de la unidad experimental. Este error no se puede evitar pero si se puede reducir
  • 18. Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior usando las repeticiones necesarias, usando unidades experimentales los más homogéneamente posible y manejándolas de manera uniforme. Testigo El testigo es el tratamiento de comparación adicional, que no debe faltar en un experimento; la elección del tratamiento testigo es de gran importancia en cualquier investigación, éste se constituye como referencial del experimento y sirve para la comparación de los tratamientos en prueba. Diseños Experimentales: Es un método científico de investigación que consiste en hacer operaciones prácticas destinadas a demostrar, comprobar o descubrir fenómenos o principios básicos. Tiene como propósito proporcionar la máxima cantidad de información a un costo mínimo. Diseñar un experimento es planificarlo, qué es lo que se pretende experimentar, es planearlo de modo que se tenga la secuencia completa de pasos tomados de antemano para asegurar que la información que se obtendrá permita un análisis objetivo que conduzca a deducciones (demostración de hipótesis) válidas con respecto al problema de investigación previamente establecido. Principios Básicos de la Experimentación: Los principios básicos de la experimentación son tres: Repetición, Azarización y Control Local. Repetición. Es la reproducción del experimento básico llamado también réplica y solamente a través de ella se pueden obtener conclusiones de un fenómeno. Tiene dos funciones: Proporcionar una estimación del error experimental y brindar una medición más precisa de los efectos de los tratamientos, es decir, que hace posible la prueba de significancia. Azarización. Es la asignación de los tratamientos a las unidades experimentales de modo que todas tengan la misma posibilidad de recibir un tratamiento. Tiene la como función hacer válida la prueba de significancia. Control Local. Es la cantidad de balanceo, bloqueo o agrupamiento de las unidades experimentales que se emplean en el diseño adoptado. Tiene la función de hacer más eficiente el diseño experimental, es decir, hacer más sensitiva la prueba de significancia
  • 19. Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior reduciendo con ello la magnitud del error. Los criterios de agrupamiento van a depender del tipo de ciencia donde se esté experimentando. Exigencias de la Experimentación: Las exigencias de la experimentación son: Tipicidad, Uniformidad, Grado de Precisión, Control efectivo de las medidas y observaciones. Tipicidad. Llamado también representatividad, hace mención que no se pueden extrapolar resultados a condiciones diferentes a las que se originaron. Uniformidad. Indica que todas las unidades experimentales deben ser tratadas uniformemente y que la única diferencia entre ellos sea los tratamientos que se están evaluando en ellas. Esto evita tener resultados enmascarados en los experimentos. Grado de Precisión. Un experimento bien planeado debe permitir al investigador medir diferencias en los tratamientos con el grado de precisión esperado evitando para ello comete errores al montar el ensayo y en su misma ejecución. Esto debe ser una tarea de primer orden por parte del investigador. Es por ello que se debe tener especial cuidado en la conducción y manejo del experimento. Control efectivo de las medidas y observaciones. Es necesario hacer anotaciones de las manifestaciones de las unidades experimentales que permitan explicar ciertos aspectos del experimento. Los diseños experimentales como tal se dividen en dos grupos: diseños experimentales simples y diseños experimentales complejos. Entre los diseños experimentales simples se tiene al Diseño Completamente al Azar, Diseño en Bloques Completamente al Azar, Diseño Cuadrado Latino principalmente. 3. DISEÑO COMPLETAMENTE AL AZAR (DCA) O DISEÑO CON UN SOLO CRITERIO DE CLASIFICACIÓN Este diseño es el más simple de todos; en él se asigna al azar los tratamientos a grupos de unidades experimentales previamente determinadas. Asimismo, todas las variables, excepto las que están en estudio se mantienen constantes.
  • 20. Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior 3.1. ¿Cuándo utilizar este Diseño? Este diseño se utiliza cuando las unidades experimentales son homogéneas, o sea, que la única diferencia que existe son los tratamientos que se aplican a las unidades experimentales. Este diseño se usa cuando se estudia dos o más tratamientos bajo las siguientes condiciones: a.- Lugar y unidades experimentales muy uniformes (suelo homogéneo, en laboratorios, invernaderos, galpones, aulas, etc.), donde no hay heterogeneidad necesaria de absorber. b.- Cuando sea probable que una parte del experimento se pierda. c.- Cuando se tiene un experimento pequeño y donde la mayor precisión de otras distribuciones no compensan la pérdida de grados de libertad en el error. Este tipo de diseño proporciona el máximo número de grados de libertad para la estimación del error experimental; además, no requiere estimar datos faltantes, es decir, puede analizarse con diferente número de repeticiones por tratamiento (diseño desbalanceado). 3.2. Modelo Aditivo Lineal El concepto de modelo lineal es una réplica de algo; así como un edificio puede ser representado en una maqueta. Debe evitarse el error de creer que el modelo lineal es el mundo real; ya que sólo es una abstracción de una realidad que existe en la mente del hombre con el objetivo de ayudarse en el análisis de los procesos naturales que afectan por diversos factores a fuentes de variación y que dichos modelos son de naturaleza transitoria y son susceptibles a mejorarse. La consideración básica para un diseño Completamente al Azar es que las observaciones pueden representarse por medio del modelo estadístico lineal que es el siguiente: Donde: Yij = Variable Respuesta μ = Efecto común a todas las observaciones Ti = Efecto del i-ésimo tratamiento Eij = Erro experimental o error del modelo
  • 21. Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior 3.3. Supuesto del Análisis de Varianza De forma general, los supuestos en los que se basa el análisis de varianza son: Homogeneidad de Varianza, Normalidad, Aditividad y Linealidad del Modelo, e Independencia. 3.3.1. Homogeneidad de Varianza: Las varianzas de las diferentes medías deben ser homogéneas. Por lo general, en el análisis de varianza, se utiliza un promedio de n varianza (CME) para obtener la mejor estimación de la varianza común. Pero, si las varianzas dentro de los tratamientos fuesen de hecho distintas, no se tendría justificación para combinarlas, ya que el promediar varianzas de tratamientos mayores y menores podría proporcionar resultados engañosos. La diferencia entre dos tratamientos con varianzas grandes puede ser considerada significativa cuando en realidad ésta puede haber ocurrido por casualidad. Por otra parte, la diferencia entre dos tratamientos con varianzas pequeñas puede ser declarada no significativa cuando en verdad lo es. Existen muchas técnicas para probar homogeneidad de varianza, como la prueba de Bartlett, Prueba de F, propuesta por R.A. Fischer. Por la rapidez de esta última prueba se propone la misma para efecto del curso, lo cual no desmerece en ninguna otra prueba. La prueba de F propuesta por Fischer se basa en lo siguiente: ( ) ( ) La prueba de hipótesis que se emplea es la siguiente: Ho: Ha:  La regla de decisión es la siguiente: No Rechazo de Ho si Fc  F (m-1, n-1)gl. Esto quiere decir que las varianzas son homogéneas. RHo si Fc > F (m-1, n-1)gl, lo cual indica que las varianza son homogéneas. Box (S/F; citado por Calzada Benza, 1970) mencionó que si la razón entre la varianza mayor y la varianza menor es menor de cuatro, se puede considerar que hay suficiente homogeneidad de varianza, siendo éste posiblemente un criterio más rápido para probar homogeneidad de varianza.
  • 22. Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior 3.3.2. Normalidad: Los términos del error son aleatorios, independientes y normalmente distribuidos. Este supuesto es de gran importancia ya que cuando los datos no se distribuyen normalmente los coeficientes de variación son muy elevados. Cuando los datos de una variable no presentan normalidad, existen algunas tipos de transformaciones en dependencia de la característica de los datos de la variable en cuestión que la hacen normal. Para probar normalidad también existen varias técnicas entre las que se pueden mencionar la prueba de Shapiro-Wilk y la de Lilliefors. Si el lector está interesado en profundizar sobre estas pruebas se le sugiere consultar a Ramírez y López (1993). (Métodos Estadísticos no Paramétricos) 3.3.3. Aditividad y Linealidad del Modelo: Lo anterior se cumple en el modelo aditivo lineal ya que todos los efectos se suman y son lineales porque cada uno de sus elementos del modelo lineal, están a la potencia "1". 3.3.4. Independencia: Este supuesto implica que los términos del error son aleatorios, no correlacionados (independientes) normalmente distribuidos; además, de las varianzas y las medias de las distintas muestras. 3.4. Análisis de varianza para este Diseño El análisis de varianza consiste en la partición de la variación total en fuentes de variación conocidas y la que no es conocida se atribuye al error. El análisis de varianza separa parte de la varianza causada por efectos accidentales, no sistemáticos (error experimental o simplemente error) de los causados por efectos sistemáticos conocidos (tratamientos). Antes de mostrar la tabla de análisis de varianza para este diseño se muestra a continuación un cuadro de concentración de información (Cuadro 1) y posteriormente las ecuaciones trabajo para el mismo.
  • 23. Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior Cuadro 1. Concentración de los datos para un Diseño Completamente al Azar con “i” tratamiento y “j” repeticiones. TRATAMIENTOS REPETICIONES ΣYi. 1 2 3 … j 1 Y11 Y12 Y13 Y1j Y1. 2 Y21 Y22 Y23 Y2j Y2. 3 Y31 Y32 Y33 Y3j Y3. …i Yi1 Yi2 Yi3 Yij Yi. ΣY.j Y.1 Y.2 Y.3 Y.j Y.. El modelo lineal para este diseño tiene solo dos fuentes de variación y es el siguiente: El modelo aditivo de un Diseño Completamente al Azar se corresponde con las salidas de varianza que se muestran en los Cuadro 2 y 3. Cuadro 2. Salida de varianza para un Diseño Completamente al Azar con igual número de repeticiones (diseño balanceado). F.V gl SC CM Fc Ft Tratamiento t-1 SCTRAT. ( ) Error t(r-1) SCError ( ) Total tr-1 SCTotales Donde: F.V = Fuente de variación gl = Grados de libertad SC = Suma de Cuadrados CM = Cuadrado Medio Fc = “F” calculado Ft = “F” tabulado que se encuentra en la tabla de “F” a un nivel de significancia “” (probabilidad de error tipo I), grados de libertad de los tratamientos y grados de libertad del error En caso de que los tratamientos tengan diferentes número de repeticiones (diseño desbalanceado) la salida de varianza es la siguiente:
  • 24. Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior Cuadro 3. Salida de varianza para un Diseño Completamente al Azar con desigual número de repeticiones (diseño desbalanceado). FV gl SC CM Fc Ft Tratamiento t-1 SCTRAT. ( ) Error n-t SCError Total n-1 SCTotales 3.4.1. Ecuaciones de trabajo ; Factor de corrección si el experimento es balanceado ; Factor de corrección si el experimento es desbalanceado ∑ ; Suma de cuadrados totales ∑ ; Suma de cuadrado de tratamiento si el experimento es balanceado ∑ ; Suma de cuadrados si el experimento es desbalanceado ; Suma de cuadrados del error 3.4.2. Prueba de Hipótesis en el Análisis de Varianza de un Diseño Completamente al Azar En el análisis de varianza de este diseño se prueba el siguiente juego de hipótesis estadísticas: Ho: µ1 = µ2 = µ3 =… µi (T1 = T2 = T3 = …Ti). Esto es lo mismo que: Ho: µ1 - µ2 - µ3 -… µi = 0 (T1 - T2 - T3 - …Ti = 0). Ha: µ1 - µ2 - µ3 -… µi  0 (T1  T2 T3  …Ti). La hipótesis nula asume el efecto de igual, es decir, que los tratamiento ejercen el mismo efecto sobre la variable respuesta. Esta es la hipótesis que se somete a prueba y, la hipótesis alternativa, en su esencia, es la que contradice a la hipótesis nula. Dado que la hipótesis nula es la que se somete a prueba, entonces puede ser aceptada ó rechazada, si no es rechazada significa que no existe la suficiente evidencia experimental para
  • 25. Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior hacerlo, en caso de rechazarse, de inmediato se acepta la hipótesis alternativa. Para saber cuándo aceptar o rechazar la hipótesis nula se toma en cuenta la siguiente regla de decisión. No Rechazo de Ho (NRHo) si Fc  Ft (F de tablas) Rechazo de Ho (Rho) si Fc > Ft (F de tablas) 3.5. Interpretación de Resultados Para una mejor ilustración de la interpretación de los resultados de un análisis en este diseño, se muestra a continuación el siguiente ejemplo: En un estudio del efecto de la glucosa sobre la liberación de insulina, se trataron especímenes de tejido pancreático de animales experimentales con cinco concentraciones diferentes de glucosa. Posteriormente se hizo la determinación de la cantidad de insulina liberada. Se pide realizar el análisis de varianza correspondiente usando una probabilidad de error Tipo I de (0.01), es decir,  = 0.01. Los datos obtenidos se muestran en el Cuadro 4. Cuadro 4. Insulina liberada a diferentes concentraciones de glucosa en las unidades experimentales. Tratamiento Repeticiones 1 2 3 4 5 6 7 8 1 1.53 1.61 3.75 2.89 3.26 2.83 2.86 2.59 2 3.15 3.96 3.59 1.89 1.45 3.49 1.56 2.44 3 3.89 4.80 3.69 5.70 5.62 5.79 4.75 5.33 4 8.18 5.64 7.36 5.33 8.82 5.26 8.75 7.10 5 5.86 5.46 5.69 6.49 7.81 9.03 7.49 8.98 Adaptado de Wyane (1970) En el mismo cuadro de información se pueden incluir los totales de tratamiento como también sus varianzas por cada uno de ellos como se muestra en el Cuadro 5.
  • 26. Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior Cuadro 5. Insulina liberada a diferentes concentraciones de glucosa en las unidades experimentales, totales y varianza por tratamiento. Tratamiento Repeticiones ΣYi. S² 1 2 3 4 5 6 7 8 1 1.53 1.61 3.75 2.89 3.26 2.83 2.86 2.59 21.32 0.5791 2 3.15 3.96 3.59 1.89 1.45 3.49 1.56 2.44 21.53 0.9702 3 3.89 4.8 3.69 5.7 5.62 5.79 4.75 5.33 39.57 0.6621 4 8.18 5.64 7.36 5.33 8.82 5.26 8.75 7.1 56.44 2.2212 5 5.86 5.46 5.69 6.49 7.81 9.03 7.49 8.98 56.81 2.0718 ΣY.j 22.61 21.47 24.08 22.3 26.96 26.4 25.41 26.44 195.67 Y.. Revisando el supuesto de homogeneidad de varianza y tomando en cuenta lo propuesto por Box (S/F; citado por Calzada Benza, 1970) se relacionará la varianza mayor con la varianza menor, en este caso varianza del tratamiento 1 y la del tratamiento 4. Entonces: = 3.8356 Como la relación entre la varianza mayor y la menor y tomando en cuenta lo propuesto por Box (S/F) se puede concluir que existe homogeneidad de varianza. Comenzando a realizar el análisis de varianza se tiene lo siguiente: ( ) ( ) Analizando los resultados obtenidos al aplicar las ecuaciones de trabajo para este diseño es importante señalar que ninguna de estas sumas de cuadrados puede ser negativa ya que son componentes de varianza y la varianza nunca puede ser negativa. Por otra parte, se puede observar que la Suma de Cuadrados Totales es la mayor, en verdad ésta es la variación total y ninguna de las demás puede ser mayor que ésta. Además se puede observar que la Suma de Cuadrados del Error se obtiene por diferencia entre la Suma de Cuadrados Totales y la de Tratamiento. Esto es producto de la aplicación misma de lo que es análisis de varianza. Una vez obtenidas las sumas de cuadrados correspondientes, el siguiente paso es construir
  • 27. Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior la tabla de análisis de varianza (salida de varianza) la cual queda como se muestra en el Cuadro 6 y además es recomendable que esta tabla vaya acompañada del Coeficiente de Variación (C.V) el cual se define como la relación entre la raíz cuadrada del Cuadrado Medio del Error y el Promedio de la Variable respuesta o en estudio. ( √ ) ( √ ) Cuadro 6. Salida de varianza para los datos del Cuadro 4. F.V gl SC CM Fc F(0.01, 4, 35) Tratamiento 4 154.921015 38.7302538 29.7714584 3.908 Error 35 45.5321625 1.30091893 Total 39 200.453178 C.V. = 23.32% Si se toma en cuenta el juego de hipótesis de este diseño y la regla de decisión se puede concluir que se rechaza la hipótesis ya que el “Fc” es mayor que el “Ft”. A manera de conclusión se puede decir lo siguiente: Con un 99% de confiabilidad se concluye que al menos unos de los tratamientos evaluados ejercen un efecto distinto (P ˂ 0.01) sobre la liberación de insulina. Ahora la pregunta es: ¿Cuál es ( o son) ese (esos) tratamiento (s) que hizo (hicieron) rechazar la hipótesis nula?. Esta interrogante no la responde el análisis de varianza ya que éste solo prueba si existe o no efecto de las variables dependientes sobre la dependiente. Es por ello que se deben hacer otros análisis para responder esta interrogante. Para responder a estas interrogantes existen dos técnicas principalmente que son las pruebas a priori o Contrastes Ortogonales y las pruebas obligadas por los datos llamadas también Pruebas de Rangos Múltiples o Separación de Medias. Estas últimas por el grado de uso que tienen en las investigaciones de índole experimental son las que se desarrollan a continuación. 3.6. Pruebas obligadas por los Datos o de Rangos Múltiples Cuando el análisis de varianza de un experimento reporta diferencias significativas y son más de dos tratamiento, es necesario saber quién “metió el ruido en la prueba de hipótesis” que
  • 28. Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior provocó que la hipótesis nula sea rechazada. Para este fin, existen las llamadas pruebas de Rangos Múltiples. Entre estas pruebas están:  Diferencia Mínima Significativa (DMS) (LSD)  Método de Duncan  Método de Student-Newman-Keuls (SNK)  Método de Tukey (Diferencia Significativa Honesta)  Método de Scheffé. Cada uno de estos procedimientos de comparación de medias está basado en un conjunto de suposiciones, y son usualmente efectivos para fines específicos. En cualquiera de los casos la hipótesis nula supone la igualdad de las medias y la alternativa lo contrario y se utilizan siempre y cuando en el análisis de varianza rechace la hipótesis nula. Lo anterior indica que la prueba de hipótesis que se hace es la siguiente: Ho: | | Ha: | | La hipótesis nula, que es la que se prueba, asume el efecto de igualdad de los promedios a comparar es por ello que la diferencia es igual a cero y por lo tanto, la hipótesis alternativa contradice la hipótesis nula con una desigualdad. La regla de decisión es la siguiente: NRHo = Valor crítico de la prueba está dentro de la diferencia: | |   | | RHo: Si Valor Crítico de la prueba es  | | o bien Si el Valor Crítico ˂ | | 3.6.1. Diferencia Mínima Significativa (DMS) Esta prueba solo debe usarse para comparar medias adyacentes en un arreglo ordenado, medias por orden de magnitud. Cuando DMS se usa indiscriminadamente para probar todas las diferencias posibles entre las diversas medias, ciertas diferencias serán significativas, pero no al nivel de significancia que se ha elegido. El número posible de comparaciones de medias tomadas de dos en dos a la vez es igual a ( ) . Los especialistas hacen mención que este método es adecuado para comparar un tratamiento estándar (testigo) con otros tratamientos.
  • 29. Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior Esta prueba utiliza un solo comparador y su fórmula es la siguiente: √ , donde: DMS = Es el valor crítico de la prueba t/2 = Valor tabular de “t” de student para los grados de libertad del error obtenido a un /2. r = número de repeticiones 3.6.2. Método de Duncan Esta prueba es ampliamente utilizada entre las diversas pruebas de Rangos Múltiples. Su método es de naturaleza secuencial, lo que quiere decir, que utiliza un nuevo valor “estudentizado”, para cada una de las comparaciones de medias adyacentes ordenadas por magnitud en orden descendente. Esta prueba incluye el cálculo de las diferencias significativas mínima entre las medias de tratamiento cuando éstas se encuentran dispuestas en orden de magnitud. La fórmula es la siguiente: √ Donde: Es el valor extraído de una tabla especial de rango “estudentizado”, con los grados de libertad del error y con la disposición relativa de las medias en el arreglo. CMError = Cuadrado Medio del Error r = Número de repeticiones. 3.6.3. Método de Student-Newman-Keuls (SNK) Es una prueba de carácter secuencial, es decir, que utiliza un nuevo valor “estudentizado” para cada comparación. Para el cálculo de esta prueba se requiere determinar la diferencia mínima significativa entre las medias del tratamiento cuando éstas se encuentran dispuestas en orden de magnitud. Su fórmula es la siguiente:
  • 30. Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior √ ; Donde: q = Valor obtenido de tablas especiales de rango “estudentizado”, para los grados de libertad del error y con la disposición relativa de las medias en el arreglo CMError = Cuadrado medio del error r = número de repeticiones 3.6.4. Método de Tukey Este método es un procedimiento basado en el rango “ estudentizado” , pero no es secuencial, ya que utiliza un sólo comparador de “q” ordinario. Sin embargo, el método de Tukey es útil en situaciones en que se desea hacer un primer énfasis en el uso del experimento con un total para determinar la significancia de los pares de medias. Esta prueba sólo es exacta cuando los grupos tienen igual número de elementos y para medias que no han sido ajustadas por covarianza. Esta prueba se define de la siguiente manera: √ Donde: q = Valor obtenido de tablas especiales de rango “estudentizados”, para los grados de libertad del error y con la disposición relativa de las medias en el arreglo CMError = Cuadrado medio del error r = número de repeticiones 3.6.5. Método de Scheffé Se considera un método bastante general que utiliza la distribución de “F” de Snedecor. El método de Scheffé puede aplicarse para probar hipótesis generales de que una función lineal de las medias poblacionales es igual a cero. En contraste con las comparaciones múltiples basadas en rangos estudentizados, el método de Scheffé es un método exacto para medias provenientes de medias de igual o desigual tamaño y para medias que han sido ajustadas por covarianza. Para el cálculo se requiere determinar la mínima diferencia significativa entre las medias de los tratamientos cuando éstos se encuentran ordenados en
  • 31. Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior orden de magnitud. Su valor crítico se determina a través de la siguiente expresión: √( ) ( ) Donde: t = Número de tratamientos F = Valor que se obtiene de la distribución de “F” de Snedecor con t-1 y los grados de libertad del error. CError = Cuadrado medio del error, y ri, rj representan el número de observaciones usadas para calcular cada media muestra Ejemplo. A continuación se aplican todas las pruebas de rangos múltiples antes expuestas de manera que se pueda realizar una comparación entre éstas. Los promedios por tratamiento son los siguientes: Cuadro 7. Medias por tratamientos y Medias ordenadas por magnitud descendente. Tratamiento Promedio Tratamiento Promedios Ordenados 1 2.665 5 7.10125 2 2.69125 4 7.055 3 4.94625 3 4.94625 4 7.055 2 2.69125 5 7.10125 1 2.665 Aplicando DMS a un nivel de significancia  = 0.01 que es el mismo nivel de significancia que se utilizó para el análisis de varianza, además de la siguiente información: CMError = 1.30091893 r = 8 t/2(35) = 2.7238 √ Por lo tanto el valor crítico de la prueba es de 1.5534. A continuación se presentan en el Cuadro 7 las comparaciones a realizar, las diferencias entre las medias y el resultado de comparar estas diferencias con el valor crítico de la
  • 32. Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior prueba de DMS. Cuadro 7. Resultado de la prueba de DMS para los tratamientos estudiados. Comparación Diferencia de Medias Resultado de la comparación T5 versus T4 0.04625 ns T5 versus T3 2.155 * T5 versus T2 4.41 * T5 versus T1 4.43625 * T4 versus T3 2.10875 * T4 versus T2 4.36375 * T4 versus T1 4.39 * T3 versus T2 2.255 * T3 versus T1 2.28125 * T2 versus T1 0.02625 ns ns = No significativo * = significativo Las comparaciones se pueden resumir de acuerdo al siguiente rango de mérito Tratamiento Comparación 5 a 4 a 3 b 2 c 1 c Promedios con literales distintas son estadísticamente diferentes según el método de DMS (P ˂ 0.01). Interpretando los resultados de la separación o comparación de medias según DMS se puede decir que las concentraciones de glucosa 5 y 4 producen la misma cantidad de insulina liberada (P  0.01), pero diferente (P ˂ 0.01) a las demás concentraciones de glucosa experimentadas. Esto quiere decir que es indistinto utilizar la concentración 5 o 4. Al comparar el tratamiento 4 (concentración 4) con las demás, ésta tuvo un comportamiento diferente (P ˂ 0.01) a las demás concentraciones de glucosa, es decir, 3, 2 y 1. Igualmente mostró la concentración 3 respecto a la 2 y 1, no así la concentración 2 que tuvo el mismo comportamiento (P > 0.01) con la concentración 1. Al aplicar el método de Duncan se obtuvo lo siguiente:
  • 33. Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior √ Para realizar la prueba de Duncan lo primero que se debe hacer es obtener los valores estudentizados extraídos de la tabla de Duncan. En este caso se están utilizando valores interpolados ya que no existen en la tabla grado de libertad igual a 35 solo hay entre 30 y 40 por lo tanto lo que se hizo fue promediar los dos valores. Estos son los siguientes: Cuadro 8. Valores estudentizado extraído de la tabla de Duncan y valores críticos de la prueba según el número de medias a comparar. Medias a comparar 2 3 4 5 R(0.01, 35) 3.855 4.025 4.13 4.195 RMS 1.554549 1.623103 1.665445 1.691656 Aquí se puede ver el efecto secuencial de Duncan ya que utiliza un comparador distinto según el número de medias a comparar. Los resultados de aplicar la prueba son los siguientes: Cuadro 9. Contrastación de las diferencias entre medias adyacentes con los valores críticos de Duncan. Promedios Promedios 7.10125 7.055 4.94625 2.69125 2.665 Tratamientos 5 4 3 2 1 7.10125 5 0 0.04625 ns 2.155 * 4.41* 4.43625 * 7.055 4 0 2.10875* 4.36375* 4.39* 4.94625 3 0 2.255* 2.28125* 2.69125 2 0 0.02625 ns 2.665 1 0 RMS 1.69166 1.66544 1.62310 1.55455 ns = No significativo * = significativo
  • 34. Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior Lo anterior se resume en el siguiente rango de mérito: Tratamiento Comparación 5 a 4 a 3 b 2 c 1 c Promedios con literales distintas son estadísticamente diferentes según el método de Duncan (P ˂ 0.01). Como se puede observar, en este caso los resultados obtenidos son los mismos que en la prueba de DMS, por lo tanto, la interpretación es la misma. Aplicando SNK: √ Al igual que la prueba de Duncan, SNK es una prueba secuencial lo que indica que utiliza un valor diferente para cada comparación de acuerdo al número de medias a comparar. Los valores q y valores críticos de SNK se muestran en el Cuadro 10. Cuadro 10. Valores estudentizados de la prueba de SNK de acuerdo al número de medias adyacentes a comparar y valores críticos de la misma. Medias a comparar 2 3 4 5 q(0.01, 35) 3.855 4.41 4.75 4.99 SNK 1.55454932 1.778356 1.9154628 2.0122441
  • 35. Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior Los resultados al aplicar la prueba de rangos múltiples de SNK se resumen en el Cuadro 11. Cuadro 11. Resultados de la comparación de medias según el método de SNK. Promedios Promedios 7.10125 7.055 4.94625 2.69125 2.665 Tratamientos 5 4 3 2 1 7.10125 5 0 0.04625 ns 2.155 * 4.41* 4.43625 * 7.055 4 0 2.10875* 4.36375* 4.39* 4.94625 3 0 2.255* 2.28125* 2.69125 2 0 0.02625 ns 2.665 1 0 SNK 2.0122441 1.9154628 1.778356 1.554549 ns = No significativo * = significativo Lo anterior se resume en el siguiente rango de mérito. Tratamiento Comparación 5 a 4 a 3 b 2 c 1 c Promedios con literales distintas son estadísticamente diferentes según el método de SNK (P ˂ 0.01) En este caso, los resultados de aplicación del método de SNK coinciden con el anterior y por ende, la interpretación es la misma. Aplicando ahora el método de Tukey o Diferencia Honesta Mínima se tiene lo siguiente: √ Tukey no es un método secuencial, es decir, que utiliza un solo valor estudentizado para obtener el valor crítico de prueba, utiliza la misma tabla que SNK pero con el número máximo de medias a comparar. q(0,01, 5, 35) = 4.99 √ Los resultados de contrastar la diferencia de medias ordenadas con el valor crítico de la prueba de Tukey se muestra en el Cuadro 12.
  • 36. Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior Cuadro 12. Resultados de la aplicación de la prueba de Tukey a los promedios de los tratamientos estudiados. Comparación Diferencia de Medias Resultado de la comparación T5 versus T4 0.04625 ns T5 versus T3 2.155 * T5 versus T2 4.41 * T5 versus T1 4.43625 * T4 versus T3 2.10875 * T4 versus T2 4.36375 * T4 versus T1 4.39 * T3 versus T2 2.255 * T3 versus T1 2.28125 * T2 versus T1 0.02625 ns ns = No significativo * = significativo Resumiendo los resultados del Cuadro 12 en un rango de mérito se tiene lo siguiente: Tratamiento Comparación 5 a 4 a 3 b 2 c 1 c Promedios con literales distintas son estadísticamente diferentes según el método de Tukey (P ˂ 0.01). Aplicando ahora la última prueba de separación de medias de las propuestas en este documento se tiene lo siguiente: Método de Scheffé √( ) ( ) La prueba de Scheffé al igual que Tukey no es una prueba secuencial por lo tanto solo utiliza un valor de “F” de Snedecor que se extrae un nivel de significancia “”, para el caso del ejemplo  = 0.01, con los grado de libertad de tratamientos y los del error experimental. De acuerdo a esto se tiene lo siguiente:
  • 37. Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior F(0.01, 4, 35) = 3.908 √( ) ( ) Cuadro 13. Resultados de la aplicación de la prueba de Scheffé a los promedios de los tratamientos estudiados. Comparación Diferencia de Medias Resultado de la comparación T5 versus T4 0.04625 ns T5 versus T3 2.155 ns T5 versus T2 4.41 * T5 versus T1 4.43625 * T4 versus T3 2.10875 ns T4 versus T2 4.36375 * T4 versus T1 4.39 * T3 versus T2 2.255 * T3 versus T1 2.28125 * T2 versus T1 0.02625 ns ns = No significativo * = significativo Resumiendo los resultados del Cuadro 13 en un rango de mérito se tiene lo siguiente: Tratamiento Comparación 5 a 4 a 3 a 2 b 1 b Promedios con literales distintas son estadísticamente diferentes según el método de Scheffé (P ˂ 0.01). 3.7. ¿Cuándo, Porqué y Cuál Prueba de Rangos Múltiples Utilizar? Todas las pruebas de rangos múltiples o separación o comparación de medias se utilizan siempre y cuando en el análisis de varianza se rechace la hipótesis ya este análisis solo detecta si existe efecto o no de los tratamientos sometidos a consideración pero no indica cuál o cuáles son los tratamientos responsables de este rechazo.
  • 38. Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior En el Cuadro 14 se resumen los resultados obtenidos por cada una de las pruebas de separación de medias aplicados. Cuadro 14. Resumen de los resultados obtenidos al aplicar las pruebas de rangos múltiples de DMS, Duncan, SNK, Tukey y Scheffé a un nivel de significancia de  = 0.05. Tratamiento Promedio DMS Duncan SNK Tukey Scheffé 5 7.10125 a a a a a 4 7.055 a a a a a 3 4.94625 b b b b a 2 2.69125 c c c c b 1 2.665 c c c c b Promedios con literales distintas son estadísticamente diferentes (P ˂ 0.01). Según Martínez Garza (1994) el método de Scheffé es más riguroso para detectar diferencias significativas y esto se demuestra con los resultados expuestos en el Cuadro 14, es por ello que se recomiendo usarlo a un  = 0.1. Por otra parte se ha podido observar que tanto SNK como Tukey tiende a no detectar diferencias estadística donde DMS y Duncan lo han hecho con diferencias mayores. Una discusión más fundamentada sobre las separaciones de medias puede encontrarse en Steel y Torrie (1992) en su obra “Bioestadística: Principios y Procedimientos pero sí se puede deducir que para experimentos en fases exploratorias es recomendable usar pruebas que no sean tan rigurosas como es DMS, Duncan e inclusive SNK, sin embargo, si este no es el caso y los promedios no han sido corregidos por efecto de covariable, es recomendable Tukey y si se requiere una prueba más rigurosa sin importar si el experimento es balanceado o no, si los promedios ha sido corregido o no por covariable, es recomendable usar Scheffé.
  • 39. Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior 4. DISEÑO EN BLOQUES COMPLETAMENTE AL AZAR (BCA) O CON DOS CRITERIOS DE CLASIFICACIÓN No siempre el material experimental es homogéneo limitando en este caso el uso del Diseño Completamente al Azar (DCA). En estos casos es recomendable usar el Diseño en Bloques Completamente al Azar. 4.1.¿Cuándo utilizar este diseño? Este diseño se utiliza cuando el material experimental presenta un factor de “estorbo” que no es de interés estudiar pero que sí puede afectar los resultados conllevando a conclusiones erradas o bien los llamados efectos enmascarados. Tiene como principio maximizar la variabilidad entre bloques y minimizar la variabilidad interbloque o variabilidad interna. Esto se logra ya que las unidades experimentales dentro de cada bloque son homogéneas pero son heterogéneas entre bloques. Si se habla de un diseño en Bloques Completamente al Azar, deben existir tantas unidades experimentales dentro de cada bloque como tratamientos se tenga, de manera que cada tratamiento tenga una repetición en cada bloque. Esto al mismo tiempo se vuelve una desventaja para este diseño ya que si se pierde una unidad experimental o más, se rompe el principio de bloqueo ya que los tratamientos no tendrían el mismo número de repeticiones dentro de cada bloque. Es por ello que en este caso para analizar este diseño se deben estimar los datos perdidos conllevando a pérdidas de grados de libertad en el error y por ende a un aumento del cuadrado medio del error. El tema de estimación de datos perdidos no se desarrolla en este documento, pero se pueden consultar las fuentes que citan al final del mismo. 4.2.Modelo Aditivo Lineal de un BCA El modelo aditivo lineal para este diseño es el siguiente: Donde: Yij = Variable respuesta = Efecto común a todas las observaciones Bj = Efecto de la j-ésima repetición; j = 1, 2, 3,...r repeticiones Ti = Efecto del j-ésimo tratamiento; i = 1, 2, 3, …i, tratamiento Eij = Error experimental
  • 40. Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior 4.3. Análisis de Varianza para un BCA Antes de exponer la salida de varianza y las ecuaciones de trabajo, se presenta un cuadro de concentración o vaciamiento de información. Cuadro 15. Concentración de los datos para un Diseño en Bloques Completamente al Azar (BCA). TRATAMIENTOS BLOQUES ΣYi. 1 2 3 … j 1 Y11 Y12 Y13 Y1j Y1. 2 Y21 Y22 Y23 Y2j Y2. 3 Y31 Y32 Y33 Y3j Y3. …i Yi1 Yi2 Yi3 Yij Yi. ΣY.j Y.1 Y.2 Y.3 Y.j Y.. La salida de varianza de este diseño y de acuerdo a su modelo aditivo lineal es el siguiente: Cuadro 15. Salida de varianza para un diseño en Bloques Completamente al Azar. F.V gl SC CM Fc Ft Bloque r-1 SCBloque CMBloque ( ) Tratamiento t-1 SCTRAT. CMTRAT. ( ) Error (t-1)(r-1) SCError CMError Total tr-1 SCTotales En este diseño se prueban dos juegos de hipótesis uno para bloques y otros para tratamientos. Estas hipótesis son las siguientes: Para tratamiento Ho: µ1 - µ2 - µ3 -… µi = 0 (T1 - T2 - T3 - …Ti = 0) Ha: µ1 - µ2 - µ3 -… µi  0(T1 - T2 - T3 - …Ti  0). Para Bloques Ho: Bµ1 - Bµ2 - Bµ3 -… Bµj = 0 (B1 - B2 - B3 - …Bj = 0) Ha: Bµ1 - Bµ2 - Bµ3 -… Bµj  0 (B1 - B2 - B3  …Bj  0). Las ecuaciones de trabajo para realizar el análisis de varianza de este diseño son las
  • 41. Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior siguientes: ; Factor de Corrección ∑ ∑ ∑ ( ) Ejemplo: Un fisioterapeuta deseaba comparar tres métodos para enseñar a los pacientes el uso de cierto aparato protético. Tenía la sensación de que la rapidez de aprendizaje sería diferente para pacientes de diferentes edades y deseaba diseñar un experimento en el que pudiera tomarse en consideración la influencia de la edad. Para ello selección tres pacientes en cada uno de los cuatros grupos de edades para participar en el experimento y, en cada grupo de edad se asignó un paciente aleatoriamente a cada uno de los métodos de enseñanza. Los métodos de instrucción corresponden a los tratamientos y los cinco grupos de edades corresponden a los bloques. La variable medida fue el tiempo (días) requerido para aprender el uso de cierto aparato protético. Los datos son los siguientes: Cuadro 16. Tiempo requerido para el manejo de un aparato protético bajo tres modalidades de enseñanza en grupos de diferentes edades. Método de Enseñanza Edades (años) ΣYi. < a 20 20 a 29 30 a 39 40 a 49 50 y más A 7 8 9 10 11 45 B 9 9 9 9 12 48 C 10 10 12 12 14 58 ΣY.j 26 27 30 31 37 151 Adaptado de Wyane (1970) Realice el análisis de varianza correspondiente a un  = 0.01. Aplicando las ecuaciones de trabajo se tiene lo siguiente: ( )
  • 42. Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior (7² + 8² +…14²)-1520.06667 = 46.93333 ( ) ( ) ( ) Cuadro 17. Salida de varianza para el ejemplo de Diseños en Bloques Completamente a Azar. F.V gl SC CM Fc F(0.01) Bloques 4 6.2333 14.38465 7.006 Tratamiento 2 9.26666 21.38458 8.649 Error 8 0.43333 Total 15 46.93333 Interpretación de Resultados Es necesario recalcar que en un diseño de bloques completamente al azar la variable que se está bloqueando no es de interés estudiar, en este caso, el fisioterapeuta está interesado en el manejo del aparato protético sin embargo, el presume que la edad puede estar afectando esta velocidad de aprendizaje en este tipo de pacientes y por ello que organiza el experimento y agrupa las unidades experimentales de acuerdo a las edades de los paciente. Cuando se establece un diseño en bloques completamente al azar, es necesario estar seguro que en verdad el factor de estorbo existe, caso contrario se pierde grados de libertad en el error, lo cual hace que las diferencias dentro de los tratamientos (error experimental) sean mayores con las consecuencias que corresponden. Para el caso del ejemplo, se puede verificar en la salida de varianza que existe diferencias significativas (P  0.01) en bloques lo cual indica, que el investigador tenía razón en realizar el bloqueo por edades de los pacientes. Esto indica también que la velocidad de aprendizaje (vista como el manejo del aparato protético), se ve afectada por la edad. Por otra parte, este mismo análisis indica que los métodos de enseñanza afectan o ejercen efecto significativo en la velocidad de aprendizaje de los pacientes. Esto se puede concluir a un 99% de confiabilidad. Dado que el análisis de varianza reportó diferencias significativas en el tiempo de
  • 43. Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior aprendizaje, se debe aplicar una prueba de rangos múltiples para verificar cuál de las técnicas de enseñanza. Para realizar lo antes expuesto lo primero que hay que hacer es ordenar las medias por magnitud (descendente) como se muestra en el Cuadro 18. Cuadro 18. Promedios por método de enseñanza utilizado. Método de Enseñanza Promedios Método de Enseñanza Promedios Ordenados A 9 C 11.6 B 9.6 B 9.6 C 11.6 A 9 Aplicando la prueba de Tukey a un  = 0.01 √ √ 1.65742075 Cuadro 19. Resultados de la aplicación de la prueba de Tukey a los promedios de los Métodos de Enseñanza estudiados. Comparaciones Diferencias de Medias Resultado de la Comparación A versus B 2.0 * A versus C 2.6 * B versus C 0.6 ns Medias con literales distintas son diferentes estadísticamente (P  0.01). Resumiendo los resultados de las comparaciones realizadas se puede resumir a través del siguiente rango de mérito Método de Enseñanza Comparación C a B b A b
  • 44. Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior Lo anterior indica que el método donde los pacientes tardan menos son el A y el B, ambos métodos son estadísticamente iguales, es decir, que ejercen el mismo efecto sobre el tiempo que duran los pacientes para aprender el manejo de aparato protético y el método donde se tarda más es el método C ya que aquí los pacientes tardan en promedio 11 días y que fue diferente (P 0.01) a los demás métodos. 5. DISEÑO CUADRADO LATINO (DCL) Anteriormente se han analizado los casos de los diseños Completamente al Azar donde el material experimental tiene que ser homogéneo y Bloques al Azar, donde el material experimental presenta un factor sistemático o de estorbo. Sin embargo, en la investigación se presentan casos donde el material experimental presenta dos tipos de efectos no sistemáticos o sea dos factores de estorbo, que no son de interés en la investigación pero pueden afectar los resultados del experimento. Además, imposibilita el uso de los diseños antes mencionados. 5.1. ¿Cuándo Utilizar este Diseño? El diseño Cuadrado Latino, es considerado como una variante del diseño Bloques al Azar. Este diseño es de gran utilidad cuando el material experimental presenta dos efectos de estorbo. Permite controlar dos efectos sistemáticos que afectan al material experimental, además del efecto de tratamiento que es el de interés estudiar. Tiene la característica de controlar los efectos de estorbo a través de hileras y columna, o sea un doble bloqueo. Para que los efectos de las hileras y las columnas no se confundan con el de los tratamientos, éstos se ubican de tal forma que un tratamiento no se repite en la misma columna y la misma hilera. Por esta razón, la cantidad de tratamiento coincide con el mismo número de filas y columnas. La principal restricción de este diseño es que el número de repeticiones es igual al número de tratamiento, si este último es considerable el número de repeticiones requerido se vuelve impracticable. Son pocos usados los Cuadros Latinos 12 x 12, mientras que el tamaño más común es desde 5 x 5 hasta 8 X 8. Este diseño presenta hasta cierto punto la misma desventaja que los Bloques al Azar de que, el error experimental por unidad, se aumente con el tamaño del cuadro.
  • 45. Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior 5.2. Modelo Aditivo Lineal de para un DCL El modelo aditivo lineal para este diseño es el siguiente: Yij(k) = µ + Hi + Cj + Tk(ij) + Eijk Donde: Yij (k) = Variable respuesta µ = Efecto común a todas las observaciones Hi = Efecto de la i - ésima hilera i = 1, 2, 3,... i hileras Cj = Efecto de la j-ésima columna j = 1, 2, 3,… j columnas Tk (ij) = Efecto del k-ésimo tratamiento en la i-ésima hilera y j-ésima columna k = 1, 2, 3,… k tratamientos. Ejk = Error del modelo En este diseño se prueban hipótesis para columnas, hileras y tratamiento de la misma forma que se ha hecho anteriormente, es decir, la hipótesis nula asume el efecto de igualdad en caso y la alternativa su contradicción. 5.3. Análisis de Varianza para un diseño Cuadrado Latino DCL Al igual que los casos anteriores, antes de exponer la salida de varianza, se muestra un cuadro de concentración de información, que es de donde obtiene como tal al análisis de varianza que se debe corresponder con el modelo aditivo lineal. Cuadro 20. Cuadro de vaciamiento de información para un diseño Cuadrado Latino. Hileras Columnas ΣYi. C1 C2 C3 … Cj H1 Y11 Y12 Y13 Y1j Y1. H2 Y21 Y22 Y23 Y2j Y2. H3 Y31 Y32 Y33 Y3j Y3. … Hi Yi1 Yi2 Yi3 Yij Yi. ΣY.j Y.1 Y.2 Y.3 Y.j Y.. Los tratamientos están entre las hileras y las columnas bajo las características que se han mencionado anteriormente, es por ello que hay que hacer un resumen de los tratamientos en otro cuadrado como se muestra a continuación.
  • 46. Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior Cuadro 21. Resumen de la información de los tratamientos extraído de un diseño Cuadrado Latino. Tratamiento Repeticiones ΣYi. R1 R2 R3 … Rj T1 Y11 Y12 Y13 Y1j Y1. T2 Y21 Y22 Y23 Y2j Y2. T3 Y31 Y32 Y33 Y3j Y3. … Tk Yi1 Yi2 Yi3 Yij Y..k Y..1 Y..2 Y..3 Y..j Y… La salida de varianza para un DCL es la siguiente: Cuadro 22. Salida de varianza para un diseño Cuadrado Latino FV gl SC CM Fc Ft Hileras t-1 SCHileras CMHileras ( ) Columnas t-1 SCColumn CMColumn ( ) Tratamiento t-1 SCTRAT. CMTRAT. ( ) Error (t-1)(t-2) SCError CMError Total t²-1 SCTotales Las ecuaciones de trabajo para el análisis de varianza de este diseño son las siguientes: (∑ ) ∑ ∑ ∑ ∑ ( ) Ejemplo:
  • 47. Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior Se estudia la eficacia de cuatro fármacos diferentes (F1, F2, F3 y F4) en el tratamiento de una enfermedad, para ello, se observa el número de días que tardan en curar los enfermos tratados con estos fármacos. Se considera que el factor edad y el factor peso pueden influir en el experimento, por ello, se controlan estos factores y se consideran cuatro niveles de edad (E1, E2, E3 y E4) y cuatro de peso (P1, P2, P3 y P4). Los resultados del experimento diseñado según la técnica del cuadrado latino se reportan en el Cuadro 23. ¿Qué conclusiones se deducen del experimento a un nivel de significancia del 5%?” Cuadro 23. Efecto de cuatro fármacos en los días para una curar una enfermedad en pacientes de cuatro grupos etáreos y cuatro tipos de peso. Peso Grupo Etáreo E1 E2 E3 E4 P1 10.0 F1 9.5 F2 7.0 F4 11.5 F3 P2 8.0 F2 10.0 F1 8.5 F3 9.0 F4 P3 7.0 F3 6.5 F4 7.0 F1 8.0 F2 P4 6.0 F4 5.0 F3 6.0 F2 9.0 F1 Lo primero que se debe hacer es resumir la información para columnas e hileras. Esta es la siguiente: Peso Grupo Etáreo ΣYi.. E1 E2 E3 E4 P1 10.0 9.5 7.0 11.5 38.0 P2 8.0 10.0 8.5 9.0 35.5 P3 7.0 6.5 7.0 8.0 28.5 P4 6.0 5.0 6.0 9.0 26.0 ΣY.j. 31.0 31.0 28.5 37.5 128.0 y la de tratamiento quedaría de la siguiente forma: Fármaco (Tratamiento) 1 2 3 4 ΣY..k F1 10.0 10.0 7.0 9.0 36.0 F2 8.0 9.5 6.0 8.0 31.5 F3 7.0 5.0 8.5 11.5 32.0 F4 6.0 6.5 7.0 9.0 28.5
  • 48. Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior Con esta información se puede realizar el análisis de varianza (∑ ) ∑ ( ) ∑ ( ) ∑ ( ) ∑ ( ) ( ) ( ) Resumiendo lo anterior en la salida de varianza correspondiente a este diseño se tiene lo siguiente: Cuadro 24. Salida de varianza para el diseño Cuadrado Latino del ejemplo. F.V gl SC CM FC Ft (0.05) Peso (Hileras) 3 24.125 8.0416667 10.432432 4.757 Grupo Etáreo (Columnas) 3 11.125 3.7083333 4.8108108 4.757 Fármaco (Tratamiento) 3 7.125 2.375 3.0810811 4.757 Error 6 4.625 0.7708333 Total 15 47.0 De acuerdo al análisis de varianza realizado se concluye al 95% de confiabilidad que existe efecto significativo del peso en los días que tardan los enfermos en curarse, de igual manera lo hicieron los grupos etáreos estudiados. Al revisar el efecto de los fármacos (tratamiento) se observó que éstos ejercieron el mismo efecto en los días para curarse por lo tanto es indistinto usar uno o el otro. En este caso, al igual que en los bloques, si existe efecto de hileras o columnas se concluye nada más que era necesario bloquear en ese sentido. Si se encuentra efecto de tratamiento, se debe aplicar alguna prueba de rangos múltiples.
  • 49. Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior 6. DISEÑOS FACTORIALES Como se mencionó en un principio, todos los diseños hasta ahora desarrollados son diseños simples donde solo se ha analizado el efecto de tratamiento. Sin embargo, se presentan situaciones donde la interrogante a investigar se encuentra supeditada por varios factores controlables, por ejemplo:  El efecto de diferentes dosis de un desparasitante en niños de diferentes condiciones sociales.  El efecto de diferentes productos para reducir triglicéridos en pacientes con distintas condiciones corporales, etc. En la parte introductoria de este documento se mencionó que un factor es un tratamiento que genera más tratamiento (niveles de un factor). Puede ser que la reducción de los triglicéridos pueda estar relacionada con tipo de producto y una condición corporal determinada, es decir, puede ser que exista efecto de interacciones de los niveles de los factores estudiados. Si bien es cierto que en algunos casos se pueden estudiar por separados tales efectos, el tiempo que se requiere para obtener la repuesta es mayor y además muchas veces se necesita aplicar ambos factores para ver el comportamiento de las interacciones de los niveles de éstos. Es por ello que una de las ventajas de este tipo de diseño es que además de estudiar los efectos principales, se pueden estudiar las interacciones de los niveles de los factores reduciendo el tiempo de experimentación y además proporcionando conclusiones más concretas en el estudio. Los diseños factoriales se dividen en diseños factoriales simples y diseños factoriales complejo. Estos pueden ejecutarse en cualquiera de los diseños simples o clásicos hasta ahora desarrollado, es decir, que se pueden tener diseños factoriales en un diseño completamente al azar, en bloques completamente al azar y en cuadrado latino. De igual forma se puede hacer en los diseños factoriales complejos, todo depende de las características del material experimental que se utilice en el experimento. A continuación se desarrollan diseños factoriales simples en arreglos completamente al azar y en bloques completamente al azar.
  • 50. Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior 6.1. ¿Cuándo utilizar diseños factoriales simples en un arreglo completamente al azar? De cuando utilizar estos diseño se ha expuesto anteriormente por lo tanto solo se desarrolla lo de completamente al azar. Los diseños factoriales simples en arreglo completamente al azar su utilizan cuando se está interesado estudiar al mismo tiempo el efecto de dos o más factores al mismo tiempo y el material experimental a usar es homogéneo, es decir, no presenta factor de estorbo alguna que pueda afectar los resultados del experimento. De forma general los diseños factoriales simples se puede clasificar de acuerdo al número de factores que se estudien o bien de acuerdo a que si se estudian todos los niveles de los factores (factoriales completos) o se estudian cierto niveles de éstos (factoriales incompletos). En función del número de factores que se estudien, los diseños factoriales pueden ser bifactoriales, trifactoriales, etc. Generalmente es recomendable hasta tres por el efecto de interpretación. Para el análisis de experimentos factoriales se analizan primero los efectos principales (factores individuales) y posteriormente las interacciones de los mismos. Hay autores que mencionan que en caso de existir efecto de las interacciones no tiene sentido estudiar los factores por separados ya que para ver el efecto en la variable respuesta se requiere de las interacciones de los niveles de los factores en estudio. 6.2. Arreglo combinatorio Como se ha mencionado anteriormente, un factor es una clase de tratamiento que genera más tratamiento llamados niveles. Un nivel se refiere a los diferentes tratamientos dentro de un factor y arreglo combinatorio se refiere a la combinación de los niveles de los factores en estudio. Suponga que se tiene un factor A con tres niveles (a1, a2, a3) y un factor B con cuatro niveles (b1, b2, b3, b4). En este caso se tiene un experimento bifactorial 3 x 4. El arreglo combinatorio de estos dos factores sería el que se muestra en el Cuadro 25. Cuadro 25. Arreglo combinatorio bifactorial 3 x 4. Factor A Factor B b1 b2 b3 b4 a1 a1b1 a1b2 a1b3 a1b4 a2 a2b1 a2b2 a2b3 a2b4 a3 a3b1 a3b2 a3b3 a3b4
  • 51. Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior 6.3.Modelo aditivo lineal Para representar un experimento factorial se utiliza un modelo lineal que tome en consideración la suma de una constante general común a todas las observaciones más los efectos principales de los factores a estudiar así como los efectos secundarios (interacciones) adicionándole finalmente un efecto aleatorio o error experimental. Además se tiene que considerar en el modelo la forma de asignación de los tratamientos definidos (interacciones) a las unidades experimentales. Esto quiere decir, que si el material experimental es homogéneo, se hará en un arreglo completamente al azar, si hay un factor de estorbo, entonces se hará en bloques completamente al azar, etc. Es importante mencionar que en este tipo de experimentos factoriales, todos los factores se estudian bajo un mismo rigor, cosa que no ocurres en los experimentos factoriales complejos ya que en éstos se sacrifica precisión en uno para estudiar con mayor precisión el otro. Supóngase que en el ejemplo de arreglo combinatorio expuesto líneas arriba, se lleva a cabo en un diseño o arreglo completamente al azar, entonces su modelo aditivo lineal sería el siguiente: ( ) Yijk = Variable respuesta µ = Efecto común a todas las observaciones Ai = Efecto del i-ésimo nivel del factor A: i = a1, a2, a3 niveles del factor A Bj = Efecto del j-ésimo nivel del factor B: j = b1, b2, b3, b4 niveles del factor B (A*B)ij = Interacción del i-ésimo nivel del factor A con el j-ésimo nivel del factor B Eijk = Error del modelo En este diseño se prueban hipótesis tanto para el factor A, factor B y para las interacciones, bajo la misma tipología desarrollada en este documento (hipótesis nula e hipótesis alternativa). En caso de rechazo de la hipótesis nula, se debe hacer prueba de rangos múltiples según sea el caso Un cuadro de vaciamiento de información para un diseño bifactorial un arreglo completamente al azar se muestra a continuación.
  • 52. Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior Cuadro 26. Cuadro de vaciamiento de información para un diseño bifactorial en un arreglo completamente al azar. Factor A Factor B Repeticiones ΣYij. 1 2 3 …k a1 b1 Y111 Y112 Y113 Y11k Y11. b2 Y121 Y122 Y123 Y12k Y12. b3 Y131 Y132 Y133 Y13k Y13. bj Y1j1 Y1j2 Y1j3 Y1jk Y1j. a2 b1 Y211 Y212 Y213 Y21k Y21. b2 Y221 Y222 Y223 Y22k Y22. b3 Y231 Y232 Y233 Y23k Y23. bj Y2j1 Y2j2 Y2j3 Y2jk Y2i. a3 b1 Y311 Y312 Y313 Y31k Y31. b2 Y321 Y322 Y323 Y32k Y32. b3 Y331 Y332 Y333 Y33k Y33. bj Y3j1 Y3j2 Y3j3 Y3jk Y3j. ai b1 Yi11 Yi12 Yi13 Yi1k Yi1. b2 Yi21 Yi22 Yi23 Yi2k Yi2. b3 Yi31 Yi32 Yi33 Yi3k Yi3. …bj Yij1 Yij2 Yij3 Yijk Yij. De este cuadro se extrae la información de los efectos principales y secundarios (interacciones) como se muestra en el Cuadro 27. Cuadro 27. Información de los efectos principales y de las interacciones entre los mismos. Factor A Factor B ΣYi.. b1 b2 b3 b4 …bj a1 Y11. Y12. Y13. Y14. Y1j. Y1.. a2 Y21. Y22. Y23. Y24. Y2j. Y2.. a3 Y31. Y32. Y33. Y34. Y3j. Y3.. …ai Yi1. Yi2. Yi3. Yi4. Yij. Yi.. ΣY.j. Y.1. Y.2. Y.3. Y.4. Y.j. Y… Las ecuaciones de trabajo son las siguientes: (∑ )
  • 53. Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior ( ) ( ) ( ) ( ) ( ) La salida de varianza de acuerdo al modelo aditivo lineal sería la que se muestra en el Cuadro 28. Cuadro 28. Salida de varianza para un diseño bifactorial en un arreglo completamente al azar. F.V gl SC CM Fc Ft Factor A a-1 SCA F(,glA, gl Error) Factor B b-1 SCB F(,glB, gl Error) A*B (a-1)(b-1) SCAB ( )( ) F(,glAB, gl Error) Error ab(r-1) SCError ( ) Total abr-1 SCTotales Si el diseño bifactorial se hubiera llevado a cabo en arreglo en bloques completamente al azar el modelo aditivo lineal es el siguiente: ( ) Yijk = Variable respuesta µ = Efecto común a todas las observaciones Ai = Efecto del i-ésimo nivel del factor A: i = a1, a2, a3 niveles del factor A Bj = Efecto del j-ésimo nivel del factor B: j = b1, b2, b3, b4 niveles del factor B (A*B)ij = Interacción del i-ésimo nivel del factor A con el j-ésimo nivel del factor B αk = Efecto de k-ésimo bloque: k = 1, 2, 3,… bloques Eijk = Error del modelo Y la salida de varianza sería la que se muestra en el Cuadro 29.
  • 54. Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior Cuadro 29. Salida de varianza para un diseño bifactorial en un arreglo de bloques completamente al azar. F.V gl SC CM Fc Ft Bloque k-1 SCBloques F(, glbloque, gl Error Factor A a-1 SCA F(,glA, gl Error) Factor B b-1 SCB F(,glB, gl Error) A*B (a-1)(b-1) SCAB ( )( ) F(,glAB, gl Error) Error (ab-1)(r-1) SCError ( ) Total abr-1 SCTotales En este caso se adicionaría una hipótesis más que sería la de bloque y si hubiera un rechazo de Ho, la interpretación sería la misma que se ha mencionado anteriormente. Ejemplo Un médico está interesado en determinar si tanto el estado nutricional como la edad (grupo etáreo) de la madre tiene efecto sobre el peso del recién nacido. Los estados nutricionales de su interés fueron: Normal, Sobrepeso y Obesa, y los grupos etáreos fueron: menores a 15 años, 15 a 18 años, 19 a 30 años y mayores a 30 años. Seleccionó de forma aleatoria cuatro madres para cada combinación de los niveles de los dos factores, estado nutricional y grupo etáreo). Los pesos obtenidos en gramos fueron los que se reportan en el Cuadro 30. En este caso se tiene un experimento bifactorial, Estado Nutricional y Grupo Etáreo, cada uno con tres y cuatro niveles, respectivamente. Esto hace que se tenga un bifactorial 3 x 4 (esto vendría a ser un factorial completo asimétrico, asimétrico por no tienen el mismo número de niveles y completo por se estudian todos los niveles que han sido propuestos por el investigador. Por otra parte se tiene cuatro repeticiones por tratamiento (combinación), entonces viene a ser un bifactorial 3 x 4 con 4 repeticiones, haciendo un total de 48 unidades experimentales como se muestra en el Cuadro 30. Para los datos del Cuadro 30 realice lo siguiente: a. Proponga y describa un modelo aditivo lineal para el experimento. b. Proponga los juegos de hipótesis a probar. c. Realice el análisis de varianza correspondiente de acuerdo al modelo aditivo lineal
  • 55. Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior propuesto en el inciso a., a una significancia del 1%. Realice conclusiones. d. Si existe rechazo de Ho en cualquiera de los factores como en las interacciones de los mismos, realice la prueba de rangos múltiples de Tukey al 99% de confiabilidad. Emita conclusiones Cuadro 30. Pesos de los recién nacidos de acuerdo al estado nutricional de la madre y al grupo etáreo de las mismas. Estado Nutricional Grupo Etáreo Repeticiones 1 2 3 4 Normal Menor de 15 1800 1900 1700 2000 15 a 18 2000 2400 2900 3000 19 a 30 3000 2800 2900 3200 Mayor a 30 3100 3300 2600 2800 Con sobrepeso Menor de 15 2100 1800 1900 2200 15 a 18 2500 2900 3200 2900 19 a 30 2700 2900 3100 3500 Mayor a 30 2900 2600 3200 2700 Obesa Menor de 15 3000 2800 2400 2500 15 a 18 3100 3300 2900 3400 19 a 30 2800 2500 3200 3100 Mayor a 30 2800 3100 3400 3500 Dado que este experimento fue realizado en un arreglo completamente al azar no es necesario totalizar las columnas por lo tanto se procede a continuación a obtener la información de las interacciones de los niveles de los factores estudiados. Para ello es necesario totalizar en fila las interacciones como se muestra en el Cuadro 31 posteriormente hacer en cuadro de las interacciones que conllevaran a los totales de los efectos principales como se reporta en el Cuadro 32, estos totales se muestran tanto en la suma de las hileras como de las columnas de acuerdo a como se dispongan los factores (totales marginales) y los valores de las interacciones están dentro del cuadro.
  • 56. Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior Cuadro 31. Datos del experimento con las interacciones totalizadas. Estado Nutricional Grupo Etáreo Repeticiones ΣYij. 1 2 3 4 Normal Menor de 15 1800 1900 1700 2000 7400 15 a 18 2000 2400 2900 3000 10300 19 a 30 3000 2800 2900 3200 11900 Mayor a 30 3100 3300 2600 2800 11800 Con sobrepeso Menor de 15 2100 1800 1900 2200 8000 15 a 18 2500 2900 3200 2900 11500 19 a 30 2700 2900 3100 3500 12200 Mayor a 30 2900 2600 3200 2700 11400 Obesa Menor de 15 3000 2800 2400 2500 10700 15 a 18 3100 3300 2900 3400 12700 19 a 30 2800 2500 3200 3100 11600 Mayor a 30 2800 3100 3400 3500 12800 Cuadro 32. Efectos principales e interacciones de los factores Estado Nutricional y Grupo Etáreo. Estado Nutricional Grupo Etáreo (años) ΣYi.. Menor de 15 15 a 18 19 a 30 Mayor a 30 Normal 7400 10300 11900 11800 41400 Con sobrepeso 8000 11500 12200 11400 43100 Obesa 10700 12700 11600 12800 47800 ΣY.j. 26100 34500 35700 36000 132300 Desarrollando las actividades solicitadas para el ejemplo se tiene lo siguiente: a. Modelo aditivo lineal ( ) Yijk = Variable respuesta (peso de los recién nacidos) µ = Efecto común a todas las observaciones Ni = Efecto del i-ésimo estado nutricional; i = Normal, Con sobrepeso y Obesa Gj = Efecto del j-ésimo grupo etáreo; menores de 15, 15 a 18, 19 a 30 y mayores a 30 años (N*E)ij = Efecto de la interacción del i-ésimo nivel del factor Estado Nutricional con el j- ésimo nivel del factor Grupo Etáreo Eijk = Error del modelo
  • 57. Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior b. Juego de Hipótesis Como existen dos factores y sus interacciones, las hipótesis son las siguientes: Para el factor Estado Nutricional: Ho: µNormal- µSobre peso- µObesa = 0 Ha: µNormal- µSobre peso- µObesa  0 Para el factor Grupo Etáreo: Ho: µmenores de 15 - µ15 a 18 - µ19 a 30 - µmayores 30 años = 0 Ha: µmenores de 15 - µ15 a 18 - µ19 a 30 - µmayores 30 años  0 Para las interacciones: Ho: µa1b1 - µa1b2 - µa1b3 - µa1b4 - … µa3b4 = 0 Ha: µa1b1 - µa1b2 - µa1b3 - µa1b4 - … µa3b4  0 c. Análisis de varianza (∑ ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) Con estos cálculos se construye la salida o tabla de varianza como se muestra en el Cuadro 33.
  • 58. Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior Cuadro 33. Salida de varianza para el diseño bifactorial en un DCA del ejemplo. F.V gl SC CM Fc Ft (0.01) Estado Nutricional 2 1373750 686875 8.3609467 5.248 Grupo Etáreo 3 5510625 1836875 22.359256 4.377 Interacción 6 1196250 199375 2.4268808 3.351 Error 36 2957500 82152.778 Total 47 11038125 De acuerdo a los resultados del análisis de varianza se puede concluir con 99% de confiabilidad que el peso de los recién nacidos se ve afectado por el Estado Nutricional y por el Grupo Etáreo de las madres, es decir, que ejercen efectos significativos (P < 0.01) en el peso de los recién nacidos, no así las interacciones de los niveles estudiados ya que ésta resultó ser no significativa. Esto indica que los factores estudiados ejercen efectos aditivos o bien que actúan de forma independiente en la variable respuesta. d. Separación de media de Tukey al 99% de confiabilidad Cuando se dan este tipo de resultados hay que determinar el nivel o niveles de cada factor que provocaron el rechazo de la hipótesis nula en el análisis de varianza. Para ello hay que hacer los ajustes necesarios como se muestra en el Cuadro 34. Cuadro 34. Ajuste de los efectos principales y secundarios para la separación de medias. Efecto Total Promedio Ajuste A ΣYi.. √ B ΣY.j. √ AB ΣYij. √ Aplicando estos ajustes para los efectos principales se tiene lo siguiente:
  • 59. Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior Estado Nutricional Totales Promedio Normal 41400 2587.5 Con sobrepeso 43100 2693.75 Obesa 47800 2987.5 Aplicando Tukey para el factor Estado Nutricional se tiene lo siguiente: √ √ Ordenando los promedios de los niveles del factor Estado Nutricional y estableciendo las comparaciones correspondiente se tiene lo siguiente: Estado Nutricional Promedio Comparaciones Diferencias Resultado Obesa 2987.5 Obesa-Sobrepeso 293.75 ns a Con sobrepeso 2693.75 Obesa- Normal 400 * ab Normal 2587.5 Sobrepeso - Normal 106.25 ns b En este caso se puede decir que de los niveles del factor Estado Nutricional, solo el nivel Obesa ejerció un efecto distinto (P <0.01) en el peso de los recién nacidos. Los ajustes para los niveles del factor Grupo Etáreo se tiene lo siguiente: Grupo Etáreo Totales Promedio Menor de 15 26100 2175 15 a 18 34500 2875 19 a 30 35700 2975 Mayor a 30 36000 3000 Aplicando la Tukey para los niveles del factor Grupo Etáreo √ √ Ordenando los promedios de los niveles del factor Grupo Etáreo y estableciendo las comparaciones correspondiente se tiene lo siguiente:
  • 60. Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior Comparaciones Diferencias Mayor a 30 - 19 a 30 25 ns Mayor a 30 - 15 a 18 125 ns Mayor a 30 - Menor a 15 825* 19 a 30 - 15 a 18 100 ns 19 a 30 - Menor a 15 800 * 15 a 18 - Menor a 15 700 * Grupo Etáreo Promedio Resultado Mayor a 30 3000 a 19 a 30 2975 a 15 a 18 2875 a Menor de 15 2175 b De acuerdo a los resultados de Tukey se puede concluir que de los niveles del factor Grupo Etáreo, solamente uno de éstos ejerció un efecto distinto el peso de los recién nacidos como las madres menores de 15 años.
  • 61. Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior BIBLIOGRAFIA CONSULTADA PARA ESTRUCTURAR EL DOCUMENTO COCHRAN, W. y G.M. COX. 1991. Diseños Experimentales. 2da. Edic. Edit. Trillas. México, D.F. FREUD, R.J. and R.C. LITTELL. 1991. SAS System for Regression. SAS Institute Inc, Cary. N.C. USA. HERRERA HARO, J.G y G. LORENZANA. 1994. Aplicaciones del SAS (Statistical Analysis System) a los Métodos Estadísticos. Instituto Tecnológico Agropecuario de Oaxaca. Oaxaca, México. HILDERBRAND, P.E. y F. POEY. 1989. Ensayos Agronómicos en Fincas según el Enfoque de Sistemas Agropecuarios. Edit. Agropecuaria Latinoamericana, Inc. Estados Unidos de Norteamérica. INFANTE GIL, S. y G. ZARATE DE LARA. 1990. Métodos Estadísticos. Un enfoque interdiciplinario. 2da. Edic. Edit. Trillas. México, D.F. LITTLE, T. y F.J. HILLS. 1989. Métodos Estadísticos para la Investigación Agropecuaria. 2da. Edic. Edit. Trillas. México, D.F. LOPEZ, P.F. 1989. Uso del SAS para análisis estadísticos de datos experimentales. Centro Agronómico Tropical de Investigación y Enseñanza C.A.T.I.E. Turrialba, Costa Rica. MARTINEZ-GARZA, A. 1988. Diseños Experimentales. Métodos y Elementos de Teoría. Edit. Trillas. México, D.F, MARTINEZ-GARZA, A. 1994. Experimentación Agrícola. Métodos Estadísticos. Universidad Autónoma Chapingo. Chapingo, México. MARTINEZ SOLARIS, F. 2111. http://cdn.slidesharecdn.com/ss_thumbnails/estadisticaydiseosexperimentales- 110925201348-phpapp02-thumbnail.jpg?1316999785
  • 62. Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior MONTGOMERY, D.C. 1991. Diseños y Análisis de Experimentos. Edit. Iberoaméria. México, D.F. STEEL, R.G.D. y J.H. TORRIE. 1992. Bioestadística. Principios y Procedimientos. 2da. Edic. Edit. McGraw-Hill. México, D.F. RAO, C.R. 1952. Advanced statistical methods in biometric reseach. John Wiley. New York, USA. RENDON, S.G. 1992. Métodos Estadísticos (Muestreo, Diseños Experimentales, Estadística No Paramétrica). Universidad Autónoma de Chapingo. Chapingo, México. REYES, C.P. 1992. Diseño de Experimentos Aplicados: Agronomía, Biología, Química, Industrias, Ciencias Sociales. 3era Edic. Edit. Trillas. México, D.F. RODRIGUEZ del ANGEL, J.M. 1991. Métodos de Investigación Pecuaria. Edit. Trillas. México, D.F. WAYNE W. D. 1977. Estadística con Aplicaciones a las Ciencias Sociales y a la Educación. Edit. McGraw-Hill. México.