SlideShare una empresa de Scribd logo
EL ANÁLISIS DE LA VARIANZA (ANOVA)
            1. Comparación de múltiples poblaciones

                          Ricard Boqué, Alicia Maroto
            Grupo de Quimiometría y Cualimetría. Universitat Rovira i Virgili.
                      Pl. Imperial Tàrraco, 1. 43005-Tarragona



El análisis de la varianza (ANOVA) es una potente herramienta estadística, de gran
utilidad tanto en la industria, para el control de procesos, como en el laboratorio de
análisis, para el control de métodos analíticos. Los ejemplos de aplicación son
múltiples, pudiéndose agrupar, según el objetivo que persiguen, en dos
principalmente : la comparación de múltiples columnas de datos y la estimación de
los componentes de variación de un proceso. Nos ocupamos en este artículo de la
primera de ellas.



Comparación de múltiples poblaciones


La comparación de diversos conjuntos de resultados es habitual en los laboratorios
analíticos. Así, por ejemplo, puede interesar comparar diversos métodos de análisis
con diferentes características, diversos analistas entre sí, o una serie de
laboratorios que analizan una misma muestra con el mismo método (ensayos
colaborativos). También sería el caso cuando queremos analizar una muestra que
ha estado sometida a diferentes tratamientos o ha estado almacenada en
diferentes condiciones. En todos estos ejemplos hay dos posibles fuentes de
variación: una es el error aleatorio en la medida y la otra es lo que se denomina
factor controlado (tipo de método, diferentes condiciones, analista o laboratorio,...).
Una de las herramientas estadísticas más utilizadas que permite la separación de
las diversas fuentes de variación es el análisis de la varianza (ANOVA, del inglés
Analysis of Variance) [Massart, 1997].

El ANOVA también puede utilizarse en situaciones donde ambas fuentes de
variación son aleatorias. Un ejemplo sería el análisis de algún compuesto de un
vino almacenado en un depósito. Supongamos que las muestras se toman
aleatoriamente de diferentes partes del depósito y se realizan diversos análisis
replicados. Aparte de la variación natural en la medida tendremos una variación en
la composición del vino de les diferentes partes del depósito.


                                                                                     1
Cuando tengamos un factor, controlado o aleatorio, aparte del error propio de la
medida, hablaremos del ANOVA de un factor. En el caso de que estuviésemos
desarrollando un nuevo método colorimétrico y quisiéramos investigar la influencia
de diversos factores independientes sobre la absorbancia, tales como la
concentración de reactivo A y la temperatura a la que tiene lugar la reacción,
entonces hablaríamos de un ANOVA de dos factores. En los casos donde tenemos
dos o más factores que influyen, se realizan los experimentos para todas las
combinaciones de los factores estudiados, seguido del ANOVA. Se puede deducir
entonces si cada uno de los factores o una interacción entre ellos tienen influencia
significativa en el resultado.

Para utilizar el ANOVA de forma satisfactoria deben cumplirse tres tipos de
hipótesis, aunque se aceptan ligeras desviaciones de las condiciones ideales:

   1. Cada conjunto de datos debe ser independiente del resto.
   2. Los resultados obtenidos para cada conjunto deben seguir una distribución
      normal.
   3. Las varianzas de cada conjunto de datos no deben diferir de forma
      significativa.



ANOVA de un factor

Tomemos como ejemplo la comparación de 5 laboratorios que analizan nk veces
con el mismo procedimiento la concentración de Pb en una misma muestra de
agua de río. El objetivo del ANOVA aquí es comparar los errores sistemáticos con
los aleatorios obtenidos al realizar diversos análisis en cada laboratorio. Hemos
comentado antes que son condiciones importantes que cada laboratorio analice
sus muestras de manera independiente y con precisiones parecidas a las del resto
de laboratorios. En la tabla 1 se muestran los resultados obtenidos (expresados en
µg/L).




                                                                                  2
Tabla 1. Resultados del análisis de plomo en agua de río realizado por 5 laboratorios (k
indica el nº de laboratorio).
    Resultados        Laboratorio A   Laboratorio B    Laboratorio C   Laboratorio D   Laboratorio E

         1                2.3                6.5           1.7             2.1             8.5
         2                4.1                4.0           2.7             3.8             5.5
         3                4.9                4.2           4.1             4.8             6.1
         4                2.5                6.3           1.6             2.8             8.2
         5
                          3.1                4.4           4.1             4.8              -
         6
         7                3.7                 -            2.8             3.7              -
                           -                  -             -              4.2              -
       Suma              20.6                25.4          17.0            26.2           28.3
 Valor medio,   xk       3.4                 5.1           2.8             3.7            7.1
         nk               6                   5             6               7              4

 Media aritmética de todos los resultados,   x = 4.2
 Número total de resultados, N = 28




Observando los valores medios todo parece indicar que existen diferencias entre
los laboratorios. Ahora bien, ¿son dichas diferencias significativas? El ANOVA
responde a esta cuestión. El objetivo del ANOVA es comparar los diversos valores
medios para determinar si alguno de ellos difiere significativamente del resto. Para
ello se utiliza una estrategia bien lógica: si los resultados proporcionados por los
diversos laboratorios no contienen errores sistemáticos, los valores medios
respectivos no diferirán mucho los unos de los otros y su dispersión, debida a los
errores aleatorios, será comparable a la dispersión presente individualmente en
cada laboratorio.

El secreto está, pues, en descomponer la variabilidad total de los datos en dos
fuentes de variación: la debida a los laboratorios y la debida a la precisión dentro de
cada laboratorio. Matemáticamente, la suma de cuadrados total, SST, puede
descomponerse como una suma de dos sumas de cuadrados:

                                       SST = SSR + SSlab

SST es la suma de las diferencias al cuadrado de cada resultado individual respecto a
la media de todos los resultados y por tanto, representa la variación total de los datos.
SSR mide las desviaciones entre los resultados individuales (xkj ), de cada laboratorio
(donde j indica el nº de repetición) y la media del laboratorio (xk ) y, por lo tanto, es
una medida de la dispersión dentro de los laboratorios. Cuando se divide SSR por los
correspondientes grados de libertad, (N - K), se obtiene el cuadrado medio (o MS, del
inglés Mean Square) "dentro de los laboratorios", MS R.


                                                                                                       3
Por su lado, SS lab mide las desviaciones entre los resultados medios de los
laboratorios y el resultado medio global y, dividido por sus grados de libertad, (k - 1),
constituye el cuadrado medio "entre laboratorios", MS lab. La Tabla 2 muestra las
diferentes expresiones para calcular las sumas de cuadrados y las correspondientes
varianzas.

Tabla 2. Expresiones para el cálculo del ANOVA de un factor (K indica el número de
laboratorios y N el número total de resultados).
     Fuente                                          Grados de
                    Suma de cuadrados                                Varianza               Fcal
                                                      libertad
                               K                                             SSlab
     Entre         SSlab = ∑ n k (xk − x ) 2                       MSlab =
                                                       K-1
  laboratorios                k =1                                           K -1
                                                                                         F = MS lab
  Dentro de los              K nk                                            SSR             MSR
                   SSR = ∑ ∑ ( xkj − xk ) 2           N–K          MSR =
  laboratorios              k =1 j = 1                                       N-K
                              K nk                                           SS T
      Total        SST = ∑ ∑ ( xkj − x )2              N-1         MST =
                            k =1j =1                                         N -1



Se calculan, por tanto, MS lab y MS R como una medida de las dispersiones
comentadas y se comparan mediante una prueba de hipótesis F. Si no existe
diferencia estadísticamente significativa entre ellas, la presencia de errores aleatorios
será la causa predominante de la discrepancia entre los valores medios. Si, por el
contrario, existe algún error sistemático, MS lab será mucho mayor que MS R, con lo
cual el valor calculado de F será mayor que el valor tabulado Ftab para el nivel de
significación α escogido y los grados de libertad mencionados.

A continuación se muestra la típica tabla ANOVA obtenida para los resultados del
ejemplo de la Tabla 1:

Tabla 3. Tabla ANOVA para los resultados de la Tabla 1.

    Fuente         Suma de               Grados de      Cuadrado
                                                                        Fcal        Probabilidad
                  cuadrados               libertad       medio
     Entre
  laboratorios      53.13                   4             13.28        10.30         6.23·10-5
 Dentro de los
  laboratorios      29.64                   23            1.29
     Total          82.77                   27
                            Ftab = 2.79 (α = 0.05, 4, 23, 1 cola)




                                                                                                      4
Como Fcal > Ftab, en este caso se podría concluir que al menos uno de los
laboratorios ha producido resultados la media de los cuales difiere de forma
estadísticamente significativa del resto de laboratorios. El valor de probabilidad que
aparece en la Tabla 3 indica aquel valor de α a partir del cual el ANOVA no detectaría
ninguna diferencia significativa. Así pues, a menor valor de probabilidad, mayor
seguridad de que existen diferencias significativas.

El ANOVA no indica cuántos laboratorios difieren ni cuáles son. Una inspección visual
de los resultados puede proporcionar sin duda alguna pista, pero si se quieren tener
criterios más sólidos, hay diversas pruebas estadísticas que permiten saber de qué
laboratorios se trata [Massart, 1997].

En el ejemplo que hemos presentado, todos los laboratorios han analizado la
muestra siguiendo un procedimiento analítico común. Se hubiese podido plantear
que cada laboratorio utilizase dos procedimientos comunes, por ejemplo el método
oficial y un método alternativo. En este caso dispondríamos de los resultados del
contenido en plomo obtenidos por una serie de laboratorios con dos métodos
distintos, y el ANOVA nos proporcionaría información sobre la existencia de
discrepancias entre laboratorios y entre métodos. Sería un ejemplo de ANOVA de
dos factores.


Conclusiones


En este artículo hemos visto que el ANOVA puede utilizarse para comparar entre sí
las medias de los resultados obtenidos por diversos laboratorios, analistas,
métodos de análisis, etc. En el siguiente artículo mostraremos cómo utilizar el
ANOVA para descomponer la variación total de un proceso en las fuentes de
variación parciales. Esto nos puede resultar muy útil para, por ejemplo, determinar
cuáles son los factores que afectan más a un determinado procedimiento analítico.


Desde el punto de vista práctico, existen múltiples paquetes estadísticos que
permiten ejecutar rápidamente los cálculos del ANOVA. Lo que es interesante, sin
embargo, es que el usuario tenga capacidad para extraer conclusiones químicas de
los resultados obtenidos.




                                                                                    5
Referencias bibliográficas


D.L. Massart, B.M.G. Vandeginste, L.M.C. Buydens, S. de Jong, P.J. Lewi, J.
Smeyers-Verbeke, “Handbook of Chemometrics and Qualimetrics: Part A”, Elsevier
(1997), Amsterdam.




Los autores agradecen todos los comentarios relacionados con los contenidos de
este artículo. Pueden dirigirse, mediante mensaje electrónico, a la dirección:
quimio@quimica.urv.es.


Una versión en soporte electrónico de este artículo e información suplementaria
puede encontrarse en:
http://www.quimica.urv.es/quimio




                                                                              6

Más contenido relacionado

La actualidad más candente

6 diseños completamente aleatorizado y bloques al azar
6   diseños completamente aleatorizado y bloques al azar6   diseños completamente aleatorizado y bloques al azar
6 diseños completamente aleatorizado y bloques al azar
rbarriosm
 
Dbca
DbcaDbca
DISEÑO DE BLOQUES COMPLETO AL AZAR 1
DISEÑO DE BLOQUES COMPLETO AL AZAR 1DISEÑO DE BLOQUES COMPLETO AL AZAR 1
DISEÑO DE BLOQUES COMPLETO AL AZAR 1
Alberto Carranza Garcia
 
Disenos factoriales
Disenos factorialesDisenos factoriales
Disenos factoriales
jaimealvarado2003
 
Diseño factorial de 3 factores
Diseño factorial de 3 factores Diseño factorial de 3 factores
Diseño factorial de 3 factores
Oscar Saenz
 
El análisis cualitativo y cuantitativo
El análisis cualitativo y cuantitativo El análisis cualitativo y cuantitativo
El análisis cualitativo y cuantitativo
DiegoRobertoMunizaga1
 
Análisis de la varianza
Análisis de la varianza  Análisis de la varianza
Análisis de la varianza
elea90
 
Uso del fotómetro
Uso del fotómetroUso del fotómetro
Uso del fotómetro
BrandoOn Hernández Bna
 
Experimentos con arreglos Ortogonales Unidad II Ing. de la Calidad
Experimentos con arreglos Ortogonales Unidad II Ing. de la CalidadExperimentos con arreglos Ortogonales Unidad II Ing. de la Calidad
Experimentos con arreglos Ortogonales Unidad II Ing. de la Calidad
Ingrid Burgos
 
Problemas Disenos Factoriales
Problemas Disenos FactorialesProblemas Disenos Factoriales
Problemas Disenos Factoriales
Alberto Carranza Garcia
 
Analisis de varianza de dos vias
Analisis de varianza de dos viasAnalisis de varianza de dos vias
Analisis de varianza de dos vias
naila gomez avila
 
4+an%c3%a1lisis+de+varianza
4+an%c3%a1lisis+de+varianza4+an%c3%a1lisis+de+varianza
4+an%c3%a1lisis+de+varianza
pedropulecio
 
quimica analitica
quimica analiticaquimica analitica
quimica analitica
EduardoQuintana48
 
Paper3 saponificacion-rcstr
Paper3 saponificacion-rcstrPaper3 saponificacion-rcstr
Paper3 saponificacion-rcstr
miguelon333
 
Curva calibracion
Curva calibracionCurva calibracion
Curva calibracion
wandres270
 
Informe saponificacion
Informe saponificacionInforme saponificacion
Informe saponificacion
Javiera Navarro
 
Calibración de la balanza analítica
Calibración de la balanza analíticaCalibración de la balanza analítica
Calibración de la balanza analítica
Lezkathe Zapata
 
Titulación potenciométrica de un ácido débil con una base fuerte
Titulación potenciométrica de un ácido débil con una base fuerteTitulación potenciométrica de un ácido débil con una base fuerte
Titulación potenciométrica de un ácido débil con una base fuerte
Carolina Vesga Hernandez
 
Análisis de la varianza
Análisis de la varianzaAnálisis de la varianza

La actualidad más candente (19)

6 diseños completamente aleatorizado y bloques al azar
6   diseños completamente aleatorizado y bloques al azar6   diseños completamente aleatorizado y bloques al azar
6 diseños completamente aleatorizado y bloques al azar
 
Dbca
DbcaDbca
Dbca
 
DISEÑO DE BLOQUES COMPLETO AL AZAR 1
DISEÑO DE BLOQUES COMPLETO AL AZAR 1DISEÑO DE BLOQUES COMPLETO AL AZAR 1
DISEÑO DE BLOQUES COMPLETO AL AZAR 1
 
Disenos factoriales
Disenos factorialesDisenos factoriales
Disenos factoriales
 
Diseño factorial de 3 factores
Diseño factorial de 3 factores Diseño factorial de 3 factores
Diseño factorial de 3 factores
 
El análisis cualitativo y cuantitativo
El análisis cualitativo y cuantitativo El análisis cualitativo y cuantitativo
El análisis cualitativo y cuantitativo
 
Análisis de la varianza
Análisis de la varianza  Análisis de la varianza
Análisis de la varianza
 
Uso del fotómetro
Uso del fotómetroUso del fotómetro
Uso del fotómetro
 
Experimentos con arreglos Ortogonales Unidad II Ing. de la Calidad
Experimentos con arreglos Ortogonales Unidad II Ing. de la CalidadExperimentos con arreglos Ortogonales Unidad II Ing. de la Calidad
Experimentos con arreglos Ortogonales Unidad II Ing. de la Calidad
 
Problemas Disenos Factoriales
Problemas Disenos FactorialesProblemas Disenos Factoriales
Problemas Disenos Factoriales
 
Analisis de varianza de dos vias
Analisis de varianza de dos viasAnalisis de varianza de dos vias
Analisis de varianza de dos vias
 
4+an%c3%a1lisis+de+varianza
4+an%c3%a1lisis+de+varianza4+an%c3%a1lisis+de+varianza
4+an%c3%a1lisis+de+varianza
 
quimica analitica
quimica analiticaquimica analitica
quimica analitica
 
Paper3 saponificacion-rcstr
Paper3 saponificacion-rcstrPaper3 saponificacion-rcstr
Paper3 saponificacion-rcstr
 
Curva calibracion
Curva calibracionCurva calibracion
Curva calibracion
 
Informe saponificacion
Informe saponificacionInforme saponificacion
Informe saponificacion
 
Calibración de la balanza analítica
Calibración de la balanza analíticaCalibración de la balanza analítica
Calibración de la balanza analítica
 
Titulación potenciométrica de un ácido débil con una base fuerte
Titulación potenciométrica de un ácido débil con una base fuerteTitulación potenciométrica de un ácido débil con una base fuerte
Titulación potenciométrica de un ácido débil con una base fuerte
 
Análisis de la varianza
Análisis de la varianzaAnálisis de la varianza
Análisis de la varianza
 

Similar a Anovacast

Web
WebWeb
Web
rilara
 
tabla Anova
tabla Anovatabla Anova
tabla Anova
Edwyn Martinez
 
Anova 3
Anova 3Anova 3
Anova 3
tmaldito
 
Item 4: Presentación de resultados del primer ejercicio del Ring Test regiona...
Item 4: Presentación de resultados del primer ejercicio del Ring Test regiona...Item 4: Presentación de resultados del primer ejercicio del Ring Test regiona...
Item 4: Presentación de resultados del primer ejercicio del Ring Test regiona...
ExternalEvents
 
Análisis de Varianza (ANOVA) de una Vía
Análisis de Varianza (ANOVA) de una VíaAnálisis de Varianza (ANOVA) de una Vía
Análisis de Varianza (ANOVA) de una Vía
Isaac Ortega
 
Analisis de varianza
Analisis de varianzaAnalisis de varianza
Analisis de varianza
Jorge Ybrahim Mukdassi
 
Anova
AnovaAnova
Univariante.pptx
Univariante.pptxUnivariante.pptx
Univariante.pptx
CarlosSalazar2092
 
An lisis de_varianza
An lisis de_varianzaAn lisis de_varianza
An lisis de_varianza
David Espinoza
 
La prueba anova
La prueba anovaLa prueba anova
Diseno Completamente al Azar
Diseno Completamente al AzarDiseno Completamente al Azar
Diseno Completamente al Azar
Alberto Carranza Garcia
 
S2 1 Intro Anva
S2 1 Intro AnvaS2 1 Intro Anva
S2 1 Intro Anva
taecoep
 
Diseño ejemplos
Diseño ejemplosDiseño ejemplos
Diseño ejemplos
Julian Buttowski
 
Experimentos con un solo factor
Experimentos con un solo factorExperimentos con un solo factor
Experimentos con un solo factor
Jhon Erik Hurtado Tarrillo
 
ANOVA
ANOVAANOVA
Apuntes simulación y optimización de procesos químicos
Apuntes simulación y optimización de procesos químicosApuntes simulación y optimización de procesos químicos
Apuntes simulación y optimización de procesos químicos
Joaquín Carlos Soriano Rodríguez
 
Metodos infostat
Metodos infostatMetodos infostat
Unidad 2
Unidad 2Unidad 2
Taguchi
TaguchiTaguchi
Clase ANOVA.ppt
Clase ANOVA.pptClase ANOVA.ppt
Clase ANOVA.ppt
manuelrojaslescano
 

Similar a Anovacast (20)

Web
WebWeb
Web
 
tabla Anova
tabla Anovatabla Anova
tabla Anova
 
Anova 3
Anova 3Anova 3
Anova 3
 
Item 4: Presentación de resultados del primer ejercicio del Ring Test regiona...
Item 4: Presentación de resultados del primer ejercicio del Ring Test regiona...Item 4: Presentación de resultados del primer ejercicio del Ring Test regiona...
Item 4: Presentación de resultados del primer ejercicio del Ring Test regiona...
 
Análisis de Varianza (ANOVA) de una Vía
Análisis de Varianza (ANOVA) de una VíaAnálisis de Varianza (ANOVA) de una Vía
Análisis de Varianza (ANOVA) de una Vía
 
Analisis de varianza
Analisis de varianzaAnalisis de varianza
Analisis de varianza
 
Anova
AnovaAnova
Anova
 
Univariante.pptx
Univariante.pptxUnivariante.pptx
Univariante.pptx
 
An lisis de_varianza
An lisis de_varianzaAn lisis de_varianza
An lisis de_varianza
 
La prueba anova
La prueba anovaLa prueba anova
La prueba anova
 
Diseno Completamente al Azar
Diseno Completamente al AzarDiseno Completamente al Azar
Diseno Completamente al Azar
 
S2 1 Intro Anva
S2 1 Intro AnvaS2 1 Intro Anva
S2 1 Intro Anva
 
Diseño ejemplos
Diseño ejemplosDiseño ejemplos
Diseño ejemplos
 
Experimentos con un solo factor
Experimentos con un solo factorExperimentos con un solo factor
Experimentos con un solo factor
 
ANOVA
ANOVAANOVA
ANOVA
 
Apuntes simulación y optimización de procesos químicos
Apuntes simulación y optimización de procesos químicosApuntes simulación y optimización de procesos químicos
Apuntes simulación y optimización de procesos químicos
 
Metodos infostat
Metodos infostatMetodos infostat
Metodos infostat
 
Unidad 2
Unidad 2Unidad 2
Unidad 2
 
Taguchi
TaguchiTaguchi
Taguchi
 
Clase ANOVA.ppt
Clase ANOVA.pptClase ANOVA.ppt
Clase ANOVA.ppt
 

Último

Actividad Sumativa #2 Realizado por Luis Leal..pptx
Actividad Sumativa #2 Realizado por Luis Leal..pptxActividad Sumativa #2 Realizado por Luis Leal..pptx
Actividad Sumativa #2 Realizado por Luis Leal..pptx
luis95466
 
Sesión 1-2 Formulación de Estados Financieros (2).pdf
Sesión 1-2 Formulación de Estados Financieros (2).pdfSesión 1-2 Formulación de Estados Financieros (2).pdf
Sesión 1-2 Formulación de Estados Financieros (2).pdf
JhoanaSilvaHeredia
 
El-Codigo-De-La-Abundancia para todos.pdf
El-Codigo-De-La-Abundancia para todos.pdfEl-Codigo-De-La-Abundancia para todos.pdf
El-Codigo-De-La-Abundancia para todos.pdf
AshliMack
 
Guia de emprendimientos para los alumnos
Guia de emprendimientos para los alumnosGuia de emprendimientos para los alumnos
Guia de emprendimientos para los alumnos
cantutecperu
 
Documentos comerciales, documento comercial
Documentos comerciales, documento comercialDocumentos comerciales, documento comercial
Documentos comerciales, documento comercial
JaimeMorra
 
Tema 20 Cuentas Por Cobrar Finanzas I UNSA
Tema 20 Cuentas Por Cobrar Finanzas I UNSATema 20 Cuentas Por Cobrar Finanzas I UNSA
Tema 20 Cuentas Por Cobrar Finanzas I UNSA
GABRIELAALEXANDRASAI1
 
Lo nuevo NOI 11 haz ese momento historico
Lo nuevo NOI 11 haz ese momento historicoLo nuevo NOI 11 haz ese momento historico
Lo nuevo NOI 11 haz ese momento historico
Cade Soluciones
 
apoyo contabilidad para personas que comienza
apoyo contabilidad para personas que comienzaapoyo contabilidad para personas que comienza
apoyo contabilidad para personas que comienza
MarcoCarrillo41
 
4. PRESENTACION LETRA DE CAMBIO EN BOLIVIA.pdf
4. PRESENTACION LETRA DE CAMBIO EN BOLIVIA.pdf4. PRESENTACION LETRA DE CAMBIO EN BOLIVIA.pdf
4. PRESENTACION LETRA DE CAMBIO EN BOLIVIA.pdf
eloy472575
 
DIRECTORIO órgano de control institucional - ABRIL 2024.pdf
DIRECTORIO órgano de control institucional - ABRIL 2024.pdfDIRECTORIO órgano de control institucional - ABRIL 2024.pdf
DIRECTORIO órgano de control institucional - ABRIL 2024.pdf
peruvip2
 
Evolución de la mercadotecnia y selección del producto en la empresa KFC
Evolución de la mercadotecnia y selección del producto en la empresa KFCEvolución de la mercadotecnia y selección del producto en la empresa KFC
Evolución de la mercadotecnia y selección del producto en la empresa KFC
AndrobertoAlva
 
Curso de Capacitación Cruz Roja Mexicana
Curso de Capacitación Cruz Roja MexicanaCurso de Capacitación Cruz Roja Mexicana
Curso de Capacitación Cruz Roja Mexicana
RobertoJesusCastillo1
 
INVESTIGACION FORMATIVA GESTIÓN DE TALENTO HUMANO
INVESTIGACION FORMATIVA GESTIÓN DE TALENTO HUMANOINVESTIGACION FORMATIVA GESTIÓN DE TALENTO HUMANO
INVESTIGACION FORMATIVA GESTIÓN DE TALENTO HUMANO
jennicaceres
 
cafetales encalado y producción usos y costumbres
cafetales encalado y producción usos y costumbrescafetales encalado y producción usos y costumbres
cafetales encalado y producción usos y costumbres
DavidFloresJara
 
ANÁLISIS FINANCIERO DE LA EMPRESA GLORIA.pptx
ANÁLISIS FINANCIERO DE LA EMPRESA GLORIA.pptxANÁLISIS FINANCIERO DE LA EMPRESA GLORIA.pptx
ANÁLISIS FINANCIERO DE LA EMPRESA GLORIA.pptx
PalJosuTiznadoCanaza
 
Teoria del diseño organizacional. Admon.
Teoria del diseño organizacional. Admon.Teoria del diseño organizacional. Admon.
Teoria del diseño organizacional. Admon.
Vavendao
 
Los catorce principios de calidad en las empresas, según Deming..pptx
Los catorce  principios de calidad en las empresas, según Deming..pptxLos catorce  principios de calidad en las empresas, según Deming..pptx
Los catorce principios de calidad en las empresas, según Deming..pptx
AbelQuispe31
 
Tema 3 - Tecnicas de Recoleccion de Datos.pptx
Tema 3 - Tecnicas de Recoleccion de Datos.pptxTema 3 - Tecnicas de Recoleccion de Datos.pptx
Tema 3 - Tecnicas de Recoleccion de Datos.pptx
CarmeloPrez1
 
ejecucion de la investigacion de mercados
ejecucion  de la investigacion de mercadosejecucion  de la investigacion de mercados
ejecucion de la investigacion de mercados
MARIAGUADALUPEMENDEZ10
 
capítulo 3 y 4 de finazas internacionales
capítulo 3 y 4  de finazas internacionalescapítulo 3 y 4  de finazas internacionales
capítulo 3 y 4 de finazas internacionales
josehernandez790860
 

Último (20)

Actividad Sumativa #2 Realizado por Luis Leal..pptx
Actividad Sumativa #2 Realizado por Luis Leal..pptxActividad Sumativa #2 Realizado por Luis Leal..pptx
Actividad Sumativa #2 Realizado por Luis Leal..pptx
 
Sesión 1-2 Formulación de Estados Financieros (2).pdf
Sesión 1-2 Formulación de Estados Financieros (2).pdfSesión 1-2 Formulación de Estados Financieros (2).pdf
Sesión 1-2 Formulación de Estados Financieros (2).pdf
 
El-Codigo-De-La-Abundancia para todos.pdf
El-Codigo-De-La-Abundancia para todos.pdfEl-Codigo-De-La-Abundancia para todos.pdf
El-Codigo-De-La-Abundancia para todos.pdf
 
Guia de emprendimientos para los alumnos
Guia de emprendimientos para los alumnosGuia de emprendimientos para los alumnos
Guia de emprendimientos para los alumnos
 
Documentos comerciales, documento comercial
Documentos comerciales, documento comercialDocumentos comerciales, documento comercial
Documentos comerciales, documento comercial
 
Tema 20 Cuentas Por Cobrar Finanzas I UNSA
Tema 20 Cuentas Por Cobrar Finanzas I UNSATema 20 Cuentas Por Cobrar Finanzas I UNSA
Tema 20 Cuentas Por Cobrar Finanzas I UNSA
 
Lo nuevo NOI 11 haz ese momento historico
Lo nuevo NOI 11 haz ese momento historicoLo nuevo NOI 11 haz ese momento historico
Lo nuevo NOI 11 haz ese momento historico
 
apoyo contabilidad para personas que comienza
apoyo contabilidad para personas que comienzaapoyo contabilidad para personas que comienza
apoyo contabilidad para personas que comienza
 
4. PRESENTACION LETRA DE CAMBIO EN BOLIVIA.pdf
4. PRESENTACION LETRA DE CAMBIO EN BOLIVIA.pdf4. PRESENTACION LETRA DE CAMBIO EN BOLIVIA.pdf
4. PRESENTACION LETRA DE CAMBIO EN BOLIVIA.pdf
 
DIRECTORIO órgano de control institucional - ABRIL 2024.pdf
DIRECTORIO órgano de control institucional - ABRIL 2024.pdfDIRECTORIO órgano de control institucional - ABRIL 2024.pdf
DIRECTORIO órgano de control institucional - ABRIL 2024.pdf
 
Evolución de la mercadotecnia y selección del producto en la empresa KFC
Evolución de la mercadotecnia y selección del producto en la empresa KFCEvolución de la mercadotecnia y selección del producto en la empresa KFC
Evolución de la mercadotecnia y selección del producto en la empresa KFC
 
Curso de Capacitación Cruz Roja Mexicana
Curso de Capacitación Cruz Roja MexicanaCurso de Capacitación Cruz Roja Mexicana
Curso de Capacitación Cruz Roja Mexicana
 
INVESTIGACION FORMATIVA GESTIÓN DE TALENTO HUMANO
INVESTIGACION FORMATIVA GESTIÓN DE TALENTO HUMANOINVESTIGACION FORMATIVA GESTIÓN DE TALENTO HUMANO
INVESTIGACION FORMATIVA GESTIÓN DE TALENTO HUMANO
 
cafetales encalado y producción usos y costumbres
cafetales encalado y producción usos y costumbrescafetales encalado y producción usos y costumbres
cafetales encalado y producción usos y costumbres
 
ANÁLISIS FINANCIERO DE LA EMPRESA GLORIA.pptx
ANÁLISIS FINANCIERO DE LA EMPRESA GLORIA.pptxANÁLISIS FINANCIERO DE LA EMPRESA GLORIA.pptx
ANÁLISIS FINANCIERO DE LA EMPRESA GLORIA.pptx
 
Teoria del diseño organizacional. Admon.
Teoria del diseño organizacional. Admon.Teoria del diseño organizacional. Admon.
Teoria del diseño organizacional. Admon.
 
Los catorce principios de calidad en las empresas, según Deming..pptx
Los catorce  principios de calidad en las empresas, según Deming..pptxLos catorce  principios de calidad en las empresas, según Deming..pptx
Los catorce principios de calidad en las empresas, según Deming..pptx
 
Tema 3 - Tecnicas de Recoleccion de Datos.pptx
Tema 3 - Tecnicas de Recoleccion de Datos.pptxTema 3 - Tecnicas de Recoleccion de Datos.pptx
Tema 3 - Tecnicas de Recoleccion de Datos.pptx
 
ejecucion de la investigacion de mercados
ejecucion  de la investigacion de mercadosejecucion  de la investigacion de mercados
ejecucion de la investigacion de mercados
 
capítulo 3 y 4 de finazas internacionales
capítulo 3 y 4  de finazas internacionalescapítulo 3 y 4  de finazas internacionales
capítulo 3 y 4 de finazas internacionales
 

Anovacast

  • 1. EL ANÁLISIS DE LA VARIANZA (ANOVA) 1. Comparación de múltiples poblaciones Ricard Boqué, Alicia Maroto Grupo de Quimiometría y Cualimetría. Universitat Rovira i Virgili. Pl. Imperial Tàrraco, 1. 43005-Tarragona El análisis de la varianza (ANOVA) es una potente herramienta estadística, de gran utilidad tanto en la industria, para el control de procesos, como en el laboratorio de análisis, para el control de métodos analíticos. Los ejemplos de aplicación son múltiples, pudiéndose agrupar, según el objetivo que persiguen, en dos principalmente : la comparación de múltiples columnas de datos y la estimación de los componentes de variación de un proceso. Nos ocupamos en este artículo de la primera de ellas. Comparación de múltiples poblaciones La comparación de diversos conjuntos de resultados es habitual en los laboratorios analíticos. Así, por ejemplo, puede interesar comparar diversos métodos de análisis con diferentes características, diversos analistas entre sí, o una serie de laboratorios que analizan una misma muestra con el mismo método (ensayos colaborativos). También sería el caso cuando queremos analizar una muestra que ha estado sometida a diferentes tratamientos o ha estado almacenada en diferentes condiciones. En todos estos ejemplos hay dos posibles fuentes de variación: una es el error aleatorio en la medida y la otra es lo que se denomina factor controlado (tipo de método, diferentes condiciones, analista o laboratorio,...). Una de las herramientas estadísticas más utilizadas que permite la separación de las diversas fuentes de variación es el análisis de la varianza (ANOVA, del inglés Analysis of Variance) [Massart, 1997]. El ANOVA también puede utilizarse en situaciones donde ambas fuentes de variación son aleatorias. Un ejemplo sería el análisis de algún compuesto de un vino almacenado en un depósito. Supongamos que las muestras se toman aleatoriamente de diferentes partes del depósito y se realizan diversos análisis replicados. Aparte de la variación natural en la medida tendremos una variación en la composición del vino de les diferentes partes del depósito. 1
  • 2. Cuando tengamos un factor, controlado o aleatorio, aparte del error propio de la medida, hablaremos del ANOVA de un factor. En el caso de que estuviésemos desarrollando un nuevo método colorimétrico y quisiéramos investigar la influencia de diversos factores independientes sobre la absorbancia, tales como la concentración de reactivo A y la temperatura a la que tiene lugar la reacción, entonces hablaríamos de un ANOVA de dos factores. En los casos donde tenemos dos o más factores que influyen, se realizan los experimentos para todas las combinaciones de los factores estudiados, seguido del ANOVA. Se puede deducir entonces si cada uno de los factores o una interacción entre ellos tienen influencia significativa en el resultado. Para utilizar el ANOVA de forma satisfactoria deben cumplirse tres tipos de hipótesis, aunque se aceptan ligeras desviaciones de las condiciones ideales: 1. Cada conjunto de datos debe ser independiente del resto. 2. Los resultados obtenidos para cada conjunto deben seguir una distribución normal. 3. Las varianzas de cada conjunto de datos no deben diferir de forma significativa. ANOVA de un factor Tomemos como ejemplo la comparación de 5 laboratorios que analizan nk veces con el mismo procedimiento la concentración de Pb en una misma muestra de agua de río. El objetivo del ANOVA aquí es comparar los errores sistemáticos con los aleatorios obtenidos al realizar diversos análisis en cada laboratorio. Hemos comentado antes que son condiciones importantes que cada laboratorio analice sus muestras de manera independiente y con precisiones parecidas a las del resto de laboratorios. En la tabla 1 se muestran los resultados obtenidos (expresados en µg/L). 2
  • 3. Tabla 1. Resultados del análisis de plomo en agua de río realizado por 5 laboratorios (k indica el nº de laboratorio). Resultados Laboratorio A Laboratorio B Laboratorio C Laboratorio D Laboratorio E 1 2.3 6.5 1.7 2.1 8.5 2 4.1 4.0 2.7 3.8 5.5 3 4.9 4.2 4.1 4.8 6.1 4 2.5 6.3 1.6 2.8 8.2 5 3.1 4.4 4.1 4.8 - 6 7 3.7 - 2.8 3.7 - - - - 4.2 - Suma 20.6 25.4 17.0 26.2 28.3 Valor medio, xk 3.4 5.1 2.8 3.7 7.1 nk 6 5 6 7 4 Media aritmética de todos los resultados, x = 4.2 Número total de resultados, N = 28 Observando los valores medios todo parece indicar que existen diferencias entre los laboratorios. Ahora bien, ¿son dichas diferencias significativas? El ANOVA responde a esta cuestión. El objetivo del ANOVA es comparar los diversos valores medios para determinar si alguno de ellos difiere significativamente del resto. Para ello se utiliza una estrategia bien lógica: si los resultados proporcionados por los diversos laboratorios no contienen errores sistemáticos, los valores medios respectivos no diferirán mucho los unos de los otros y su dispersión, debida a los errores aleatorios, será comparable a la dispersión presente individualmente en cada laboratorio. El secreto está, pues, en descomponer la variabilidad total de los datos en dos fuentes de variación: la debida a los laboratorios y la debida a la precisión dentro de cada laboratorio. Matemáticamente, la suma de cuadrados total, SST, puede descomponerse como una suma de dos sumas de cuadrados: SST = SSR + SSlab SST es la suma de las diferencias al cuadrado de cada resultado individual respecto a la media de todos los resultados y por tanto, representa la variación total de los datos. SSR mide las desviaciones entre los resultados individuales (xkj ), de cada laboratorio (donde j indica el nº de repetición) y la media del laboratorio (xk ) y, por lo tanto, es una medida de la dispersión dentro de los laboratorios. Cuando se divide SSR por los correspondientes grados de libertad, (N - K), se obtiene el cuadrado medio (o MS, del inglés Mean Square) "dentro de los laboratorios", MS R. 3
  • 4. Por su lado, SS lab mide las desviaciones entre los resultados medios de los laboratorios y el resultado medio global y, dividido por sus grados de libertad, (k - 1), constituye el cuadrado medio "entre laboratorios", MS lab. La Tabla 2 muestra las diferentes expresiones para calcular las sumas de cuadrados y las correspondientes varianzas. Tabla 2. Expresiones para el cálculo del ANOVA de un factor (K indica el número de laboratorios y N el número total de resultados). Fuente Grados de Suma de cuadrados Varianza Fcal libertad K SSlab Entre SSlab = ∑ n k (xk − x ) 2 MSlab = K-1 laboratorios k =1 K -1 F = MS lab Dentro de los K nk SSR MSR SSR = ∑ ∑ ( xkj − xk ) 2 N–K MSR = laboratorios k =1 j = 1 N-K K nk SS T Total SST = ∑ ∑ ( xkj − x )2 N-1 MST = k =1j =1 N -1 Se calculan, por tanto, MS lab y MS R como una medida de las dispersiones comentadas y se comparan mediante una prueba de hipótesis F. Si no existe diferencia estadísticamente significativa entre ellas, la presencia de errores aleatorios será la causa predominante de la discrepancia entre los valores medios. Si, por el contrario, existe algún error sistemático, MS lab será mucho mayor que MS R, con lo cual el valor calculado de F será mayor que el valor tabulado Ftab para el nivel de significación α escogido y los grados de libertad mencionados. A continuación se muestra la típica tabla ANOVA obtenida para los resultados del ejemplo de la Tabla 1: Tabla 3. Tabla ANOVA para los resultados de la Tabla 1. Fuente Suma de Grados de Cuadrado Fcal Probabilidad cuadrados libertad medio Entre laboratorios 53.13 4 13.28 10.30 6.23·10-5 Dentro de los laboratorios 29.64 23 1.29 Total 82.77 27 Ftab = 2.79 (α = 0.05, 4, 23, 1 cola) 4
  • 5. Como Fcal > Ftab, en este caso se podría concluir que al menos uno de los laboratorios ha producido resultados la media de los cuales difiere de forma estadísticamente significativa del resto de laboratorios. El valor de probabilidad que aparece en la Tabla 3 indica aquel valor de α a partir del cual el ANOVA no detectaría ninguna diferencia significativa. Así pues, a menor valor de probabilidad, mayor seguridad de que existen diferencias significativas. El ANOVA no indica cuántos laboratorios difieren ni cuáles son. Una inspección visual de los resultados puede proporcionar sin duda alguna pista, pero si se quieren tener criterios más sólidos, hay diversas pruebas estadísticas que permiten saber de qué laboratorios se trata [Massart, 1997]. En el ejemplo que hemos presentado, todos los laboratorios han analizado la muestra siguiendo un procedimiento analítico común. Se hubiese podido plantear que cada laboratorio utilizase dos procedimientos comunes, por ejemplo el método oficial y un método alternativo. En este caso dispondríamos de los resultados del contenido en plomo obtenidos por una serie de laboratorios con dos métodos distintos, y el ANOVA nos proporcionaría información sobre la existencia de discrepancias entre laboratorios y entre métodos. Sería un ejemplo de ANOVA de dos factores. Conclusiones En este artículo hemos visto que el ANOVA puede utilizarse para comparar entre sí las medias de los resultados obtenidos por diversos laboratorios, analistas, métodos de análisis, etc. En el siguiente artículo mostraremos cómo utilizar el ANOVA para descomponer la variación total de un proceso en las fuentes de variación parciales. Esto nos puede resultar muy útil para, por ejemplo, determinar cuáles son los factores que afectan más a un determinado procedimiento analítico. Desde el punto de vista práctico, existen múltiples paquetes estadísticos que permiten ejecutar rápidamente los cálculos del ANOVA. Lo que es interesante, sin embargo, es que el usuario tenga capacidad para extraer conclusiones químicas de los resultados obtenidos. 5
  • 6. Referencias bibliográficas D.L. Massart, B.M.G. Vandeginste, L.M.C. Buydens, S. de Jong, P.J. Lewi, J. Smeyers-Verbeke, “Handbook of Chemometrics and Qualimetrics: Part A”, Elsevier (1997), Amsterdam. Los autores agradecen todos los comentarios relacionados con los contenidos de este artículo. Pueden dirigirse, mediante mensaje electrónico, a la dirección: quimio@quimica.urv.es. Una versión en soporte electrónico de este artículo e información suplementaria puede encontrarse en: http://www.quimica.urv.es/quimio 6