SlideShare una empresa de Scribd logo
1 de 37
Caroline Godoy
Turma : Sistemas de Informação
Última aula
• Comparação de duas amostras independentes e dependentes;


• Comparação de duas populações – proporções;


• ANOVA (Análise de Variâncias): teste para comparar as diversas médias;


    • Conceitos e exemplos;
ANOVA




Princípio da ANOVA
• Estabelecer um modelo que possa representar os valores observados na
  seguinte forma:


                Observação = previsível + aleatória


• Ou seja, cada resposta obtida é resultado de algo controlado ou
  previsível, que incorpora o conhecimento que se tem sobre o assunto
  (expressa em termos de uma função matemática com parâmetros
  desconhecidos); + uma parte aleatória que pode ser representada por um
  modelo probabilístico;
ANOVA




Princípio da ANOVA



           YNx1  X Nxa  ax1   Nx1



   X Nxa
    ax1
ANOVA



       Modelo estatístico (one-way):
                                                                                       Tratamentos
                          y ij  μ i  ε ij          Efeito aleatório
                                                                        i=1,2,...,a,             j
        Efeito comum           μ  τ i  ε ij                          =1,2,...,r
                                
                                                                                        Observações
                                       μi         Efeito específico

yij= é a j-ésima observação do i-ésimo tratamento;
i é média do i-ésimo tratamento
 é uma constante para todas as observações (média geral);
i é o efeito do i-ésimo tratamento;
ij é o erro aleatório(erros de medida, fatores não controláveis, diferenças entre as unidades
experimentais, etc.).
       Pressuposições: 1) os erros aleatórios são independentes;
                          2) os erros aleatórios são normalmente distribuídos;
                          3) os erros aleatórios tem média 0 (zero) e variância 2;

    Ou, então:              yij ~ N (   i ; 2 ) e independentes
                                                                                                       5
ANOVA




   ANOVA – Análise de Variância
   • Objetivo: Utilizar a partição da variabilidade total da variável resposta
     (medida de interesse para comparação) como critério para o teste de
     igualdade entre as populações.




ou seja, quando ni é igual para todas as unidades experimentais
Aqui trabalharemos com experimentos balanceados e chamaremos a quantidade de
observações de r
ANOVA




ANOVA – Análise de Variância



              a


      r



          r
                  =
                      r

          r
ANOVA




ANOVA – Análise de Variância
          r


    i=1   j=1




                a
ANOVA




  Decomposição da soma de quadrados total
 A denominação de análise de variância resulta de decompor a variabilidade total dos
 dados em suas componentes. A soma de quadrado total (SQT) corrigido pela média global,



                          SQT   y ij  y..  ,
                                       a    r
                                                             2

                                      i 1 j1

  usa-se como medida de variabilidade total dos dados.



Pode-se    mostrar que a soma de quadrados total pode ser expressa através da seguinte
relação:


            y     ij  y..   n  y i.  y ..    y ij  y i. 
            a   r                       a                        a   r
                              2                          2                          2

           i 1 j1
                 1   
                                    i
                                         i 1 j1  
                    SQT                     SQtrat                       SQE

                           Espera-se valores                             Espera-se valores
                               grandes                                      pequenos
ANOVA




 Graus de liberdade:
 SQT tem ar-1 graus de liberdade; SQTrat tem a-1 g.l. e       SQE tem a(r-1) g.l.

Quadrados médios:
                            QMTrat  SQTrat
                                      a 1                QME  a(r-1)
                                                                SQE

                           Variância entre amostras       Dentro das amostras
 Esperanças dos quadrados médios:
                                E(QME) = 2
                                                  a
                                               r  τ i2
                          E(QMTrat)  σ 2       i 1
                                                a 1


                                         QMTrat
    Teste de hipótese:
                                    F 0  QME
ANOVA



         Análise Estatística

 F0 = QMTrat / QME
 Critério para rejeição de H0: F0 > F,a-1,n-a .


 Pode-se usar o nível descritivo (em inglês: p-value: É o menor valor de  para o qual
 rejeitamos a hipótese nula.
 Exemplo: para =5%, assim, se o nível descritivo < do que 0,05  rejeitar H0, caso
 contrário,  aceitar H0.
 Fórmulas para o cálculo das somas de quadrados:                 a    r  2
                                                                        y..
                                                       SQT   yij  2

                                                             i 1 j1   n
Hipóteses: H0: 1= 2=...= a = 
                                                                           2
                                                                1 a 2 y..
           H1: i  ᵥ para pelo menos um par (i,v)
                                                        SQTrat   y i. 
 Equivalentemente                                               r i 1    n
Hipóteses: H0: 1=  2=...=  a =0
           H1:  i  0 para pelo menos um i
                                                      SQE  SQT  SQTrat
ANOVA




Tabela da análise de variância de um experimento com um fator.
Causas de      Soma de Graus de Quadrados                F0          Valor p
variação       quadrados liberdade médios

Entre           SQTrat        a-1       QMTrat     QMTrat
tratamentos                                        QME

Erro (dentro    SQE           n-a       QME
tratamentos)

Total           SQT           n-1




n=ar



    y     ij  y..   n  y i.  y ..    y ij  y i. 
        a   r                       a                     a      r
                          2                        2                           2

   i 1 j1
         1   
                            i
                                 i 1 j1  
                SQT                      SQtrat                      SQE
ANOVA




 Coeficiente de Determinação
• Medida de Proporção da variabilidade total explicada pelo modelo
  obtido. (Quanto da variável resposta é explicada pelos tratamentos)

                                     SQTrat
                              R2 
                                     SQTot
• Considera-se aceitável um coeficiente acima de 0,70 ou 70%


• Serve para avaliar se o teste foi eficiente
ANOVA




Exemplo: Considerando o exemplo temos:


                    Tratamentos (servidores)
                      A       B         C       D
                      64      78        75      55   a=4
                      72      91        93      66   r=6
                      68      97        78      49   ar = 24=n
                      77      82        71      64
                      56      85        63      70
                      95      77        76      68
    Total (yi. )     432     510       456     372   1770        y..
    Média y i.      72      85       76       62   73.75       y ..
     y ij
        2
                    31994   43652    35144     23402 134192       y ij
                                                                     2

     j                                                           i, j
ANOVA




 Exemplo

    SQT  134192 
                   17702     134192  130558  3654
                      24
                     
                      
                        FC


         432 2  510 2  456 2  372 2
SQTrat                                 FC  132174  130559  1636
                       6

  SQE  SQT  SQTrat  3654  1636  2018

                        Montar a Tabela
                               ou
ANOVA




 Análise de Variância

  Causas de Variação         GL      SQ      QM       F
  Servidores
                              3     1636    545.3   5.40**
  (entre servidores)
  Erro Experimental
                             20     2018    100.9
  (dentro de servidores)
  Total                      23     3654



F.013.20   4,94         **SIGNIFICATIVO A 1%
ANOVA




Análise de Variância




 F   0
          5.40  F 0.01;(3;20)  4.94
 A diferença entre médias de tratamentos é significativa
 Rejeita-se H0
ANOVA




Análise de Variância
 CONCLUSÃO

     Os servidores    investigados se
 diferenciam em termos de tempo de
 transmissão de dados
ANOVA




  Software R
dados=read.table("anova.txt",header=T)
attach(dados)
# Gráfico de boxplot
boxplot(Tempo~Servidor,xlab="Servidores",ylab="Tempo")
# Tabela de anova
fit= aov(Tempo ~ Servidor, dados)
anova(fit)
ANOVA




 Diagnóstico do Modelo
 Verificar se as pressuposições básicas do modelo são válidas. Isso é realizado através
 de uma análise de resíduos.

Pressuposições: 1) os erros aleatórios são independentes;
                2) os erros aleatórios são normalmente distribuídos;
                3) os erros aleatórios tem média 0 (zero) e variância 2;

1) Define-se o resíduo da ij-ésima observação como:
                                                                         Não será abordada

                            e ij  y ij  y ij
                                          ˆ                            (homoscedasticidade)



onde yij  μ  τ i  yi.  valores preditos pelo modelo.
     ˆ     ˆ ˆ

           A suposição de normalidade

 Vamos usar o gráfico normal de probabilidades: sob normalidade dos erros este gráfico
 deve apresentar uma forma de reta.
Software R
## Análise de residuos
V_ajustados=fitted(fit)      # Valores preditos
res=residuals(fit)           # Valores residuais
# Gráfico de probabilidade
qqnorm(res, pch=20)
qqline(res)
## Gráfico de valores preditos e residuais
plot(V_ajustados,res, pch=20,ylab="Residuos", xlab="Valores ajustados")
abline(h=0,lty=2)
title(main=" Plot dos residuos vs valores ajustados")
Comparações entre Pares de Médias

• Quando rejeitamos Ho ou seja, quando pelo menos uma média é diferente e quando
   as pressuposições dos resíduos são aceitas, podemos comparar as diferentes médias e
   dizer qual é diferente das demais


• Devem ser realizadas após o teste F da análise de variância rejeitar a hipótese nula


• Existem vários testes como Intervalo de Bonferroni, LSD, porém o preferido dos
   pesquisadores é o Teste de Tukey
Teste de Tukey
Duas médias são diferentes significativamente se a diferença das médias amostrais
(em valor absoluto) for superior a DMS (Diferença Mínima Significativa):

                                                                 QME
                 IC ( i  k )  ( yi  yk )  q ;n 1
                                                                  n
Onde q é um apropriado nível de confiança superior da amplitude studentizada para k
médias (tratamentos) e f graus de liberdade associados a estimativa s2 de 2 (QME).

Exemplo: dados dos servidores. O valor da Diferença Mínima Significativa é:

                                              diff    lwr          upr              p adj
                                        A-D 10 -6.232221        26.23222      0.3378150
  Conclusão: pelo teste de              C-D 14 -2.232221        30.23222      0.1065573
  Tukey, ao nível de significância
  de 5%, as médias dos                  B-D 23 6.767779 39.23222              0.0039064
  servidores B e D, apresentam
  diferença significativa.              C-A 4 -12.232221       20.23222       0.8998057
                                        B-A 13 -3.232221       29.23222       0.1461929
                                        B-C 9 -7.232221        25.23222       0.4270717
Software R
  TukeyHSD(fit, ordered = TRUE)
Exercício
Exercício
Exercício




Não rejeitamos Ho a um nível de 5%
Exercício




Não rejeitamos Ho a um nível de 5%
Exercício

 Segue distribuição
      normal
Exercício

 Valores em torno da
       média 0
ANOVA COM 2 FATORES
• Mesma ideia de um fator:




• Gráfico de Interação: A interação entre os fatores corresponde a
  diferença de comportamento de um fator nos diferentes níveis do outro
  fator com respeito a característica de interesse. Uma das forma mais
  simples de avaliarmos a interação entre os fatores é o gráfico de
  interação.
ANOVA COM 2 FATORES
 • Mesma ideia de um fator:




Não há
interação
Regressão linear Simples
Próxima aula
Prova

Entrega do trabalho

Más contenido relacionado

La actualidad más candente

Bioestatistica basica -_paulo_margotto
Bioestatistica basica -_paulo_margottoBioestatistica basica -_paulo_margotto
Bioestatistica basica -_paulo_margottoAndréia Pereira
 
Exemplo de cálculo média,moda e mediana com distribuição frequencia
Exemplo de cálculo média,moda e mediana com distribuição frequenciaExemplo de cálculo média,moda e mediana com distribuição frequencia
Exemplo de cálculo média,moda e mediana com distribuição frequenciaRenato Ribeiro Soares
 
Tabela f 95% bilateral
Tabela f 95% bilateralTabela f 95% bilateral
Tabela f 95% bilateralAjudar Pessoas
 
Estudos epidemiológicos
Estudos epidemiológicosEstudos epidemiológicos
Estudos epidemiológicosLene So
 
Formulario estatistica descritiva univariada e bivariava 2013
Formulario estatistica descritiva univariada e bivariava  2013Formulario estatistica descritiva univariada e bivariava  2013
Formulario estatistica descritiva univariada e bivariava 2013Pedro Casquilho
 
34 nucleo e imagem de uma transformacao linear
34 nucleo e imagem de uma transformacao linear34 nucleo e imagem de uma transformacao linear
34 nucleo e imagem de uma transformacao linearAndressa Leite Rodrigues
 
Aula1: Introdução á Bioestatística
Aula1: Introdução á BioestatísticaAula1: Introdução á Bioestatística
Aula1: Introdução á Bioestatísticaansansil
 
Curvas de nível
Curvas de nívelCurvas de nível
Curvas de nívelfernando-tn
 
Estatistica aplicada exercicios resolvidos manual tecnico formando
Estatistica aplicada exercicios resolvidos manual tecnico formandoEstatistica aplicada exercicios resolvidos manual tecnico formando
Estatistica aplicada exercicios resolvidos manual tecnico formandoAntonio Mankumbani Chora
 
Relatório de química
Relatório de químicaRelatório de química
Relatório de químicaADSONTORREZANE
 
Testes hipot parametricos_pressupostos
Testes hipot parametricos_pressupostosTestes hipot parametricos_pressupostos
Testes hipot parametricos_pressupostosCélia M. D. Sales
 

La actualidad más candente (20)

Aula 05 Gráficos Estatísticos
Aula 05   Gráficos EstatísticosAula 05   Gráficos Estatísticos
Aula 05 Gráficos Estatísticos
 
Conceitos Básicos de Estatística II
Conceitos Básicos de Estatística IIConceitos Básicos de Estatística II
Conceitos Básicos de Estatística II
 
Normas da APA
Normas da APANormas da APA
Normas da APA
 
Bioestatistica basica -_paulo_margotto
Bioestatistica basica -_paulo_margottoBioestatistica basica -_paulo_margotto
Bioestatistica basica -_paulo_margotto
 
Exemplo de cálculo média,moda e mediana com distribuição frequencia
Exemplo de cálculo média,moda e mediana com distribuição frequenciaExemplo de cálculo média,moda e mediana com distribuição frequencia
Exemplo de cálculo média,moda e mediana com distribuição frequencia
 
Tabela f 95% bilateral
Tabela f 95% bilateralTabela f 95% bilateral
Tabela f 95% bilateral
 
Estudos epidemiológicos
Estudos epidemiológicosEstudos epidemiológicos
Estudos epidemiológicos
 
Formulario estatistica descritiva univariada e bivariava 2013
Formulario estatistica descritiva univariada e bivariava  2013Formulario estatistica descritiva univariada e bivariava  2013
Formulario estatistica descritiva univariada e bivariava 2013
 
34 nucleo e imagem de uma transformacao linear
34 nucleo e imagem de uma transformacao linear34 nucleo e imagem de uma transformacao linear
34 nucleo e imagem de uma transformacao linear
 
Aula1: Introdução á Bioestatística
Aula1: Introdução á BioestatísticaAula1: Introdução á Bioestatística
Aula1: Introdução á Bioestatística
 
Aula 12 intervalo de confiança
Aula 12   intervalo de confiançaAula 12   intervalo de confiança
Aula 12 intervalo de confiança
 
Curvas de nível
Curvas de nívelCurvas de nível
Curvas de nível
 
Estatistica aplicada exercicios resolvidos manual tecnico formando
Estatistica aplicada exercicios resolvidos manual tecnico formandoEstatistica aplicada exercicios resolvidos manual tecnico formando
Estatistica aplicada exercicios resolvidos manual tecnico formando
 
Relatório de química
Relatório de químicaRelatório de química
Relatório de química
 
Regressão Linear I
Regressão Linear IRegressão Linear I
Regressão Linear I
 
Aula 2 estudo transversal
Aula 2   estudo transversalAula 2   estudo transversal
Aula 2 estudo transversal
 
Testes hipot parametricos_pressupostos
Testes hipot parametricos_pressupostosTestes hipot parametricos_pressupostos
Testes hipot parametricos_pressupostos
 
Aula inferencia
Aula inferenciaAula inferencia
Aula inferencia
 
Estatistica descritiva
Estatistica descritiva Estatistica descritiva
Estatistica descritiva
 
Aula 12 medidas de dispersão
Aula 12   medidas de dispersãoAula 12   medidas de dispersão
Aula 12 medidas de dispersão
 

Similar a Aula 7 - Sistemas de informação

Aula 5 - Sistemas de informação
Aula 5 - Sistemas de informaçãoAula 5 - Sistemas de informação
Aula 5 - Sistemas de informaçãoCaroline Godoy
 
Aula 6 - Sistemas de informação
Aula 6 - Sistemas de informaçãoAula 6 - Sistemas de informação
Aula 6 - Sistemas de informaçãoCaroline Godoy
 
Aula 2 - Sistemas de informação
Aula 2 - Sistemas de informaçãoAula 2 - Sistemas de informação
Aula 2 - Sistemas de informaçãoCaroline Godoy
 
Processamento digital de sinais
Processamento digital de sinaisProcessamento digital de sinais
Processamento digital de sinaisLuiz Henrique
 
Processamento digital de sinais
Processamento digital de sinaisProcessamento digital de sinais
Processamento digital de sinaisLuiz Henrique
 
AMD - Aula n.º 2 - testes amostras independentes.pptx
AMD - Aula n.º 2 - testes amostras independentes.pptxAMD - Aula n.º 2 - testes amostras independentes.pptx
AMD - Aula n.º 2 - testes amostras independentes.pptxNunoSilva599593
 
Medida de risco por Teoria de Valores Extremos
Medida de risco por Teoria de Valores ExtremosMedida de risco por Teoria de Valores Extremos
Medida de risco por Teoria de Valores ExtremosRenato Vicente
 
Estatistica cap 1 2 3 e 4
Estatistica cap 1 2 3 e 4 Estatistica cap 1 2 3 e 4
Estatistica cap 1 2 3 e 4 diegogabandrade
 
Aula 6 - Educação física
Aula 6 - Educação físicaAula 6 - Educação física
Aula 6 - Educação físicaCaroline Godoy
 
A previsão do ibovespa através de um modelo de regressão linear múltipla - Da...
A previsão do ibovespa através de um modelo de regressão linear múltipla - Da...A previsão do ibovespa através de um modelo de regressão linear múltipla - Da...
A previsão do ibovespa através de um modelo de regressão linear múltipla - Da...Daniel Brandão de Castro
 
Regressão - aula 02/04
Regressão - aula 02/04Regressão - aula 02/04
Regressão - aula 02/04Rodrigo de Sá
 
Capitulo 8 gujarati resumo
Capitulo 8 gujarati resumoCapitulo 8 gujarati resumo
Capitulo 8 gujarati resumoMonica Barros
 

Similar a Aula 7 - Sistemas de informação (20)

Aula 5 - Sistemas de informação
Aula 5 - Sistemas de informaçãoAula 5 - Sistemas de informação
Aula 5 - Sistemas de informação
 
Aula 11 estimação
Aula 11   estimaçãoAula 11   estimação
Aula 11 estimação
 
Aula 6 - Sistemas de informação
Aula 6 - Sistemas de informaçãoAula 6 - Sistemas de informação
Aula 6 - Sistemas de informação
 
Aula 2 - Sistemas de informação
Aula 2 - Sistemas de informaçãoAula 2 - Sistemas de informação
Aula 2 - Sistemas de informação
 
Princípios de Estatística Inferencial - II
Princípios de Estatística Inferencial - IIPrincípios de Estatística Inferencial - II
Princípios de Estatística Inferencial - II
 
Processamento digital de sinais
Processamento digital de sinaisProcessamento digital de sinais
Processamento digital de sinais
 
Processamento digital de sinais
Processamento digital de sinaisProcessamento digital de sinais
Processamento digital de sinais
 
AMD - Aula n.º 2 - testes amostras independentes.pptx
AMD - Aula n.º 2 - testes amostras independentes.pptxAMD - Aula n.º 2 - testes amostras independentes.pptx
AMD - Aula n.º 2 - testes amostras independentes.pptx
 
Regressao linear multipla
Regressao linear multiplaRegressao linear multipla
Regressao linear multipla
 
Medida de risco por Teoria de Valores Extremos
Medida de risco por Teoria de Valores ExtremosMedida de risco por Teoria de Valores Extremos
Medida de risco por Teoria de Valores Extremos
 
V@R: Overview
V@R: Overview V@R: Overview
V@R: Overview
 
Aula 14 new
Aula 14 newAula 14 new
Aula 14 new
 
Introd inferencia
Introd inferenciaIntrod inferencia
Introd inferencia
 
Introd inferencia
Introd inferenciaIntrod inferencia
Introd inferencia
 
Estatistica cap 1 2 3 e 4
Estatistica cap 1 2 3 e 4 Estatistica cap 1 2 3 e 4
Estatistica cap 1 2 3 e 4
 
Aula 6 - Educação física
Aula 6 - Educação físicaAula 6 - Educação física
Aula 6 - Educação física
 
A previsão do ibovespa através de um modelo de regressão linear múltipla - Da...
A previsão do ibovespa através de um modelo de regressão linear múltipla - Da...A previsão do ibovespa através de um modelo de regressão linear múltipla - Da...
A previsão do ibovespa através de um modelo de regressão linear múltipla - Da...
 
Regressão - aula 02/04
Regressão - aula 02/04Regressão - aula 02/04
Regressão - aula 02/04
 
Capitulo 8 gujarati resumo
Capitulo 8 gujarati resumoCapitulo 8 gujarati resumo
Capitulo 8 gujarati resumo
 
Apostila 1 calculo i
Apostila 1 calculo iApostila 1 calculo i
Apostila 1 calculo i
 

Más de Caroline Godoy

Aula 5 - Educação física
Aula 5 - Educação físicaAula 5 - Educação física
Aula 5 - Educação físicaCaroline Godoy
 
Aula 4 - Sistemas de informação
Aula 4 - Sistemas de informaçãoAula 4 - Sistemas de informação
Aula 4 - Sistemas de informaçãoCaroline Godoy
 
Aula 4 - Educação física
Aula 4 - Educação físicaAula 4 - Educação física
Aula 4 - Educação físicaCaroline Godoy
 
Aula 3 - Sistemas de informação
Aula 3 - Sistemas de informaçãoAula 3 - Sistemas de informação
Aula 3 - Sistemas de informaçãoCaroline Godoy
 
Aula 3 - Educação física
Aula 3  - Educação físicaAula 3  - Educação física
Aula 3 - Educação físicaCaroline Godoy
 
Aula 2 educação física
Aula 2   educação físicaAula 2   educação física
Aula 2 educação físicaCaroline Godoy
 
Aula 1 - Estatística Inferencial
Aula 1 - Estatística InferencialAula 1 - Estatística Inferencial
Aula 1 - Estatística InferencialCaroline Godoy
 

Más de Caroline Godoy (7)

Aula 5 - Educação física
Aula 5 - Educação físicaAula 5 - Educação física
Aula 5 - Educação física
 
Aula 4 - Sistemas de informação
Aula 4 - Sistemas de informaçãoAula 4 - Sistemas de informação
Aula 4 - Sistemas de informação
 
Aula 4 - Educação física
Aula 4 - Educação físicaAula 4 - Educação física
Aula 4 - Educação física
 
Aula 3 - Sistemas de informação
Aula 3 - Sistemas de informaçãoAula 3 - Sistemas de informação
Aula 3 - Sistemas de informação
 
Aula 3 - Educação física
Aula 3  - Educação físicaAula 3  - Educação física
Aula 3 - Educação física
 
Aula 2 educação física
Aula 2   educação físicaAula 2   educação física
Aula 2 educação física
 
Aula 1 - Estatística Inferencial
Aula 1 - Estatística InferencialAula 1 - Estatística Inferencial
Aula 1 - Estatística Inferencial
 

Aula 7 - Sistemas de informação

  • 1. Caroline Godoy Turma : Sistemas de Informação
  • 2. Última aula • Comparação de duas amostras independentes e dependentes; • Comparação de duas populações – proporções; • ANOVA (Análise de Variâncias): teste para comparar as diversas médias; • Conceitos e exemplos;
  • 3. ANOVA Princípio da ANOVA • Estabelecer um modelo que possa representar os valores observados na seguinte forma: Observação = previsível + aleatória • Ou seja, cada resposta obtida é resultado de algo controlado ou previsível, que incorpora o conhecimento que se tem sobre o assunto (expressa em termos de uma função matemática com parâmetros desconhecidos); + uma parte aleatória que pode ser representada por um modelo probabilístico;
  • 4. ANOVA Princípio da ANOVA YNx1  X Nxa  ax1   Nx1 X Nxa  ax1
  • 5. ANOVA Modelo estatístico (one-way): Tratamentos y ij  μ i  ε ij Efeito aleatório i=1,2,...,a, j Efeito comum  μ  τ i  ε ij =1,2,...,r   Observações μi Efeito específico yij= é a j-ésima observação do i-ésimo tratamento; i é média do i-ésimo tratamento  é uma constante para todas as observações (média geral); i é o efeito do i-ésimo tratamento; ij é o erro aleatório(erros de medida, fatores não controláveis, diferenças entre as unidades experimentais, etc.). Pressuposições: 1) os erros aleatórios são independentes; 2) os erros aleatórios são normalmente distribuídos; 3) os erros aleatórios tem média 0 (zero) e variância 2; Ou, então: yij ~ N (   i ; 2 ) e independentes 5
  • 6. ANOVA ANOVA – Análise de Variância • Objetivo: Utilizar a partição da variabilidade total da variável resposta (medida de interesse para comparação) como critério para o teste de igualdade entre as populações. ou seja, quando ni é igual para todas as unidades experimentais Aqui trabalharemos com experimentos balanceados e chamaremos a quantidade de observações de r
  • 7. ANOVA ANOVA – Análise de Variância a r r = r r
  • 8. ANOVA ANOVA – Análise de Variância r i=1 j=1 a
  • 9. ANOVA Decomposição da soma de quadrados total A denominação de análise de variância resulta de decompor a variabilidade total dos dados em suas componentes. A soma de quadrado total (SQT) corrigido pela média global, SQT   y ij  y..  , a r 2 i 1 j1 usa-se como medida de variabilidade total dos dados. Pode-se mostrar que a soma de quadrados total pode ser expressa através da seguinte relação:  y ij  y..   n  y i.  y ..    y ij  y i.  a r a a r 2 2 2 i 1 j1     1    i    i 1 j1   SQT SQtrat SQE Espera-se valores Espera-se valores grandes pequenos
  • 10. ANOVA Graus de liberdade: SQT tem ar-1 graus de liberdade; SQTrat tem a-1 g.l. e SQE tem a(r-1) g.l. Quadrados médios: QMTrat  SQTrat a 1 QME  a(r-1) SQE Variância entre amostras Dentro das amostras Esperanças dos quadrados médios: E(QME) = 2 a r  τ i2 E(QMTrat)  σ 2  i 1 a 1 QMTrat Teste de hipótese: F 0  QME
  • 11. ANOVA Análise Estatística F0 = QMTrat / QME Critério para rejeição de H0: F0 > F,a-1,n-a . Pode-se usar o nível descritivo (em inglês: p-value: É o menor valor de  para o qual rejeitamos a hipótese nula. Exemplo: para =5%, assim, se o nível descritivo < do que 0,05  rejeitar H0, caso contrário,  aceitar H0. Fórmulas para o cálculo das somas de quadrados: a r 2 y.. SQT   yij  2 i 1 j1 n Hipóteses: H0: 1= 2=...= a =  2 1 a 2 y.. H1: i  ᵥ para pelo menos um par (i,v) SQTrat   y i.  Equivalentemente r i 1 n Hipóteses: H0: 1=  2=...=  a =0 H1:  i  0 para pelo menos um i SQE  SQT  SQTrat
  • 12. ANOVA Tabela da análise de variância de um experimento com um fator. Causas de Soma de Graus de Quadrados F0 Valor p variação quadrados liberdade médios Entre SQTrat a-1 QMTrat QMTrat tratamentos QME Erro (dentro SQE n-a QME tratamentos) Total SQT n-1 n=ar  y ij  y..   n  y i.  y ..    y ij  y i.  a r a a r 2 2 2 i 1 j1     1    i    i 1 j1   SQT SQtrat SQE
  • 13. ANOVA Coeficiente de Determinação • Medida de Proporção da variabilidade total explicada pelo modelo obtido. (Quanto da variável resposta é explicada pelos tratamentos) SQTrat R2  SQTot • Considera-se aceitável um coeficiente acima de 0,70 ou 70% • Serve para avaliar se o teste foi eficiente
  • 14. ANOVA Exemplo: Considerando o exemplo temos: Tratamentos (servidores) A B C D 64 78 75 55 a=4 72 91 93 66 r=6 68 97 78 49 ar = 24=n 77 82 71 64 56 85 63 70 95 77 76 68 Total (yi. ) 432 510 456 372 1770 y.. Média y i.  72 85 76 62 73.75 y ..  y ij 2 31994 43652 35144 23402 134192  y ij 2 j i, j
  • 15. ANOVA Exemplo SQT  134192  17702  134192  130558  3654 24    FC 432 2  510 2  456 2  372 2 SQTrat   FC  132174  130559  1636 6 SQE  SQT  SQTrat  3654  1636  2018 Montar a Tabela ou
  • 16. ANOVA Análise de Variância Causas de Variação GL SQ QM F Servidores 3 1636 545.3 5.40** (entre servidores) Erro Experimental 20 2018 100.9 (dentro de servidores) Total 23 3654 F.013.20   4,94 **SIGNIFICATIVO A 1%
  • 17. ANOVA Análise de Variância F 0  5.40  F 0.01;(3;20)  4.94 A diferença entre médias de tratamentos é significativa Rejeita-se H0
  • 18. ANOVA Análise de Variância CONCLUSÃO Os servidores investigados se diferenciam em termos de tempo de transmissão de dados
  • 19. ANOVA Software R dados=read.table("anova.txt",header=T) attach(dados) # Gráfico de boxplot boxplot(Tempo~Servidor,xlab="Servidores",ylab="Tempo") # Tabela de anova fit= aov(Tempo ~ Servidor, dados) anova(fit)
  • 20. ANOVA Diagnóstico do Modelo Verificar se as pressuposições básicas do modelo são válidas. Isso é realizado através de uma análise de resíduos. Pressuposições: 1) os erros aleatórios são independentes; 2) os erros aleatórios são normalmente distribuídos; 3) os erros aleatórios tem média 0 (zero) e variância 2; 1) Define-se o resíduo da ij-ésima observação como: Não será abordada e ij  y ij  y ij ˆ (homoscedasticidade) onde yij  μ  τ i  yi.  valores preditos pelo modelo. ˆ ˆ ˆ A suposição de normalidade Vamos usar o gráfico normal de probabilidades: sob normalidade dos erros este gráfico deve apresentar uma forma de reta.
  • 21.
  • 22.
  • 23. Software R ## Análise de residuos V_ajustados=fitted(fit) # Valores preditos res=residuals(fit) # Valores residuais # Gráfico de probabilidade qqnorm(res, pch=20) qqline(res) ## Gráfico de valores preditos e residuais plot(V_ajustados,res, pch=20,ylab="Residuos", xlab="Valores ajustados") abline(h=0,lty=2) title(main=" Plot dos residuos vs valores ajustados")
  • 24. Comparações entre Pares de Médias • Quando rejeitamos Ho ou seja, quando pelo menos uma média é diferente e quando as pressuposições dos resíduos são aceitas, podemos comparar as diferentes médias e dizer qual é diferente das demais • Devem ser realizadas após o teste F da análise de variância rejeitar a hipótese nula • Existem vários testes como Intervalo de Bonferroni, LSD, porém o preferido dos pesquisadores é o Teste de Tukey
  • 25. Teste de Tukey Duas médias são diferentes significativamente se a diferença das médias amostrais (em valor absoluto) for superior a DMS (Diferença Mínima Significativa): QME IC ( i  k )  ( yi  yk )  q ;n 1 n Onde q é um apropriado nível de confiança superior da amplitude studentizada para k médias (tratamentos) e f graus de liberdade associados a estimativa s2 de 2 (QME). Exemplo: dados dos servidores. O valor da Diferença Mínima Significativa é: diff lwr upr p adj A-D 10 -6.232221 26.23222 0.3378150 Conclusão: pelo teste de C-D 14 -2.232221 30.23222 0.1065573 Tukey, ao nível de significância de 5%, as médias dos B-D 23 6.767779 39.23222 0.0039064 servidores B e D, apresentam diferença significativa. C-A 4 -12.232221 20.23222 0.8998057 B-A 13 -3.232221 29.23222 0.1461929 B-C 9 -7.232221 25.23222 0.4270717
  • 26. Software R TukeyHSD(fit, ordered = TRUE)
  • 27.
  • 30. Exercício Não rejeitamos Ho a um nível de 5%
  • 31. Exercício Não rejeitamos Ho a um nível de 5%
  • 33. Exercício Valores em torno da média 0
  • 34. ANOVA COM 2 FATORES • Mesma ideia de um fator: • Gráfico de Interação: A interação entre os fatores corresponde a diferença de comportamento de um fator nos diferentes níveis do outro fator com respeito a característica de interesse. Uma das forma mais simples de avaliarmos a interação entre os fatores é o gráfico de interação.
  • 35. ANOVA COM 2 FATORES • Mesma ideia de um fator: Não há interação