Análises Multivariadas

Correlações e Análises Multivariadas
Cristiano Lemes

Análises que serão abordadas
• Análise de Variância:
– Correlações Fenotípica, Genotípica e Residual
• Correlações:
– Simples ou de Pearson;
– Teste Mantel
– Correlações de Spearman
– Dispersão Gráfica
• Análises de Trilha
– Análise de trilha simples
– Análise de trilha com colinearidade

Análises que serão abordadas
• Métodos de Agrupamento:
– Variáveis Canônicas
– Componentes Principais
– Tocher (método de otimização)
– Correlação cofenética
– Transformar matriz de similaridade em dissimilaridade
• Dissimilaridade:
– Distância Euclidiana (baseada no arquivo de medias)
– Distância Mahalabonis (considera as repetições)
• Bootstrap e ponto de corte em dendogramas.
• Dissimilaridade através de marcadores:
– morfológicos
– moleculares
– Analise combinada (morfológico+molecular).

Análise de Variância
Tem o objetivo de avaliar se as diferenças observadas entre as médias das
amostras são estatisticamente significantes.
- Tabular os dados no Excel;
- Usar PONTO no lugar de VÍRGULA para separar as casas decimais (Ctrl
+ L ou em configurações locais);
- De preferência organizar as análises em planilhas do mesmo arquivo;

Clicar em “Entrada de dados”

Colar o conjuto de dados aqui
Posteriormente salvar isso clicando no
local indicado pela seta

Seguir os passos conforme esta inlustrado acima

Clicar aqui para abrir
o arquivo a ser
analisado

Abrir o arquivo
Depois de
abrir, clicar em Sair

O próximo passo e clicar em
“Declaração de Parâmetros”
Completar os itens
solicitados conforme os
dados do experimento a
ser analisado
Em seguida clicar em
retornar
Nomear as variaveis a serem
analisadas

Criar um novo arquivo
com o nome das
variáveis

Clicar em “Nome das Variáveis” e seguir os passos acima ate
encontrar o arquivo com o nome das mesmas criado
anteriormente

Localizar o arquivo
Posteriormente clicar
em finalizar

Clicar em “ANOVA” para
rodar a análise

Exportar análise para o
Excel

Ao final dessa saída da ANOVA
encontram-se as matrizes de
correlação
Fenotípica, Genotípica e
Residual
Recomenda-se colar essa análise em um nova
planilha do arquivo original dos dados

- Em seguida voltar ao Genes e clicar em “Finalizar” análise
- Salvar as matrizes de interesse que estao disponíveis para
serem usada em análises posteriores
- Clicar em “Processar”

Pode-se também solicitar
apenas o “Resumo” da Anova

Correlações
Permite avaliar a magnitude e o sentido
das relações entre caracteres.
- Correlações rfe, rge e rre;
- Correlações Simples (Pearson): feita a
partir do arquivo de medias, (DAD.med);
-Teste Mantel: permite testar a
significâncias de associações em várias
simulações;
- Correlação de Spearman: para dados
não paramétricos
Dispersão Gráfica: permite a
visualização das associações
entre caracteres baseado nas
correlações simples dos
mesmos

- Declarar Parâmetros
- Dar um nome para o arquivo de
saída
- O campo “Código para Valores
Perdidos” não precisa ser preenchido
- Retornar
- Nomear as variáveis

Na sequência clicar em “Processar”
Clicar em “OK” na janela que aparece depois

Encontrar o menor valor
de correlação significativo
para o nível de
sgnificância adotado.

- Encontrar o arquivo de Saída
- Exportá-lo para o Excel

Teste Mantel
Usar o mesmo arquivo de médias para rodar o teste Mantel

- Nomear um arquivo de saída
-Definir um número de
simulações
- Processar

Correlação de Spearman
- Usar o mesmo arquivo
de médias
- Renomear o arquivo de
saída

- Localizar o arquivo de saida e
exportá-lo para o Excel

- Formatar os dados
- Identificar cada coluna com suas
respectivas variáveis

Dispersão Gráfica
Usar o mesmo arquivo de médias para visualizar a dispersão gráfica

Análise de Trilha
Analisa o efeito direto de uma variável independente (x) sobre uma
variável dependente (y) após a remoção da influência de todas as
outras variáveis independentes (xi) incluídas na análise.

Abrir o arquivo de correlações fenotípicas “rfe.dat”

-Declarar Parâmetros
- Informar o número variáveis do arquivo “rfe.dat”

-Clicar em “Processar”
- Informar as Variáveis e em seguida clicar em “Prosseguir”

- Analisar o arquivo de saída

Análise de Trilha com Colineariedade

-Declarar Parâmetros
- Informar o número variáveis
do arquivo “rfe.dat”

Deve-se escolher o menor valor de “K” para o qual a maioria dos coeficientes de
trilha, associados aos vários caracteres esteje estabilizado.

Variáveis Canônicas
- Técnica de Dispersão Gráfica
- exige experimento com delineamento experimental (repetições)
- Para serem representativos as 2 primeiras variáveis devem explicar
pelo menos 80% da variação original dos dados;

- Abrir arquivo de médias
- Em “Dispersão” completar com o “cre”
- Declarar o número de variáveis
- Nomear variáveis

Nesse caso
as 2
primeiras
variáveis
explicam
mais de
80% da
variação
original dos
dados

Componentes Principais
- Técnica de Dispersão Gráfica
- Permitem a identificação da divergência genética
- Não exige experimentos com delineamento experimental (usa-se apenas
o arquivo de médias)
- Para ser representativo os 2 primeiros componentes devem explicar
pelo menos 80% da variação original dos dados.

Nesse caso os
2 primeiros
componentes
explicam
mais de 80%
da variação
original dos
dados

Tocher
- Método de Agrupamento
- A média das medidas de distância dentro de cada grupo deve ser menor
do que as distâncias médias entre quaisquer grupo
- Não permite comparar acessos dentro do mesmo do mesmo grupo

Dissimilaridade - Distância de Euclidiana
- Experimentos que não contemplam delineamento
- Análise feita apartir do arquivo de médias
- Matriz de Distância Genética ou dendogramas

- Saída do Dendograma
- Desvantagem do Genes, ausência de mecanismos de formatação

Dissimilaridade - Distância de Mahalanobis
- Leva em conta as variâncias e covariâncias e correlações residuais
entre os caracteres aferidos.
- Considera as repetições experimentais

-Nomear as Variáveis
- Gerar Matriz
-Processar Agrupamento
-Fazer Bootstrap
-Testa a consistência das bifurcações em porcentagem a partir de um
número determinado de simulações

Contribuição Relativa dos Caracteres – Singh 1981
Identificação dos caracteres que mais contribuíram para a
dissimilaridade genética

Dendograma gerado a partir da matriz de distância de Mahalanobis

Correlação Cofenética
Mede a correlação (ajuste) entre a matriz de distância original e as distâncias
apresentadas no dendrograma.
Muito importante quando são realizadas inferências com base no
dendrograma

Abrir a “matriz de distância genética” que se deseja analisar

Cosntruindo dendogramas no Ntsys
- Abrir a “matriz de distância
genética” no Genes
- Formatá-lo conforme o
modelo ao lado

- No NTSYS, em clustering, clicar em
SAHN, e no Imput file abrir a matriz de
dissimilaridade (Excel)
-

No output tree file, digitar
um nome de saída
(exemplo DE =
dendrograma)
Em Clustering methods deixar UPGMA; aí
pedir para rodar (Compute), Com isso vai
abrir uma janela de escritas que pode ser
fechada, e após deves buscar no canto
inferior esquerdo da janela uma figura
pequena em forma de dendrograma:
Clicando nela aparece a FIGURA que pode
ser formatada conforme interesse, sendo
salva formato metafile.

Conforme exposto acima, o programa Ntsys possui vários
mecanismos que podem ser ajustados para formatar os
dendogramas da mais adequada a cada situação

Matriz Mahalanobis - Ntsys
Idem passos anteriores para
construção do dendograma a partir
da matriz de Distância Euclidiana

CCC no Ntsys
Lembrar do arquivo de
saída que foi salvo
anteriormente

- Antes de começar o cálculo do CCC refazer analise de dissimilaridade
no Ntsys, substituindo o nome dos genótipos por letras.
- Calcular a matriz cofenética a partir do dentrograma que foi salvo
(DE). Isto é feito no mesmo local clustering, clicar em Cophenetic
values, e em Imput tree file abrir o DE e na Output Coph file, colocar
um nome de saída (COEF de cofenético).
- Feito isso clicar em “Compute”.

-Depois, clicar em Graphics, em seguida em Matrix comprison
plot, e no Input file 1 (X) abrir a matriz de dissimilaridade do
Excel, aquela do inicio, e no Input file 2 (X), abrir a matriz cofenética
de nome salvo (COEF).
- No Input file 3 (X) não vai nada. No Number of
permutations, digitar 1000. (feito isso pedir para rodar). Vai abrir um
gráfico que quando fechado aparece uma janela de escritas, e em
uma delas aparece o valor da correlação entre as matrizes e que é o
valor cofenético.

Cálculo de Similaridade Genética a partir de
Marcadores Moleculares
- Juntar todos os marcadores polimórficos em única planilha do Excel
- Colocar nome dos genótipos e números de códigos (exemplo 1=cálculo
da similaridade; 10=número de genótipos; 182=número de
marcadores utilizados)

- No NTSYS: entrar em Similarity, depois em quantitative date e
no Input file one buscar a planilha de dados do Excel com os
códigos, genótipos e marcadores.
- Deixar clicado X em By rows, Coefficient clicar em DICE, e em
Output file escrever qualquer nome de saída do arquivo de
similaridade (só escrever o nome que ele salva no mesmo lugar
que foi buscada a planilha de dados anterior.
- Rodar a análise (compute)

Transformá-la em
dissimilaridade genética
(1 menos os valores de
similaridade que abrirem
Após, sem números em
formato de fórmula, inserir uma
coluna e duas linhas, colocando
o nome dos genótipos em forma
de matriz, porém, nas primeiras
três células da linha digitar os
códigos: 2=indica cálculo de
dissimilaridade, 10 e 10=
indicam a dimensão da matriz.

Análises Multivariadas

Recomendados

Recomendados

Más contenido relacionado

La actualidad más candente

La actualidad más candente (20)

Similar a Análises Multivariadas

Similar a Análises Multivariadas (13)

Análises Multivariadas