1) O documento descreve vários métodos de análises multivariadas que serão abordados, incluindo análise de variância, correlações, análises de trilha, métodos de agrupamento, dissimilaridade e análises combinadas utilizando marcadores.
2) São detalhados os passos para executar análise de variância, correlações, análises de trilha, variáveis canônicas, componentes principais, método de Tocher, distâncias de Euclidiana e Mahalanobis no software Genes.
3) Também
2. Análises que serão abordadas
• Análise de Variância:
– Correlações Fenotípica, Genotípica e Residual
• Correlações:
– Simples ou de Pearson;
– Teste Mantel
– Correlações de Spearman
– Dispersão Gráfica
• Análises de Trilha
– Análise de trilha simples
– Análise de trilha com colinearidade
3. Análises que serão abordadas
• Métodos de Agrupamento:
– Variáveis Canônicas
– Componentes Principais
– Tocher (método de otimização)
– Correlação cofenética
– Transformar matriz de similaridade em dissimilaridade
• Dissimilaridade:
– Distância Euclidiana (baseada no arquivo de medias)
– Distância Mahalabonis (considera as repetições)
• Bootstrap e ponto de corte em dendogramas.
• Dissimilaridade através de marcadores:
– morfológicos
– moleculares
– Analise combinada (morfológico+molecular).
4. Análise de Variância
Tem o objetivo de avaliar se as diferenças observadas entre as médias das
amostras são estatisticamente significantes.
- Tabular os dados no Excel;
- Usar PONTO no lugar de VÍRGULA para separar as casas decimais (Ctrl
+ L ou em configurações locais);
- De preferência organizar as análises em planilhas do mesmo arquivo;
12. O próximo passo e clicar em
“Declaração de Parâmetros”
Completar os itens
solicitados conforme os
dados do experimento a
ser analisado
Em seguida clicar em
retornar
Nomear as variaveis a serem
analisadas
18. Ao final dessa saída da ANOVA
encontram-se as matrizes de
correlação
Fenotípica, Genotípica e
Residual
Recomenda-se colar essa análise em um nova
planilha do arquivo original dos dados
19. - Em seguida voltar ao Genes e clicar em “Finalizar” análise
- Salvar as matrizes de interesse que estao disponíveis para
serem usada em análises posteriores
- Clicar em “Processar”
21. Correlações
Permite avaliar a magnitude e o sentido
das relações entre caracteres.
- Correlações rfe, rge e rre;
- Correlações Simples (Pearson): feita a
partir do arquivo de medias, (DAD.med);
-Teste Mantel: permite testar a
significâncias de associações em várias
simulações;
- Correlação de Spearman: para dados
não paramétricos
Dispersão Gráfica: permite a
visualização das associações
entre caracteres baseado nas
correlações simples dos
mesmos
23. - Declarar Parâmetros
- Dar um nome para o arquivo de
saída
- O campo “Código para Valores
Perdidos” não precisa ser preenchido
- Retornar
- Nomear as variáveis
24. Na sequência clicar em “Processar”
Clicar em “OK” na janela que aparece depois
25. Encontrar o menor valor
de correlação significativo
para o nível de
sgnificância adotado.
26. - Encontrar o arquivo de Saída
- Exportá-lo para o Excel
38. Análise de Trilha
Analisa o efeito direto de uma variável independente (x) sobre uma
variável dependente (y) após a remoção da influência de todas as
outras variáveis independentes (xi) incluídas na análise.
49. Deve-se escolher o menor valor de “K” para o qual a maioria dos coeficientes de
trilha, associados aos vários caracteres esteje estabilizado.
50.
51.
52. Variáveis Canônicas
- Técnica de Dispersão Gráfica
- exige experimento com delineamento experimental (repetições)
- Para serem representativos as 2 primeiras variáveis devem explicar
pelo menos 80% da variação original dos dados;
53. - Abrir arquivo de médias
- Em “Dispersão” completar com o “cre”
- Declarar o número de variáveis
- Nomear variáveis
56. Componentes Principais
- Técnica de Dispersão Gráfica
- Permitem a identificação da divergência genética
- Não exige experimentos com delineamento experimental (usa-se apenas
o arquivo de médias)
- Para ser representativo os 2 primeiros componentes devem explicar
pelo menos 80% da variação original dos dados.
57.
58.
59. Nesse caso os
2 primeiros
componentes
explicam
mais de 80%
da variação
original dos
dados
60.
61. Tocher
- Método de Agrupamento
- A média das medidas de distância dentro de cada grupo deve ser menor
do que as distâncias médias entre quaisquer grupo
- Não permite comparar acessos dentro do mesmo do mesmo grupo
62.
63.
64.
65. Dissimilaridade - Distância de Euclidiana
- Experimentos que não contemplam delineamento
- Análise feita apartir do arquivo de médias
- Matriz de Distância Genética ou dendogramas
66.
67.
68.
69.
70.
71. - Saída do Dendograma
- Desvantagem do Genes, ausência de mecanismos de formatação
72.
73. Dissimilaridade - Distância de Mahalanobis
- Leva em conta as variâncias e covariâncias e correlações residuais
entre os caracteres aferidos.
- Considera as repetições experimentais
74.
75. -Nomear as Variáveis
- Gerar Matriz
-Processar Agrupamento
-Fazer Bootstrap
-Testa a consistência das bifurcações em porcentagem a partir de um
número determinado de simulações
76.
77. Contribuição Relativa dos Caracteres – Singh 1981
Identificação dos caracteres que mais contribuíram para a
dissimilaridade genética
81. Correlação Cofenética
Mede a correlação (ajuste) entre a matriz de distância original e as distâncias
apresentadas no dendrograma.
Muito importante quando são realizadas inferências com base no
dendrograma
82. Abrir a “matriz de distância genética” que se deseja analisar
83.
84. Cosntruindo dendogramas no Ntsys
- Abrir a “matriz de distância
genética” no Genes
- Exportá-lo para o Excel
- Formatá-lo conforme o
modelo ao lado
85. - No NTSYS, em clustering, clicar em
SAHN, e no Imput file abrir a matriz de
dissimilaridade (Excel)
-
86. No output tree file, digitar
um nome de saída
(exemplo DE =
dendrograma)
Em Clustering methods deixar UPGMA; aí
pedir para rodar (Compute), Com isso vai
abrir uma janela de escritas que pode ser
fechada, e após deves buscar no canto
inferior esquerdo da janela uma figura
pequena em forma de dendrograma:
Clicando nela aparece a FIGURA que pode
ser formatada conforme interesse, sendo
salva formato metafile.
87.
88. Conforme exposto acima, o programa Ntsys possui vários
mecanismos que podem ser ajustados para formatar os
dendogramas da mais adequada a cada situação
96. - Antes de começar o cálculo do CCC refazer analise de dissimilaridade
no Ntsys, substituindo o nome dos genótipos por letras.
- Calcular a matriz cofenética a partir do dentrograma que foi salvo
(DE). Isto é feito no mesmo local clustering, clicar em Cophenetic
values, e em Imput tree file abrir o DE e na Output Coph file, colocar
um nome de saída (COEF de cofenético).
- Feito isso clicar em “Compute”.
97. -Depois, clicar em Graphics, em seguida em Matrix comprison
plot, e no Input file 1 (X) abrir a matriz de dissimilaridade do
Excel, aquela do inicio, e no Input file 2 (X), abrir a matriz cofenética
de nome salvo (COEF).
- No Input file 3 (X) não vai nada. No Number of
permutations, digitar 1000. (feito isso pedir para rodar). Vai abrir um
gráfico que quando fechado aparece uma janela de escritas, e em
uma delas aparece o valor da correlação entre as matrizes e que é o
valor cofenético.
98.
99.
100. Cálculo de Similaridade Genética a partir de
Marcadores Moleculares
- Juntar todos os marcadores polimórficos em única planilha do Excel
- Colocar nome dos genótipos e números de códigos (exemplo 1=cálculo
da similaridade; 10=número de genótipos; 182=número de
marcadores utilizados)
101. - No NTSYS: entrar em Similarity, depois em quantitative date e
no Input file one buscar a planilha de dados do Excel com os
códigos, genótipos e marcadores.
- Deixar clicado X em By rows, Coefficient clicar em DICE, e em
Output file escrever qualquer nome de saída do arquivo de
similaridade (só escrever o nome que ele salva no mesmo lugar
que foi buscada a planilha de dados anterior.
- Rodar a análise (compute)
102.
103. Transformá-la em
dissimilaridade genética
(1 menos os valores de
similaridade que abrirem
Após, sem números em
formato de fórmula, inserir uma
coluna e duas linhas, colocando
o nome dos genótipos em forma
de matriz, porém, nas primeiras
três células da linha digitar os
códigos: 2=indica cálculo de
dissimilaridade, 10 e 10=
indicam a dimensão da matriz.