SlideShare una empresa de Scribd logo
1 de 104
Correlações e Análises Multivariadas
Cristiano Lemes
Análises que serão abordadas
• Análise de Variância:
– Correlações Fenotípica, Genotípica e Residual
• Correlações:
– Simples ou de Pearson;
– Teste Mantel
– Correlações de Spearman
– Dispersão Gráfica
• Análises de Trilha
– Análise de trilha simples
– Análise de trilha com colinearidade
Análises que serão abordadas
• Métodos de Agrupamento:
– Variáveis Canônicas
– Componentes Principais
– Tocher (método de otimização)
– Correlação cofenética
– Transformar matriz de similaridade em dissimilaridade
• Dissimilaridade:
– Distância Euclidiana (baseada no arquivo de medias)
– Distância Mahalabonis (considera as repetições)
• Bootstrap e ponto de corte em dendogramas.
• Dissimilaridade através de marcadores:
– morfológicos
– moleculares
– Analise combinada (morfológico+molecular).
Análise de Variância
Tem o objetivo de avaliar se as diferenças observadas entre as médias das
amostras são estatisticamente significantes.
- Tabular os dados no Excel;
- Usar PONTO no lugar de VÍRGULA para separar as casas decimais (Ctrl
+ L ou em configurações locais);
- De preferência organizar as análises em planilhas do mesmo arquivo;
Clicar em “Entrada de dados”
Clicar em “NOVO”
Colar o conjuto de dados aqui
Posteriormente salvar isso clicando no
local indicado pela seta
Seguir os passos conforme esta inlustrado acima
Clicar aqui para abrir
o arquivo a ser
analisado
Clicar em “Abrir”
Abrir o arquivo
Depois de
abrir, clicar em Sair
O próximo passo e clicar em
“Declaração de Parâmetros”
Completar os itens
solicitados conforme os
dados do experimento a
ser analisado
Em seguida clicar em
retornar
Nomear as variaveis a serem
analisadas
Criar um novo arquivo
com o nome das
variáveis
Clicar em “Nome das Variáveis” e seguir os passos acima ate
encontrar o arquivo com o nome das mesmas criado
anteriormente
Localizar o arquivo
Posteriormente clicar
em finalizar
Clicar em “ANOVA” para
rodar a análise
Exportar análise para o
Excel
Ao final dessa saída da ANOVA
encontram-se as matrizes de
correlação
Fenotípica, Genotípica e
Residual
Recomenda-se colar essa análise em um nova
planilha do arquivo original dos dados
- Em seguida voltar ao Genes e clicar em “Finalizar” análise
- Salvar as matrizes de interesse que estao disponíveis para
serem usada em análises posteriores
- Clicar em “Processar”
Pode-se também solicitar
apenas o “Resumo” da Anova
Correlações
Permite avaliar a magnitude e o sentido
das relações entre caracteres.
- Correlações rfe, rge e rre;
- Correlações Simples (Pearson): feita a
partir do arquivo de medias, (DAD.med);
-Teste Mantel: permite testar a
significâncias de associações em várias
simulações;
- Correlação de Spearman: para dados
não paramétricos
Dispersão Gráfica: permite a
visualização das associações
entre caracteres baseado nas
correlações simples dos
mesmos
Abrir arquivo de médias
- Declarar Parâmetros
- Dar um nome para o arquivo de
saída
- O campo “Código para Valores
Perdidos” não precisa ser preenchido
- Retornar
- Nomear as variáveis
Na sequência clicar em “Processar”
Clicar em “OK” na janela que aparece depois
Encontrar o menor valor
de correlação significativo
para o nível de
sgnificância adotado.
- Encontrar o arquivo de Saída
- Exportá-lo para o Excel
Teste Mantel
Usar o mesmo arquivo de médias para rodar o teste Mantel
- Nomear um arquivo de saída
-Definir um número de
simulações
- Processar
Correlação de Spearman
- Usar o mesmo arquivo
de médias
- Renomear o arquivo de
saída
- Localizar o arquivo de saida e
exportá-lo para o Excel
- Formatar os dados
- Identificar cada coluna com suas
respectivas variáveis
Spearman
Pearson
Dispersão Gráfica
Usar o mesmo arquivo de médias para visualizar a dispersão gráfica
Análise de Trilha
Analisa o efeito direto de uma variável independente (x) sobre uma
variável dependente (y) após a remoção da influência de todas as
outras variáveis independentes (xi) incluídas na análise.
Abrir o arquivo de correlações fenotípicas “rfe.dat”
-Declarar Parâmetros
- Informar o número variáveis do arquivo “rfe.dat”
- Nomear as variáveis
-Clicar em “Processar”
- Informar as Variáveis e em seguida clicar em “Prosseguir”
- Analisar o arquivo de saída
- Exportá-lo para o Excel
Análise de Trilha com Colineariedade
Abrir o arquivo de correlações fenotípicas “rfe.dat”
-Declarar Parâmetros
- Informar o número variáveis
do arquivo “rfe.dat”
- Nomear as variáveis
Deve-se escolher o menor valor de “K” para o qual a maioria dos coeficientes de
trilha, associados aos vários caracteres esteje estabilizado.
Variáveis Canônicas
- Técnica de Dispersão Gráfica
- exige experimento com delineamento experimental (repetições)
- Para serem representativos as 2 primeiras variáveis devem explicar
pelo menos 80% da variação original dos dados;
- Abrir arquivo de médias
- Em “Dispersão” completar com o “cre”
- Declarar o número de variáveis
- Nomear variáveis
Nesse caso
as 2
primeiras
variáveis
explicam
mais de
80% da
variação
original dos
dados
Componentes Principais
- Técnica de Dispersão Gráfica
- Permitem a identificação da divergência genética
- Não exige experimentos com delineamento experimental (usa-se apenas
o arquivo de médias)
- Para ser representativo os 2 primeiros componentes devem explicar
pelo menos 80% da variação original dos dados.
Nesse caso os
2 primeiros
componentes
explicam
mais de 80%
da variação
original dos
dados
Tocher
- Método de Agrupamento
- A média das medidas de distância dentro de cada grupo deve ser menor
do que as distâncias médias entre quaisquer grupo
- Não permite comparar acessos dentro do mesmo do mesmo grupo
Dissimilaridade - Distância de Euclidiana
- Experimentos que não contemplam delineamento
- Análise feita apartir do arquivo de médias
- Matriz de Distância Genética ou dendogramas
- Saída do Dendograma
- Desvantagem do Genes, ausência de mecanismos de formatação
Dissimilaridade - Distância de Mahalanobis
- Leva em conta as variâncias e covariâncias e correlações residuais
entre os caracteres aferidos.
- Considera as repetições experimentais
-Nomear as Variáveis
- Gerar Matriz
-Processar Agrupamento
-Fazer Bootstrap
-Testa a consistência das bifurcações em porcentagem a partir de um
número determinado de simulações
Contribuição Relativa dos Caracteres – Singh 1981
Identificação dos caracteres que mais contribuíram para a
dissimilaridade genética
Dendograma gerado a partir da matriz de distância de Mahalanobis
Correlação Cofenética
Mede a correlação (ajuste) entre a matriz de distância original e as distâncias
apresentadas no dendrograma.
Muito importante quando são realizadas inferências com base no
dendrograma
Abrir a “matriz de distância genética” que se deseja analisar
Cosntruindo dendogramas no Ntsys
- Abrir a “matriz de distância
genética” no Genes
- Exportá-lo para o Excel
- Formatá-lo conforme o
modelo ao lado
- No NTSYS, em clustering, clicar em
SAHN, e no Imput file abrir a matriz de
dissimilaridade (Excel)
-
No output tree file, digitar
um nome de saída
(exemplo DE =
dendrograma)
Em Clustering methods deixar UPGMA; aí
pedir para rodar (Compute), Com isso vai
abrir uma janela de escritas que pode ser
fechada, e após deves buscar no canto
inferior esquerdo da janela uma figura
pequena em forma de dendrograma:
Clicando nela aparece a FIGURA que pode
ser formatada conforme interesse, sendo
salva formato metafile.
Conforme exposto acima, o programa Ntsys possui vários
mecanismos que podem ser ajustados para formatar os
dendogramas da mais adequada a cada situação
Dendograma feito no Ntsys
Matriz Mahalanobis - Ntsys
Idem passos anteriores para
construção do dendograma a partir
da matriz de Distância Euclidiana
CCC no Ntsys
Lembrar do arquivo de
saída que foi salvo
anteriormente
- Antes de começar o cálculo do CCC refazer analise de dissimilaridade
no Ntsys, substituindo o nome dos genótipos por letras.
- Calcular a matriz cofenética a partir do dentrograma que foi salvo
(DE). Isto é feito no mesmo local clustering, clicar em Cophenetic
values, e em Imput tree file abrir o DE e na Output Coph file, colocar
um nome de saída (COEF de cofenético).
- Feito isso clicar em “Compute”.
-Depois, clicar em Graphics, em seguida em Matrix comprison
plot, e no Input file 1 (X) abrir a matriz de dissimilaridade do
Excel, aquela do inicio, e no Input file 2 (X), abrir a matriz cofenética
de nome salvo (COEF).
- No Input file 3 (X) não vai nada. No Number of
permutations, digitar 1000. (feito isso pedir para rodar). Vai abrir um
gráfico que quando fechado aparece uma janela de escritas, e em
uma delas aparece o valor da correlação entre as matrizes e que é o
valor cofenético.
Cálculo de Similaridade Genética a partir de
Marcadores Moleculares
- Juntar todos os marcadores polimórficos em única planilha do Excel
- Colocar nome dos genótipos e números de códigos (exemplo 1=cálculo
da similaridade; 10=número de genótipos; 182=número de
marcadores utilizados)
- No NTSYS: entrar em Similarity, depois em quantitative date e
no Input file one buscar a planilha de dados do Excel com os
códigos, genótipos e marcadores.
- Deixar clicado X em By rows, Coefficient clicar em DICE, e em
Output file escrever qualquer nome de saída do arquivo de
similaridade (só escrever o nome que ele salva no mesmo lugar
que foi buscada a planilha de dados anterior.
- Rodar a análise (compute)
Transformá-la em
dissimilaridade genética
(1 menos os valores de
similaridade que abrirem
Após, sem números em
formato de fórmula, inserir uma
coluna e duas linhas, colocando
o nome dos genótipos em forma
de matriz, porém, nas primeiras
três células da linha digitar os
códigos: 2=indica cálculo de
dissimilaridade, 10 e 10=
indicam a dimensão da matriz.
Análises Multivariadas

Más contenido relacionado

La actualidad más candente

Fiscalização em campo de produção de sementes
Fiscalização em campo de produção de sementesFiscalização em campo de produção de sementes
Fiscalização em campo de produção de sementesGeraldo Henrique
 
Unidade 02 formação e desenvolvimento das sementes
Unidade 02 formação e desenvolvimento das sementesUnidade 02 formação e desenvolvimento das sementes
Unidade 02 formação e desenvolvimento das sementesBruno Rodrigues
 
Manejo Integrado de Doenças de Plantas
Manejo Integrado de Doenças de PlantasManejo Integrado de Doenças de Plantas
Manejo Integrado de Doenças de PlantasAgriculturaSustentavel
 
Teste rápido agro 1 2 3 4
Teste rápido agro 1 2 3 4Teste rápido agro 1 2 3 4
Teste rápido agro 1 2 3 4caiovguimaraes
 
Análises agrupamento e dissimilaridade no Genes
Análises agrupamento e dissimilaridade no GenesAnálises agrupamento e dissimilaridade no Genes
Análises agrupamento e dissimilaridade no GenesCristiano Lemes da Silva
 
Genética quantitativa 2010 2v1
Genética quantitativa 2010 2v1Genética quantitativa 2010 2v1
Genética quantitativa 2010 2v1UERGS
 
Caracteres qualitativos e quantitativos
Caracteres qualitativos e quantitativosCaracteres qualitativos e quantitativos
Caracteres qualitativos e quantitativosVanessa Holanda
 
CULTIVARES DE SOJA
CULTIVARES DE SOJACULTIVARES DE SOJA
CULTIVARES DE SOJAGeagra UFG
 
Desbaste em Floresta Plantada
Desbaste em Floresta PlantadaDesbaste em Floresta Plantada
Desbaste em Floresta PlantadaCassio Augusto
 
Adubação na cultura do Algodeiro
Adubação na cultura do AlgodeiroAdubação na cultura do Algodeiro
Adubação na cultura do AlgodeiroGeagra UFG
 
Silagem (milho, sorgo, capim)
Silagem (milho, sorgo, capim)Silagem (milho, sorgo, capim)
Silagem (milho, sorgo, capim)Brenda Bueno
 
A cultura do Milho
A cultura do MilhoA cultura do Milho
A cultura do MilhoKiller Max
 
Tecnologia e Produção de Sementes Forrageiras no Brasil
Tecnologia e Produção de Sementes Forrageiras no BrasilTecnologia e Produção de Sementes Forrageiras no Brasil
Tecnologia e Produção de Sementes Forrageiras no BrasilAlice Melo Candido
 
MANEJO DE FITONEMATOIDES
MANEJO DE FITONEMATOIDESMANEJO DE FITONEMATOIDES
MANEJO DE FITONEMATOIDESGeagra UFG
 

La actualidad más candente (20)

Fiscalização em campo de produção de sementes
Fiscalização em campo de produção de sementesFiscalização em campo de produção de sementes
Fiscalização em campo de produção de sementes
 
Unidade 02 formação e desenvolvimento das sementes
Unidade 02 formação e desenvolvimento das sementesUnidade 02 formação e desenvolvimento das sementes
Unidade 02 formação e desenvolvimento das sementes
 
Manejo Integrado de Doenças de Plantas
Manejo Integrado de Doenças de PlantasManejo Integrado de Doenças de Plantas
Manejo Integrado de Doenças de Plantas
 
Teste rápido agro 1 2 3 4
Teste rápido agro 1 2 3 4Teste rápido agro 1 2 3 4
Teste rápido agro 1 2 3 4
 
Análises agrupamento e dissimilaridade no Genes
Análises agrupamento e dissimilaridade no GenesAnálises agrupamento e dissimilaridade no Genes
Análises agrupamento e dissimilaridade no Genes
 
Genética quantitativa 2010 2v1
Genética quantitativa 2010 2v1Genética quantitativa 2010 2v1
Genética quantitativa 2010 2v1
 
Caracteres qualitativos e quantitativos
Caracteres qualitativos e quantitativosCaracteres qualitativos e quantitativos
Caracteres qualitativos e quantitativos
 
CULTIVARES DE SOJA
CULTIVARES DE SOJACULTIVARES DE SOJA
CULTIVARES DE SOJA
 
Ação gênica
Ação gênicaAção gênica
Ação gênica
 
Dimensionamento de silos
Dimensionamento de silosDimensionamento de silos
Dimensionamento de silos
 
Desbaste em Floresta Plantada
Desbaste em Floresta PlantadaDesbaste em Floresta Plantada
Desbaste em Floresta Plantada
 
Endogamia e heterose
Endogamia e heteroseEndogamia e heterose
Endogamia e heterose
 
Adubação na cultura do Algodeiro
Adubação na cultura do AlgodeiroAdubação na cultura do Algodeiro
Adubação na cultura do Algodeiro
 
Plants c3 02
Plants c3 02Plants c3 02
Plants c3 02
 
Silagem (milho, sorgo, capim)
Silagem (milho, sorgo, capim)Silagem (milho, sorgo, capim)
Silagem (milho, sorgo, capim)
 
A cultura do Milho
A cultura do MilhoA cultura do Milho
A cultura do Milho
 
Anatomia e morfologia de fitonematoides
Anatomia e morfologia de fitonematoidesAnatomia e morfologia de fitonematoides
Anatomia e morfologia de fitonematoides
 
Tecnologia e Produção de Sementes Forrageiras no Brasil
Tecnologia e Produção de Sementes Forrageiras no BrasilTecnologia e Produção de Sementes Forrageiras no Brasil
Tecnologia e Produção de Sementes Forrageiras no Brasil
 
Microbiologia Agrícola UFMT - Aula 006
Microbiologia Agrícola UFMT - Aula 006Microbiologia Agrícola UFMT - Aula 006
Microbiologia Agrícola UFMT - Aula 006
 
MANEJO DE FITONEMATOIDES
MANEJO DE FITONEMATOIDESMANEJO DE FITONEMATOIDES
MANEJO DE FITONEMATOIDES
 

Similar a Análises Multivariadas

[José Ahirton Lopes] Treinamento - Árvores de Decisão, SVM e Naive Bayes
[José Ahirton Lopes] Treinamento - Árvores de Decisão, SVM e Naive Bayes[José Ahirton Lopes] Treinamento - Árvores de Decisão, SVM e Naive Bayes
[José Ahirton Lopes] Treinamento - Árvores de Decisão, SVM e Naive BayesAhirton Lopes
 
Análise multivariada aplicada à pesquisa
Análise multivariada aplicada à pesquisaAnálise multivariada aplicada à pesquisa
Análise multivariada aplicada à pesquisaCarlos Moura
 
UFG - Topic Modeling in Text
UFG - Topic Modeling in TextUFG - Topic Modeling in Text
UFG - Topic Modeling in TextMarlesson Santana
 
Aula de programacao_final.dizando
Aula de programacao_final.dizandoAula de programacao_final.dizando
Aula de programacao_final.dizandoJoão Gomes
 
Aprendizagem Automática
Aprendizagem AutomáticaAprendizagem Automática
Aprendizagem Automáticabutest
 
Exame mat6º revisões; preparação
Exame mat6º revisões; preparaçãoExame mat6º revisões; preparação
Exame mat6º revisões; preparaçãomarcommendes
 
Tutorial basico uso_de_ferramentas_do_nc (1)
Tutorial basico uso_de_ferramentas_do_nc (1)Tutorial basico uso_de_ferramentas_do_nc (1)
Tutorial basico uso_de_ferramentas_do_nc (1)Sandro Rabelo
 
Scaling bayesian network parameter learning with Hadoop
Scaling bayesian network parameter learning with HadoopScaling bayesian network parameter learning with Hadoop
Scaling bayesian network parameter learning with HadoopJoão Gabriel Lima
 
09/12 Operadores Quantitativos
09/12  Operadores Quantitativos09/12  Operadores Quantitativos
09/12 Operadores QuantitativosCícera Malheiro
 

Similar a Análises Multivariadas (13)

[José Ahirton Lopes] Treinamento - Árvores de Decisão, SVM e Naive Bayes
[José Ahirton Lopes] Treinamento - Árvores de Decisão, SVM e Naive Bayes[José Ahirton Lopes] Treinamento - Árvores de Decisão, SVM e Naive Bayes
[José Ahirton Lopes] Treinamento - Árvores de Decisão, SVM e Naive Bayes
 
Análise multivariada aplicada à pesquisa
Análise multivariada aplicada à pesquisaAnálise multivariada aplicada à pesquisa
Análise multivariada aplicada à pesquisa
 
UFG - Topic Modeling in Text
UFG - Topic Modeling in TextUFG - Topic Modeling in Text
UFG - Topic Modeling in Text
 
Aula de programacao_final.dizando
Aula de programacao_final.dizandoAula de programacao_final.dizando
Aula de programacao_final.dizando
 
Aprendizagem Automática
Aprendizagem AutomáticaAprendizagem Automática
Aprendizagem Automática
 
Algoritmo de Rabin-Karp
Algoritmo de Rabin-KarpAlgoritmo de Rabin-Karp
Algoritmo de Rabin-Karp
 
Exame mat6º revisões; preparação
Exame mat6º revisões; preparaçãoExame mat6º revisões; preparação
Exame mat6º revisões; preparação
 
Tutorial basico uso_de_ferramentas_do_nc (1)
Tutorial basico uso_de_ferramentas_do_nc (1)Tutorial basico uso_de_ferramentas_do_nc (1)
Tutorial basico uso_de_ferramentas_do_nc (1)
 
Aula13-15.pdf
Aula13-15.pdfAula13-15.pdf
Aula13-15.pdf
 
Introdução à Estatística
Introdução à EstatísticaIntrodução à Estatística
Introdução à Estatística
 
Modelos (S)ARIMA e extensões
Modelos (S)ARIMA e extensõesModelos (S)ARIMA e extensões
Modelos (S)ARIMA e extensões
 
Scaling bayesian network parameter learning with Hadoop
Scaling bayesian network parameter learning with HadoopScaling bayesian network parameter learning with Hadoop
Scaling bayesian network parameter learning with Hadoop
 
09/12 Operadores Quantitativos
09/12  Operadores Quantitativos09/12  Operadores Quantitativos
09/12 Operadores Quantitativos
 

Análises Multivariadas

  • 1. Correlações e Análises Multivariadas Cristiano Lemes
  • 2. Análises que serão abordadas • Análise de Variância: – Correlações Fenotípica, Genotípica e Residual • Correlações: – Simples ou de Pearson; – Teste Mantel – Correlações de Spearman – Dispersão Gráfica • Análises de Trilha – Análise de trilha simples – Análise de trilha com colinearidade
  • 3. Análises que serão abordadas • Métodos de Agrupamento: – Variáveis Canônicas – Componentes Principais – Tocher (método de otimização) – Correlação cofenética – Transformar matriz de similaridade em dissimilaridade • Dissimilaridade: – Distância Euclidiana (baseada no arquivo de medias) – Distância Mahalabonis (considera as repetições) • Bootstrap e ponto de corte em dendogramas. • Dissimilaridade através de marcadores: – morfológicos – moleculares – Analise combinada (morfológico+molecular).
  • 4. Análise de Variância Tem o objetivo de avaliar se as diferenças observadas entre as médias das amostras são estatisticamente significantes. - Tabular os dados no Excel; - Usar PONTO no lugar de VÍRGULA para separar as casas decimais (Ctrl + L ou em configurações locais); - De preferência organizar as análises em planilhas do mesmo arquivo;
  • 5. Clicar em “Entrada de dados”
  • 7. Colar o conjuto de dados aqui Posteriormente salvar isso clicando no local indicado pela seta
  • 8. Seguir os passos conforme esta inlustrado acima
  • 9. Clicar aqui para abrir o arquivo a ser analisado
  • 11. Abrir o arquivo Depois de abrir, clicar em Sair
  • 12. O próximo passo e clicar em “Declaração de Parâmetros” Completar os itens solicitados conforme os dados do experimento a ser analisado Em seguida clicar em retornar Nomear as variaveis a serem analisadas
  • 13. Criar um novo arquivo com o nome das variáveis
  • 14. Clicar em “Nome das Variáveis” e seguir os passos acima ate encontrar o arquivo com o nome das mesmas criado anteriormente
  • 15. Localizar o arquivo Posteriormente clicar em finalizar
  • 16. Clicar em “ANOVA” para rodar a análise
  • 18. Ao final dessa saída da ANOVA encontram-se as matrizes de correlação Fenotípica, Genotípica e Residual Recomenda-se colar essa análise em um nova planilha do arquivo original dos dados
  • 19. - Em seguida voltar ao Genes e clicar em “Finalizar” análise - Salvar as matrizes de interesse que estao disponíveis para serem usada em análises posteriores - Clicar em “Processar”
  • 20. Pode-se também solicitar apenas o “Resumo” da Anova
  • 21. Correlações Permite avaliar a magnitude e o sentido das relações entre caracteres. - Correlações rfe, rge e rre; - Correlações Simples (Pearson): feita a partir do arquivo de medias, (DAD.med); -Teste Mantel: permite testar a significâncias de associações em várias simulações; - Correlação de Spearman: para dados não paramétricos Dispersão Gráfica: permite a visualização das associações entre caracteres baseado nas correlações simples dos mesmos
  • 22. Abrir arquivo de médias
  • 23. - Declarar Parâmetros - Dar um nome para o arquivo de saída - O campo “Código para Valores Perdidos” não precisa ser preenchido - Retornar - Nomear as variáveis
  • 24. Na sequência clicar em “Processar” Clicar em “OK” na janela que aparece depois
  • 25. Encontrar o menor valor de correlação significativo para o nível de sgnificância adotado.
  • 26. - Encontrar o arquivo de Saída - Exportá-lo para o Excel
  • 27.
  • 28. Teste Mantel Usar o mesmo arquivo de médias para rodar o teste Mantel
  • 29. - Nomear um arquivo de saída -Definir um número de simulações - Processar
  • 30.
  • 31. Correlação de Spearman - Usar o mesmo arquivo de médias - Renomear o arquivo de saída
  • 32. - Localizar o arquivo de saida e exportá-lo para o Excel
  • 33. - Formatar os dados - Identificar cada coluna com suas respectivas variáveis
  • 35. Dispersão Gráfica Usar o mesmo arquivo de médias para visualizar a dispersão gráfica
  • 36.
  • 37.
  • 38. Análise de Trilha Analisa o efeito direto de uma variável independente (x) sobre uma variável dependente (y) após a remoção da influência de todas as outras variáveis independentes (xi) incluídas na análise.
  • 39. Abrir o arquivo de correlações fenotípicas “rfe.dat”
  • 40. -Declarar Parâmetros - Informar o número variáveis do arquivo “rfe.dat” - Nomear as variáveis
  • 41. -Clicar em “Processar” - Informar as Variáveis e em seguida clicar em “Prosseguir”
  • 42. - Analisar o arquivo de saída - Exportá-lo para o Excel
  • 43. Análise de Trilha com Colineariedade
  • 44. Abrir o arquivo de correlações fenotípicas “rfe.dat”
  • 45. -Declarar Parâmetros - Informar o número variáveis do arquivo “rfe.dat” - Nomear as variáveis
  • 46.
  • 47.
  • 48.
  • 49. Deve-se escolher o menor valor de “K” para o qual a maioria dos coeficientes de trilha, associados aos vários caracteres esteje estabilizado.
  • 50.
  • 51.
  • 52. Variáveis Canônicas - Técnica de Dispersão Gráfica - exige experimento com delineamento experimental (repetições) - Para serem representativos as 2 primeiras variáveis devem explicar pelo menos 80% da variação original dos dados;
  • 53. - Abrir arquivo de médias - Em “Dispersão” completar com o “cre” - Declarar o número de variáveis - Nomear variáveis
  • 54. Nesse caso as 2 primeiras variáveis explicam mais de 80% da variação original dos dados
  • 55.
  • 56. Componentes Principais - Técnica de Dispersão Gráfica - Permitem a identificação da divergência genética - Não exige experimentos com delineamento experimental (usa-se apenas o arquivo de médias) - Para ser representativo os 2 primeiros componentes devem explicar pelo menos 80% da variação original dos dados.
  • 57.
  • 58.
  • 59. Nesse caso os 2 primeiros componentes explicam mais de 80% da variação original dos dados
  • 60.
  • 61. Tocher - Método de Agrupamento - A média das medidas de distância dentro de cada grupo deve ser menor do que as distâncias médias entre quaisquer grupo - Não permite comparar acessos dentro do mesmo do mesmo grupo
  • 62.
  • 63.
  • 64.
  • 65. Dissimilaridade - Distância de Euclidiana - Experimentos que não contemplam delineamento - Análise feita apartir do arquivo de médias - Matriz de Distância Genética ou dendogramas
  • 66.
  • 67.
  • 68.
  • 69.
  • 70.
  • 71. - Saída do Dendograma - Desvantagem do Genes, ausência de mecanismos de formatação
  • 72.
  • 73. Dissimilaridade - Distância de Mahalanobis - Leva em conta as variâncias e covariâncias e correlações residuais entre os caracteres aferidos. - Considera as repetições experimentais
  • 74.
  • 75. -Nomear as Variáveis - Gerar Matriz -Processar Agrupamento -Fazer Bootstrap -Testa a consistência das bifurcações em porcentagem a partir de um número determinado de simulações
  • 76.
  • 77. Contribuição Relativa dos Caracteres – Singh 1981 Identificação dos caracteres que mais contribuíram para a dissimilaridade genética
  • 78.
  • 79. Dendograma gerado a partir da matriz de distância de Mahalanobis
  • 80.
  • 81. Correlação Cofenética Mede a correlação (ajuste) entre a matriz de distância original e as distâncias apresentadas no dendrograma. Muito importante quando são realizadas inferências com base no dendrograma
  • 82. Abrir a “matriz de distância genética” que se deseja analisar
  • 83.
  • 84. Cosntruindo dendogramas no Ntsys - Abrir a “matriz de distância genética” no Genes - Exportá-lo para o Excel - Formatá-lo conforme o modelo ao lado
  • 85. - No NTSYS, em clustering, clicar em SAHN, e no Imput file abrir a matriz de dissimilaridade (Excel) -
  • 86. No output tree file, digitar um nome de saída (exemplo DE = dendrograma) Em Clustering methods deixar UPGMA; aí pedir para rodar (Compute), Com isso vai abrir uma janela de escritas que pode ser fechada, e após deves buscar no canto inferior esquerdo da janela uma figura pequena em forma de dendrograma: Clicando nela aparece a FIGURA que pode ser formatada conforme interesse, sendo salva formato metafile.
  • 87.
  • 88. Conforme exposto acima, o programa Ntsys possui vários mecanismos que podem ser ajustados para formatar os dendogramas da mais adequada a cada situação
  • 90. Matriz Mahalanobis - Ntsys Idem passos anteriores para construção do dendograma a partir da matriz de Distância Euclidiana
  • 91.
  • 92.
  • 93.
  • 94.
  • 95. CCC no Ntsys Lembrar do arquivo de saída que foi salvo anteriormente
  • 96. - Antes de começar o cálculo do CCC refazer analise de dissimilaridade no Ntsys, substituindo o nome dos genótipos por letras. - Calcular a matriz cofenética a partir do dentrograma que foi salvo (DE). Isto é feito no mesmo local clustering, clicar em Cophenetic values, e em Imput tree file abrir o DE e na Output Coph file, colocar um nome de saída (COEF de cofenético). - Feito isso clicar em “Compute”.
  • 97. -Depois, clicar em Graphics, em seguida em Matrix comprison plot, e no Input file 1 (X) abrir a matriz de dissimilaridade do Excel, aquela do inicio, e no Input file 2 (X), abrir a matriz cofenética de nome salvo (COEF). - No Input file 3 (X) não vai nada. No Number of permutations, digitar 1000. (feito isso pedir para rodar). Vai abrir um gráfico que quando fechado aparece uma janela de escritas, e em uma delas aparece o valor da correlação entre as matrizes e que é o valor cofenético.
  • 98.
  • 99.
  • 100. Cálculo de Similaridade Genética a partir de Marcadores Moleculares - Juntar todos os marcadores polimórficos em única planilha do Excel - Colocar nome dos genótipos e números de códigos (exemplo 1=cálculo da similaridade; 10=número de genótipos; 182=número de marcadores utilizados)
  • 101. - No NTSYS: entrar em Similarity, depois em quantitative date e no Input file one buscar a planilha de dados do Excel com os códigos, genótipos e marcadores. - Deixar clicado X em By rows, Coefficient clicar em DICE, e em Output file escrever qualquer nome de saída do arquivo de similaridade (só escrever o nome que ele salva no mesmo lugar que foi buscada a planilha de dados anterior. - Rodar a análise (compute)
  • 102.
  • 103. Transformá-la em dissimilaridade genética (1 menos os valores de similaridade que abrirem Após, sem números em formato de fórmula, inserir uma coluna e duas linhas, colocando o nome dos genótipos em forma de matriz, porém, nas primeiras três células da linha digitar os códigos: 2=indica cálculo de dissimilaridade, 10 e 10= indicam a dimensão da matriz.