1) O documento discute a aplicação de análises multivariadas em estudos de comunidades vegetais.
2) Essas análises permitem examinar padrões espaciais e temporais na composição de espécies e relacioná-los a variáveis ambientais.
3) Exemplos de métodos de análise multivariada incluem MANOVA, análise discriminante linear e análise de componentes principais.
2. 2
Outline
• Comunidades vegetais
• Tipos de dados
• Tipos de estudos
• O que são Análises Multivariadas?
• Vantagens e características
• Escolha de métodos
• Exemplos de métodos
• MANOVA
• Análise Discriminante Linear
• Análise de Componentes Principais
5. • Unidades de amostragem:
• E.g.: plots, transectos,quadrats
• Geralmente em estrutura espacial ou temporal hierárquica
• Parâmetros registrados por taxas múltiplas em cada unidade
• E.g.: contagem simples, densidades,% de cobertura vegetal,
presença-ausência
• Variáveis ambientais registradas em cada unidade
• pH, salinidade,temperatura, nutrientes,tipo de sedimento do solo,
elevação
Dados de estudos de comunidades vegetais
6. • Examinar padrões temporais e espaciais na composição de
espécies
• Relacionar padrões à variáveis ambientais das unidades
amostradas
• Determinar quais táxons são chave em “direcionar” os
padrões temporais e espaciais
Exemplos de objetivos em estudos de
comunidade vegetal
7. 7
Complexidade de variáveis
• Composição da
comunidade
• Características
morfológicas das espécies
• Características ambientais
8. O que são Análises Multivariadas?
• Dois grupos de métodos estatísticos: univariada e
multivariada
• A análise multivariada (AMV) fornece métodos
estatísticos para estudo das relações conjuntas de
variáveis em dados que contêm intercorrelações.
• Porque muitas variáveis podem ser consideradas
simultaneamente, as interpretações podem ser feitas que
não são possíveis com estatísticas univariadas.
8
9. AMV usa todos os dados disponíveis para capturar o
máximo de informação possível. O princípio básico é
diminuir o número de variáveis de centenas para um mero
punhado.
9
O que são Análises Multivariadas?
AMV
[
10. Pluralitas non est ponenda sine necessitate.
Tradução aproximada: "Não torne as coisas mais complicadas do que
precisam ser."
Análises multivariadas são baseadas na
“Navalha de Ockham”
William of Ockham
(1285-1347) 10
William de Ockham foi um monge Inglês do século
14, autor do princípio lógico de que a explicação
para qualquer fenômeno deve assumir apenas as
premissas estritamente necessárias à explicação do
mesmo e eliminar todas as que não causariam
qualquer diferença aparente nas predições da
hipótese ou teoria.
O termo "navalha" se explica porque o princípio
serve para cortar as partes desnecessárias de uma
teoria científica.
11. 11
• O principal elemento da AMV é a redução da dimensionalidade.
Levado ao extremo, isso pode significar ir de centenas de
dimensões (variáveis) para apenas algumas, o que nos permite
criar um gráfico bidimensional.
• Usando estes gráficos, que os nossos olhos e cérebros podem
facilmente manipular, somos capazes de perscrutar o banco de
dados e identificar tendências e correlações.
Redução de dimensionalidade
15. 15
Como escolher o método
• Depende do objetivo do investigador
• Para cartografar ou descrever a vegetação: classificação
• Para avaliar relações entre a vegetação e o ambiente:
ordenação
• Classificação: identifica indivíduos ou objetos em grupos
ou classes se baseando em medidas das variáveis através
de algum índice de similaridade E.g.: Análise discriminante
• Ordenação: sumariza um grande número de medidas em
poucas variáveis sintéticas (eixos ou componentes) E.g.:
PCA
16. Exemplos de Métodos
• Que determinam diferenças entre grupos:
• ANOVA Fatorial;
• MANOVA;
• Análise Discriminante;
• Que determinam a estrutura da relação:
• Regressão Múltipla
• Correlação Canônica
• Análise de Componentes Principais;
• Análise de Correspondência;
• Análise de agrupamento;
17. 17
• Uma extensão de ANOVA em que os efeitos principais e
interações são avaliados em uma combinação de VDs
• Análise de variância realizada em múltiplas variáveis
dependentes (VD) simultaneamente
• Compara várias médias de diferentes populações para
verificar se essas populações possuem médias de variáveis
iguais ou não
• Testa se diferenças médias entre os grupos em uma
combinação de VDs é provável de ocorrer por acaso
MANOVA
Teste Número de VI Número de VD
Teste t 1 1
ANOVA Múltiplos 1
MANOVA Múltiplos Múltiplos
18. 18
• H0: μ11 = μ12 =…= μ1k ; = μ21 = μ22 =…= μ2k
• Onde μij significa a média populacional da variável i no grupo
j. Essa Ho diz que a média da variável 1 é a mesma para todos
os k grupos e que as médias da vaiável 2 são as mesmas para
k grupos, e assim por diante.
• HA: As k populações não tem as mesmas médias paras as
diversas variáveis.
Teste de hipótese da MANOVA
19. 19
• A MANOVA desenvolve uma combinação linear de variáveis
dependentes
• Equação: Z = c1V1 + c2V2 + c3V3 + ...+ cnVn
• Essa combinação leva em consideração todas as possíveis
correlações entre as variáveis
Correlações da MANOVA
V1 V2 V3
V1 SSv1 SCPv1xv2 SCPv1xv3
V2 SCPv1xv2 SSv2 SCPv2xv3
V3 SCPv1xv3 SCPv2xv3 SSv3
SS = Soma dos
Quadrados
SCP = Soma dos
Produtos
Cruzados
20. 20
• Wilks’ lambda (Λ)
• Teste estatístico comumente usado em MANOVA
• H0 é rejeitada quando o valor de Λ é pequeno (0-1)
• Λ são normalmente transformados em valores de F or X2
mais familiares
• Teste de Pillai-Bertlett
• Nesse caso, valores altos significam rejeição de Ho
• Também é transformado em estatística de F
Índices da MANOVA
21. 21
Reich et al. 1999. Generality of leaf trait relationships: a test across six biomes.
Ecology 80: 1955–1969.
• Reich et al. (1999) examinou a generalidade das
características foliares de espécies diferentes em uma
variedade de ecossistemas e regiões geográficas.
• 2 populações, entre 3 e 11 espécies, 2 grupos funcionais
(arbustos e árvores) e 5 variáveis:
• área foliar específica, concentração de N2 na folha,capacidade
fotossintética líquida à base de massa, capacidade fotossintética
líquida à base de área foliar e capacidade de condutância difusora
fotossintética.
• Vamos testar os efeitos da localização e grupo funcional, e
sua interação, nessas cinco variáveis de resposta tomadas
em conjunto
Exemplo de MANOVA
23. • Suponha duas classes
• Assuma que elas são linearmente separáveis por uma fronteira l(θ)
• Otimizar o parâmetro θ para encontrar a melhor fronteira.
• Análise Discriminante gera uma combinação linear das variáveis
que maximiza a probabilidade de observações serem atribuídas
corretamente aos seus grupos pré-determinados
Ruim Boa
Análise Discriminante Linear
24. • Tenta encontrar uma transformação linear através da
maximização da distância entre-classes e minimização da
distância intra-classe.
• O método tenta encontrar a melhor direção de maneira que
quando os dados são projetados em um plano, as classes
possam ser separadas.
Análise Discriminante Linear
25. 25
Análise de Componentes Principais
• descreve os dados contidos num quadro indivíduos-
variáveis numéricas: p variáveis serão mediadas com n
indivíduos
• transforma um conjunto original de variáveis em outro
conjunto: os componentes principais de dimensões
equivalentes
• detecta a estrutura nas relações entre as variáveis
26. 26
1. Padronizar os dados
2. Calcular a matriz de covariância
3. Encontrar os eigenvalues e eigenvectors da matriz de
covariância
Eigenvalues:Conceitualmente podem ser considerados como
medidor da força (comprimento relativo) de um eixo no espaço N-
dimensional
Eigenvectors:Enquanto um eigenvalue é o comprimento de um eixo,
o eigenvector determina a sua orientação no espaço
4. Plotar os componentes principais sobre os dados
Passos para a Análise de
Componentes Principais
27. 27
Exemplo de mangue
• Composição da
comunidade
• Características
morfológicas das espécies
• Características ambientais
29. 29
• Áreas não ficaram bem
separadas
• Maior parte dos dados
sumarizados por
atributos do solo.
• PCA1 explica 36% da
variância e representado
principalmente por
conteúdo de areia
• PCA2 explica 24% da
variância, representado
principalmente por
salinidade
31. 31
Mito ou verdade?
• Uma análise estatística com mais de 2 variáveis é uma análise
multivariada.
Mito. Quando mais de 2 variáveis estão inter-relacionados uns
com os outros,podemos usar estatística multivariada.
• A finalidade da estatística multivariada é estabelecer correlação
entre os conjuntos de variáveis.
Verdade. Mas é objetivo não se limita a determinar relação entre
conjunto de variáveis.Ele tende a controlar o efeito de algumas
variáveis que intervêm em relacionamento entre os conjuntos de
variáveis.
32. 32
Resumo
• Uma comunidade vegetal pode ser definida como todas as espécies que
ocupam uma determinada área circunscrita por um ecólogo para o propósito de
um estudo
• AMV fornecem métodos estatísticos para estudo das relações conjuntas de
variáveis em dados que contêm intercorrelações.
• O princípio básico da AMV é diminuir o número de variáveis correlacionadas
(redução da dimensionalidade).
• Classificação: identifica indivíduos ou objetos em grupos ou classes se baseando
em medidas das variáveis através de algum índice de similaridade E.g.: Análise
discriminante.
• Ordenação: sumariza um grande número de medidas em poucas variáveis
sintéticas (eixos ou componentes) E.g.: PCA.
• MANOVA é uma extensão de ANOVA em que os efeitos principais e interações
são avaliados em uma combinação de VDs.
• Análise Discriminante gera uma combinação linear das variáveis que maximiza
a probabilidade de observações serem atribuídas corretamente aos seus
grupos pré-determinados.
• Análise de Componentes Principais transforma um conjunto original de
variáveis em outro conjunto: os componentes principais de dimensões
equivalentes.
33. 33
•Objetivo:
• explorar e identificar dimensões não reconhecidas que
afetam o comportamento
• obter avaliações comparativas de objetos quando as bases
específicas de comparação são desconhecidas ou identificadas
•Passos:
•- identificar todos os objetos relevantes
•- escolher entre dados de similaridade ou de preferência
•- selecionar uma análise agregada ou desagregada
Escalonamento Multidimensional