SlideShare uma empresa Scribd logo
1 de 46
Baixar para ler offline
INSTITUTO SUPERIOR TÉCNICO
UNIVERSIDADE TÉCNICA DE LISBOA
DISTÂNCIA PERCORRIDA EM TRANSPORTE INDIVIDUAL –
CONSTRUÇÃO DE UM MODELO DE REGRESSÃO LINEAR
TRABALHO PRÁTICO N.º 1
TÉCNICAS DE APOIO AO PLANEAMENTO DE TRANSPORTES
MESTRADO EM PLANEAMENTO E OPERAÇÃO DE TRANSPORTES
André Ramos, aluno n.º 76819
Luís Neto, aluno n.º 74776
Professor João Abreu e Silva
Lisboa, 6 de Novembro de 2012
Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL
André Ramos (n.º 76819) / Luís Neto (n.º 74776)
ÍNDICE
1. INTRODUÇÃO................................................................................................................................1
2. CATEGORIZAÇÃO DAS VARIÁVEIS............................................................................................2
2.1. APRESENTAÇÃO DAS VARIÁVEIS...............................................................................................................................2
2.2. ELIMINAÇÃO DE VARIÁVEIS ......................................................................................................................................3
3. ANÁLISE FATORIAL COM CATEGORIZAÇÃO DAS VARIÁVEIS...............................................5
3.1. VARIÁVEIS DE USO DO SOLO ...................................................................................................................................6
3.2. VARIÁVEIS SOCIOECONÓMICAS..............................................................................................................................14
4. ANÁLISE FATORIAL SEM CATEGORIZAÇÃO DAS VARIÁVEIS.............................................24
5. CONSTRUÇÃO DO MODELO DE REGRESSÃO LINEAR .........................................................33
5.1. MODELO 1 – ANÁLISE FATORIAL COM CATEGORIZAÇÃO DAS VARIÁVEIS....................................................................34
5.2. MODELO 2 – ANÁLISE FATORIAL SEM CATEGORIZAÇÃO DAS VARIÁVEIS....................................................................38
6. CONSIDERAÇÕES FINAIS..........................................................................................................43
BIBLIOGRAFIA.....................................................................................................................................44
Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL
André Ramos (n.º 76819) / Luís Neto (n.º 74776) 1
1. INTRODUÇÃO
O presente relatório diz respeito à construção de
um modelo de regressão linear para o cálculo do
peso do uso do automóvel em função de diversas
variáveis socioeconómicas, de uso do solo e de
mobilidade das freguesias da Área Metropolitana
de Lisboa, com recurso à utilização do software
IBM® SPSS® Statistics (versão 20).
A partir da variável dependente – peso da utilização
do automóvel na repartição modal das viagens (ou
seja, a distância relativa em TI) – vai estabelecer-
se um modelo que represente a relação entre os
padrões de mobilidade dos habitantes e algumas
características desta população e da área onde
residem.
Numa primeira fase, agrupar-se-ão as variáveis
disponíveis na base de dados fornecida em dois
grupos principais – variáveis socioeconómicas e
variáveis de uso do solo – para, através da
Análise Fatorial Exploratória, as poder “reduzir” a
um número mais compacto e trabalhável de fatores
do modelo de regressão linear.
Num segundo momento, tentou-se construir o
modelo de análise fatorial sem categorizar as
variáveis independentes, dada a difícil definição
concreta do tipo de variável que cada uma é na
realidade, tentando avaliar se essa nova análise
fatorial é mais adequada aos dados disponíveis.
De seguida, foram calculados os coeficientes
associados a cada uma das novas variáveis (e às
que não forem alvo da análise fatorial), procedendo
igualmente às verificações necessárias de modo a
garantir que o modelo de regressão linear cumpre
as assunções que se exigem, terminando com uma
análise crítica do(s) modelo(s) obtido(s).
Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL
André Ramos (n.º 76819) / Luís Neto (n.º 74776) 2
2. CATEGORIZAÇÃO DAS VARIÁVEIS
2.1. APRESENTAÇÃO DAS VARIÁVEIS
Da base de dados fornecida, relativa a 204 zonas
da Área Metropolitana de Lisboa – nalguns casos,
contendo agrupamentos de freguesias – constam
34 variáveis, uma das quais (PTIDIST – peso das
viagens de transporte individual na repartição
modal, em função da distância percorrida) deverá
ser utilizada como variável dependente do modelo,
pois é aquela que se pretende precisamente
quantificar.
Assim, as variáveis a testar na construção do
modelo são as seguintes:
 PTCDIST – peso das viagens de
transporte coletivo na repartição modal,
em função da distância percorrida;
 FAM>1TI – percentagem de famílias com
mais de 1 automóvel;
 AcTC_TI5 – rácio entre acessibilidade
usando transporte coletivo e a
acessibilidade usando transporte
individual;
 LNDENS_GL – logaritmo da densidade
global da zona;
 PPASSE – percentagem de habitantes
com passe de transporte público;
 DISTTIHAB – Distância viajada em
transporte individual;
 PPESSGL1000 – percentagem dos
“habitantes globais” (isto é, residentes,
trabalhadores e estudantes) a menos de 1
quilómetro de um nó de autoestrada;
 PPGLOB400BUS – percentagem de
“habitantes globais” a menos de 400
metros de uma paragem de autocarro;
 KMVIA/PESSGL – rácio entre
infraestruturas rodoviárias e “habitantes
globais”;
 TXANALF – percentagem de habitantes
sem estudos;
 TXUNIV – percentagem de habitantes
com um grau académico;
 TX_SECT_I – percentagem de
trabalhadores do setor primário
(agricultura e pesca);
 TX_SECT_III – percentagem de
trabalhadores do setor terciário (serviços e
comércio);
 IPC – índice de poder de compra;
 DEP_EMP_LX – percentagem de
habitantes a trabalhar no município de
Lisboa;
 TX_MOT – taxa de motorização;
 COMP – índice de compacidade;
 ENTROP – índice de entropia;
 MIX – relação entre os habitantes e os
trabalhadores e estudantes;
Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL
André Ramos (n.º 76819) / Luís Neto (n.º 74776) 3
 PPGLOB400TCSP – percentagem de
“habitantes globais” a menos de 400
metros de uma estação/paragem de
transporte público pesado;
 DISTCBD – distância ao centro de Lisboa;
 PAURB – percentagem de área
urbanizada;
 POP – número de residentes;
 EMP_EST – número de estudantes e
trabalhadores;
 PFAM0EMP – percentagem de famílias
sem trabalhadores;
 PFAM1EMP – percentagem de famílias
com 1 trabalhadores;
 PFAM2EMP – percentagem de famílias
com 2 trabalhadores;
 PFAMM2EMP – percentagem de famílias
com mais de 2 trabalhadores;
 PFAM0LIB – percentagem de famílias
com 0 trabalhadores por conta própria;
 PFAMM1LIB – percentagem de famílias
com 1 ou mais trabalhadores por conta
própria;
 PFAMCRIANC – percentagem de famílias
com crianças;
 DIMGLOB – tamanho global (soma de
residentes, estudantes e trabalhadores);
 LNACTCTI – logaritmo do rácio entre
acessibilidade usando transporte coletivo
e a acessibilidade usando transporte
individual.
2.2. ELIMINAÇÃO DE VARIÁVEIS
Das 33 variáveis independentes que poderiam ser
usadas na análise fatorial e/ou no modelo de
regressão linear, foram, desde logo, abandonadas
algumas, nomeadamente:
 As variáveis POP e EMP_EST foram
assumidas como sendo variáveis
meramente “caracterizáveis” e indicativas
da zona em questão, sem influência na
quota de TI;
 As variáveis PFAMM2EMP e PFAMM1LIB
foram eliminadas por se tratar de
combinações lineares de outras variáveis
(PFAM0EMP, PFAM1EMP e PFAM2EMP,
no primeiro caso, e PFAMM1LIB, no
segundo caso); por sua vez, a variável
LNACTCTI também é uma transformação
logarítmica da variável AcTC_TI5.
Posto isto, optou-se pela categorização destas
variáveis em variáveis de uso do solo e variáveis
socioeconómicas, como se descreve na Tabela
2.1.
Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL
André Ramos (n.º 76819) / Luís Neto (n.º 74776) 4
Tabela 2.1 – Categorização das variáveis
Variáveis de uso
do solo
Variáveis
socioeconómicas
AcTC_TI5
LNDENS_GL
PPESSGL1000
PPGLOB400BUS
KMVIA/PESSGL
COMP
ENTROP
MIX
PPGLOB400TCSP
DISTCBD
PAURB.
FAM>1TI
TXANALF
TXUNIV
TX_SECT_I
TX_SECT_III
IPC
TX_MOT
PFAM0EMP
PFAM1EMP
PFAM2EMP
PFAM0LIB
PFAMCRIANC
DIMGLOB
As variáveis PTCDIST, PPASSE e DISTTIHAB
foram englobadas numa terceira categoria
(variáveis mais relacionadas com a “mobilidade”) e,
por isso, não foram utilizadas nas análises fatoriais
efetuadas com separação das variáveis.
Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL
André Ramos (n.º 76819) / Luís Neto (n.º 74776) 5
3. ANÁLISE FATORIAL COM CATEGORIZAÇÃO DAS
VARIÁVEIS
A Análise Fatorial Exploratória (AFE) tem o
intuito principal de detetar relações latentes entre
variáveis de modo a construir fatores que permitam
explicar essa relação entre elas, permitindo reduzir
o número de variáveis a utilizar noutras análises
(como os modelos de regressão linear).
De modo a verificar a adequabilidade de um
modelo de análise fatorial, existem algumas
verificações a fazer:
 Medida de adequação da amostragem
de Kaiser-Meyer-Olkin (mais conhecido
por KMO): compara as correlações
simples com as correlações observadas
entre variáveis, e em função dos valores
assumidos (consoante a Tabela 3.1),
“recomenda” a utilização da análise
fatorial ou não;
Tabela 3.1 – Recomendação da AFE face aos valores de
KMO
Valor de KMO Recomendação da AFE
0,9 a 1,0 Excelente
0,8 a 0,9 Boa
0,7 a 0,8 Média
0,6 a 0,7 Medíocre
0,5 a 0,6 Mau (mas aceitável)
Menor que 0,5 Inaceitável
 MSA (Measure of Sampling
Adequancy): trata-se de uma
particularização do KMO para cada uma
das variáveis, sendo representada pela
diagonal principal da matriz de anti-
imagem, que deve tomar valores
superiores a 0,5;
 Teste de Esfericidade de Bartlett:
embora bastante sensível à dimensão da
amostra (o que leva à sua utilização com
prudência), obriga a que o p-value seja
inferior a 0,001, significado de que as
variáveis estão correlacionadas
significativamente e os fatores comuns
são bastante importantes;
 Comunalidades e variância total
explicada (ou variância extraída total):
as comunalidades são a percentagem de
variância de cada variável explicada pelos
fatores extraídos, devendo ser sempre
superiores a 50%; por sua vez, a variância
extraída total pelos fatores com valores
próprios (eigenvalues) superiores a 1 deve
também ser, no mínimo, superior a 50%;
pelo “scree plot” obtido no SPSS®, deve
ser possível observar uma inflexão no
gráfico assim que os eigenvalues forem
inferiores a 1;
 Goodness of Fit Index (GFI): índice
usado para analisar o ajustamento do
modelo de análise fatorial aos dados,
devendo tomar valores superiores a 0,9 e,
preferencialmente, a 0,95; o GFI tende,
Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL
André Ramos (n.º 76819) / Luís Neto (n.º 74776) 6
contudo, a sobrestimar o ajustamento,
pelo que se deve calcular o GFI ajustado
(que leva em conta os graus de liberdade
e o número de variâncias-covariâncias
não redundantes);
 Root Mean Square Residual (RMSR*):
índice usado igualmente para medir o
ajustamento do modelo aos dados,
devendo tomar valores inferiores a 0,1 e,
preferencialmente a 0,05.
De referir que, para a estimação dos fatores
relativos quer ao uso do solo, quer às variáveis
socioeconómicas, usou-se o Método das
Componentes Principais para a extração dos
fatores, juntamente com o Critério de Kaiser (ou
seja, consideraram-se apenas os fatores com
eigenvalue ou valor próprio superior a 1). Para a
rotação dos fatores, utilizou-se o método Varimax,
uma vez que se pretende obter uma estrutura de
fatores em que cada variável está fortemente
associada a apenas um fator, e porque não se
suspeita da existência de algum fator geral.
Nas tabelas dos loadings de cada fator, são
apresentados apenas os loadings de valor superior
a 0,5, por ser este o valor mínimo para serem
considerados como significantes (de facto, para a
amostra em análise, um loading de 0,4 já poderia
ser considerado aceitável).
Por fim, para cálculo das variáveis a usar na
regressão linear, usou-se o Método de Thompson
(ou método da regressão).
3.1. VARIÁVEIS DE USO DO SOLO
Como visto no Capítulo 2, as variáveis de uso do
solo testadas foram:
 AcTC_TI5;
 LNDENS_GL;
 PPESSGL1000;
 PPGLOB400BUS;
 KMVIA/PESSGL;
 COMP;
 ENTROP;
 MIX;
 PPGLOB400TCSP;
 DISTCBD;
 PAURB.
1ª Iteração
Correu-se a análise fatorial do SPSS® para estas
variáveis (cuja descrição se apresenta na Figura
3.1) e extraíram-se os diversos outputs, que se
apresentam e caracterizam de seguida.
Figura 3.1 – Estatística descritiva da 1ª iteração das
variáveis de uso do solo
Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL
André Ramos (n.º 76819) / Luís Neto (n.º 74776) 7
Na Figura 3.2 é apresentado o KMO, bem como o
teste de Esfericidade de Bartlett. Neste caso, o
KMO atinge um valor de 0,871, o que faz com que
a análise fatorial seja fortemente recomendada. Por
sua vez, a título indicativo, o teste de Esfericidade
de Bartlett resulta num p-value inferior a 0,001,
como seria desejável.
Figura 3.2 – KMO e teste de Esfericidade de Bartlett da 1ª
iteração das variáveis de uso do solo
Olhando agora para a diagonal principal da matriz
de anti-imagem das correlações (vide Figura 3.3)
de modo a obter a MSA para cada uma das
variáveis, é observável que todos os valores são
superiores a 0,5, atestando a adequação de todas
as variáveis.
Figura 3.3 – Matrizes de anti-imagem da 1ª iteração das variáveis de uso do solo
O passo seguinte passa pela análise das
comunalidades de cada variável, que se
apresentam na Figura 3.4. Como se observa, a
percentagem da variância de cada variável
explicada pelos fatores comuns extraídos pelo
Método das Componentes Principais é sempre
superior a 0,5.
Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL
André Ramos (n.º 76819) / Luís Neto (n.º 74776) 8
Figura 3.4 – Comunalidades da 1ª iteração das variáveis
de uso do solo
Por sua vez, a Figura 3.5 representa a
percentagem de variância explicada por cada um
dos fatores. Como se observa, são retidos três
fatores que explicam cerca de 72% da variabilidade
total. Isso pode também ser confirmado pelo “scree
plot” (Figura 3.6), que apresenta uma inflexão do
terceiro para o quarto fator.
Figura 3.5 – Variância total explicada pelos fatores da 1ª iteração das variáveis de uso do solo
Figura 3.6 – “Scree plot” dos fatores da 1ª iteração das
variáveis de uso do solo
Os pesos dos fatores (ou loadings) são
apresentados na Figura 3.7 e na Figura 3.8 (antes
e pós-rotação Varimax, respetivamente).
Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL
André Ramos (n.º 76819) / Luís Neto (n.º 74776) 9
Figura 3.7 – Loadings dos fatores da 1ª iteração das
variáveis de uso do solo antes da rotação
Figura 3.8 – Loadings dos fatores da 1ª iteração das
variáveis de uso do solo após a rotação
Por fim, como forma de certificar a qualidade do
modelo fatorial, foram calculados alguns dos
índices adequados para o efeito, nomeadamente o
GFI, o AGFI e o RMSR*, como se apresenta na
Tabela 3.2, a partir da matriz dos resíduos (Figura
3.9).
Tabela 3.2 – Índices de qualidade do modelo fatorial da 1ª
iteração das variáveis de uso do solo
GFI 0,88
AGFI 0,69
RMSR* 0,07
Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL
André Ramos (n.º 76819) / Luís Neto (n.º 74776) 10
Figura 3.9 – Matriz dos resíduos da 1ª iteração das variáveis de uso do solo
Quer o GFI, quer o seu valor ajustado AGFI (mais
conservativo) assumem valores inferiores a 0,9,
pelo que se considera que o modelo não se ajusta
bem aos dados disponíveis. Por sua vez, o RMSR*
é inferior a 0,1, pelo que o ajustamento, por este
índice, já se pode considerar bom.
Ainda assim, face aos dois primeiros indicadores,
optou-se por uma nova iteração da análise fatorial,
retirando a variável com a menor comunalidade:
PPESSGL1000.
2ª Iteração
Correndo novamente a análise fatorial com o novo
conjunto de variáveis (vide Figura 3.10),
confrontou-se os resultados obtidos com os
pressupostos teóricos.
Figura 3.10 – Estatística descritiva da 2ª iteração das
variáveis de uso do solo
O valor de KMO, desta feita, praticamente não se
alterou face à iteração anterior, tendo o teste de
Esfericidade de Bartlett resultado dentro dos
valores pretendidos (p-value inferior a 0,001), como
indica a Figura 3.11.
Figura 3.11 – KMO e teste de Esfericidade de Bartlett da
2ª iteração das variáveis de uso do solo
Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL
André Ramos (n.º 76819) / Luís Neto (n.º 74776) 11
A matriz de anti-imagem obtida apresenta-se na
Figura 3.12 e a sua diagonal principal (a MSA para
cada variável) assume valores elevados (sempre
superiores a 0,5), atestando a adequação de todas
as variáveis.
Figura 3.12 – Matrizes de anti-imagem da 2ª iteração das variáveis de uso do solo
Da análise das comunalidades de cada variável
(vide Figura 3.13) são percetíveis as elevadas
percentagens de variância explicada (novamente
sempre superiores a 0,5).
Figura 3.13 – Comunalidades da 2ª iteração das variáveis
de uso do solo
A variância explicada por cada um dos fatores
resulta, então, numa variância total explicada de
75% (3 fatores com valores próprios superiores a
1), como se apresenta na Figura 3.14 e no “scree
plot” da Figura 3.15.
Os loadings de cada fator, antes e depois da
rotação dos fatores, apresentam-se, por sua vez,
na Figura 3.16 e na Figura 3.17, respetivamente.
Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL
André Ramos (n.º 76819) / Luís Neto (n.º 74776) 12
Figura 3.14 – Variância total explicada pelos fatores da 2ª iteração das variáveis de uso do solo
Figura 3.15 – “Scree plot” dos fatores da 2ª iteração das
variáveis de uso do solo
Figura 3.16 – Loadings dos fatores da 2ª iteração das
variáveis de uso do solo antes da rotação
Figura 3.17 – Loadings dos fatores da 2ª iteração das
variáveis de uso do solo após a rotação
De modo a verificar novamente a adequabilidade
do modelo, calculou-se o GFI, o AGFI e o RMSR*
(vide Tabela 3.3) tendo como base a matriz dos
resíduos (Figura 3.18).
Tabela 3.3 – Índices de qualidade do modelo fatorial da 2ª
iteração das variáveis de uso do solo
GFI 0,91
AGFI 0,73
RMSR* 0,07
Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL
André Ramos (n.º 76819) / Luís Neto (n.º 74776) 13
Figura 3.18 – Matriz dos resíduos da 2ª iteração das variáveis de uso do solo
Desta feita, o GFI é superior a 0,9 e o RMSR* é
superior a 0,1, pelo que o ajustamento se pode
aceitar. Apesar de o AGFI ser inferior a 0,9,
decidiu-se (uma vez que o GFI cumpre o
pretendido) aceitar por enquanto esta solução de
modelo de análise fatorial, já que estes fatores não
são totalmente infalíveis.
Note-se que se verificam algumas relações na
Figura 3.17 que, à partida, seriam expectáveis:
 Zonas com uma densidade elevada têm
uma área urbanizada elevada e também
uma alta percentagem de população a
menos de 400 metros de uma paragem de
autocarro (pois os operadores adequam a
oferta à procura);
 Zonas com elevada percentagem da
população a menos de 400 metros dum
transporte público pesado têm,
tendencialmente, um índice de
acessibilidade em transporte coletivo
elevado.
Dados os valores obtidos nos loadings, estes
fatores do uso do solo passarão a ser denominados
de:
 Fator “Alto dos Moinhos” FAM (ou f1) –
representa áreas fortemente urbanizadas,
muito próximas do centro da cidade e com
bom serviço de autocarros;
 Fator “ferroviário” FF (ou f2) – descreve
as zonas próximas de um transporte
público pesado e com elevada
acessibilidade de transporte público face
ao transporte individual;
 Fator de entropia FE (ou f3) – representa
as zonas com forte entropia.
Estes fatores, de acordo com a Figura 3.19, são
dados por:
Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL
André Ramos (n.º 76819) / Luís Neto (n.º 74776) 14
FAM = -0,040 x AcTC_TI5 + 0,195 x LNDENS_GL + 0,295 x PPGLOB400BUS – 0,212 x KMVIA/PESSGL – 0,265 x COMP
– 0,069 x ENTROP – 0,230 x MIX – 0,116 x PPGLOB400TCSP + 0,175 x PAURB – 0,258 x DISTCBD
FF = 0,356 x AcTC_TI5 + 0,020 x LNDENS_GL – 0,114 x PPGLOB400BUS + 0,180 x KMVIA/PESSGL + 0,057 x COMP
+ 0,006 x ENTROP + 0,521 x MIX + 0,420 x PPGLOB400TCSP + 0,030 x PAURB + 0,118 x DISTCBD
FE = -0,088 x AcTC_TI5 – 0,002 x LNDENS_GL – 0,131 x PPGLOB400BUS – 0,344 x KMVIA/PESSGL + 0,471 x COMP
+ 0,687 x ENTROP + 0,038 x MIX – 0,013 x PPGLOB400TCSP + 0,041 x PAURB – 0,115 x DISTCBD
Figura 3.19 – Coeficientes dos fatores das variáveis de
uso do solo
3.2. VARIÁVEIS SOCIOECONÓMICAS
Desta feita, as variáveis de caracterização
socioeconómica da população de cada zona
utilizadas na análise fatorial foram, numa primeira
instância:
 FAM>1TI;
 TXANALF;
 TXUNIV;
 TX_SECT_I;
 TX_SECT_III;
 IPC;
 TX_MOT;
 PFAM0EMP;
 PFAM1EMP;
 PFAM2EMP;
 PFAM0LIB;
 PFAMCRIANC;
 DIMGLOB.
1ª Iteração
Recorrendo ao SPSS®, correu-se pela primeira vez
a construção do modelo de análise fatorial, com as
variáveis descritas (Figura 3.20).
Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL
André Ramos (n.º 76819) / Luís Neto (n.º 74776) 15
Figura 3.20 – Estatística descritiva da 1ª iteração das
variáveis socioeconómicas
No entanto, apesar de anteriormente já se ter
eliminado algumas das variáveis da análise por
serem uma combinação linear de outras, a
mensagem obtida na matriz das correlações – “a
matriz não é positiva definida” ou, dito de outra
forma, a matriz é singular e não admite uma matriz
inversa (e o seu determinante é nulo) – denuncia a
existência de uma variável que ainda é combinação
linear de outra(s). Como resultado, as matrizes de
anti-imagem e o KMO não são calculados.
Olhando para as variáveis disponíveis, optou-se, na
2ª iteração, pela eliminação da TXUNIV, por se
desconfiar da elevada relação com a variável
TXANALF.
2ª Iteração
Correndo novamente o modelo, já foi possível obter
uma solução de análise fatorial.
Nesta solução, o KMO obtido foi de 0,709 (vide
Figura 3.21), que se encontra muito perto do limite
inferior a partir do qual a adequação da análise
fatorial é “média” (ou seja, pouco acima do
“medíocre”). O teste de Esfericidade de Bartlett
resulta num p-value inferior a 0,001, revelando que
as variáveis estão correlacionadas
significativamente.
Figura 3.21 – KMO e teste de Esfericidade de Bartlett da
2ª iteração das variáveis socioeconómicas
Já com a matriz de anti-imagem das correlações
disponível (vide Figura 3.3) e olhando para a sua
diagonal principal, registam-se valores MSA
inferiores a 0,5 para as variáveis PFAM0EMP,
PFAM1EMP e PFAM2EMP, o que revela que elas
não se adequam à estrutura definida pelas
restantes variáveis e, por isso, deve ser
considerada a sua eliminação da análise fatorial.
Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL
André Ramos (n.º 76819) / Luís Neto (n.º 74776) 16
Figura 3.22 – Matrizes de anti-imagem da 2ª iteração das variáveis socioeconómicas
Por sua vez, olhando para as comunalidades das
diversas variáveis (vide Figura 3.23), regista-se
igualmente a presença de uma delas com uma
percentagem de variância explicada inferior a 50%
(DIMGLOB).
Figura 3.23 – Comunalidades da 2ª iteração das variáveis
socioeconómicas
Considerou-se, por isso, a passagem para uma
nova iteração do modelo, já com a eliminação
destas 4 variáveis que não cumprem as pretensões
da análise (PFAM0EMP, PFAM1EMP, PFAM2EMP
e DIMGLOB).
3ª Iteração
Já com um número mais reduzido de variáveis
(Figura 3.24), correu-se novamente o modelo de
análise fatorial.
Figura 3.24 – Estatística descritiva da 3ª iteração das
variáveis socioeconómicas
Nesta iteração, o valor do KMO foi
substancialmente mais elevado (por eliminação das
Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL
André Ramos (n.º 76819) / Luís Neto (n.º 74776) 17
variáveis com fraca adequação), como se
apresenta na Figura 3.25. Uma vez mais, o teste de
Esfericidade de Bartlett resultou num p-value
inferior a 0,001.
Figura 3.25 – KMO e teste de Esfericidade de Bartlett da
3ª iteração das variáveis socioeconómicas
Inspecionando a diagonal principal da nova matriz
de anti-imagem das correlações (vide Figura 3.26),
todas as variáveis apresentam valores de MSA
muito satisfatórios. As comunalidades destas
variáveis, por sua vez, também são sempre
superiores a 0,5, como se observa na Figura 3.27.
Figura 3.26 – Matrizes de anti-imagem da 3ª iteração das variáveis socioeconómicas
Figura 3.27 – Comunalidades da 3ª iteração das variáveis
socioeconómicas
Na Figura 3.28, apresenta-se a variância explicada
pelos fatores com valores próprios superiores a 1: é
explicada quase 79% da variância total através de
dois fatores, como também se pode observar pelo
“scree plot” da Figura 3.29.
Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL
André Ramos (n.º 76819) / Luís Neto (n.º 74776) 18
Figura 3.28 – Variância total explicada pelos fatores da 3ª iteração das variáveis socioeconómicas
Figura 3.29 – “Scree plot” dos fatores da 3ª iteração das
variáveis socioeconómicas
Neste momento, procedeu-se de imediato ao
cálculo dos índices de certificação da qualidade do
modelo fatorial, que se apresentam na Tabela 3.4,
a partir da matriz dos resíduos (Figura 3.30).
Tabela 3.4 – Índices de qualidade do modelo fatorial da 3ª
iteração das variáveis socioeconómicas
GFI 0,98
AGFI 0,94
RMSR* 0,09
Figura 3.30 – Matriz dos resíduos da 3ª iteração das variáveis socioeconómicas
Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL
André Ramos (n.º 76819) / Luís Neto (n.º 74776) 19
Tanto o GFI como o AGFI são superiores a 0,9,
pelo que se pode considerar que o modelo se
ajusta bem aos dados disponíveis. Por sua vez, o
RMSR* é inferior a 0,1 mas muito próximo desse
valor, a partir do qual se considera que o
ajustamento é inaceitável.
Deste modo, como forma de tentar evitar alguns
dos valores das comunalidades mais baixos, não
se aceitou esta solução do modelo fatorial e
procedeu-se a uma nova iteração, testando
alternativamente a eliminação de uma ou mais do
conjunto de variáveis FAM>1TI, TXMOT,
PFAM0LIB e PFAMCRIANC – efetivamente, para
a 4ª iteração, acabaram por ser eliminadas as duas
primeiras destas quatro.
4ª Iteração
Correndo o modelo de análise fatorial agora com
apenas as seis variáveis que restaram das análises
anteriores (vide Figura 3.31), efetuaram-se as
verificações habituais.
Figura 3.31 – Estatística descritiva da 4ª iteração das
variáveis socioeconómicas
Nesta nova iteração, o valor do KMO subiu um
pouco, verificando-se novamente os pressupostos
inerentes ao teste de Esfericidade de Bartlett (p-
value inferior a 0,001), como se verifica na Figura
3.32.
Figura 3.32 – KMO e teste de Esfericidade de Bartlett da
4ª iteração das variáveis socioeconómicas
Neste caso, a diagonal principal da matriz de anti-
imagem das correlações (Figura 3.33) apresenta
alguns valores de MSA mais baixos que a anterior,
mas ainda assim, na globalidade verifica-se a
adequação de todas as variáveis (como, aliás, o
KMO já indiciava).
Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL
André Ramos (n.º 76819) / Luís Neto (n.º 74776) 20
Figura 3.33 – Matrizes de anti-imagem da 4ª iteração das variáveis socioeconómicas
As comunalidades das variáveis, desta vez,
apresentam valores muito superiores a 0,5, como
se observa na Figura 3.34.
A variância total explicada pelos fatores com
valores próprios superiores a 1, que são dois (vide
Figura 3.35 e “scree plot” da Figura 3.36), sobe
agora para os 86%.
Figura 3.34 – Comunalidades da 4ª iteração das variáveis
socioeconómicas
Figura 3.35 – Variância total explicada pelos fatores da 4ª iteração das variáveis socioeconómicas
Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL
André Ramos (n.º 76819) / Luís Neto (n.º 74776) 21
Figura 3.36 – “Scree plot” dos fatores da 4ª iteração das
variáveis socioeconómicas
Na Figura 3.37 e Figura 3.38 são apresentados, por
fim, os loadings antes e depois da rotação dos
eixos do tipo Varimax, respetivamente, todos com
valores muito elevados.
Figura 3.37 – Loadings dos fatores da 4ª iteração das
variáveis socioeconómicas antes da rotação
Figura 3.38 – Loadings dos fatores da 4ª iteração das
variáveis socioeconómicas após a rotação
Averiguando a qualidade deste novo modelo
fatorial, e a partir da matriz dos resíduos (vide
Figura 3.39), verifica-se através de qualquer um
dos três índices apresentados na Tabela 3.5 (GFI,
AGFI e RMSR*) a boa adequabilidade do modelo
aos dados existentes.
Tabela 3.5 – Índices de qualidade do modelo fatorial da 4ª
iteração das variáveis socioeconómicas
GFI 0,99
AGFI 0,96
RMSR* 0,05
Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL
André Ramos (n.º 76819) / Luís Neto (n.º 74776) 22
Figura 3.39 – Matriz dos resíduos da 4ª iteração das variáveis socioeconómicas
Uma vez mais, os dois fatores revelam algumas
relações de algum modo aceitáveis:
 Zonas com elevada taxa de analfabetismo
apresentam um índice de poder de
compra muito reduzido e uma taxa de
trabalhadores no setor primário muito
elevada;
 Famílias sem profissionais liberais (ou
seja, com trabalhadores por conta de
outrem) têm menos filhos.
Assim, os fatores de caracterização
socioeconómica passarão a ser denominados de:
 Fator “Poor Farmer” FPF (f1) – representa
os indivíduos com baixo poder de compra,
níveis de literacia reduzidos e empregos
do setor primário;
 Fator “Yuppie Workaholics” FYW (f2) –
descreve os típicos jovens sem
independência financeira que trabalham
por conta de outrem e adiam a
paternidade.
Estes fatores, de acordo com a Figura 3.40, são
dados por:
FPF = 0,305 x TXANALF + 0,270 x TX_SECT_I – 0,268 x TX_SECT_III – 0,306 x IPC + 0,124 x PFAM0LIB – 0,089 x PFAMCRIANC
FYW = 0,087 x TXANALF + 0,032 x TX_SECT_I – 0,006 x TX_SECT_III – 0,091 x IPC + 0,568 x PFAM0LIB – 0,538 x PFAMCRIANC
Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL
André Ramos (n.º 76819) / Luís Neto (n.º 74776) 23
Figura 3.40 – Coeficientes dos fatores das variáveis
socioeconómicas
Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL
André Ramos (n.º 76819) / Luís Neto (n.º 74776) 24
4. ANÁLISE FATORIAL SEM CATEGORIZAÇÃO DAS
VARIÁVEIS
De acordo com a bibliografia consultada,
particularmente o modelo de Stead, Williams e
Titheridge, os padrões de uso do solo estão
intimamente relacionados com as características
socioeconómicas (e ambos influenciam os padrões
de mobilidade), sendo difícil separá-los claramente
ou, dito de outra forma, categorizar determinada
variável como sendo especificamente de uso do
solo ou socioeconómica (vide Figura 4.1).
Figura 4.1 – Modelo conceptual das interações entre
padrões de mobilidade, padrões de uso do solo e
características socioeconómicas
Fonte: Stead, Williams e Titheridge, 2000
Desse modo, testou-se a construção de um modelo
de análise fatorial sem separação das variáveis,
tentando perceber se os resultados obtidos
permitiam a sua utilização no modelo de regressão
linear a construir.
Como se referiu anteriormente, nem todas as
variáveis foram usadas nesta análise fatorial (não
se eliminaram apenas aquelas que se sabia serem
combinações lineares de outras, mas também a
variável TXUNIV, que se veio a descobrir durante
as análises fatoriais anteriores).
1ª Iteração
Recorrendo ao SPSS® e tomando as variáveis
descritas (Figura 4.2) nesta análise fatorial,
obtiveram-se os outputs necessários para a
verificação da adequabilidade do modelo.
Figura 4.2 – Estatística descritiva da 1ª iteração da análise
fatorial sem categorização das variáveis
Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL
André Ramos (n.º 76819) / Luís Neto (n.º 74776) 25
Nesta solução, obteve-se logo uma adequação da
análise fatorial “boa”, uma vez que o KMO
resultante foi de 0,858 (vide Figura 4.3). O teste de
Esfericidade de Bartlett, como habitual, resultou
num p-value inferior a 0,001.
Figura 4.3 – KMO e teste de Esfericidade de Bartlett da 1ª
iteração da análise fatorial sem categorização das
variáveis
Na matriz anti-imagem (apresentada na Figura 4.5),
a diagonal principal apresenta alguns valores de
MSA inferiores a 0,5, nomeadamente na variável
PFAM1EMP, seguida de valores entre 0,5 e 0,6
nas variáveis PFAM0EMP e PFAM2EMP.
Analisando as comunalidades (vide Figura 4.4),
registam-se variâncias explicadas inferiores a 50%
nas variáveis PPESSGL1000 e ENTROP, e uma
variância explicada de menos de 55% pela variável
DIMGLOB.
Estas seis variáveis tornaram-se, por isso, nas
“candidatas” à eliminação, tendo sido efetuada uma
nova iteração para avaliar um novo modelo de
análise fatorial.
Figura 4.4 – Comunalidades da 1ª iteração da análise
fatorial sem categorização das variáveis
Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL
André Ramos (n.º 76819) / Luís Neto (n.º 74776) 26
Figura 4.5 – Matrizes de anti-imagem da 1ª iteração da análise fatorial sem categorização das variáveis
Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL
André Ramos (n.º 76819) / Luís Neto (n.º 74776) 27
2ª Iteração
A 2ª iteração foi realizada já com as variáveis
anteriormente descritas retiradas do modelo de
análise fatorial (vide Figura 4.6).
Figura 4.6 – Estatística descritiva da 2ª iteração da análise
fatorial sem categorização das variáveis
Nesta iteração, o valor do KMO subiu ligeiramente,
como se observa na Figura 4.7. O teste de
Esfericidade de Bartlett resultou novamente num
valor de p-value inferior a 0,001.
Figura 4.7 – KMO e teste de Esfericidade de Bartlett da 2ª
iteração da análise fatorial sem categorização das
variáveis
Da análise da matriz de anti-imagem (Figura 4.9) é
percetível (como, aliás, o elevado KMO já indiciava)
a alta adequação da análise fatorial efetuada pelas
MSA elevadas. As comunalidades, desta vez,
também são bastante superiores a 0,5 (e até a 0,7),
pelo que não se espera, por aqui, eliminar qualquer
uma das variáveis utilizadas (vide Figura 4.8).
Figura 4.8 – Comunalidades da 2ª iteração da análise
fatorial sem categorização das variáveis
Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL
André Ramos (n.º 76819) / Luís Neto (n.º 74776) 28
Figura 4.9 – Matrizes de anti-imagem da 2ª iteração da análise fatorial sem categorização das variáveis
Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL
André Ramos (n.º 76819) / Luís Neto (n.º 74776) 29
A variância total explicada pelos 4 fatores obtidos
nesta análise fatorial (como indica a Figura 4.10 e a
Figura 4.11), atinge os 80%, o que se considera
muito satisfatório.
Figura 4.10 – Variância total explicada pelos fatores da 2ª iteração da análise fatorial sem categorização das variáveis
Figura 4.11 – “Scree plot” dos fatores da 2ª iteração da
análise fatorial sem categorização das variáveis
Os loadings de cada fator apresentam-se na Figura
4.12 e na Figura 4.13 (antes e depois da rotação do
tipo Varimax, respetivamente).
Figura 4.12 – Loadings dos fatores da 2ª iteração da
análise fatorial sem categorização das variáveis antes da
rotação
Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL
André Ramos (n.º 76819) / Luís Neto (n.º 74776) 30
Figura 4.13 – Loadings dos fatores da 2ª iteração da
análise fatorial sem categorização das variáveis após a
rotação
A partir da matriz dos resíduos (vide Figura 4.15), é
possível calcular os indicadores da qualidade deste
modelo de análise fatorial, que se apresentam na
Tabela 4.1: todos eles cumprem os requisitos (GFI
e AGFI superiores a 0,90 e RMSR* inferior a 0,10),
pelo que se garante a boa adequabilidade do
modelo aos dados existentes.
Tabela 4.1 – Índices de qualidade do modelo fatorial da 2ª
iteração da análise fatorial sem categorização das
variáveis
GFI 0,97
AGFI 0,93
RMSR* 0,05
Os fatores obtidos explicam algumas
características latentes entre as várias variáveis, e
foram denominados da seguinte forma:
 Fator “Parque dos Príncipes” FPP (f1) –
representa os indivíduos com elevado
poder de compra, trabalhadores do setor
terciário, com uma média densidade de
urbanização mas taxa de rede viária baixa
(zonas com muitos espaços verdes);
 Fator “Portas de Benfica” FPB (f2) –
explica as zonas com média densidade de
ocupação e um bom serviço de TC;
 Fator “Baía de Cascais” FBC (f3) –
representa as famílias com mais que uma
viatura, alta taxa de motorização, e com
profissionais liberais e crianças no
agregado;
 Fator “Instituto Superior Técnico” FIST
(f4) – representa uma zona com boa
acessibilidade de TC (nomeadamente
transporte público pesado) e com uma
relação de estudantes e trabalhadores alta
face ao número de habitantes.
Os coeficientes destes fatores apresentam-se na
Figura 4.14.
Figura 4.14 – Coeficientes dos fatores sem categorização
das variáveis
Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL
André Ramos (n.º 76819) / Luís Neto (n.º 74776) 31
Desta forma, os fatores tomam a forma que se
segue:
FPP = 0,076 x FAM>1TI – 0,101 x AcTC_TI5 + 0,013 x LNDENS_GL – 0,008 x PPGLOB400BUS – 0,210 x KMVIA/PESSGL – 0,261 x
TXANALF – 0,239 x TX_SECT_I + 0,168 x TX_SECT_III + 0,273 x IPC + 0,034 x DEP_EMP_LX + 0,095 x TX_MOT + 0,152 x COMP –
0,035 x MIX – 0,042 x PPGLOB400TCSP – 0,064 x DISTCBD + 0,040 x PAURB – 0,074 x PFAM0LIB + 0,024 x PFAMCRIANC
FPB = -0,104 x FAM>1TI – 0,008 x AcTC_TI5 + 0,127 x LNDENS_GL + 0,340 x PPGLOB400BUS + 0,106 x KMVIA/PESSGL + 0,123 x
TXANALF + 0,131 x TX_SECT_I – 0,039 x TX_SECT_III – 0,070 x IPC + 0,157 x DEP_EMP_LX – 0,074 x TX_MOT – 0,518 x COMP –
0,279 x MIX – 0,079 x PPGLOB400TCSP – 0,164 x DISTCBD + 0,149 x PAURB – 0,111 x PFAM0LIB + 0,149 x PFAMCRIANC
FBC = 0,248 x FAM>1TI – 0,034 x AcTC_TI5 + 0,000 x LNDENS_GL + 0,087 x PPGLOB400BUS + 0,035 x KMVIA/PESSGL – 0,063 x
TXANALF + 0,013 x TX_SECT_I + 0,045 x TX_SECT_III + 0,097 x IPC + 0,056 x DEP_EMP_LX + 0,234 x TX_MOT – 0,070 x COMP +
0,012 x MIX + 0,082 x PPGLOB400TCSP – 0,023 x DISTCBD + 0,081 x PAURB – 0,439 x PFAM0LIB + 0,400 x PFAMCRIANC
FIST = 0,043 x FAM>1TI + 0,321 x AcTC_TI5 + 0,049 x LNDENS_GL – 0,115 x PPGLOB400BUS + 0,042 x KMVIA/PESSGL + 0,020 x
TXANALF + 0,054 x TX_SECT_I + 0,049 x TX_SECT_III – 0,079 x IPC + 0,041 x DEP_EMP_LX – 0,018 x TX_MOT + 0,197 x COMP +
0,523 x MIX + 0,398 x PPGLOB400TCSP + 0,059 x DISTCBD + 0,050 x PAURB – 0,042 x PFAM0LIB + 0,040 x PFAMCRIANC
Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL
André Ramos (n.º 76819) / Luís Neto (n.º 74776) 32
Figura 4.15 – Matriz dos resíduos da 2ª iteração da análise fatorial sem categorização das variáveis
Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL
André Ramos (n.º 76819) / Luís Neto (n.º 74776) 33
5. CONSTRUÇÃO DO MODELO DE REGRESSÃO LINEAR
Uma vez que se realizaram dois conjuntos de
análises fatoriais, proceder-se-á à averiguação de
qual o modelo que melhor se ajusta aos dados
disponíveis, desde que cumpra as verificações
necessárias.
Essas verificações explicam-se sucintamente de
seguida:
 Coeficiente de determinação (R²):
medida de avaliação do efeito das
variáveis independentes sobre a variável
dependente, medindo a qualidade de
ajustamento, e toma valores entre 0 e 1
(ou seja, um valor de 1,0 ou 100%
representa que 100% da variabilidade total
da variável dependente é explicada pelas
variáveis independentes do modelo de
regressão linear usado); de forma a poder
comparar dois modelos com diferentes
números de variáveis, deve calcular-se o
coeficiente ajustado (R2
a);
 Estatística de Durbin-Watson: este teste
procura garantir que não existem
correlações entre as variâncias – para tal,
é exigido que o valor do teste seja o mais
próximo possível de 2,0 (com uma
amplitude de +- 0,2);
 Verificação dos resíduos: procedimento
gráfico cujo objetivo é garantir que os
erros têm distribuição normal com média
nula e variância constante (verificado
através de um gráfico de probabilidade
normal, com a probabilidade acumulada
dos erros no eixo das abcissas e a
probabilidade acumulada que se obteria
caso os erros possuíssem realmente
distribuição normal no eixo das
ordenadas) e que são independentes; os
erros dever-se-ão distribuir de forma linear
em redor do zero de forma a garantir que
são independentes e não se registam
problemas de heteroscedasticidade;
 Verificação da significância do modelo:
trata-se de verificar se o p-value do teste
ANOVA é inferior a 0,001, de modo a
garantir que o modelo é altamente
significativo;
 Variance Inflation Factors (VIF): estes
valores devem, para cada variável, ser
inferiores a 5, sob pena de se estar
perante problemas de multicolinearidade
entre variáveis;
 Condition Index: estes valores, por sua
vez, devem ser inferiores a 15, novamente
como forma de despiste de situações de
multicolinearidade entre variáveis;
 Valores centrados da influência de
cada caso (Leverage) no ajustamento
do modelo: segundo a bibliografia, os
valores de Leverage devem situar-se
abaixo de 0,2 (entre 0,2 e 0,5 consideram-
se valores aceitáveis mas “arriscados”).
Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL
André Ramos (n.º 76819) / Luís Neto (n.º 74776) 34
5.1. MODELO 1 – ANÁLISE FATORIAL COM
CATEGORIZAÇÃO DAS VARIÁVEIS
Das análises fatoriais separadas efetuadas para as
variáveis de uso do solo e para as variáveis
socioeconómicas, resultaram 5 fatores (agora
transformados em 5 novas variáveis), a saber:
 Fator “Alto dos Moinhos” FAM;
 Fator “ferroviário” FF;
 Fator de entropia FE;
 Fator “Poor Farmer” FPF;
 Fator “Yuppie Workaholics” FYW.
1ª Iteração
Nesta 1ª iteração, além destas 5 variáveis
calculadas a partir da análise fatorial, foram usadas
ainda outras 3 variáveis que haviam ficado de fora
nessa fase (vide Figura 5.1):
 PTCDIST;
 PPASSE;
 DISTTIHAB.
Figura 5.1 – Estatística descritiva da 1ª iteração do
modelo de regressão linear (análise fatorial com
categorização das variáveis)
Um dos outputs mais úteis do SPSS® é
apresentado na Figura 5.2, que resume alguns dos
indicadores do modelo testado.
Figura 5.2 – Resumo da 1ª iteração do modelo de regressão linear (análise fatorial com categorização das variáveis)
Como se observa, o R2 obtido é de 0,684 (ou
0,671, considerando o ajustamento), o que não é
de menosprezar, mas a estatística de Durbin-
Watson resulta num valor de 1,644, fora do
intervalo pretendido.
Desse modo, procedeu-se desde logo a uma
revisão das variáveis utilizadas, através do teste de
eliminação das variáveis complementares às
resultantes das análises fatoriais. Testou-se,
alternativamente, a eliminação das variáveis
PTCDIST, PPASSE e DISTTIHAB, tendo-se
optado por manter apenas as duas últimas
Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL
André Ramos (n.º 76819) / Luís Neto (n.º 74776) 35
2ª Iteração
Correu-se, então, o modelo de regressão linear
retirando a variável PTCDIST (vide Figura 5.3).
Figura 5.3 – Estatística descritiva da 2ª iteração do
modelo de regressão linear (análise fatorial com
categorização das variáveis)
Olhando para o resumo do modelo dado pelo
SPSS®, que se apresenta na Figura 5.4, é
percetível a forte subida do valor do teste de
Durbin-Watson, tendo contudo o R2 (e o seu valor
ajustado) descido também com alguma expressão.
Figura 5.4 – Resumo da 2ª iteração do modelo de regressão linear (análise fatorial com categorização das variáveis)
Olhando para os gráficos dos resíduos, conclui-se
o seguinte:
 Os resíduos têm distribuição normal com
média nula e variância constante (vide
Figura 5.5, para a representação do
histograma, ou a Figura 5.6, para o normal
probability plot, em que os pontos se
distribuem aproximadamente sobre a
diagonal principal);
 Os resíduos distribuem-se de forma
aparentemente aleatória em torno do eixo
horizontal (ei = 0), o que garante a sua
independência (Figura 5.7) e a
homoscedasticidade das variáveis.
Figura 5.5 – Histograma dos resíduos da 2ª iteração do
modelo de regressão linear (análise fatorial com
categorização das variáveis)
Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL
André Ramos (n.º 76819) / Luís Neto (n.º 74776) 36
Figura 5.6 – Normal probability plot da 2ª iteração do
modelo de regressão linear (análise fatorial com
categorização das variáveis)
Figura 5.7 – Gráfico da distribuição dos erros da 2ª
iteração do modelo de regressão linear (análise fatorial
com categorização das variáveis)
Pelo teste da ANOVA (Figura 5.8), o p-value é
inferior a 0,001, pelo que o modelo de regressão
linear tem significado para qualquer nível de
significância.
Figura 5.8 – Teste da ANOVA da 2ª iteração do modelo
de regressão linear (análise fatorial com categorização
das variáveis)
Por sua vez, da análise da Figura 5.9 constata-se
que os VIF de todas as variáveis são inferiores a 5.
Da Figura 5.10 percebe-se igualmente que os
condition index de todas as variáveis são inferiores
a 15, pelo que está garantida a não existência de
problemas de multicolinearidade entre variáveis.
Figura 5.9 – Coeficientes e VIF da 2ª iteração do modelo de regressão linear (análise fatorial com categorização das variáveis)
Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL
André Ramos (n.º 76819) / Luís Neto (n.º 74776) 37
Figura 5.10 – Verificação de multicolinearidade da 2ª iteração do modelo de regressão linear (análise fatorial com
categorização das variáveis)
Olhando, por fim, para o valor da Leverage (valores
centrados da influência de cada caso no
ajustamento do modelo), que se apresenta na
Figura 5.11, verifica-se que esta toma um valor
máximo de 0,282, o que se pode considerar
“arriscado” – de algum modo, pode significar a
presença de um outlier.
Figura 5.11 – Verificação da Leverage da 2ª iteração do
modelo de regressão linear (análise fatorial com
categorização das variáveis)
Pela Figura 5.9 apresentada é ainda possível retirar
os coeficientes do modelo de regressão linear
construído. Uma primeira conclusão (retirada da
coluna dos coeficientes estandardizados) é que o
modelo passa pela origem (a ordenada na origem
passa é zero).
Por outro lado, os maiores coeficientes são das
variáveis DISTTIHAB e PPASSE (variáveis de
mobilidade, o que seria de esperar), seguida da
variável FYW e são também as que têm p-values
(significâncias) mais pequenas.
Os coeficientes do modelo ajustado são, então,
dados pela coluna dos coeficientes não
estandardizados:
PTIDIST = 0,395 + 0,013 x FAM – 0,014 x FF – 0,008 x FE –
0,011 x FPF – 0,021 x FYW + 0,017 x DISTTIHAB – 0,340 x
PPASSE
Neste modelo, são percetíveis as seguintes
conclusões:
 Alguns dos fatores relativos ao uso do
solo apresentam sinal positivo
(nomeadamente o fator FAM, que está
relacionado com uma alta urbanização),
enquanto outros apresentam uma
influência negativa na parcela de viagens
em TI (os que evidenciam a existência de
Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL
André Ramos (n.º 76819) / Luís Neto (n.º 74776) 38
transporte coletivo pesado e a entropia da
zona);
 Quanto aos fatores socioeconómicos,
verifica-se que quanto menor a
“terciarização” da população, menor a
distância percorrida em TI;
 Os sinais obtidos no modelo de regressão
linear para as variáveis de mobilidade
também parecem estar suficientemente
reais, uma vez que a distância relativa
percorrida em TI aumenta com a distância
absoluta e diminui com a posse de passe.
Eliminação de Outliers
De forma a tentar melhor a adequabilidade do
modelo de regressão linear aos dados, realizou-se
o diagnóstico disponível no SPSS® para deteção de
outliers na base de dados.
Os vários indicadores do modelo de regressão
linear (Durbin-Watson, R2, etc.), praticamente não
sofreram alterações, apesar de serem encontrados
outliers a uma distância de mais de 3 desvios
padrões da média da variável respetiva, pelo que
não se apresentou a análise efetuada nesse
sentido.
5.2. MODELO 2 – ANÁLISE FATORIAL SEM
CATEGORIZAÇÃO DAS VARIÁVEIS
A partir da análise fatorial sem categorização das
variáveis que se efetuou no Capítulo 4, testou-se o
modelo de regressão linear, recorrendo às novas
quatro variáveis criadas:
 Fator “Parque dos Príncipes” FPP;
 Fator “Portas de Benfica” FPB;
 Fator “Baía de Cascais” FBC;
 Fator “Instituto Superior Técnico” FIST.
1ª Iteração
Nesta fase, além dessas quatro variáveis,
utilizaram-se novamente as três variáveis de
mobilidade que haviam ficado de fora da análise
fatorial (vide Figura 5.12):
 PTCDIST;
 PPASSE;
 DISTTIHAB.
Figura 5.12 – Estatística descritiva da 1ª iteração do
modelo de regressão linear (análise fatorial sem
categorização das variáveis)
Através do resumo do modelo (Figura 5.13) é
constatável a existência de um R2 ajustado com um
valor já significativo (0,686) mas a resposta ao
teste de Durbin-Watson não passou de 1,704.
Assim, procurou realizar-se uma 2ª iteração,
através de novo teste de eliminação de alguma(s)
das variáveis de mobilidade, tendo-se finalizado
novamente com a eliminação da variável PTCDIST.
Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL
André Ramos (n.º 76819) / Luís Neto (n.º 74776) 39
Figura 5.13 – Resumo da 1ª iteração do modelo de regressão linear (análise fatorial sem categorização das variáveis)
2ª Iteração
O novo modelo de regressão linear (sem a variável
PTCDIST, como indica a Figura 5.14) foi analisado
pelos procedimentos disponíveis no SPSS®.
Figura 5.14 – Estatística descritiva da 2ª iteração do
modelo de regressão linear (análise fatorial sem
categorização das variáveis)
O resumo do modelo (vide Figura 5.15), desta feita,
demonstra um teste de Durbin-Watson com um
valor já dentro do aceitável (1,931), ou seja, não se
verificam correlações entre as variâncias das
variáveis, tendo o R2 ajustado descido para 0,628.
Figura 5.15 – Resumo da 2ª iteração do modelo de regressão linear (análise fatorial sem categorização das variáveis)
Olhando para os gráficos dos resíduos deste novo
modelo de regressão linear, podem ser retiradas as
seguintes conclusões:
 Os resíduos têm distribuição normal com
média nula e variância constante (vide
Figura 5.16, que apresenta o histograma,
ou a Figura 5.17, com o normal probability
plot, em que os pontos se distribuem
aproximadamente sobre a diagonal
principal);
 Os resíduos distribuem-se de forma
aparentemente aleatória em torno do eixo
horizontal (ei = 0), garantindo a sua
Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL
André Ramos (n.º 76819) / Luís Neto (n.º 74776) 40
independência (Figura 5.18) e
homoscedasticidade.
Figura 5.16 – Histograma dos resíduos da 2ª iteração do
modelo de regressão linear (análise fatorial sem
categorização das variáveis)
Figura 5.17 – Normal probability plot da 2ª iteração do
modelo de regressão linear (análise fatorial sem
categorização das variáveis)
Figura 5.18 – Gráfico da distribuição dos erros da 2ª
iteração do modelo de regressão linear (análise fatorial
sem categorização das variáveis)
O teste da ANOVA para este novo modelo (Figura
5.19) resulta num p-value novamente inferior a
0,001, concluindo-se que o modelo de regressão
linear é significativo para qualquer nível de
significância.
Figura 5.19 – Teste da ANOVA da 2ª iteração do modelo
de regressão linear (análise fatorial sem categorização
das variáveis)
A Figura 5.20 permite verificar que os VIF para
todas as variáveis são inferiores a 5, o mesmo
enquanto os condition índex (vide Figura 5.21) são
inferiores a 15, confirmando que não se registam
problemas de multicolinearidade entre variáveis.
Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL
André Ramos (n.º 76819) / Luís Neto (n.º 74776) 41
Figura 5.20 – Coeficientes e VIF da 2ª iteração do modelo de regressão linear (análise fatorial sem categorização das
variáveis)
Figura 5.21 – Verificação de multicolinearidade da 2ª iteração do modelo de regressão linear (análise fatorial sem
categorização das variáveis)
A confirmação final do valor da Leverage (vide
Figura 5.22) permite perceber que, neste modelo,
se regista um valor máximo de 0,264, o que, tal
como no outro modelo testado, se pode considerar
“arriscado” (uma vez que a base de dados é a
mesma, são naturais os indícios da presença de
um outlier).
Figura 5.22 – Verificação da Leverage da 2ª iteração do
modelo de regressão linear (análise fatorial sem
categorização das variáveis)
Regressando à Figura 5.20, verifica-se novamente
que o modelo passa pela origem (considerando os
coeficientes estandardizados). Além disso,
registam-se novamente coeficientes superiores nas
variáveis de mobilidade (DISTTIHAB e PPASSE,
com especial incidência para a primeira, como não
é de estranhar), sendo as variáveis com p-values
(significâncias) mais pequenas, seguidas da
variável FBC.
Pode, por fim, escrever-se a expressão do modelo
de regressão linear a partir da coluna dos
coeficientes não estandardizados:
Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL
André Ramos (n.º 76819) / Luís Neto (n.º 74776) 42
PTIDIST = 0,390 + 0,010 x FPP + 0,015 x FPB + 0,027 x FBC –
0,015 x FIST + 0,017 x DISTTIHAB – 0,301 x PPASSE
Olhando para a expressão resultante, os
coeficientes obtidos parecem, em grande parte dos
casos, apresentar alguns valores compreensíveis,
apesar de ser menos intuitiva a sua explicação:
 Quanto maior o poder de compra
(representado pela variável FPP), maior a
distância relativa percorrida em TI;
 A relação entre a variável que representa
a elevada taxa de motorização e até a
posse de um maior número de viaturas
(FBC) é positiva;
 A relação entre uma variável
representativa de boa acessibilidade de
TC (FIST) e a distância relativa em TI tem
sinal negativo;
 Em contrapartida, o sinal do coeficiente da
variável FPB é de mais difícil interpretação,
uma vez que um bom serviço de
transporte coletivo (pelo menos como
sucederia nas zonas que esta
variável/fator representa) deveria induzir a
uma menor distância percorrida em
transporte individual.
Eliminação de Outliers
Uma vez mais, tentou fazer-se o diagnóstico da
existência de outliers nos dados disponíveis.
Contudo, tal como no outro modelo de regressão
linear, não se alteraram significativamente os
indicadores do modelo (alterações apenas na
terceira casa decimal), pelo que se optou pela sua
exclusão deste relatório.
Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL
André Ramos (n.º 76819) / Luís Neto (n.º 74776) 43
6. CONSIDERAÇÕES FINAIS
Os dois modelos de regressão linear que se
obtiveram parecem explicar de forma aceitável ou,
pelo menos, com suficiente razoabilidade, a relação
entre a distância relativa percorrida em TI com as
variáveis independentes usadas.
Analisando comparativamente estes modelos e as
análises fatoriais que lhes dão origem, observa-se
que:
 O modelo de regressão linear feito sem
categorização das variáveis (Modelo 2)
tem um teste de Durbin-Watson superior e
um R2
a ligeiramente superior ao do
modelo em que se realizou a separação
das variáveis (Modelo 1), cumprindo
ambos as restantes verificações efetuadas
– deste modo, considera-se esse modelo
como mais ajustado aos dados e como
mais explicativo da relação entre a
distância relativa percorrida em TI e as
diferentes variáveis utilizadas;
 Por si só, o facto de o Modelo 1 ter
pegado em variáveis separadamente
torna-o menos robusto que o Modelo 2,
em que o próprio modelo de análise
fatorial, na construção dos fatores, faz
essa separação;
 Por um lado, julga-se que os fatores
obtidos no Modelo 1 explicam melhor as
variáveis, pelo menos em termos de
relação entre as variáveis de cada fator –
o facto de no Modelo 2 se terem poucos
fatores que tentam explicar um grande
número de variáveis torna-as menos
intuitivas na interpretação;
 Por outro lado, o Modelo 1 pode vir a
sofrer de um processo de “garbage in
garbage out”, ou seja, depende mais
passos intermédios, podendo falhar logo
de início numa errada categorização das
variáveis; além disso, neste caso em
particular, as próprias análises fatoriais
que originam o Modelo 1 têm valores de
KMO inferiores, e uma delas (a análise
fatorial considerando as variáveis de uso
do solo) tem um AGFI inferior a 0,90.
Assim, entende-se que o Modelo 2 é o que
apresenta uma maior robustez na explicação dos
resultados:
PTIDIST = 0,390 + 0,010 x FPP + 0,015 x FPB + 0,027 x FBC –
0,015 x FIST + 0,017 x DISTTIHAB – 0,301 x PPASSE
De destacar que os coeficientes obtidos em cada
um dos modelos são bastante semelhantes
(particularmente, como se esperava, nas variáveis
de mobilidade), ajudando a atestar a razoabilidade
dos resultados.
Além disso, essa semelhança dos resultados acaba
por dar razão aos defensores de cada uma das
teorias – quer aqueles que defendem a separação
das variáveis, quer os que consideram que todas
elas estão interligadas e não se devem categorizar
separadamente
Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL
André Ramos (n.º 76819) / Luís Neto (n.º 74776) 44
BIBLIOGRAFIA
Livros
 Maroco, J., “Análise Estatística com o SPSS Statistics” – 5ª edição, Report Number, 2011
 Washington, Simon P., Karlaftis, Mathew G. e Mannering, “Statistical and Econometric Methods
for Transportation Data Analysis”, Chapman & Hall/CRL, 2003
Publicações e
Aulas
 Abreu e Silva, J., “Repartição Modal e Usos do Solo – Construção de um Modelo Explicativo
para a Área Metropolitana de Lisboa”, IST, 2005
 Abreu e Silva, J., Slides das aulas teóricas de Técnicas de Apoio ao Planeamento de
Transportes, IST, 2012

Mais conteúdo relacionado

Semelhante a Modelo regressão distância TI

Apostila sistemasdetransportes 2008.doc
Apostila sistemasdetransportes 2008.docApostila sistemasdetransportes 2008.doc
Apostila sistemasdetransportes 2008.docMarcelo Augusto
 
Avaliação dos Padrões de Mobilidade no Municipio de Sintra_Relatório
Avaliação dos Padrões de Mobilidade no Municipio de Sintra_RelatórioAvaliação dos Padrões de Mobilidade no Municipio de Sintra_Relatório
Avaliação dos Padrões de Mobilidade no Municipio de Sintra_RelatórioLuis Neto
 
Infraestrutura Com Foco Nos Transportes Nas Cidades
Infraestrutura Com Foco Nos Transportes Nas CidadesInfraestrutura Com Foco Nos Transportes Nas Cidades
Infraestrutura Com Foco Nos Transportes Nas CidadesDaniel Pettini
 
Luiz cortez na III Semana Saude e Meio Ambiente Santa Marcelina
Luiz cortez na III Semana Saude e Meio Ambiente Santa MarcelinaLuiz cortez na III Semana Saude e Meio Ambiente Santa Marcelina
Luiz cortez na III Semana Saude e Meio Ambiente Santa MarcelinaSantaMarcelinaMeioAmbiente
 
Confiabilidade e variabilidade do tempo de viagem em sistemas Bus Rapid Transit
Confiabilidade e variabilidade do tempo de viagem em sistemas Bus Rapid TransitConfiabilidade e variabilidade do tempo de viagem em sistemas Bus Rapid Transit
Confiabilidade e variabilidade do tempo de viagem em sistemas Bus Rapid TransitDiego Mateus da Silva
 
Dissertacao de joana gomes a mobilidade e a teoria da cidade compacta
Dissertacao de joana gomes   a mobilidade e a teoria da cidade compactaDissertacao de joana gomes   a mobilidade e a teoria da cidade compacta
Dissertacao de joana gomes a mobilidade e a teoria da cidade compactaMichael Corrêa Monteiro
 
Curso de tecnologia de transportes
Curso de tecnologia de transportesCurso de tecnologia de transportes
Curso de tecnologia de transportesCIRINEU COSTA
 
Case Study of London Buses Transport System
Case Study of London Buses Transport SystemCase Study of London Buses Transport System
Case Study of London Buses Transport SystemRodolfo Guidi
 
Indicadores de eficiência operacional de uma empresa do setor
Indicadores de eficiência operacional de uma empresa do setorIndicadores de eficiência operacional de uma empresa do setor
Indicadores de eficiência operacional de uma empresa do setorJacyara Costa
 
Mobilidade Urbana - Um estudo sobre o transporte público na Zona Leste de São...
Mobilidade Urbana - Um estudo sobre o transporte público na Zona Leste de São...Mobilidade Urbana - Um estudo sobre o transporte público na Zona Leste de São...
Mobilidade Urbana - Um estudo sobre o transporte público na Zona Leste de São...Diego-Soares
 
Sistema de informação ao usuário da rede de transporte público (ônibus) atrav...
Sistema de informação ao usuário da rede de transporte público (ônibus) atrav...Sistema de informação ao usuário da rede de transporte público (ônibus) atrav...
Sistema de informação ao usuário da rede de transporte público (ônibus) atrav...Renato Arbex
 
Procura de Eficiência Energética e ambiental , distribuição de correio no mei...
Procura de Eficiência Energética e ambiental , distribuição de correio no mei...Procura de Eficiência Energética e ambiental , distribuição de correio no mei...
Procura de Eficiência Energética e ambiental , distribuição de correio no mei...Luis Neto
 

Semelhante a Modelo regressão distância TI (18)

Apostila sistemasdetransportes 2008.doc
Apostila sistemasdetransportes 2008.docApostila sistemasdetransportes 2008.doc
Apostila sistemasdetransportes 2008.doc
 
Construção Civil
Construção CivilConstrução Civil
Construção Civil
 
000454227
000454227000454227
000454227
 
Avaliação dos Padrões de Mobilidade no Municipio de Sintra_Relatório
Avaliação dos Padrões de Mobilidade no Municipio de Sintra_RelatórioAvaliação dos Padrões de Mobilidade no Municipio de Sintra_Relatório
Avaliação dos Padrões de Mobilidade no Municipio de Sintra_Relatório
 
Infraestrutura Com Foco Nos Transportes Nas Cidades
Infraestrutura Com Foco Nos Transportes Nas CidadesInfraestrutura Com Foco Nos Transportes Nas Cidades
Infraestrutura Com Foco Nos Transportes Nas Cidades
 
Luiz cortez na III Semana Saude e Meio Ambiente Santa Marcelina
Luiz cortez na III Semana Saude e Meio Ambiente Santa MarcelinaLuiz cortez na III Semana Saude e Meio Ambiente Santa Marcelina
Luiz cortez na III Semana Saude e Meio Ambiente Santa Marcelina
 
Confiabilidade e variabilidade do tempo de viagem em sistemas Bus Rapid Transit
Confiabilidade e variabilidade do tempo de viagem em sistemas Bus Rapid TransitConfiabilidade e variabilidade do tempo de viagem em sistemas Bus Rapid Transit
Confiabilidade e variabilidade do tempo de viagem em sistemas Bus Rapid Transit
 
Dissertacao de joana gomes a mobilidade e a teoria da cidade compacta
Dissertacao de joana gomes   a mobilidade e a teoria da cidade compactaDissertacao de joana gomes   a mobilidade e a teoria da cidade compacta
Dissertacao de joana gomes a mobilidade e a teoria da cidade compacta
 
Curso de tecnologia de transportes
Curso de tecnologia de transportesCurso de tecnologia de transportes
Curso de tecnologia de transportes
 
Rafael nascimento
Rafael nascimentoRafael nascimento
Rafael nascimento
 
Tcc para imprimir
Tcc para imprimirTcc para imprimir
Tcc para imprimir
 
Case Study of London Buses Transport System
Case Study of London Buses Transport SystemCase Study of London Buses Transport System
Case Study of London Buses Transport System
 
Indicadores de eficiência operacional de uma empresa do setor
Indicadores de eficiência operacional de uma empresa do setorIndicadores de eficiência operacional de uma empresa do setor
Indicadores de eficiência operacional de uma empresa do setor
 
Mobilidade Urbana - Um estudo sobre o transporte público na Zona Leste de São...
Mobilidade Urbana - Um estudo sobre o transporte público na Zona Leste de São...Mobilidade Urbana - Um estudo sobre o transporte público na Zona Leste de São...
Mobilidade Urbana - Um estudo sobre o transporte público na Zona Leste de São...
 
Sistema de informação ao usuário da rede de transporte público (ônibus) atrav...
Sistema de informação ao usuário da rede de transporte público (ônibus) atrav...Sistema de informação ao usuário da rede de transporte público (ônibus) atrav...
Sistema de informação ao usuário da rede de transporte público (ônibus) atrav...
 
Emdec/plano viario 24/1/18
Emdec/plano viario 24/1/18Emdec/plano viario 24/1/18
Emdec/plano viario 24/1/18
 
Procura de Eficiência Energética e ambiental , distribuição de correio no mei...
Procura de Eficiência Energética e ambiental , distribuição de correio no mei...Procura de Eficiência Energética e ambiental , distribuição de correio no mei...
Procura de Eficiência Energética e ambiental , distribuição de correio no mei...
 
Plano de Mobilidade Urbana
Plano de Mobilidade UrbanaPlano de Mobilidade Urbana
Plano de Mobilidade Urbana
 

Mais de Luis Neto

II Seminário – RPAS_Apresentação_LuisNeto_adapt_PDF
II Seminário – RPAS_Apresentação_LuisNeto_adapt_PDFII Seminário – RPAS_Apresentação_LuisNeto_adapt_PDF
II Seminário – RPAS_Apresentação_LuisNeto_adapt_PDFLuis Neto
 
Logística Urbana - modelo exploratório da aplicação de um sistema aéreo não t...
Logística Urbana - modelo exploratório da aplicação de um sistema aéreo não t...Logística Urbana - modelo exploratório da aplicação de um sistema aéreo não t...
Logística Urbana - modelo exploratório da aplicação de um sistema aéreo não t...Luis Neto
 
Logística Urbana - Uma Alternativa e Complemento na Distribuição com o Uso de...
Logística Urbana - Uma Alternativa e Complemento na Distribuição com o Uso de...Logística Urbana - Uma Alternativa e Complemento na Distribuição com o Uso de...
Logística Urbana - Uma Alternativa e Complemento na Distribuição com o Uso de...Luis Neto
 
Logística Urbana na Baixa Pombalina - Uma Solução Inteligente_Relatório
Logística Urbana na Baixa Pombalina - Uma Solução Inteligente_RelatórioLogística Urbana na Baixa Pombalina - Uma Solução Inteligente_Relatório
Logística Urbana na Baixa Pombalina - Uma Solução Inteligente_RelatórioLuis Neto
 
Logistica Urbana na Baixa Pombalina - Uma Solução Inteligente_Apresentação pa...
Logistica Urbana na Baixa Pombalina - Uma Solução Inteligente_Apresentação pa...Logistica Urbana na Baixa Pombalina - Uma Solução Inteligente_Apresentação pa...
Logistica Urbana na Baixa Pombalina - Uma Solução Inteligente_Apresentação pa...Luis Neto
 
Logistica Urbana na Baixa de Lisboa - Uma Solução Inteligente_ Apresentação P...
Logistica Urbana na Baixa de Lisboa - Uma Solução Inteligente_ Apresentação P...Logistica Urbana na Baixa de Lisboa - Uma Solução Inteligente_ Apresentação P...
Logistica Urbana na Baixa de Lisboa - Uma Solução Inteligente_ Apresentação P...Luis Neto
 
Localização e Dimensionamento de Equipamentos Escolares_Relatório
Localização e Dimensionamento de Equipamentos Escolares_RelatórioLocalização e Dimensionamento de Equipamentos Escolares_Relatório
Localização e Dimensionamento de Equipamentos Escolares_RelatórioLuis Neto
 
Articles: The Economic Impact of California High-Speed Rail in the Sacramento...
Articles: The Economic Impact of California High-Speed Rail in the Sacramento...Articles: The Economic Impact of California High-Speed Rail in the Sacramento...
Articles: The Economic Impact of California High-Speed Rail in the Sacramento...Luis Neto
 
Article: A Hierarchical Location Model for Public Facility Planning_ Apresent...
Article: A Hierarchical Location Model for Public Facility Planning_ Apresent...Article: A Hierarchical Location Model for Public Facility Planning_ Apresent...
Article: A Hierarchical Location Model for Public Facility Planning_ Apresent...Luis Neto
 
Article: Two Phases Algorithm of Transport Network Design Problem_ Apresentação
Article: Two Phases Algorithm of Transport Network Design Problem_ Apresentação Article: Two Phases Algorithm of Transport Network Design Problem_ Apresentação
Article: Two Phases Algorithm of Transport Network Design Problem_ Apresentação Luis Neto
 
Road Cargo Transport Externalities, will we be willing to internalize them?_R...
Road Cargo Transport Externalities, will we be willing to internalize them?_R...Road Cargo Transport Externalities, will we be willing to internalize them?_R...
Road Cargo Transport Externalities, will we be willing to internalize them?_R...Luis Neto
 
Segurança na Carga Aérea, Terminal de Carga do Aeroporto de Lisboa_ Relatório
Segurança na Carga Aérea, Terminal de Carga do Aeroporto de Lisboa_ RelatórioSegurança na Carga Aérea, Terminal de Carga do Aeroporto de Lisboa_ Relatório
Segurança na Carga Aérea, Terminal de Carga do Aeroporto de Lisboa_ RelatórioLuis Neto
 
Segurança em Terminais de Carga Aérea Novo Terminal de Carga do Aeroporto de ...
Segurança em Terminais de Carga Aérea Novo Terminal de Carga do Aeroporto de ...Segurança em Terminais de Carga Aérea Novo Terminal de Carga do Aeroporto de ...
Segurança em Terminais de Carga Aérea Novo Terminal de Carga do Aeroporto de ...Luis Neto
 
Segurança em Terminias de Carga Aérea , Aeroporto de Lisboa_ Apresentação Par...
Segurança em Terminias de Carga Aérea , Aeroporto de Lisboa_ Apresentação Par...Segurança em Terminias de Carga Aérea , Aeroporto de Lisboa_ Apresentação Par...
Segurança em Terminias de Carga Aérea , Aeroporto de Lisboa_ Apresentação Par...Luis Neto
 
Segurança em Terminias de Carga Aérea, Aeroporto de Lisboa_Apresentação Parte 1
Segurança em Terminias de Carga Aérea, Aeroporto de Lisboa_Apresentação Parte 1Segurança em Terminias de Carga Aérea, Aeroporto de Lisboa_Apresentação Parte 1
Segurança em Terminias de Carga Aérea, Aeroporto de Lisboa_Apresentação Parte 1Luis Neto
 
UAS - Unmanned Aircraft Systems Civil & Public Application_ Relatório
UAS - Unmanned Aircraft Systems Civil & Public Application_ RelatórioUAS - Unmanned Aircraft Systems Civil & Public Application_ Relatório
UAS - Unmanned Aircraft Systems Civil & Public Application_ RelatórioLuis Neto
 
UAS- Unmanned Aircraft Systems Civil & Public Application_ Presentation
UAS- Unmanned Aircraft Systems Civil & Public Application_ PresentationUAS- Unmanned Aircraft Systems Civil & Public Application_ Presentation
UAS- Unmanned Aircraft Systems Civil & Public Application_ PresentationLuis Neto
 
Modelos de Apoio à Decisão_Relatório Trabalho 2
Modelos de Apoio à Decisão_Relatório Trabalho 2Modelos de Apoio à Decisão_Relatório Trabalho 2
Modelos de Apoio à Decisão_Relatório Trabalho 2Luis Neto
 
Modelos de Apoio à Decisão_ Apresentação Trabalho 2
Modelos de Apoio à Decisão_ Apresentação Trabalho 2Modelos de Apoio à Decisão_ Apresentação Trabalho 2
Modelos de Apoio à Decisão_ Apresentação Trabalho 2Luis Neto
 
Modelos de Apoio à Decisão_ Exercicos_Relatório 1
Modelos de Apoio à Decisão_ Exercicos_Relatório 1Modelos de Apoio à Decisão_ Exercicos_Relatório 1
Modelos de Apoio à Decisão_ Exercicos_Relatório 1Luis Neto
 

Mais de Luis Neto (20)

II Seminário – RPAS_Apresentação_LuisNeto_adapt_PDF
II Seminário – RPAS_Apresentação_LuisNeto_adapt_PDFII Seminário – RPAS_Apresentação_LuisNeto_adapt_PDF
II Seminário – RPAS_Apresentação_LuisNeto_adapt_PDF
 
Logística Urbana - modelo exploratório da aplicação de um sistema aéreo não t...
Logística Urbana - modelo exploratório da aplicação de um sistema aéreo não t...Logística Urbana - modelo exploratório da aplicação de um sistema aéreo não t...
Logística Urbana - modelo exploratório da aplicação de um sistema aéreo não t...
 
Logística Urbana - Uma Alternativa e Complemento na Distribuição com o Uso de...
Logística Urbana - Uma Alternativa e Complemento na Distribuição com o Uso de...Logística Urbana - Uma Alternativa e Complemento na Distribuição com o Uso de...
Logística Urbana - Uma Alternativa e Complemento na Distribuição com o Uso de...
 
Logística Urbana na Baixa Pombalina - Uma Solução Inteligente_Relatório
Logística Urbana na Baixa Pombalina - Uma Solução Inteligente_RelatórioLogística Urbana na Baixa Pombalina - Uma Solução Inteligente_Relatório
Logística Urbana na Baixa Pombalina - Uma Solução Inteligente_Relatório
 
Logistica Urbana na Baixa Pombalina - Uma Solução Inteligente_Apresentação pa...
Logistica Urbana na Baixa Pombalina - Uma Solução Inteligente_Apresentação pa...Logistica Urbana na Baixa Pombalina - Uma Solução Inteligente_Apresentação pa...
Logistica Urbana na Baixa Pombalina - Uma Solução Inteligente_Apresentação pa...
 
Logistica Urbana na Baixa de Lisboa - Uma Solução Inteligente_ Apresentação P...
Logistica Urbana na Baixa de Lisboa - Uma Solução Inteligente_ Apresentação P...Logistica Urbana na Baixa de Lisboa - Uma Solução Inteligente_ Apresentação P...
Logistica Urbana na Baixa de Lisboa - Uma Solução Inteligente_ Apresentação P...
 
Localização e Dimensionamento de Equipamentos Escolares_Relatório
Localização e Dimensionamento de Equipamentos Escolares_RelatórioLocalização e Dimensionamento de Equipamentos Escolares_Relatório
Localização e Dimensionamento de Equipamentos Escolares_Relatório
 
Articles: The Economic Impact of California High-Speed Rail in the Sacramento...
Articles: The Economic Impact of California High-Speed Rail in the Sacramento...Articles: The Economic Impact of California High-Speed Rail in the Sacramento...
Articles: The Economic Impact of California High-Speed Rail in the Sacramento...
 
Article: A Hierarchical Location Model for Public Facility Planning_ Apresent...
Article: A Hierarchical Location Model for Public Facility Planning_ Apresent...Article: A Hierarchical Location Model for Public Facility Planning_ Apresent...
Article: A Hierarchical Location Model for Public Facility Planning_ Apresent...
 
Article: Two Phases Algorithm of Transport Network Design Problem_ Apresentação
Article: Two Phases Algorithm of Transport Network Design Problem_ Apresentação Article: Two Phases Algorithm of Transport Network Design Problem_ Apresentação
Article: Two Phases Algorithm of Transport Network Design Problem_ Apresentação
 
Road Cargo Transport Externalities, will we be willing to internalize them?_R...
Road Cargo Transport Externalities, will we be willing to internalize them?_R...Road Cargo Transport Externalities, will we be willing to internalize them?_R...
Road Cargo Transport Externalities, will we be willing to internalize them?_R...
 
Segurança na Carga Aérea, Terminal de Carga do Aeroporto de Lisboa_ Relatório
Segurança na Carga Aérea, Terminal de Carga do Aeroporto de Lisboa_ RelatórioSegurança na Carga Aérea, Terminal de Carga do Aeroporto de Lisboa_ Relatório
Segurança na Carga Aérea, Terminal de Carga do Aeroporto de Lisboa_ Relatório
 
Segurança em Terminais de Carga Aérea Novo Terminal de Carga do Aeroporto de ...
Segurança em Terminais de Carga Aérea Novo Terminal de Carga do Aeroporto de ...Segurança em Terminais de Carga Aérea Novo Terminal de Carga do Aeroporto de ...
Segurança em Terminais de Carga Aérea Novo Terminal de Carga do Aeroporto de ...
 
Segurança em Terminias de Carga Aérea , Aeroporto de Lisboa_ Apresentação Par...
Segurança em Terminias de Carga Aérea , Aeroporto de Lisboa_ Apresentação Par...Segurança em Terminias de Carga Aérea , Aeroporto de Lisboa_ Apresentação Par...
Segurança em Terminias de Carga Aérea , Aeroporto de Lisboa_ Apresentação Par...
 
Segurança em Terminias de Carga Aérea, Aeroporto de Lisboa_Apresentação Parte 1
Segurança em Terminias de Carga Aérea, Aeroporto de Lisboa_Apresentação Parte 1Segurança em Terminias de Carga Aérea, Aeroporto de Lisboa_Apresentação Parte 1
Segurança em Terminias de Carga Aérea, Aeroporto de Lisboa_Apresentação Parte 1
 
UAS - Unmanned Aircraft Systems Civil & Public Application_ Relatório
UAS - Unmanned Aircraft Systems Civil & Public Application_ RelatórioUAS - Unmanned Aircraft Systems Civil & Public Application_ Relatório
UAS - Unmanned Aircraft Systems Civil & Public Application_ Relatório
 
UAS- Unmanned Aircraft Systems Civil & Public Application_ Presentation
UAS- Unmanned Aircraft Systems Civil & Public Application_ PresentationUAS- Unmanned Aircraft Systems Civil & Public Application_ Presentation
UAS- Unmanned Aircraft Systems Civil & Public Application_ Presentation
 
Modelos de Apoio à Decisão_Relatório Trabalho 2
Modelos de Apoio à Decisão_Relatório Trabalho 2Modelos de Apoio à Decisão_Relatório Trabalho 2
Modelos de Apoio à Decisão_Relatório Trabalho 2
 
Modelos de Apoio à Decisão_ Apresentação Trabalho 2
Modelos de Apoio à Decisão_ Apresentação Trabalho 2Modelos de Apoio à Decisão_ Apresentação Trabalho 2
Modelos de Apoio à Decisão_ Apresentação Trabalho 2
 
Modelos de Apoio à Decisão_ Exercicos_Relatório 1
Modelos de Apoio à Decisão_ Exercicos_Relatório 1Modelos de Apoio à Decisão_ Exercicos_Relatório 1
Modelos de Apoio à Decisão_ Exercicos_Relatório 1
 

Último

Livro Vibrações Mecânicas - Rao Singiresu - 4ª Ed.pdf
Livro Vibrações Mecânicas - Rao Singiresu - 4ª Ed.pdfLivro Vibrações Mecânicas - Rao Singiresu - 4ª Ed.pdf
Livro Vibrações Mecânicas - Rao Singiresu - 4ª Ed.pdfSamuel Ramos
 
LEAN SIX SIGMA - Garantia da qualidade e segurança
LEAN SIX SIGMA - Garantia da qualidade e segurançaLEAN SIX SIGMA - Garantia da qualidade e segurança
LEAN SIX SIGMA - Garantia da qualidade e segurançaGuilhermeLucio9
 
Eletricista instalador - Senai Almirante Tamandaré
Eletricista instalador - Senai Almirante TamandaréEletricista instalador - Senai Almirante Tamandaré
Eletricista instalador - Senai Almirante TamandaréGuilhermeLucio9
 
Tecnólogo em Mecatrônica - Universidade Anhanguera
Tecnólogo em Mecatrônica - Universidade AnhangueraTecnólogo em Mecatrônica - Universidade Anhanguera
Tecnólogo em Mecatrônica - Universidade AnhangueraGuilhermeLucio9
 
A EXTENSÃO RURAL NO BRASIL Sociologia e Extensão 1 2014.ppt
A EXTENSÃO RURAL NO BRASIL Sociologia e Extensão 1 2014.pptA EXTENSÃO RURAL NO BRASIL Sociologia e Extensão 1 2014.ppt
A EXTENSÃO RURAL NO BRASIL Sociologia e Extensão 1 2014.pptssuserb964fe
 
A Importância dos EPI's no trabalho e no dia a dia laboral
A Importância dos EPI's no trabalho e no dia a dia laboralA Importância dos EPI's no trabalho e no dia a dia laboral
A Importância dos EPI's no trabalho e no dia a dia laboralFranciscaArrudadaSil
 
Treinamento de NR06 Equipamento de Proteção Individual
Treinamento de NR06 Equipamento de Proteção IndividualTreinamento de NR06 Equipamento de Proteção Individual
Treinamento de NR06 Equipamento de Proteção Individualpablocastilho3
 

Último (7)

Livro Vibrações Mecânicas - Rao Singiresu - 4ª Ed.pdf
Livro Vibrações Mecânicas - Rao Singiresu - 4ª Ed.pdfLivro Vibrações Mecânicas - Rao Singiresu - 4ª Ed.pdf
Livro Vibrações Mecânicas - Rao Singiresu - 4ª Ed.pdf
 
LEAN SIX SIGMA - Garantia da qualidade e segurança
LEAN SIX SIGMA - Garantia da qualidade e segurançaLEAN SIX SIGMA - Garantia da qualidade e segurança
LEAN SIX SIGMA - Garantia da qualidade e segurança
 
Eletricista instalador - Senai Almirante Tamandaré
Eletricista instalador - Senai Almirante TamandaréEletricista instalador - Senai Almirante Tamandaré
Eletricista instalador - Senai Almirante Tamandaré
 
Tecnólogo em Mecatrônica - Universidade Anhanguera
Tecnólogo em Mecatrônica - Universidade AnhangueraTecnólogo em Mecatrônica - Universidade Anhanguera
Tecnólogo em Mecatrônica - Universidade Anhanguera
 
A EXTENSÃO RURAL NO BRASIL Sociologia e Extensão 1 2014.ppt
A EXTENSÃO RURAL NO BRASIL Sociologia e Extensão 1 2014.pptA EXTENSÃO RURAL NO BRASIL Sociologia e Extensão 1 2014.ppt
A EXTENSÃO RURAL NO BRASIL Sociologia e Extensão 1 2014.ppt
 
A Importância dos EPI's no trabalho e no dia a dia laboral
A Importância dos EPI's no trabalho e no dia a dia laboralA Importância dos EPI's no trabalho e no dia a dia laboral
A Importância dos EPI's no trabalho e no dia a dia laboral
 
Treinamento de NR06 Equipamento de Proteção Individual
Treinamento de NR06 Equipamento de Proteção IndividualTreinamento de NR06 Equipamento de Proteção Individual
Treinamento de NR06 Equipamento de Proteção Individual
 

Modelo regressão distância TI

  • 1. INSTITUTO SUPERIOR TÉCNICO UNIVERSIDADE TÉCNICA DE LISBOA DISTÂNCIA PERCORRIDA EM TRANSPORTE INDIVIDUAL – CONSTRUÇÃO DE UM MODELO DE REGRESSÃO LINEAR TRABALHO PRÁTICO N.º 1 TÉCNICAS DE APOIO AO PLANEAMENTO DE TRANSPORTES MESTRADO EM PLANEAMENTO E OPERAÇÃO DE TRANSPORTES André Ramos, aluno n.º 76819 Luís Neto, aluno n.º 74776 Professor João Abreu e Silva Lisboa, 6 de Novembro de 2012
  • 2. Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL André Ramos (n.º 76819) / Luís Neto (n.º 74776) ÍNDICE 1. INTRODUÇÃO................................................................................................................................1 2. CATEGORIZAÇÃO DAS VARIÁVEIS............................................................................................2 2.1. APRESENTAÇÃO DAS VARIÁVEIS...............................................................................................................................2 2.2. ELIMINAÇÃO DE VARIÁVEIS ......................................................................................................................................3 3. ANÁLISE FATORIAL COM CATEGORIZAÇÃO DAS VARIÁVEIS...............................................5 3.1. VARIÁVEIS DE USO DO SOLO ...................................................................................................................................6 3.2. VARIÁVEIS SOCIOECONÓMICAS..............................................................................................................................14 4. ANÁLISE FATORIAL SEM CATEGORIZAÇÃO DAS VARIÁVEIS.............................................24 5. CONSTRUÇÃO DO MODELO DE REGRESSÃO LINEAR .........................................................33 5.1. MODELO 1 – ANÁLISE FATORIAL COM CATEGORIZAÇÃO DAS VARIÁVEIS....................................................................34 5.2. MODELO 2 – ANÁLISE FATORIAL SEM CATEGORIZAÇÃO DAS VARIÁVEIS....................................................................38 6. CONSIDERAÇÕES FINAIS..........................................................................................................43 BIBLIOGRAFIA.....................................................................................................................................44
  • 3. Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL André Ramos (n.º 76819) / Luís Neto (n.º 74776) 1 1. INTRODUÇÃO O presente relatório diz respeito à construção de um modelo de regressão linear para o cálculo do peso do uso do automóvel em função de diversas variáveis socioeconómicas, de uso do solo e de mobilidade das freguesias da Área Metropolitana de Lisboa, com recurso à utilização do software IBM® SPSS® Statistics (versão 20). A partir da variável dependente – peso da utilização do automóvel na repartição modal das viagens (ou seja, a distância relativa em TI) – vai estabelecer- se um modelo que represente a relação entre os padrões de mobilidade dos habitantes e algumas características desta população e da área onde residem. Numa primeira fase, agrupar-se-ão as variáveis disponíveis na base de dados fornecida em dois grupos principais – variáveis socioeconómicas e variáveis de uso do solo – para, através da Análise Fatorial Exploratória, as poder “reduzir” a um número mais compacto e trabalhável de fatores do modelo de regressão linear. Num segundo momento, tentou-se construir o modelo de análise fatorial sem categorizar as variáveis independentes, dada a difícil definição concreta do tipo de variável que cada uma é na realidade, tentando avaliar se essa nova análise fatorial é mais adequada aos dados disponíveis. De seguida, foram calculados os coeficientes associados a cada uma das novas variáveis (e às que não forem alvo da análise fatorial), procedendo igualmente às verificações necessárias de modo a garantir que o modelo de regressão linear cumpre as assunções que se exigem, terminando com uma análise crítica do(s) modelo(s) obtido(s).
  • 4. Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL André Ramos (n.º 76819) / Luís Neto (n.º 74776) 2 2. CATEGORIZAÇÃO DAS VARIÁVEIS 2.1. APRESENTAÇÃO DAS VARIÁVEIS Da base de dados fornecida, relativa a 204 zonas da Área Metropolitana de Lisboa – nalguns casos, contendo agrupamentos de freguesias – constam 34 variáveis, uma das quais (PTIDIST – peso das viagens de transporte individual na repartição modal, em função da distância percorrida) deverá ser utilizada como variável dependente do modelo, pois é aquela que se pretende precisamente quantificar. Assim, as variáveis a testar na construção do modelo são as seguintes:  PTCDIST – peso das viagens de transporte coletivo na repartição modal, em função da distância percorrida;  FAM>1TI – percentagem de famílias com mais de 1 automóvel;  AcTC_TI5 – rácio entre acessibilidade usando transporte coletivo e a acessibilidade usando transporte individual;  LNDENS_GL – logaritmo da densidade global da zona;  PPASSE – percentagem de habitantes com passe de transporte público;  DISTTIHAB – Distância viajada em transporte individual;  PPESSGL1000 – percentagem dos “habitantes globais” (isto é, residentes, trabalhadores e estudantes) a menos de 1 quilómetro de um nó de autoestrada;  PPGLOB400BUS – percentagem de “habitantes globais” a menos de 400 metros de uma paragem de autocarro;  KMVIA/PESSGL – rácio entre infraestruturas rodoviárias e “habitantes globais”;  TXANALF – percentagem de habitantes sem estudos;  TXUNIV – percentagem de habitantes com um grau académico;  TX_SECT_I – percentagem de trabalhadores do setor primário (agricultura e pesca);  TX_SECT_III – percentagem de trabalhadores do setor terciário (serviços e comércio);  IPC – índice de poder de compra;  DEP_EMP_LX – percentagem de habitantes a trabalhar no município de Lisboa;  TX_MOT – taxa de motorização;  COMP – índice de compacidade;  ENTROP – índice de entropia;  MIX – relação entre os habitantes e os trabalhadores e estudantes;
  • 5. Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL André Ramos (n.º 76819) / Luís Neto (n.º 74776) 3  PPGLOB400TCSP – percentagem de “habitantes globais” a menos de 400 metros de uma estação/paragem de transporte público pesado;  DISTCBD – distância ao centro de Lisboa;  PAURB – percentagem de área urbanizada;  POP – número de residentes;  EMP_EST – número de estudantes e trabalhadores;  PFAM0EMP – percentagem de famílias sem trabalhadores;  PFAM1EMP – percentagem de famílias com 1 trabalhadores;  PFAM2EMP – percentagem de famílias com 2 trabalhadores;  PFAMM2EMP – percentagem de famílias com mais de 2 trabalhadores;  PFAM0LIB – percentagem de famílias com 0 trabalhadores por conta própria;  PFAMM1LIB – percentagem de famílias com 1 ou mais trabalhadores por conta própria;  PFAMCRIANC – percentagem de famílias com crianças;  DIMGLOB – tamanho global (soma de residentes, estudantes e trabalhadores);  LNACTCTI – logaritmo do rácio entre acessibilidade usando transporte coletivo e a acessibilidade usando transporte individual. 2.2. ELIMINAÇÃO DE VARIÁVEIS Das 33 variáveis independentes que poderiam ser usadas na análise fatorial e/ou no modelo de regressão linear, foram, desde logo, abandonadas algumas, nomeadamente:  As variáveis POP e EMP_EST foram assumidas como sendo variáveis meramente “caracterizáveis” e indicativas da zona em questão, sem influência na quota de TI;  As variáveis PFAMM2EMP e PFAMM1LIB foram eliminadas por se tratar de combinações lineares de outras variáveis (PFAM0EMP, PFAM1EMP e PFAM2EMP, no primeiro caso, e PFAMM1LIB, no segundo caso); por sua vez, a variável LNACTCTI também é uma transformação logarítmica da variável AcTC_TI5. Posto isto, optou-se pela categorização destas variáveis em variáveis de uso do solo e variáveis socioeconómicas, como se descreve na Tabela 2.1.
  • 6. Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL André Ramos (n.º 76819) / Luís Neto (n.º 74776) 4 Tabela 2.1 – Categorização das variáveis Variáveis de uso do solo Variáveis socioeconómicas AcTC_TI5 LNDENS_GL PPESSGL1000 PPGLOB400BUS KMVIA/PESSGL COMP ENTROP MIX PPGLOB400TCSP DISTCBD PAURB. FAM>1TI TXANALF TXUNIV TX_SECT_I TX_SECT_III IPC TX_MOT PFAM0EMP PFAM1EMP PFAM2EMP PFAM0LIB PFAMCRIANC DIMGLOB As variáveis PTCDIST, PPASSE e DISTTIHAB foram englobadas numa terceira categoria (variáveis mais relacionadas com a “mobilidade”) e, por isso, não foram utilizadas nas análises fatoriais efetuadas com separação das variáveis.
  • 7. Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL André Ramos (n.º 76819) / Luís Neto (n.º 74776) 5 3. ANÁLISE FATORIAL COM CATEGORIZAÇÃO DAS VARIÁVEIS A Análise Fatorial Exploratória (AFE) tem o intuito principal de detetar relações latentes entre variáveis de modo a construir fatores que permitam explicar essa relação entre elas, permitindo reduzir o número de variáveis a utilizar noutras análises (como os modelos de regressão linear). De modo a verificar a adequabilidade de um modelo de análise fatorial, existem algumas verificações a fazer:  Medida de adequação da amostragem de Kaiser-Meyer-Olkin (mais conhecido por KMO): compara as correlações simples com as correlações observadas entre variáveis, e em função dos valores assumidos (consoante a Tabela 3.1), “recomenda” a utilização da análise fatorial ou não; Tabela 3.1 – Recomendação da AFE face aos valores de KMO Valor de KMO Recomendação da AFE 0,9 a 1,0 Excelente 0,8 a 0,9 Boa 0,7 a 0,8 Média 0,6 a 0,7 Medíocre 0,5 a 0,6 Mau (mas aceitável) Menor que 0,5 Inaceitável  MSA (Measure of Sampling Adequancy): trata-se de uma particularização do KMO para cada uma das variáveis, sendo representada pela diagonal principal da matriz de anti- imagem, que deve tomar valores superiores a 0,5;  Teste de Esfericidade de Bartlett: embora bastante sensível à dimensão da amostra (o que leva à sua utilização com prudência), obriga a que o p-value seja inferior a 0,001, significado de que as variáveis estão correlacionadas significativamente e os fatores comuns são bastante importantes;  Comunalidades e variância total explicada (ou variância extraída total): as comunalidades são a percentagem de variância de cada variável explicada pelos fatores extraídos, devendo ser sempre superiores a 50%; por sua vez, a variância extraída total pelos fatores com valores próprios (eigenvalues) superiores a 1 deve também ser, no mínimo, superior a 50%; pelo “scree plot” obtido no SPSS®, deve ser possível observar uma inflexão no gráfico assim que os eigenvalues forem inferiores a 1;  Goodness of Fit Index (GFI): índice usado para analisar o ajustamento do modelo de análise fatorial aos dados, devendo tomar valores superiores a 0,9 e, preferencialmente, a 0,95; o GFI tende,
  • 8. Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL André Ramos (n.º 76819) / Luís Neto (n.º 74776) 6 contudo, a sobrestimar o ajustamento, pelo que se deve calcular o GFI ajustado (que leva em conta os graus de liberdade e o número de variâncias-covariâncias não redundantes);  Root Mean Square Residual (RMSR*): índice usado igualmente para medir o ajustamento do modelo aos dados, devendo tomar valores inferiores a 0,1 e, preferencialmente a 0,05. De referir que, para a estimação dos fatores relativos quer ao uso do solo, quer às variáveis socioeconómicas, usou-se o Método das Componentes Principais para a extração dos fatores, juntamente com o Critério de Kaiser (ou seja, consideraram-se apenas os fatores com eigenvalue ou valor próprio superior a 1). Para a rotação dos fatores, utilizou-se o método Varimax, uma vez que se pretende obter uma estrutura de fatores em que cada variável está fortemente associada a apenas um fator, e porque não se suspeita da existência de algum fator geral. Nas tabelas dos loadings de cada fator, são apresentados apenas os loadings de valor superior a 0,5, por ser este o valor mínimo para serem considerados como significantes (de facto, para a amostra em análise, um loading de 0,4 já poderia ser considerado aceitável). Por fim, para cálculo das variáveis a usar na regressão linear, usou-se o Método de Thompson (ou método da regressão). 3.1. VARIÁVEIS DE USO DO SOLO Como visto no Capítulo 2, as variáveis de uso do solo testadas foram:  AcTC_TI5;  LNDENS_GL;  PPESSGL1000;  PPGLOB400BUS;  KMVIA/PESSGL;  COMP;  ENTROP;  MIX;  PPGLOB400TCSP;  DISTCBD;  PAURB. 1ª Iteração Correu-se a análise fatorial do SPSS® para estas variáveis (cuja descrição se apresenta na Figura 3.1) e extraíram-se os diversos outputs, que se apresentam e caracterizam de seguida. Figura 3.1 – Estatística descritiva da 1ª iteração das variáveis de uso do solo
  • 9. Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL André Ramos (n.º 76819) / Luís Neto (n.º 74776) 7 Na Figura 3.2 é apresentado o KMO, bem como o teste de Esfericidade de Bartlett. Neste caso, o KMO atinge um valor de 0,871, o que faz com que a análise fatorial seja fortemente recomendada. Por sua vez, a título indicativo, o teste de Esfericidade de Bartlett resulta num p-value inferior a 0,001, como seria desejável. Figura 3.2 – KMO e teste de Esfericidade de Bartlett da 1ª iteração das variáveis de uso do solo Olhando agora para a diagonal principal da matriz de anti-imagem das correlações (vide Figura 3.3) de modo a obter a MSA para cada uma das variáveis, é observável que todos os valores são superiores a 0,5, atestando a adequação de todas as variáveis. Figura 3.3 – Matrizes de anti-imagem da 1ª iteração das variáveis de uso do solo O passo seguinte passa pela análise das comunalidades de cada variável, que se apresentam na Figura 3.4. Como se observa, a percentagem da variância de cada variável explicada pelos fatores comuns extraídos pelo Método das Componentes Principais é sempre superior a 0,5.
  • 10. Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL André Ramos (n.º 76819) / Luís Neto (n.º 74776) 8 Figura 3.4 – Comunalidades da 1ª iteração das variáveis de uso do solo Por sua vez, a Figura 3.5 representa a percentagem de variância explicada por cada um dos fatores. Como se observa, são retidos três fatores que explicam cerca de 72% da variabilidade total. Isso pode também ser confirmado pelo “scree plot” (Figura 3.6), que apresenta uma inflexão do terceiro para o quarto fator. Figura 3.5 – Variância total explicada pelos fatores da 1ª iteração das variáveis de uso do solo Figura 3.6 – “Scree plot” dos fatores da 1ª iteração das variáveis de uso do solo Os pesos dos fatores (ou loadings) são apresentados na Figura 3.7 e na Figura 3.8 (antes e pós-rotação Varimax, respetivamente).
  • 11. Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL André Ramos (n.º 76819) / Luís Neto (n.º 74776) 9 Figura 3.7 – Loadings dos fatores da 1ª iteração das variáveis de uso do solo antes da rotação Figura 3.8 – Loadings dos fatores da 1ª iteração das variáveis de uso do solo após a rotação Por fim, como forma de certificar a qualidade do modelo fatorial, foram calculados alguns dos índices adequados para o efeito, nomeadamente o GFI, o AGFI e o RMSR*, como se apresenta na Tabela 3.2, a partir da matriz dos resíduos (Figura 3.9). Tabela 3.2 – Índices de qualidade do modelo fatorial da 1ª iteração das variáveis de uso do solo GFI 0,88 AGFI 0,69 RMSR* 0,07
  • 12. Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL André Ramos (n.º 76819) / Luís Neto (n.º 74776) 10 Figura 3.9 – Matriz dos resíduos da 1ª iteração das variáveis de uso do solo Quer o GFI, quer o seu valor ajustado AGFI (mais conservativo) assumem valores inferiores a 0,9, pelo que se considera que o modelo não se ajusta bem aos dados disponíveis. Por sua vez, o RMSR* é inferior a 0,1, pelo que o ajustamento, por este índice, já se pode considerar bom. Ainda assim, face aos dois primeiros indicadores, optou-se por uma nova iteração da análise fatorial, retirando a variável com a menor comunalidade: PPESSGL1000. 2ª Iteração Correndo novamente a análise fatorial com o novo conjunto de variáveis (vide Figura 3.10), confrontou-se os resultados obtidos com os pressupostos teóricos. Figura 3.10 – Estatística descritiva da 2ª iteração das variáveis de uso do solo O valor de KMO, desta feita, praticamente não se alterou face à iteração anterior, tendo o teste de Esfericidade de Bartlett resultado dentro dos valores pretendidos (p-value inferior a 0,001), como indica a Figura 3.11. Figura 3.11 – KMO e teste de Esfericidade de Bartlett da 2ª iteração das variáveis de uso do solo
  • 13. Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL André Ramos (n.º 76819) / Luís Neto (n.º 74776) 11 A matriz de anti-imagem obtida apresenta-se na Figura 3.12 e a sua diagonal principal (a MSA para cada variável) assume valores elevados (sempre superiores a 0,5), atestando a adequação de todas as variáveis. Figura 3.12 – Matrizes de anti-imagem da 2ª iteração das variáveis de uso do solo Da análise das comunalidades de cada variável (vide Figura 3.13) são percetíveis as elevadas percentagens de variância explicada (novamente sempre superiores a 0,5). Figura 3.13 – Comunalidades da 2ª iteração das variáveis de uso do solo A variância explicada por cada um dos fatores resulta, então, numa variância total explicada de 75% (3 fatores com valores próprios superiores a 1), como se apresenta na Figura 3.14 e no “scree plot” da Figura 3.15. Os loadings de cada fator, antes e depois da rotação dos fatores, apresentam-se, por sua vez, na Figura 3.16 e na Figura 3.17, respetivamente.
  • 14. Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL André Ramos (n.º 76819) / Luís Neto (n.º 74776) 12 Figura 3.14 – Variância total explicada pelos fatores da 2ª iteração das variáveis de uso do solo Figura 3.15 – “Scree plot” dos fatores da 2ª iteração das variáveis de uso do solo Figura 3.16 – Loadings dos fatores da 2ª iteração das variáveis de uso do solo antes da rotação Figura 3.17 – Loadings dos fatores da 2ª iteração das variáveis de uso do solo após a rotação De modo a verificar novamente a adequabilidade do modelo, calculou-se o GFI, o AGFI e o RMSR* (vide Tabela 3.3) tendo como base a matriz dos resíduos (Figura 3.18). Tabela 3.3 – Índices de qualidade do modelo fatorial da 2ª iteração das variáveis de uso do solo GFI 0,91 AGFI 0,73 RMSR* 0,07
  • 15. Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL André Ramos (n.º 76819) / Luís Neto (n.º 74776) 13 Figura 3.18 – Matriz dos resíduos da 2ª iteração das variáveis de uso do solo Desta feita, o GFI é superior a 0,9 e o RMSR* é superior a 0,1, pelo que o ajustamento se pode aceitar. Apesar de o AGFI ser inferior a 0,9, decidiu-se (uma vez que o GFI cumpre o pretendido) aceitar por enquanto esta solução de modelo de análise fatorial, já que estes fatores não são totalmente infalíveis. Note-se que se verificam algumas relações na Figura 3.17 que, à partida, seriam expectáveis:  Zonas com uma densidade elevada têm uma área urbanizada elevada e também uma alta percentagem de população a menos de 400 metros de uma paragem de autocarro (pois os operadores adequam a oferta à procura);  Zonas com elevada percentagem da população a menos de 400 metros dum transporte público pesado têm, tendencialmente, um índice de acessibilidade em transporte coletivo elevado. Dados os valores obtidos nos loadings, estes fatores do uso do solo passarão a ser denominados de:  Fator “Alto dos Moinhos” FAM (ou f1) – representa áreas fortemente urbanizadas, muito próximas do centro da cidade e com bom serviço de autocarros;  Fator “ferroviário” FF (ou f2) – descreve as zonas próximas de um transporte público pesado e com elevada acessibilidade de transporte público face ao transporte individual;  Fator de entropia FE (ou f3) – representa as zonas com forte entropia. Estes fatores, de acordo com a Figura 3.19, são dados por:
  • 16. Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL André Ramos (n.º 76819) / Luís Neto (n.º 74776) 14 FAM = -0,040 x AcTC_TI5 + 0,195 x LNDENS_GL + 0,295 x PPGLOB400BUS – 0,212 x KMVIA/PESSGL – 0,265 x COMP – 0,069 x ENTROP – 0,230 x MIX – 0,116 x PPGLOB400TCSP + 0,175 x PAURB – 0,258 x DISTCBD FF = 0,356 x AcTC_TI5 + 0,020 x LNDENS_GL – 0,114 x PPGLOB400BUS + 0,180 x KMVIA/PESSGL + 0,057 x COMP + 0,006 x ENTROP + 0,521 x MIX + 0,420 x PPGLOB400TCSP + 0,030 x PAURB + 0,118 x DISTCBD FE = -0,088 x AcTC_TI5 – 0,002 x LNDENS_GL – 0,131 x PPGLOB400BUS – 0,344 x KMVIA/PESSGL + 0,471 x COMP + 0,687 x ENTROP + 0,038 x MIX – 0,013 x PPGLOB400TCSP + 0,041 x PAURB – 0,115 x DISTCBD Figura 3.19 – Coeficientes dos fatores das variáveis de uso do solo 3.2. VARIÁVEIS SOCIOECONÓMICAS Desta feita, as variáveis de caracterização socioeconómica da população de cada zona utilizadas na análise fatorial foram, numa primeira instância:  FAM>1TI;  TXANALF;  TXUNIV;  TX_SECT_I;  TX_SECT_III;  IPC;  TX_MOT;  PFAM0EMP;  PFAM1EMP;  PFAM2EMP;  PFAM0LIB;  PFAMCRIANC;  DIMGLOB. 1ª Iteração Recorrendo ao SPSS®, correu-se pela primeira vez a construção do modelo de análise fatorial, com as variáveis descritas (Figura 3.20).
  • 17. Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL André Ramos (n.º 76819) / Luís Neto (n.º 74776) 15 Figura 3.20 – Estatística descritiva da 1ª iteração das variáveis socioeconómicas No entanto, apesar de anteriormente já se ter eliminado algumas das variáveis da análise por serem uma combinação linear de outras, a mensagem obtida na matriz das correlações – “a matriz não é positiva definida” ou, dito de outra forma, a matriz é singular e não admite uma matriz inversa (e o seu determinante é nulo) – denuncia a existência de uma variável que ainda é combinação linear de outra(s). Como resultado, as matrizes de anti-imagem e o KMO não são calculados. Olhando para as variáveis disponíveis, optou-se, na 2ª iteração, pela eliminação da TXUNIV, por se desconfiar da elevada relação com a variável TXANALF. 2ª Iteração Correndo novamente o modelo, já foi possível obter uma solução de análise fatorial. Nesta solução, o KMO obtido foi de 0,709 (vide Figura 3.21), que se encontra muito perto do limite inferior a partir do qual a adequação da análise fatorial é “média” (ou seja, pouco acima do “medíocre”). O teste de Esfericidade de Bartlett resulta num p-value inferior a 0,001, revelando que as variáveis estão correlacionadas significativamente. Figura 3.21 – KMO e teste de Esfericidade de Bartlett da 2ª iteração das variáveis socioeconómicas Já com a matriz de anti-imagem das correlações disponível (vide Figura 3.3) e olhando para a sua diagonal principal, registam-se valores MSA inferiores a 0,5 para as variáveis PFAM0EMP, PFAM1EMP e PFAM2EMP, o que revela que elas não se adequam à estrutura definida pelas restantes variáveis e, por isso, deve ser considerada a sua eliminação da análise fatorial.
  • 18. Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL André Ramos (n.º 76819) / Luís Neto (n.º 74776) 16 Figura 3.22 – Matrizes de anti-imagem da 2ª iteração das variáveis socioeconómicas Por sua vez, olhando para as comunalidades das diversas variáveis (vide Figura 3.23), regista-se igualmente a presença de uma delas com uma percentagem de variância explicada inferior a 50% (DIMGLOB). Figura 3.23 – Comunalidades da 2ª iteração das variáveis socioeconómicas Considerou-se, por isso, a passagem para uma nova iteração do modelo, já com a eliminação destas 4 variáveis que não cumprem as pretensões da análise (PFAM0EMP, PFAM1EMP, PFAM2EMP e DIMGLOB). 3ª Iteração Já com um número mais reduzido de variáveis (Figura 3.24), correu-se novamente o modelo de análise fatorial. Figura 3.24 – Estatística descritiva da 3ª iteração das variáveis socioeconómicas Nesta iteração, o valor do KMO foi substancialmente mais elevado (por eliminação das
  • 19. Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL André Ramos (n.º 76819) / Luís Neto (n.º 74776) 17 variáveis com fraca adequação), como se apresenta na Figura 3.25. Uma vez mais, o teste de Esfericidade de Bartlett resultou num p-value inferior a 0,001. Figura 3.25 – KMO e teste de Esfericidade de Bartlett da 3ª iteração das variáveis socioeconómicas Inspecionando a diagonal principal da nova matriz de anti-imagem das correlações (vide Figura 3.26), todas as variáveis apresentam valores de MSA muito satisfatórios. As comunalidades destas variáveis, por sua vez, também são sempre superiores a 0,5, como se observa na Figura 3.27. Figura 3.26 – Matrizes de anti-imagem da 3ª iteração das variáveis socioeconómicas Figura 3.27 – Comunalidades da 3ª iteração das variáveis socioeconómicas Na Figura 3.28, apresenta-se a variância explicada pelos fatores com valores próprios superiores a 1: é explicada quase 79% da variância total através de dois fatores, como também se pode observar pelo “scree plot” da Figura 3.29.
  • 20. Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL André Ramos (n.º 76819) / Luís Neto (n.º 74776) 18 Figura 3.28 – Variância total explicada pelos fatores da 3ª iteração das variáveis socioeconómicas Figura 3.29 – “Scree plot” dos fatores da 3ª iteração das variáveis socioeconómicas Neste momento, procedeu-se de imediato ao cálculo dos índices de certificação da qualidade do modelo fatorial, que se apresentam na Tabela 3.4, a partir da matriz dos resíduos (Figura 3.30). Tabela 3.4 – Índices de qualidade do modelo fatorial da 3ª iteração das variáveis socioeconómicas GFI 0,98 AGFI 0,94 RMSR* 0,09 Figura 3.30 – Matriz dos resíduos da 3ª iteração das variáveis socioeconómicas
  • 21. Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL André Ramos (n.º 76819) / Luís Neto (n.º 74776) 19 Tanto o GFI como o AGFI são superiores a 0,9, pelo que se pode considerar que o modelo se ajusta bem aos dados disponíveis. Por sua vez, o RMSR* é inferior a 0,1 mas muito próximo desse valor, a partir do qual se considera que o ajustamento é inaceitável. Deste modo, como forma de tentar evitar alguns dos valores das comunalidades mais baixos, não se aceitou esta solução do modelo fatorial e procedeu-se a uma nova iteração, testando alternativamente a eliminação de uma ou mais do conjunto de variáveis FAM>1TI, TXMOT, PFAM0LIB e PFAMCRIANC – efetivamente, para a 4ª iteração, acabaram por ser eliminadas as duas primeiras destas quatro. 4ª Iteração Correndo o modelo de análise fatorial agora com apenas as seis variáveis que restaram das análises anteriores (vide Figura 3.31), efetuaram-se as verificações habituais. Figura 3.31 – Estatística descritiva da 4ª iteração das variáveis socioeconómicas Nesta nova iteração, o valor do KMO subiu um pouco, verificando-se novamente os pressupostos inerentes ao teste de Esfericidade de Bartlett (p- value inferior a 0,001), como se verifica na Figura 3.32. Figura 3.32 – KMO e teste de Esfericidade de Bartlett da 4ª iteração das variáveis socioeconómicas Neste caso, a diagonal principal da matriz de anti- imagem das correlações (Figura 3.33) apresenta alguns valores de MSA mais baixos que a anterior, mas ainda assim, na globalidade verifica-se a adequação de todas as variáveis (como, aliás, o KMO já indiciava).
  • 22. Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL André Ramos (n.º 76819) / Luís Neto (n.º 74776) 20 Figura 3.33 – Matrizes de anti-imagem da 4ª iteração das variáveis socioeconómicas As comunalidades das variáveis, desta vez, apresentam valores muito superiores a 0,5, como se observa na Figura 3.34. A variância total explicada pelos fatores com valores próprios superiores a 1, que são dois (vide Figura 3.35 e “scree plot” da Figura 3.36), sobe agora para os 86%. Figura 3.34 – Comunalidades da 4ª iteração das variáveis socioeconómicas Figura 3.35 – Variância total explicada pelos fatores da 4ª iteração das variáveis socioeconómicas
  • 23. Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL André Ramos (n.º 76819) / Luís Neto (n.º 74776) 21 Figura 3.36 – “Scree plot” dos fatores da 4ª iteração das variáveis socioeconómicas Na Figura 3.37 e Figura 3.38 são apresentados, por fim, os loadings antes e depois da rotação dos eixos do tipo Varimax, respetivamente, todos com valores muito elevados. Figura 3.37 – Loadings dos fatores da 4ª iteração das variáveis socioeconómicas antes da rotação Figura 3.38 – Loadings dos fatores da 4ª iteração das variáveis socioeconómicas após a rotação Averiguando a qualidade deste novo modelo fatorial, e a partir da matriz dos resíduos (vide Figura 3.39), verifica-se através de qualquer um dos três índices apresentados na Tabela 3.5 (GFI, AGFI e RMSR*) a boa adequabilidade do modelo aos dados existentes. Tabela 3.5 – Índices de qualidade do modelo fatorial da 4ª iteração das variáveis socioeconómicas GFI 0,99 AGFI 0,96 RMSR* 0,05
  • 24. Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL André Ramos (n.º 76819) / Luís Neto (n.º 74776) 22 Figura 3.39 – Matriz dos resíduos da 4ª iteração das variáveis socioeconómicas Uma vez mais, os dois fatores revelam algumas relações de algum modo aceitáveis:  Zonas com elevada taxa de analfabetismo apresentam um índice de poder de compra muito reduzido e uma taxa de trabalhadores no setor primário muito elevada;  Famílias sem profissionais liberais (ou seja, com trabalhadores por conta de outrem) têm menos filhos. Assim, os fatores de caracterização socioeconómica passarão a ser denominados de:  Fator “Poor Farmer” FPF (f1) – representa os indivíduos com baixo poder de compra, níveis de literacia reduzidos e empregos do setor primário;  Fator “Yuppie Workaholics” FYW (f2) – descreve os típicos jovens sem independência financeira que trabalham por conta de outrem e adiam a paternidade. Estes fatores, de acordo com a Figura 3.40, são dados por: FPF = 0,305 x TXANALF + 0,270 x TX_SECT_I – 0,268 x TX_SECT_III – 0,306 x IPC + 0,124 x PFAM0LIB – 0,089 x PFAMCRIANC FYW = 0,087 x TXANALF + 0,032 x TX_SECT_I – 0,006 x TX_SECT_III – 0,091 x IPC + 0,568 x PFAM0LIB – 0,538 x PFAMCRIANC
  • 25. Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL André Ramos (n.º 76819) / Luís Neto (n.º 74776) 23 Figura 3.40 – Coeficientes dos fatores das variáveis socioeconómicas
  • 26. Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL André Ramos (n.º 76819) / Luís Neto (n.º 74776) 24 4. ANÁLISE FATORIAL SEM CATEGORIZAÇÃO DAS VARIÁVEIS De acordo com a bibliografia consultada, particularmente o modelo de Stead, Williams e Titheridge, os padrões de uso do solo estão intimamente relacionados com as características socioeconómicas (e ambos influenciam os padrões de mobilidade), sendo difícil separá-los claramente ou, dito de outra forma, categorizar determinada variável como sendo especificamente de uso do solo ou socioeconómica (vide Figura 4.1). Figura 4.1 – Modelo conceptual das interações entre padrões de mobilidade, padrões de uso do solo e características socioeconómicas Fonte: Stead, Williams e Titheridge, 2000 Desse modo, testou-se a construção de um modelo de análise fatorial sem separação das variáveis, tentando perceber se os resultados obtidos permitiam a sua utilização no modelo de regressão linear a construir. Como se referiu anteriormente, nem todas as variáveis foram usadas nesta análise fatorial (não se eliminaram apenas aquelas que se sabia serem combinações lineares de outras, mas também a variável TXUNIV, que se veio a descobrir durante as análises fatoriais anteriores). 1ª Iteração Recorrendo ao SPSS® e tomando as variáveis descritas (Figura 4.2) nesta análise fatorial, obtiveram-se os outputs necessários para a verificação da adequabilidade do modelo. Figura 4.2 – Estatística descritiva da 1ª iteração da análise fatorial sem categorização das variáveis
  • 27. Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL André Ramos (n.º 76819) / Luís Neto (n.º 74776) 25 Nesta solução, obteve-se logo uma adequação da análise fatorial “boa”, uma vez que o KMO resultante foi de 0,858 (vide Figura 4.3). O teste de Esfericidade de Bartlett, como habitual, resultou num p-value inferior a 0,001. Figura 4.3 – KMO e teste de Esfericidade de Bartlett da 1ª iteração da análise fatorial sem categorização das variáveis Na matriz anti-imagem (apresentada na Figura 4.5), a diagonal principal apresenta alguns valores de MSA inferiores a 0,5, nomeadamente na variável PFAM1EMP, seguida de valores entre 0,5 e 0,6 nas variáveis PFAM0EMP e PFAM2EMP. Analisando as comunalidades (vide Figura 4.4), registam-se variâncias explicadas inferiores a 50% nas variáveis PPESSGL1000 e ENTROP, e uma variância explicada de menos de 55% pela variável DIMGLOB. Estas seis variáveis tornaram-se, por isso, nas “candidatas” à eliminação, tendo sido efetuada uma nova iteração para avaliar um novo modelo de análise fatorial. Figura 4.4 – Comunalidades da 1ª iteração da análise fatorial sem categorização das variáveis
  • 28. Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL André Ramos (n.º 76819) / Luís Neto (n.º 74776) 26 Figura 4.5 – Matrizes de anti-imagem da 1ª iteração da análise fatorial sem categorização das variáveis
  • 29. Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL André Ramos (n.º 76819) / Luís Neto (n.º 74776) 27 2ª Iteração A 2ª iteração foi realizada já com as variáveis anteriormente descritas retiradas do modelo de análise fatorial (vide Figura 4.6). Figura 4.6 – Estatística descritiva da 2ª iteração da análise fatorial sem categorização das variáveis Nesta iteração, o valor do KMO subiu ligeiramente, como se observa na Figura 4.7. O teste de Esfericidade de Bartlett resultou novamente num valor de p-value inferior a 0,001. Figura 4.7 – KMO e teste de Esfericidade de Bartlett da 2ª iteração da análise fatorial sem categorização das variáveis Da análise da matriz de anti-imagem (Figura 4.9) é percetível (como, aliás, o elevado KMO já indiciava) a alta adequação da análise fatorial efetuada pelas MSA elevadas. As comunalidades, desta vez, também são bastante superiores a 0,5 (e até a 0,7), pelo que não se espera, por aqui, eliminar qualquer uma das variáveis utilizadas (vide Figura 4.8). Figura 4.8 – Comunalidades da 2ª iteração da análise fatorial sem categorização das variáveis
  • 30. Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL André Ramos (n.º 76819) / Luís Neto (n.º 74776) 28 Figura 4.9 – Matrizes de anti-imagem da 2ª iteração da análise fatorial sem categorização das variáveis
  • 31. Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL André Ramos (n.º 76819) / Luís Neto (n.º 74776) 29 A variância total explicada pelos 4 fatores obtidos nesta análise fatorial (como indica a Figura 4.10 e a Figura 4.11), atinge os 80%, o que se considera muito satisfatório. Figura 4.10 – Variância total explicada pelos fatores da 2ª iteração da análise fatorial sem categorização das variáveis Figura 4.11 – “Scree plot” dos fatores da 2ª iteração da análise fatorial sem categorização das variáveis Os loadings de cada fator apresentam-se na Figura 4.12 e na Figura 4.13 (antes e depois da rotação do tipo Varimax, respetivamente). Figura 4.12 – Loadings dos fatores da 2ª iteração da análise fatorial sem categorização das variáveis antes da rotação
  • 32. Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL André Ramos (n.º 76819) / Luís Neto (n.º 74776) 30 Figura 4.13 – Loadings dos fatores da 2ª iteração da análise fatorial sem categorização das variáveis após a rotação A partir da matriz dos resíduos (vide Figura 4.15), é possível calcular os indicadores da qualidade deste modelo de análise fatorial, que se apresentam na Tabela 4.1: todos eles cumprem os requisitos (GFI e AGFI superiores a 0,90 e RMSR* inferior a 0,10), pelo que se garante a boa adequabilidade do modelo aos dados existentes. Tabela 4.1 – Índices de qualidade do modelo fatorial da 2ª iteração da análise fatorial sem categorização das variáveis GFI 0,97 AGFI 0,93 RMSR* 0,05 Os fatores obtidos explicam algumas características latentes entre as várias variáveis, e foram denominados da seguinte forma:  Fator “Parque dos Príncipes” FPP (f1) – representa os indivíduos com elevado poder de compra, trabalhadores do setor terciário, com uma média densidade de urbanização mas taxa de rede viária baixa (zonas com muitos espaços verdes);  Fator “Portas de Benfica” FPB (f2) – explica as zonas com média densidade de ocupação e um bom serviço de TC;  Fator “Baía de Cascais” FBC (f3) – representa as famílias com mais que uma viatura, alta taxa de motorização, e com profissionais liberais e crianças no agregado;  Fator “Instituto Superior Técnico” FIST (f4) – representa uma zona com boa acessibilidade de TC (nomeadamente transporte público pesado) e com uma relação de estudantes e trabalhadores alta face ao número de habitantes. Os coeficientes destes fatores apresentam-se na Figura 4.14. Figura 4.14 – Coeficientes dos fatores sem categorização das variáveis
  • 33. Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL André Ramos (n.º 76819) / Luís Neto (n.º 74776) 31 Desta forma, os fatores tomam a forma que se segue: FPP = 0,076 x FAM>1TI – 0,101 x AcTC_TI5 + 0,013 x LNDENS_GL – 0,008 x PPGLOB400BUS – 0,210 x KMVIA/PESSGL – 0,261 x TXANALF – 0,239 x TX_SECT_I + 0,168 x TX_SECT_III + 0,273 x IPC + 0,034 x DEP_EMP_LX + 0,095 x TX_MOT + 0,152 x COMP – 0,035 x MIX – 0,042 x PPGLOB400TCSP – 0,064 x DISTCBD + 0,040 x PAURB – 0,074 x PFAM0LIB + 0,024 x PFAMCRIANC FPB = -0,104 x FAM>1TI – 0,008 x AcTC_TI5 + 0,127 x LNDENS_GL + 0,340 x PPGLOB400BUS + 0,106 x KMVIA/PESSGL + 0,123 x TXANALF + 0,131 x TX_SECT_I – 0,039 x TX_SECT_III – 0,070 x IPC + 0,157 x DEP_EMP_LX – 0,074 x TX_MOT – 0,518 x COMP – 0,279 x MIX – 0,079 x PPGLOB400TCSP – 0,164 x DISTCBD + 0,149 x PAURB – 0,111 x PFAM0LIB + 0,149 x PFAMCRIANC FBC = 0,248 x FAM>1TI – 0,034 x AcTC_TI5 + 0,000 x LNDENS_GL + 0,087 x PPGLOB400BUS + 0,035 x KMVIA/PESSGL – 0,063 x TXANALF + 0,013 x TX_SECT_I + 0,045 x TX_SECT_III + 0,097 x IPC + 0,056 x DEP_EMP_LX + 0,234 x TX_MOT – 0,070 x COMP + 0,012 x MIX + 0,082 x PPGLOB400TCSP – 0,023 x DISTCBD + 0,081 x PAURB – 0,439 x PFAM0LIB + 0,400 x PFAMCRIANC FIST = 0,043 x FAM>1TI + 0,321 x AcTC_TI5 + 0,049 x LNDENS_GL – 0,115 x PPGLOB400BUS + 0,042 x KMVIA/PESSGL + 0,020 x TXANALF + 0,054 x TX_SECT_I + 0,049 x TX_SECT_III – 0,079 x IPC + 0,041 x DEP_EMP_LX – 0,018 x TX_MOT + 0,197 x COMP + 0,523 x MIX + 0,398 x PPGLOB400TCSP + 0,059 x DISTCBD + 0,050 x PAURB – 0,042 x PFAM0LIB + 0,040 x PFAMCRIANC
  • 34. Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL André Ramos (n.º 76819) / Luís Neto (n.º 74776) 32 Figura 4.15 – Matriz dos resíduos da 2ª iteração da análise fatorial sem categorização das variáveis
  • 35. Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL André Ramos (n.º 76819) / Luís Neto (n.º 74776) 33 5. CONSTRUÇÃO DO MODELO DE REGRESSÃO LINEAR Uma vez que se realizaram dois conjuntos de análises fatoriais, proceder-se-á à averiguação de qual o modelo que melhor se ajusta aos dados disponíveis, desde que cumpra as verificações necessárias. Essas verificações explicam-se sucintamente de seguida:  Coeficiente de determinação (R²): medida de avaliação do efeito das variáveis independentes sobre a variável dependente, medindo a qualidade de ajustamento, e toma valores entre 0 e 1 (ou seja, um valor de 1,0 ou 100% representa que 100% da variabilidade total da variável dependente é explicada pelas variáveis independentes do modelo de regressão linear usado); de forma a poder comparar dois modelos com diferentes números de variáveis, deve calcular-se o coeficiente ajustado (R2 a);  Estatística de Durbin-Watson: este teste procura garantir que não existem correlações entre as variâncias – para tal, é exigido que o valor do teste seja o mais próximo possível de 2,0 (com uma amplitude de +- 0,2);  Verificação dos resíduos: procedimento gráfico cujo objetivo é garantir que os erros têm distribuição normal com média nula e variância constante (verificado através de um gráfico de probabilidade normal, com a probabilidade acumulada dos erros no eixo das abcissas e a probabilidade acumulada que se obteria caso os erros possuíssem realmente distribuição normal no eixo das ordenadas) e que são independentes; os erros dever-se-ão distribuir de forma linear em redor do zero de forma a garantir que são independentes e não se registam problemas de heteroscedasticidade;  Verificação da significância do modelo: trata-se de verificar se o p-value do teste ANOVA é inferior a 0,001, de modo a garantir que o modelo é altamente significativo;  Variance Inflation Factors (VIF): estes valores devem, para cada variável, ser inferiores a 5, sob pena de se estar perante problemas de multicolinearidade entre variáveis;  Condition Index: estes valores, por sua vez, devem ser inferiores a 15, novamente como forma de despiste de situações de multicolinearidade entre variáveis;  Valores centrados da influência de cada caso (Leverage) no ajustamento do modelo: segundo a bibliografia, os valores de Leverage devem situar-se abaixo de 0,2 (entre 0,2 e 0,5 consideram- se valores aceitáveis mas “arriscados”).
  • 36. Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL André Ramos (n.º 76819) / Luís Neto (n.º 74776) 34 5.1. MODELO 1 – ANÁLISE FATORIAL COM CATEGORIZAÇÃO DAS VARIÁVEIS Das análises fatoriais separadas efetuadas para as variáveis de uso do solo e para as variáveis socioeconómicas, resultaram 5 fatores (agora transformados em 5 novas variáveis), a saber:  Fator “Alto dos Moinhos” FAM;  Fator “ferroviário” FF;  Fator de entropia FE;  Fator “Poor Farmer” FPF;  Fator “Yuppie Workaholics” FYW. 1ª Iteração Nesta 1ª iteração, além destas 5 variáveis calculadas a partir da análise fatorial, foram usadas ainda outras 3 variáveis que haviam ficado de fora nessa fase (vide Figura 5.1):  PTCDIST;  PPASSE;  DISTTIHAB. Figura 5.1 – Estatística descritiva da 1ª iteração do modelo de regressão linear (análise fatorial com categorização das variáveis) Um dos outputs mais úteis do SPSS® é apresentado na Figura 5.2, que resume alguns dos indicadores do modelo testado. Figura 5.2 – Resumo da 1ª iteração do modelo de regressão linear (análise fatorial com categorização das variáveis) Como se observa, o R2 obtido é de 0,684 (ou 0,671, considerando o ajustamento), o que não é de menosprezar, mas a estatística de Durbin- Watson resulta num valor de 1,644, fora do intervalo pretendido. Desse modo, procedeu-se desde logo a uma revisão das variáveis utilizadas, através do teste de eliminação das variáveis complementares às resultantes das análises fatoriais. Testou-se, alternativamente, a eliminação das variáveis PTCDIST, PPASSE e DISTTIHAB, tendo-se optado por manter apenas as duas últimas
  • 37. Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL André Ramos (n.º 76819) / Luís Neto (n.º 74776) 35 2ª Iteração Correu-se, então, o modelo de regressão linear retirando a variável PTCDIST (vide Figura 5.3). Figura 5.3 – Estatística descritiva da 2ª iteração do modelo de regressão linear (análise fatorial com categorização das variáveis) Olhando para o resumo do modelo dado pelo SPSS®, que se apresenta na Figura 5.4, é percetível a forte subida do valor do teste de Durbin-Watson, tendo contudo o R2 (e o seu valor ajustado) descido também com alguma expressão. Figura 5.4 – Resumo da 2ª iteração do modelo de regressão linear (análise fatorial com categorização das variáveis) Olhando para os gráficos dos resíduos, conclui-se o seguinte:  Os resíduos têm distribuição normal com média nula e variância constante (vide Figura 5.5, para a representação do histograma, ou a Figura 5.6, para o normal probability plot, em que os pontos se distribuem aproximadamente sobre a diagonal principal);  Os resíduos distribuem-se de forma aparentemente aleatória em torno do eixo horizontal (ei = 0), o que garante a sua independência (Figura 5.7) e a homoscedasticidade das variáveis. Figura 5.5 – Histograma dos resíduos da 2ª iteração do modelo de regressão linear (análise fatorial com categorização das variáveis)
  • 38. Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL André Ramos (n.º 76819) / Luís Neto (n.º 74776) 36 Figura 5.6 – Normal probability plot da 2ª iteração do modelo de regressão linear (análise fatorial com categorização das variáveis) Figura 5.7 – Gráfico da distribuição dos erros da 2ª iteração do modelo de regressão linear (análise fatorial com categorização das variáveis) Pelo teste da ANOVA (Figura 5.8), o p-value é inferior a 0,001, pelo que o modelo de regressão linear tem significado para qualquer nível de significância. Figura 5.8 – Teste da ANOVA da 2ª iteração do modelo de regressão linear (análise fatorial com categorização das variáveis) Por sua vez, da análise da Figura 5.9 constata-se que os VIF de todas as variáveis são inferiores a 5. Da Figura 5.10 percebe-se igualmente que os condition index de todas as variáveis são inferiores a 15, pelo que está garantida a não existência de problemas de multicolinearidade entre variáveis. Figura 5.9 – Coeficientes e VIF da 2ª iteração do modelo de regressão linear (análise fatorial com categorização das variáveis)
  • 39. Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL André Ramos (n.º 76819) / Luís Neto (n.º 74776) 37 Figura 5.10 – Verificação de multicolinearidade da 2ª iteração do modelo de regressão linear (análise fatorial com categorização das variáveis) Olhando, por fim, para o valor da Leverage (valores centrados da influência de cada caso no ajustamento do modelo), que se apresenta na Figura 5.11, verifica-se que esta toma um valor máximo de 0,282, o que se pode considerar “arriscado” – de algum modo, pode significar a presença de um outlier. Figura 5.11 – Verificação da Leverage da 2ª iteração do modelo de regressão linear (análise fatorial com categorização das variáveis) Pela Figura 5.9 apresentada é ainda possível retirar os coeficientes do modelo de regressão linear construído. Uma primeira conclusão (retirada da coluna dos coeficientes estandardizados) é que o modelo passa pela origem (a ordenada na origem passa é zero). Por outro lado, os maiores coeficientes são das variáveis DISTTIHAB e PPASSE (variáveis de mobilidade, o que seria de esperar), seguida da variável FYW e são também as que têm p-values (significâncias) mais pequenas. Os coeficientes do modelo ajustado são, então, dados pela coluna dos coeficientes não estandardizados: PTIDIST = 0,395 + 0,013 x FAM – 0,014 x FF – 0,008 x FE – 0,011 x FPF – 0,021 x FYW + 0,017 x DISTTIHAB – 0,340 x PPASSE Neste modelo, são percetíveis as seguintes conclusões:  Alguns dos fatores relativos ao uso do solo apresentam sinal positivo (nomeadamente o fator FAM, que está relacionado com uma alta urbanização), enquanto outros apresentam uma influência negativa na parcela de viagens em TI (os que evidenciam a existência de
  • 40. Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL André Ramos (n.º 76819) / Luís Neto (n.º 74776) 38 transporte coletivo pesado e a entropia da zona);  Quanto aos fatores socioeconómicos, verifica-se que quanto menor a “terciarização” da população, menor a distância percorrida em TI;  Os sinais obtidos no modelo de regressão linear para as variáveis de mobilidade também parecem estar suficientemente reais, uma vez que a distância relativa percorrida em TI aumenta com a distância absoluta e diminui com a posse de passe. Eliminação de Outliers De forma a tentar melhor a adequabilidade do modelo de regressão linear aos dados, realizou-se o diagnóstico disponível no SPSS® para deteção de outliers na base de dados. Os vários indicadores do modelo de regressão linear (Durbin-Watson, R2, etc.), praticamente não sofreram alterações, apesar de serem encontrados outliers a uma distância de mais de 3 desvios padrões da média da variável respetiva, pelo que não se apresentou a análise efetuada nesse sentido. 5.2. MODELO 2 – ANÁLISE FATORIAL SEM CATEGORIZAÇÃO DAS VARIÁVEIS A partir da análise fatorial sem categorização das variáveis que se efetuou no Capítulo 4, testou-se o modelo de regressão linear, recorrendo às novas quatro variáveis criadas:  Fator “Parque dos Príncipes” FPP;  Fator “Portas de Benfica” FPB;  Fator “Baía de Cascais” FBC;  Fator “Instituto Superior Técnico” FIST. 1ª Iteração Nesta fase, além dessas quatro variáveis, utilizaram-se novamente as três variáveis de mobilidade que haviam ficado de fora da análise fatorial (vide Figura 5.12):  PTCDIST;  PPASSE;  DISTTIHAB. Figura 5.12 – Estatística descritiva da 1ª iteração do modelo de regressão linear (análise fatorial sem categorização das variáveis) Através do resumo do modelo (Figura 5.13) é constatável a existência de um R2 ajustado com um valor já significativo (0,686) mas a resposta ao teste de Durbin-Watson não passou de 1,704. Assim, procurou realizar-se uma 2ª iteração, através de novo teste de eliminação de alguma(s) das variáveis de mobilidade, tendo-se finalizado novamente com a eliminação da variável PTCDIST.
  • 41. Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL André Ramos (n.º 76819) / Luís Neto (n.º 74776) 39 Figura 5.13 – Resumo da 1ª iteração do modelo de regressão linear (análise fatorial sem categorização das variáveis) 2ª Iteração O novo modelo de regressão linear (sem a variável PTCDIST, como indica a Figura 5.14) foi analisado pelos procedimentos disponíveis no SPSS®. Figura 5.14 – Estatística descritiva da 2ª iteração do modelo de regressão linear (análise fatorial sem categorização das variáveis) O resumo do modelo (vide Figura 5.15), desta feita, demonstra um teste de Durbin-Watson com um valor já dentro do aceitável (1,931), ou seja, não se verificam correlações entre as variâncias das variáveis, tendo o R2 ajustado descido para 0,628. Figura 5.15 – Resumo da 2ª iteração do modelo de regressão linear (análise fatorial sem categorização das variáveis) Olhando para os gráficos dos resíduos deste novo modelo de regressão linear, podem ser retiradas as seguintes conclusões:  Os resíduos têm distribuição normal com média nula e variância constante (vide Figura 5.16, que apresenta o histograma, ou a Figura 5.17, com o normal probability plot, em que os pontos se distribuem aproximadamente sobre a diagonal principal);  Os resíduos distribuem-se de forma aparentemente aleatória em torno do eixo horizontal (ei = 0), garantindo a sua
  • 42. Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL André Ramos (n.º 76819) / Luís Neto (n.º 74776) 40 independência (Figura 5.18) e homoscedasticidade. Figura 5.16 – Histograma dos resíduos da 2ª iteração do modelo de regressão linear (análise fatorial sem categorização das variáveis) Figura 5.17 – Normal probability plot da 2ª iteração do modelo de regressão linear (análise fatorial sem categorização das variáveis) Figura 5.18 – Gráfico da distribuição dos erros da 2ª iteração do modelo de regressão linear (análise fatorial sem categorização das variáveis) O teste da ANOVA para este novo modelo (Figura 5.19) resulta num p-value novamente inferior a 0,001, concluindo-se que o modelo de regressão linear é significativo para qualquer nível de significância. Figura 5.19 – Teste da ANOVA da 2ª iteração do modelo de regressão linear (análise fatorial sem categorização das variáveis) A Figura 5.20 permite verificar que os VIF para todas as variáveis são inferiores a 5, o mesmo enquanto os condition índex (vide Figura 5.21) são inferiores a 15, confirmando que não se registam problemas de multicolinearidade entre variáveis.
  • 43. Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL André Ramos (n.º 76819) / Luís Neto (n.º 74776) 41 Figura 5.20 – Coeficientes e VIF da 2ª iteração do modelo de regressão linear (análise fatorial sem categorização das variáveis) Figura 5.21 – Verificação de multicolinearidade da 2ª iteração do modelo de regressão linear (análise fatorial sem categorização das variáveis) A confirmação final do valor da Leverage (vide Figura 5.22) permite perceber que, neste modelo, se regista um valor máximo de 0,264, o que, tal como no outro modelo testado, se pode considerar “arriscado” (uma vez que a base de dados é a mesma, são naturais os indícios da presença de um outlier). Figura 5.22 – Verificação da Leverage da 2ª iteração do modelo de regressão linear (análise fatorial sem categorização das variáveis) Regressando à Figura 5.20, verifica-se novamente que o modelo passa pela origem (considerando os coeficientes estandardizados). Além disso, registam-se novamente coeficientes superiores nas variáveis de mobilidade (DISTTIHAB e PPASSE, com especial incidência para a primeira, como não é de estranhar), sendo as variáveis com p-values (significâncias) mais pequenas, seguidas da variável FBC. Pode, por fim, escrever-se a expressão do modelo de regressão linear a partir da coluna dos coeficientes não estandardizados:
  • 44. Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL André Ramos (n.º 76819) / Luís Neto (n.º 74776) 42 PTIDIST = 0,390 + 0,010 x FPP + 0,015 x FPB + 0,027 x FBC – 0,015 x FIST + 0,017 x DISTTIHAB – 0,301 x PPASSE Olhando para a expressão resultante, os coeficientes obtidos parecem, em grande parte dos casos, apresentar alguns valores compreensíveis, apesar de ser menos intuitiva a sua explicação:  Quanto maior o poder de compra (representado pela variável FPP), maior a distância relativa percorrida em TI;  A relação entre a variável que representa a elevada taxa de motorização e até a posse de um maior número de viaturas (FBC) é positiva;  A relação entre uma variável representativa de boa acessibilidade de TC (FIST) e a distância relativa em TI tem sinal negativo;  Em contrapartida, o sinal do coeficiente da variável FPB é de mais difícil interpretação, uma vez que um bom serviço de transporte coletivo (pelo menos como sucederia nas zonas que esta variável/fator representa) deveria induzir a uma menor distância percorrida em transporte individual. Eliminação de Outliers Uma vez mais, tentou fazer-se o diagnóstico da existência de outliers nos dados disponíveis. Contudo, tal como no outro modelo de regressão linear, não se alteraram significativamente os indicadores do modelo (alterações apenas na terceira casa decimal), pelo que se optou pela sua exclusão deste relatório.
  • 45. Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL André Ramos (n.º 76819) / Luís Neto (n.º 74776) 43 6. CONSIDERAÇÕES FINAIS Os dois modelos de regressão linear que se obtiveram parecem explicar de forma aceitável ou, pelo menos, com suficiente razoabilidade, a relação entre a distância relativa percorrida em TI com as variáveis independentes usadas. Analisando comparativamente estes modelos e as análises fatoriais que lhes dão origem, observa-se que:  O modelo de regressão linear feito sem categorização das variáveis (Modelo 2) tem um teste de Durbin-Watson superior e um R2 a ligeiramente superior ao do modelo em que se realizou a separação das variáveis (Modelo 1), cumprindo ambos as restantes verificações efetuadas – deste modo, considera-se esse modelo como mais ajustado aos dados e como mais explicativo da relação entre a distância relativa percorrida em TI e as diferentes variáveis utilizadas;  Por si só, o facto de o Modelo 1 ter pegado em variáveis separadamente torna-o menos robusto que o Modelo 2, em que o próprio modelo de análise fatorial, na construção dos fatores, faz essa separação;  Por um lado, julga-se que os fatores obtidos no Modelo 1 explicam melhor as variáveis, pelo menos em termos de relação entre as variáveis de cada fator – o facto de no Modelo 2 se terem poucos fatores que tentam explicar um grande número de variáveis torna-as menos intuitivas na interpretação;  Por outro lado, o Modelo 1 pode vir a sofrer de um processo de “garbage in garbage out”, ou seja, depende mais passos intermédios, podendo falhar logo de início numa errada categorização das variáveis; além disso, neste caso em particular, as próprias análises fatoriais que originam o Modelo 1 têm valores de KMO inferiores, e uma delas (a análise fatorial considerando as variáveis de uso do solo) tem um AGFI inferior a 0,90. Assim, entende-se que o Modelo 2 é o que apresenta uma maior robustez na explicação dos resultados: PTIDIST = 0,390 + 0,010 x FPP + 0,015 x FPB + 0,027 x FBC – 0,015 x FIST + 0,017 x DISTTIHAB – 0,301 x PPASSE De destacar que os coeficientes obtidos em cada um dos modelos são bastante semelhantes (particularmente, como se esperava, nas variáveis de mobilidade), ajudando a atestar a razoabilidade dos resultados. Além disso, essa semelhança dos resultados acaba por dar razão aos defensores de cada uma das teorias – quer aqueles que defendem a separação das variáveis, quer os que consideram que todas elas estão interligadas e não se devem categorizar separadamente
  • 46. Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL André Ramos (n.º 76819) / Luís Neto (n.º 74776) 44 BIBLIOGRAFIA Livros  Maroco, J., “Análise Estatística com o SPSS Statistics” – 5ª edição, Report Number, 2011  Washington, Simon P., Karlaftis, Mathew G. e Mannering, “Statistical and Econometric Methods for Transportation Data Analysis”, Chapman & Hall/CRL, 2003 Publicações e Aulas  Abreu e Silva, J., “Repartição Modal e Usos do Solo – Construção de um Modelo Explicativo para a Área Metropolitana de Lisboa”, IST, 2005  Abreu e Silva, J., Slides das aulas teóricas de Técnicas de Apoio ao Planeamento de Transportes, IST, 2012