O documento apresenta uma análise da localização de novas empresas em Portugal Continental em 2010 utilizando técnicas de análise espacial univariadas e multivariadas. As regiões do Norte e Lisboa apresentaram o maior número de novas empresas, enquanto o Alentejo e Algarve tiveram menos. A maioria das regiões viu uma diminuição no número de novas empresas entre 2004-2010, com Lisboa e Alentejo tendo as maiores quedas. Vários setores apresentaram baixa concentração espacial nas novas empresas.
2.
2
Localização de novas empresas em Portugal Continental em 2010
ÍNDICE
1.
INTRODUÇÃO
..................................................................................................................................
3
1.1.
ENQUADRAMENTO
...............................................................................................................................
3
1.2.
METODOLOGIA
.....................................................................................................................................
3
2.
ANÁLISE EXPLORATÓRIA
............................................................................................................
4
2.1.
APRESENTAÇÃO DOS DADOS
................................................................................................................
4
2.2.
CARTOGRAFIA....................................................................................................................................4
2.3.
TÉCNICAS UNIVARIADAS
.....................................................................................................................
5
2.3.1
Medidas de tendência central e dispersão
......................................................................................
6
2.3.2
Medidas de localização
...................................................................................................................
7
2.3.3
Medidas de especialização
............................................................................................................
10
2.3.4
Medidas de correlação e associação espacial
..............................................................................
11
2.3.5
Medidas de variação discreta
.......................................................................................................
13
2.3.6
Análise shift-share
........................................................................................................................
15
2.4..
TÉCNICAS MULTIVARIADAS
...............................................................................................................
15
2.4.1.
Métodos Factoriais
...................................................................................................................
16
2.4.1.1.
Análise em Componentes Principais (ACP)
.............................................................................
16
2.4.2.
Método de Classificação Hierárquica e Não Hierárquica
.......................................................
19
2.4.2.1.
Classificação Hierárquica
........................................................................................................
19
2.4.2.2.
Classificação Não Hierárquica – Método K-Means
.................................................................
20
3.
ANÁLISE ECONOMÉTRICA
.........................................................................................................
22
3.1.
ESCOLHA DAS VARIÁVEIS
...................................................................................................................
22
3.2.
O MODELO ECONOMÉTRICO
...............................................................................................................
24
3.3.
ANÁLISE DOS RESULTADOS ECONOMÉTRICOS
....................................................................................
25
4.
POSSIBILIDADES DE INVESTIGAÇÕES FUTURAS
..................................................................
30
5.
BIBLIOGRAFIA
..............................................................................................................................
30
3.
3
Localização de novas empresas em Portugal Continental em 2010
1. INTRODUÇÃO
1.1. Enquadramento
Este trabalho foi elaborado no âmbito da disciplina de Métodos Quantitativos da
Análise Espacial, do Mestrado de Economia e Gestão das Cidades da Faculdade de
Economia da Universidade do Porto.
Pretende-se utilizar as técnicas de análise espacial para estudar a localização de empresas
no Continente português no ano de 2010.
1.2. Metodologia
No primeiro ponto utilizaram-se as técnicas de análise exploratória, onde a variável
nascimento de empresas será caracterizada através de padrões de localização e
especialização, e será realizado um estudo para ver a variação discreta do ano de 2004 para o
ano de 2010 com recurso à análise shift-share.
No segundo ponto faremos a caracterização do surgimento de novas empresas
recorrendo a várias variáveis, com o objectivo de sabermos se é possível identificar padrões
de correlação e associação entre as variáveis escolhidas, de forma a representa-las num novo
conjunto de variáveis (componentes) que resumam e deêm relevância às variáveis originais.
Finalmente na terceira parte, faz-se análise econométrica / confirmatória,
desenvolvendo-se um modelo de regessão linear e utilizando outros autorregressivos para
ver a autocorrelação entre regiões, saber se existe depência ou não.
O estudo foi elaborado com recurso a ferrrametas informáticas tais como:
ArcExplorer, Excel; Excel Add-In de Medidas de Localização e Especialização, SPSS
Statistics e MatLab (com scripts adequados à análise espacial).
4.
4
Localização de novas empresas em Portugal Continental em 2010
2. ANÁLISE EXPLORATÓRIA
No segunda parte concentramo-nos na descrição e caracterização da nossa variável
principal o nascimento de empresas em Portugal Continental em 2010 através de técnicas
univariadas e posteriormente de técnicas multivariadas.
2.1.Apresentação dos dados
A variável principal do estudo é o nascimento de empresas em Portugal Continental
em 2010. Recolheram-se dados referentes ao ano de 2010 e 2004, todos eles disponíveis no
site do Instituto Nacional de Estatistica (www.ine.pt).
As unidades geográficas do estudo, são numa primeira fase as NUTs II e numa fase
posterior as NUTs III ambas apenas de Portugal Continental. Todos os dados recolhidos são
quantitativos, mas foram escolhidas diversas unidades de medida.
2.2. Cartografia
5.
5
Localização de novas empresas em Portugal Continental em 2010
Elaborou-se a cartografia com o objectivo de visualmente ter uma melhor percepção da
criação de empresas em Portugal continental em 2010 e a evolução que existiu de 2004 para
2010 considerando para o calculo desta variação apenas os valores de nascimentos de
empresas em cada um dos referidos anos.
Observando a cartografia podemos ver que as NUTs do Norte e Lisboa são as que
apresentam maior número de nascimento de empresas com 42863 e 44679 respectivamente,
num nível intermédio temos a NUT do Centro com 26835 empresas criadas e por fim temos
a NUT do Alentejo e a do Algarve com fraco número de criação de empresas tendo a
primeira região criado 8988 empresas e a segunda 7520 num total de 130885 constituídas
em Portugal continental no ano de 2010.
Analisando agora o mapa de variação percentual do número nascimento de empresas,
constatamos que em todas as regiões essa variação é negativa, ou seja em qualquer região do
continente foram criadas mais empresas em 2004 que em 2010. As NUTs com maior
diminuição foram Lisboa e Alentejo ambas com -7,46% . A NUT centro teve uma variação
intermédia situando-se a quebra nos -3,03%, as regiões que tiveram uma variação menos
acentuada foram o Norte (-1,41%) e o Algarve (-0,24%), com valores bastante inferiores aos
-4,24% de média em Portugal Continental.
2.3 Técnicas Univariadas
Nas técnicas univariadas é importante fazer a distinção entre a análise de estruturas
espaciais e análise de dinâmicas espaciais. A análise de estruturas espaciais refere-se
exclusivamente a um momento do tempo e vai ter em atenção os padrões espaciais de
localização e de especialização da variável em análise nesse momento, a segunda envolve
dois momento de tempo diferentes, no caso concreto 2004 e 2010 e mede as tendências de
variação desses padrões e os motivos dessas variações (variação discreta e método shift-
share). Será ainda realizada uma referência aos resultados obtidos na utilização das medidas
de tendência central e dispersão e na utilização das técnicas de correlação e associação
espacial.
6.
6
Localização de novas empresas em Portugal Continental em 2010
2.3.1 Medidas de tendência central e dispersão
Statistics
Criação de empresas
NUTS II 2004
Criação de empresas
NUTSII 2010
N Valid 5 5
Missing 0 0
Mean 27336,20 26177,00
Median 27673,00 26835,00
Mode 7538a
7520a
Std. Deviation 18720,558 17781,486
Variance 350459281,700 316181233,500
Minimum 7538 7520
Maximum 48281 44679
Percentiles 25 8625,50 8254,00
50 27673,00 26835,00
75 45878,50 43771,00
a. Multiple modes exist. The smallest value is shown
Relativamente à variável Criação de Empresas em 2010 nas 5 NUTS II de Portugal
Continental e depois de analisado o quadro podemos observar que:
-‐ Em média foram constituídas em média 26177 empresas;
-‐ Ordenando as observações de forma crescente, a observação que se encontra no
primeiro quartil (25%) da amostra é cerca de 8254 sociedades criadas, no segundo
(50%) de 26835 novas empresas e no terceiro (75%) é de 43771 novos nascimentos;
-‐ O número de sociedades constituídas mais frequente é o 7520, apesar de existirem
outras modas (a.), esta é a que apresenta o valor mais baixo;
7.
7
Localização de novas empresas em Portugal Continental em 2010
-‐ Existe
um
desvio
padrão
em
relação
à
média
de
17781
empresas,
um
intervalo
de
variação
entre
o
máximo
e
mínimo
de
novas
sociedades
de
37159
e
um
coeficiente
de
variação
(Desvio-‐padrão/Média)
de
0,68;
Constata-‐se
ainda
que,
relativamente
a
2004,
a
dispersão
das
observações
diminui,
sendo
no
ano
de
2004
de
40743
sociedades,
contudo
o
coeficiente
de
variação
manteve-‐se
idêntico
nos
0,68.
2.3.2 Medidas de localização
Índices de concentração
Através dos Índices de Concentração conseguimos saber, para cada um dos sectores, se
as novas empresas criadas em 2010 estão homogeneamente distribuídas por Portugal
Continental ou se, pelo contrário, existe concentração espacial. Os índices de Rogers e de
Herfindahl dizem-nos que quanto maiores forem os valores (mais próximos de 1), maior
será a concentração espacial, já o índice de Theil é uma medida inversa da concentração,
pelo que quanto menor for o seu valor (quanto mais próximo de 0) maior é a concentração
espacial.
Os resultados obtidos são consistentes entre si quando analisados os índices atrás
referidos. Desta forma podemos agrupar os sectores em três grupos:
-Grupo de fraca concentração onde temos a criação de novas empresas dos
sectores agricultura, produção animal, caça e silvicultura e pesca, construção, comércio por
grosso e a retalho; reparação de veículos automóveis e motociclos, transportes e
armazenagem; alojamento, restauração e similares e outras atividades de serviços, o que
seria de esperar pois são sectores que se podem espalhar por todo o território nacional, não
existindo especificidades geográficas em cada um deles excepto no sector das pescas que
A B C D E F G H I J K L M N O+P
Agricultura,
produção
animal, caça
e silvicultura
e Pesca
Indústrias
extractivas
Indústrias
transformad
oras
Eletricidade,
gás, vapor,
água quente
e fria e ar frio
e Captação,
tratamento e
distribuição
de água;
saneamento,
gestão de
resíduos e
despoluição
Construção
Comércio
por grosso
e a retalho;
reparação
de veículos
automóveis
e motociclos
Transporte
s e
armazenag
em
Alojamento,
restauração
e similares
Atividades
de
informaçã
o e de
comunicaç
ão
Atividades
imobiliárias
Atividades de
consultoria,
científicas,
técnicas e
similares e
Atividades
administrativ
as e dos
serviços de
apoio
Educação
Atividades
de saúde
humana e
apoio
social
Atividades
artísticas,
de
espetáculo
s,
desportivas
e
recreativas
Outras
atividades
de serviços
Rogers CR 3,580 3,839 4,123 3,887 3,699 3,855 3,840 3,706 4,222 3,955 3,973 3,885 3,894 3,908 3,860
Rogers normalizado CR* 0,193 0,280 0,374 0,296 0,233 0,285 0,280 0,235 0,407 0,318 0,324 0,295 0,298 0,303 0,287
Herfindahl CH 0,236 0,282 0,352 0,284 0,253 0,277 0,277 0,253 0,371 0,293 0,300 0,284 0,285 0,287 0,278
Herfindahl normalizado CH* 0,045 0,102 0,189 0,105 0,066 0,096 0,096 0,066 0,213 0,117 0,126 0,105 0,106 0,109 0,098
Theil CT 1,511 1,402 1,248 1,363 1,461 1,398 1,396 1,474 1,192 1,360 1,349 1,380 1,371 1,384 1,410
Theil normalizado CT* 0,939 0,871 0,775 0,847 0,908 0,869 0,868 0,916 0,741 0,845 0,838 0,857 0,852 0,860 0,876
Coeficiente de localização CL 0,305 0,244 0,192 0,060 0,080 0,063 0,013 0,094 0,186 0,086 0,087 0,116 0,045 0,070 0,071
Coeficiente de Gini CG 0,409 0,317 0,235 0,072 0,112 0,073 0,017 0,121 0,212 0,104 0,093 0,123 0,054 0,084 0,079
Índices de Concentração
8.
8
Localização de novas empresas em Portugal Continental em 2010
além de ter uma extensa costa está também associado às atividades do sector agrícola não
extrativa.
-Grupo de maior concentração em que se destacam novas empresas dos sectores
das indústrias transformadoras e das atividades de informação e de comunicação, resultado
também previsível dado a necessidade de algumas especificidades como vias de
comunicação, densidade populacional, equipamentos de serviços de informação e situação
geográfica estratégica para a distribuição dos seus bens e serviços.
-Grupo de concentração intermédia é composto pelos restantes sectores, todos eles
próximos do grupo de maior concentração, contudo não foram inseridos nesse grupo para
destacar os dois sectores que possuíam os maiores valores nos índices de Rogers e
Herfindahl e os menores no índice de Theil.
Relativamente aos três índices analisados é importante referir que mesmo os sectores
inseridos no grupo de maior concentração não possuem valores consistentes para dizermos
que são muito concentrados, foi decidido escolher três grupos para se poderem comparar os
sectores entre si.
Os resultados obtidos não fornecem informações sobre a unidade geográfica em que
poderá existir concentração, essa resposta está na análise aos Quocientes de Localização.
Analisemos agora os Índices de Gini, Curvas de Localização e Coeficientes de
Localização, medidas de concentração relativa que têm a atividade padrão como referência,
neste caso concreto será a totalidade dos sectores.
- O Índice de Gini é um indicador do grau de concentração espacial e pode ser visto
através das curvas de localização (em ficheiro anexo), que evidenciam graficamente a
maior ou menor similitude dos perfis de concentração de cada sector com perfil de
concentração de cada sector com perfil de concentração geral. Os sectores que apresentam
maior grau de concentração em termos relativos (embora este não seja muito elevado) são
o Agricultura, produção animal, caça, silvicultura e Pesca e das industrias extrativas,
parece razoável que assim seja pois estão fortemente dependentes da localização dos
recursos naturais.
- No que respeita aos Coeficientes de Localização, são novamente os sectores da
Agricultura, produção animal, caça, silvicultura e Pesca e das industrias extrativas que se
destacam, o que está em concordância com os resultados anteriormente analisados. Quanto
aos restantes sectores (e mesmo os dois anteriores podem ser incluídos nesta conclusão,
9.
9
Localização de novas empresas em Portugal Continental em 2010
dado o seus valores não serem elevados) não apresentam uma grande diferenciação entre
perfis de concentração no continente e o de cada uma das atividades das sociedades, pois os
seu valores são próximos de 0.
Quocientes de Localização
Quanto maior for o valor dos Quocientes de Localização, maior a concentração
espacial relativa.
Os sectores que mais se destacam, mesmo os valores não sendo muito elevados para
todos os sectores, são o da Agricultura, produção animal, caça, silvicultura e pesca e das
industrias extrativas o que está de acordo com os dados fornecidos pelo Índice de Gini.
Sendo que o Sector Agricultura, produção animal, caça, silvicultura e pesca apresentam os
maiores Quocientes de Localização na região do Alentejo e o sector das Industrias
extractivas na região Centro.
De salientar ainda que nos casos em que o índice apresenta um valor superior a 1
podemos concluir que a unidade geográfica é relativamente mais importante no contexto
nacional em termos de sector, do que em termos gerais de todos os sectores.
Por fim fazendo uma breve análise aos restantes sectores constata-se que as novas
industrias transformadoras são especialmente mais concentras no Norte; as de eletricidade,
gás, vapor, água quente e fria e ar frio e captação, tratamento e distribuição de água;
Quocientes de Localização
A B C D E F G H I J K L M N O+P
Agricultura
, produção
animal,
caça e
silvicultura
e Pesca
Indústria
s
extractiv
as
Indústri
as
transfor
madora
s
Eletricidade
, gás, vapor,
água
quente e
fria e ar frio
e Captação,
tratamento
e
distribuição
de água;
saneamento
, gestão de
resíduos e
despoluição
Construção
Comércio
por
grosso e
a retalho;
reparaçã
o de
veículos
automóve
is e
motociclo
s
Transportes e armazenagem
Alojament
o,
restauraçã
o e
similares
Atividade
s de
informaç
ão e de
comunica
ção
Atividades
imobiliária
s
Atividade
s de
consultor
ia,
científica
s,
técnicas
e
similares
e
Atividade
s
administr
ativas e
dos
serviços
de apoio
Educação
Atividades
de saúde
humana e
apoio
social
Atividades
artísticas,
de
espetácul
os,
desportiva
s e
recreativa
s
Outras
atividades
de
serviços
Norte 0,745 1,085 1,587 1,085 0,997 1,145 1,041 1,105 0,818 0,908 0,851 1,221 1,113 0,831 0,868
Centro 1,212 1,733 0,987 1,155 1,220 1,075 0,993 1,040 0,674 0,877 0,903 1,171 1,038 0,944 0,864
Lisboa 0,350 0,284 0,569 0,915 0,786 0,834 0,982 0,724 1,546 1,193 1,254 0,713 0,934 1,202 1,160
Alentejo 4,392 1,845 0,764 0,845 0,921 0,909 0,960 1,335 0,457 0,554 0,830 1,132 0,832 0,951 1,006
Algarve 1,421 1,124 0,553 0,656 1,603 1,003 0,943 1,489 0,620 1,358 0,890 0,676 0,819 1,020 1,285
10.
10
Localização de novas empresas em Portugal Continental em 2010
saneamento, gestão de resíduos e despoluição no Norte e Centro; as da Construção no
Algarve e Centro, o Comércio por grosso e a retalho e reparação de veículos automóveis e
motociclos no Norte e Centro; transportes e armazenagem no Norte; Alojamento,
restauração e similares no Algarve; as Atividades de informação e de comunicação em
Lisboa; as Atividades imobiliárias em Lisboa e Algarve; as Atividades de consultoria,
científicas, técnicas e similares e Atividades administrativas e dos serviços de apoio em
Lisboa; a educação no Norte, Centro e Alentejo; as Atividades de saúde humana e apoio
social têm quocientes de Localização muito próximos nas cinco regiões; as Atividades
artísticas, de espetáculos, desportivas e recreativas na Região de Lisboa e no Algarve e por
fim as outras atividades de serviços no Algarve, Lisboa e Alentejo.
2.3.3 Medidas de especialização
Índices de especialização
Índices de Especialização
U.G.
Rogers Herfindahl Theil
ER ER* EH EH* ET ET*
Norte 12,392 0,549 0,171 0,112 2,096 0,774
Centro 12,413 0,552 0,178 0,119 2,081 0,768
Lisboa 12,791 0,599 0,261 0,208 1,870 0,690
Alentejo 12,302 0,538 0,161 0,101 2,124 0,784
Algarve 12,383 0,548 0,174 0,115 2,092 0,773
No quadro observamos a consistência dos resultados em que a região de Lisboa é a
NUT que apresenta o maior grau de especialização empresarial das novas sociedades
constituídas. As restantes regiões têm um grau de especialização idêntico e um pouco mais
baixo que a NUT II Lisboa.
Faremos agora uma análise na perspectiva da unidade geográfica, ou seja pretendemos
saber em que sectores se especializaram ou não cada uma das NUTS II, para isso
utilizaremos os Quocientes de Especialização.
11.
11
Localização de novas empresas em Portugal Continental em 2010
Relativamente às regiões do Norte e do Centro as novas empresas são especializadas no sector
das industrias transformadoras; no respeitante a Lisboa a especialização das novas sociedades centra-
se nas atividades de informação e comunicação; o Alentejo tem a sua especialização sobretudo na
agricultura, produção animal, caça, silvicultura e pesca, mas também tem um bom quociente nas
industrias extrativas; finalmente o Algarve tem a sua especialização de novas empresas nos sectores
da construção e alojamento, restauração e similares.
Por outro lado, analisando em que sectores as NUTS são menos especializadas relativamente,
temos o norte com o sector da agricultura, produção animal, caça, silvicultura e pesca, o Centro com
as atividades de informação e de comunicação, Lisboa com as industrias extrativas e com a
agricultura, produção animal, caça, silvicultura e pesca, o Alentejo com as atividades de informação
e comunicação e o Algarve com as industrias transformadoras.
2.3.4 Medidas de correlação e associação espacial
Coeficientes de Associação Sectorial
Estes coeficientes medem a intensidade da similitude nos perfis de especialização de
duas unidades geográficas. Medem apenas a intensidade e não o sentido da relação entre
unidades geográficas. Em termos de análise temos que quanto mais próximo do zero está o
coeficiente maior é a similitude de perfis.
Analisando
concretamente
os
valores
obtidos,
concluímos
que
embora
os
valores
sejam
todos
relativamente
baixos
o
Norte
tem
maiores
similitudes
no
perfil
de
especialização
com
o
Centro,
o
Centro
com
o
Norte,
Lisboa
tem
os
valores
mais
elevados
por
isso
considera-‐se
a
região
mais
afastada
em
termos
de
similitudes
de
especialização,
o
mesmo
acontecendo
com
a
região
do
Alentejo,
o
Algarve
apresenta
uma
similitude
de
perfil
de
especialização
idêntico
ao
do
Centro.
Quocientes de Especialização
A B C D E F G H I J K L M N O+P
Agricultura,
produção
animal, caça
e silvicultura
e Pesca
Indústrias
extractivas
Indústrias
transformador
as
Eletricidade,
gás, vapor,
água quente
e fria e ar frio
e Captação,
tratamento e
distribuição
de água;
saneamento,
gestão de
resíduos e
despoluição
Construção
Comércio por
grosso e a
retalho;
reparação de
veículos
automóveis e
motociclos
Transportes e armazenagem
Alojamento,
restauração e
similares
Atividades de
informação e
de
comunicação
Atividades
imobiliárias
Atividades de
consultoria,
científicas,
técnicas e
similares e
Atividades
administrativa
s e dos
serviços de
apoio
Educação
Atividades de
saúde
humana e
apoio social
Atividades
artísticas, de
espetáculos,
desportivas e
recreativas
Outras
atividades de
serviços
Norte 0,745 1,085 1,587 1,085 0,997 1,145 1,041 1,105 0,818 0,908 0,851 1,221 1,113 0,831 0,868
Centro 1,212 1,733 0,987 1,155 1,220 1,075 0,993 1,040 0,674 0,877 0,903 1,171 1,038 0,944 0,864
Lisboa 0,350 0,284 0,569 0,915 0,786 0,834 0,982 0,724 1,546 1,193 1,254 0,713 0,934 1,202 1,160
Alentejo 4,392 1,845 0,764 0,845 0,921 0,909 0,960 1,335 0,457 0,554 0,830 1,132 0,832 0,951 1,006
Algarve 1,421 1,124 0,553 0,656 1,603 1,003 0,943 1,489 0,620 1,358 0,890 0,676 0,819 1,020 1,285
Coeficientes de Associação Sectorial
Norte Centro Lisboa Alentejo Algarve
Norte 0,000 0,049 0,191 0,119 0,128
Centro 0,049 0,000 0,171 0,109 0,089
Lisboa 0,191 0,171 0,000 0,209 0,168
Alentejo 0,119 0,109 0,209 0,000 0,123
Algarve 0,128 0,089 0,168 0,123 0,000
12.
12
Localização de novas empresas em Portugal Continental em 2010
Coeficientes de Associação Geográfica
Os
Coeficientes
de
Associação
Geográfica
medem
a
similitude
dos
padrões
de
concentração
dos
sectores
empresariais.
Mais
uma
vez
medem
apenas
a
intensidade
dessa
relação.
Quanto
maior
for
coeficiente
maior
a
dissemelhança
de
perfis.
Identificamos
os
maiores
coeficientes
(acima
de
0,3)
no
Sector
da
agricultura,
produção
animal,
caça,
silvicultura
e
pesca
em
relação
a
quase
todos
os
outros,
ou
seja
este
é
o
sector
que
apresenta
maior
dissemelhança
entre
os
perfis
de
concentração
geográfica
relativamente
à
grande
maioria
dos
restantes
sectores.
O
sector
que
tem
maior
similitude
entre
perfis
de
concentração
geográfica
com
a
maioria
dos
restantes
é
o
sector
dos
transportes
e
armazenagem
que
apresenta
o
maior
número
de
coeficientes
inferiores
a
0,1.
Coeficiente de Correlação de Bravais-Pearson
Coeficientes de Associação Geográfica
A B C D E F G H I J K L M N O+P
Agricultura
, produção
animal,
caça e
silvicultura
e Pesca
Indústrias
extractivas
Indústrias
transformad
oras
Eletricidade,
gás, vapor,
água quente
e fria e ar frio
e Captação,
tratamento e
distribuição
de água;
saneamento,
gestão de
resíduos e
despoluição
Construção
Comércio
por grosso e
a retalho;
reparação de
veículos
automóveis
e motociclos
Transportes
e
armazenag
em
Alojamento
,
restauraçã
o e
similares
Atividades
de
informaçã
o e de
comunicaç
ão
Atividades
imobiliária
s
Atividades
de
consultoria,
científicas,
técnicas e
similares e
Atividades
administrati
vas e dos
serviços de
apoio
Educação
Atividades
de saúde
humana e
apoio
social
Atividades
artísticas,
de
espetáculo
s,
desportiva
s e
recreativas
Outras
atividades
de
serviços
Agricultura, produção animal, caça - 0,218 0,350 0,304 0,243 0,296 0,312 0,249 0,431 0,341 0,343 0,279 0,319 0,319 0,316
Indústrias extractivas 0,218 - 0,261 0,215 0,199 0,207 0,238 0,178 0,430 0,323 0,331 0,191 0,231 0,313 0,308
Indústrias transformadoras 0,350 0,261 - 0,164 0,193 0,144 0,178 0,157 0,337 0,259 0,258 0,120 0,155 0,256 0,260
Eletricidade, gás, vapor, água quen 0,304 0,215 0,164 - 0,073 0,044 0,048 0,089 0,215 0,135 0,129 0,069 0,025 0,126 0,131
Construção 0,243 0,199 0,193 0,073 - 0,065 0,084 0,064 0,259 0,139 0,160 0,088 0,088 0,144 0,133
Comércio por grosso e a retalho; re 0,296 0,207 0,144 0,044 0,065 - 0,054 0,058 0,243 0,143 0,143 0,060 0,034 0,130 0,134
Transportes e armazenagem 0,312 0,238 0,178 0,048 0,084 0,054 - 0,088 0,192 0,096 0,093 0,107 0,033 0,079 0,083
Alojamento, restauração e similares 0,249 0,178 0,157 0,089 0,064 0,058 0,088 - 0,280 0,160 0,181 0,065 0,074 0,163 0,148
Atividades de informação e de comun 0,431 0,430 0,337 0,215 0,259 0,243 0,192 0,280 - 0,120 0,100 0,284 0,209 0,117 0,132
Atividades imobiliárias 0,341 0,323 0,259 0,135 0,139 0,143 0,096 0,160 0,120 - 0,045 0,203 0,119 0,045 0,032
Atividades de consultoria, científi 0,343 0,331 0,258 0,129 0,160 0,143 0,093 0,181 0,100 0,045 - 0,197 0,113 0,024 0,040
Educação 0,279 0,191 0,120 0,069 0,088 0,060 0,107 0,065 0,284 0,203 0,197 - 0,084 0,187 0,187
Atividades de saúde humana e apoio 0,319 0,231 0,155 0,025 0,088 0,034 0,033 0,074 0,209 0,119 0,113 0,084 - 0,111 0,116
Atividades artísticas, de espetácul 0,319 0,313 0,256 0,126 0,144 0,130 0,079 0,163 0,117 0,045 0,024 0,187 0,111 - 0,031
Outras atividades de serviços 0,316 0,308 0,260 0,131 0,133 0,134 0,083 0,148 0,132 0,032 0,040 0,187 0,116 0,031 -
13.
13
Localização de novas empresas em Portugal Continental em 2010
Este coeficiente diz-nos qual o sentido da relação entre os vários sectores de atividade.
Do que se pode observar, constatamos que todos os sectores estão positivamente
correlacionados entre si, os valores da correlação de Pearson são todos muito próximos de 1,
o que significa que o número de empresas de um sector aumenta quando o número de
empresas de outro sector aumenta, contudo não é possível estabelecer relações de
causalidade a partir dos coeficientes de correlação dado serem todos muito próximos. Estes
dados poderão indicar a existência do fenómeno de economias de aglomeração, ou seja tirar
vantagens da concentração espacial por exemplo na diminuição de custo de transportes de
matérias primas e/ou intermédias e/ou acabadas e troca de conhecimentos e tecnologia.
2.3.5 Medidas de variação discreta
Medidas de Variação Absolutas e Relativas
A tendência geral indica uma diminuição de nascimentos de empresas de 2004 para
2010, com cerca de menos 5616 empresas criadas, ou em termos relativos menos 4,109%.
Observando as tabelas destacamos quatro sectores que contrariam a tendência geral,
apresentando uma variação positiva, são eles o sector da eletricidade, gás, vapor, água
quente e fria, ar frio, captação, tratamento e distribuição de água, saneamento, gestão de
resíduos e despoluição com mais 59 novas empresas e variação relativa de 46,457%; o
sector das atividades de consultoria, científicas, técnicas e similares e atividades
administrativas e dos serviços de apoio com a criação de mais 11005 sociedades, em termos
percentuais 28,666%; a educação com mais 1296 nascimentos de empresas (13,771%) e
finalmente o sector das atividades de saúde humana e apoio social com 1019 novas
Variações absolutas
A B C D E F G H I J K L M N O+P
Agricultura,
produção
animal, caça e
silvicultura e
Pesca
Indústrias
extractivas
Indústrias
transformador
as
Eletricidade,
gás, vapor,
água quente e
fria e ar frio e
Captação,
tratamento e
distribuição de
água;
saneamento,
gestão de
resíduos e
despoluição
Construção
Comércio por
grosso e a
retalho;
reparação de
veículos
automóveis e
motociclos
Transportes e
armazenagem
Alojamento,
restauração e
similares
Atividades de
informação e
de
comunicação
Atividades
imobiliárias
Atividades de
consultoria,
científicas,
técnicas e
similares e
Atividades
administrativa
s e dos
serviços de
apoio
Educação
Atividades
de saúde
humana e
apoio social
Atividades
artísticas, de
espetáculos,
desportivas e
recreativas
Outras
atividades
de serviços
Norte -435 -12 -744 21 -941 -1383 -596 -234 -32 -34 2890 799 668 -26 -554 -613
Centro -276 -13 -459 12 -1330 -946 -413 -351 -72 -7 2779 309 471 -10 -532 -838
Lisboa -121 -10 -331 20 -1224 -1757 -143 -122 -257 -54 3573 73 -225 -410 -2614 -3602
Alentejo -379 -7 -87 1 -298 -529 -139 -105 -19 -42 1048 134 74 -1 -196 -545
Algarve -37 1 -51 5 -166 -177 -20 -75 1 -126 715 -19 31 -23 -77 -18
Total -1248 -41 -1672 59 -3959 -4792 -1311 -887 -379 -263 11005 1296 1019 -470 -3973 -5616
U.G. Total
Variações relativas
A B C D E F G H I J K L M N O+P
Agricultura,
produção
animal, caça e
silvicultura e
Pesca
Indústrias
extractivas
Indústrias
transformador
as
Eletricidade,
gás, vapor,
água quente e
fria e ar frio e
Captação,
tratamento e
distribuição de
água;
saneamento,
gestão de
resíduos e
despoluição
Construção
Comércio por
grosso e a
retalho;
reparação de
veículos
automóveis e
motociclos
Transportes e
armazenagem
Alojamento,
restauração e
similares
Atividades de
informação e
de
comunicação
Atividades
imobiliárias
Atividades de
consultoria,
científicas,
técnicas e
similares e
Atividades
administrativa
s e dos
serviços de
apoio
Educação
Atividades de
saúde
humana e
apoio social
Atividades
artísticas, de
espetáculos,
desportivas e
recreativas
Outras
atividades de
serviços
Norte -34,524 -35,294 -24,514 46,667 -26,016 -14,366 -62,019 -6,765 -5,808 -4,462 26,609 22,986 25,555 -2,562 -25,660 -1,410
Centro -24,731 -37,143 -33,975 37,500 -39,349 -16,344 -65,452 -15,600 -21,176 -1,566 43,722 13,691 32,595 -1,403 -34,726 -3,028
Lisboa -23,048 -62,500 -27,885 52,632 -35,748 -21,930 -28,486 -5,247 -20,078 -5,138 20,366 2,885 -7,267 -21,568 -53,897 -7,460
Alentejo -26,709 -46,667 -26,935 10,000 -36,034 -27,424 -65,877 -11,194 -23,457 -30,657 57,551 18,768 16,408 -0,412 -32,997 -5,611
Algarve -11,821 33,333 -26,702 250,000 -18,024 -12,266 -25,641 -8,961 1,471 -39,748 39,546 -4,378 7,888 -9,746 -15,587 -0,239
Total -26,937 -39,806 -27,468 46,457 -32,533 -17,881 -55,015 -9,043 -16,336 -9,690 28,666 13,771 12,739 -11,441 -41,261 -4,109
U.G. Total
14.
14
Localização de novas empresas em Portugal Continental em 2010
empresas o que equivale a uma variação em termos de percentagem de 12,739. Estas
variações positivas poderão estar associadas ao desenvolvimento tecnológico, novas
energias renováveis, investimento na investigação e na modernização do parque escolar e
serviços de saúde por parte do governo e também com envelhecimento da população no caso
dos serviços de apoio social.
Analisando agora o que aconteceu nas regiões vemos que a tendência continua negativa
sendo que Lisboa apresenta a maior diferença negativa, tanto em termos absolutos como
percentuais e o Algarve a menor diferença, sendo uma perda quase negligenciável, muito
próxima do 0, o que nos diz que a criação de novas empresas no Algarve no ano de 2010 foi
muito semelhante em termos de número, havendo algumas diferenças no tipo de sectores
escolhidos para a abertura de novas empresas. Todos os resultados apresentados comparam
o ano de 2010 com o de 2004.
Coeficientes de Reestruturação Sectorial e Coeficientes de Redistribuição
Geográfica
O Coeficiente de Redistribuição Sectorial relaciona as estruturas de produção de cada
NUT II entre 2004 e 2010, de forma a avaliar as dinâmicas de mudança no grau de
especialização sectorial. Através da análise feita ao primeiro quadro vemos que os valores
são muito semelhantes e próximos de 0 para as cinco regiões, o que significa que no
essencial respeitam a estrutura produtiva já existente, mantendo as novas empresas o padrão
de especialização.
No que respeita ao Coeficiente de redistribuição geográfica, este relaciona a proporção
de cada uma das variáveis em cada uma das unidades geográficas de 2004 para 2010, como
medida de estabilidade dos padrões de concentração espacial. Mais uma vez os valores são
Coeficientes de Reestruturação Sectorial
U.G. CRS
Norte 0,108
Centro 0,145
Lisboa 0,117
Alentejo 0,157
Algarve 0,101
Total 0,120
Coeficientes de Redistribuição Geográfica
A B C D E F G H I J K L M N O+P
Agricultura,
produção
animal, caça
e silvicultura
e Pesca
Indústrias
extractivas
Indústrias
transformado
ras
Eletricidade,
gás, vapor,
água quente
e fria e ar frio
e Captação,
tratamento e
distribuição
de água;
saneamento,
gestão de
resíduos e
despoluição
Construção
Comércio por
grosso e a
retalho;
reparação de
veículos
automóveis e
motociclos
Transportes
e
armazenage
m
Alojamento,
restauração
e similares
Atividades de
informação e
de
comunicação
Atividades
imobiliárias
Atividades de
consultoria,
científicas,
técnicas e
similares e
Atividades
administrativ
as e dos
serviços de
apoio
Educação
Atividades de
saúde
humana e
apoio social
Atividades
artísticas, de
espetáculos,
desportivas e
recreativas
Outras
atividades de
serviços
CRG 0,028 0,075 0,021 0,035 0,045 0,023 0,146 0,019 0,036 0,051 0,034 0,033 0,071 0,053 0,108 0,013
Total
15.
15
Localização de novas empresas em Portugal Continental em 2010
baixo e próximos de 0 concluindo-se que o padrão de localização permanece idêntico ao que
existia em 2004, havendo estabilidade do padrão de localização.
2.3.6 Análise shift-share
Com a análise shift-share decompomos os efeitos de variação discreta (entre 2004 e
2010) na estrutura regional-sectorial da variável nascimento de novas empresas
No que respeita à variação geral, ou seja à variação que ocorreria se cada NUT II tivesse
crescido à taxa de variação do conjunto das NUTS II e sectores de atividade (variação
homotética) observamos que a criação de novas empresas em Portugal Continental seria
menor que em 2004. Mas cada Nut II e cada sector têm as suas especificidades, sendo que a
criação de novas empresas está intimamente ligada a factores de dinamismo sectorial e de
competitividade, o que está representado pela variação estrutural e diferencial
respectivamente. Assim vemos que as causas desta diminuição de constituição de novas
empresas deve-se na Região de Lisboa a factores de competitividade e nas restantes regiões
a factores de dinamismo sectorial, pois é onde apresentam valores negativos.
2.4.Técnicas Multivariadas
Nas técnicas univariadas concentramo-nos na variável constituição de empresas por
NUTII, agora nas técnicas multivariadas o objectivo é caracterizar o conjunto de empresas
sediadas no Continente.
Análise Shift-Share clássica
Valor % Valor %
Norte -613,00 -1786,36 1173,36 -364,66 -31,08 1538,01 131,08
Centro -838,00 -1137,04 299,04 -714,57 -238,96 1013,61 338,96
Lisboa -3602,00 -1983,79 -1618,21 1737,03 -107,34 -3355,24 207,34
Alentejo -545,00 -399,09 -145,91 -509,68 349,32 363,78 -249,32
Algarve -18,00 -309,72 291,72 -148,12 -50,77 439,84 150,77
Variação diferencial
U.G.
Variação
efectiva
Variação
geral
Variação
líquida
Variação estrutural
Variáveis Unidade,de,Medida Natureza
Pessoas&ao&serviço&das&empresas nº&de&Pessoas Quantitativa
Volume&de&Négocio&das&empresas milhares&de&euros Quantitativa
VAB&das&empresas milhares&de&euros Quantitativa
Rendibilidade&das&Vendas % Quantitativa
Produtividade&aparente&do&trablho milhares&de&euros Quantitativa
Custos&com&pessoal milhares&de&euros Quantitativa
Número&de&empresas nº&de&empresas Quantitativa
Formação&bruta&de&capital milhares&de&euros Quantitativa
Produção&das&empresas milhares&de&euros Quantitativa
Resultado&Liquido&do&Exercicio milhares&de&euros Quantitativa
Taxa&de&sobrevivência&das&empresas&nascidas&2&anos&antes % Quantitativa
Peso&dos&custos&com&pessoal&no&VAB&das&empresas % Quantitativa
16.
16
Localização de novas empresas em Portugal Continental em 2010
Para o efeito, foram recolhidos dados das Nuts III relativos a 12 variáveis que
caracterizam as empresas localizadas em Portugal continental de diferentes pontos de vista.
As técnicas multivariadas usadas são importantes porque permitem a sintetização da
informação e identificam relações existentes entre as variáveis através de métodos factoriais
ou de redução de dados, agrupando unidades geográficas de acordo com as classes criadas
no âmbito da aplicação dos métodos de classificação hierárquica e não hierárquica.
2.4.1.Métodos Factoriais
O recurso a métodos factoriais torna-se indispensável dado estarmos a analisar 12
variáveis com uma observação por cada NUT III de Portugal continental, o que originaria
uma matriz muito grande com uma enorme quantidade de informação (28X12=336). Os
métodos factoriais irão permitir sintetizar a informação facilitando a sua leitura e
interpretação. Serão criadas novas variáveis (os factores ou componentes) que agregam
várias variáveis originais de acordo com as tendências, estruturas e características em
comum.
2.4.1.1.Análise em Componentes Principais (ACP)
O método factorial escolhido foi o da Análise em Componentes Principais (ACP) dado
ser o método que melhor se adequa às variáveis recolhidas uma vez que estas são todas de
natureza quantitativa.
Resultados
obtidos
através
do
SPSS
Statistics
após
a
importação
de
dados
do
Excel
Mean Std. Deviation Analysis N
Pessoal ao serviço (N.º) das Empresas 131892,571 226425,067 28
Volume de negócios (1000€) das
empresas
12331709,861 28705714,768 28
Valor acrescentado bruto (1000€) das
Empresas
3046755,355 7103260,618 28
Rendibilidade das vendas % 8,694 2,461 28
Produtividade aparente do trabalho € 3,783 0,434 28
Custos com o pessoal 1000€ 1760653,778 3913746,597 28
Nº de empresas 37863,964 52202,522 28
FBC 1000€ 637857,673 1460420,868 28
Produção (1000€) das Empresas 8437847,017 19535494,179 28
Resultado líquido do exercício 1000€ 685128,581 2213348,952 28
Taxa de sobrevivência (%) das
Empresas nascidas 2 anos antes
52,443 4,484 28
Peso dos custos com pessoal no valor
acrescentado bruto das Empresas
44,037 7,847 28
Descriptive Statistics
17.
17
Localização de novas empresas em Portugal Continental em 2010
No quadro de Communalities na coluna Exctraction obtemos a proporção de variância
explicada pelo conjunto de componentes principais retidas na análise. Os valores obtidos são
próximos de 1 por isso não haverá necessidade de retirar ou adicionar factores à análise.
As colunas Extraction e Rotation
Sums of squared Loadings do quadro acima
fornecem-nos a informação sobre a
percentagem da variância explicada pelas
componentes principais. Sendo a extração das
componentes principais feita por ordem
decrescente da variância explicada e através
da adopção do critério do valor próprio
superior a 1 é possível identificar o número de
Initial Extraction
Pessoal ao serviço (N.º) das Empresas 1,000 ,987
Volume de negócios (1000€) das
empresas
1,000 ,995
Valor acrescentado bruto (1000€) das
Empresas
1,000 ,994
Rendibilidade das vendas % 1,000 ,818
Produtividade aparente do trabalho € 1,000 ,612
Custos com o pessoal 1000€ 1,000 ,995
Nº de empresas 1,000 ,970
FBC 1000€ 1,000 ,982
Produção (1000€) das Empresas 1,000 ,995
Resultado líquido do exercício 1000€ 1,000 ,979
Taxa de sobrevivência (%) das
Empresas nascidas 2 anos antes
1,000 ,840
Peso dos custos com pessoal no valor
acrescentado bruto % das Empresas
1,000 ,811
Communalities
Extraction Method: Principal Component Analysis.
Total % of Variance Cumulative % Total
% of
Variance
Cumulati
ve % Total
% of
Variance
Cumulativ
e %
1 8,776 73,136 73,136 8,776 73,136 73,136 8,063 67,189 67,189
2 1,128 9,399 82,535 1,128 9,399 82,535 1,792 14,937 82,126
3 1,072 8,930 91,465 1,072 8,930 91,465 1,121 9,339 91,465
4 ,749 6,244 97,710
5 ,217 1,811 99,521
6 ,049 ,408 99,929
7 ,006 ,053 99,982
8 ,001 ,010 99,992
9 ,001 ,005 99,997
10 ,000 ,002 99,998
11 ,000 ,001 100,000
12 4,379E-05 ,000 100,000
Component Initial Eigenvalues
Extraction Sums of Squared
Loadings
Rotation Sums of Squared
Loadings
18.
18
Localização de novas empresas em Portugal Continental em 2010
componentes principais a partir do qual o contributo da retenção de mais uma componente é
negligenciável. Assim o número de componentes a reter é 3, explicando estas 91,465% da
variância total. O gráfico Scree Plot
confirma
a
escolha
atendendo
ao
critério
do
valor
próprio
superior
a
1.
A Rotated Component Matrix é uma matriz de correlações entre as variáveis originais e
as componentes principais retidas. Para conseguirmos interpretar o quadro anterior e as
componentes principais que foram originadas temos que identificar as correlações de maior
intensidade e o sentido dessas correlações.
O primeira componente principal (1) está positivamente correlacionado com maioria
das variáveis, com o pessoal ao serviço das empresas, volume de negócios, VAB, custos
com pessoal, número de empresas, formação bruta de capital, produção das empresas e
resultado líquido do exercício, pelo que será uma componente de Dimensão Económica.
A segunda componente principal (2) tem uma correlação positiva com a
rendibilidade das vendas e número de empresas e uma correlação negativa com a taxa de
sobrevivência das empresas nascidas 2 anos antes, poderá indiciar uma componente de
relação inversa entre rendibilidade das vendas e sobrevivência de empresas nascidas 2
anos antes.
A terceira componente principal correlaciona positivamente a produtividade aparente
do trabalho e o peso dos custo do pessoal no VAB o que sugere uma componente de
Produtividade do Trabalho.
1 2 3
Pessoal ao serviço (N.º) das Empresas ,963 ,235 ,070
Volume de negócios (1000€) das
empresas
,974 ,215 -,028
Valor acrescentado bruto (1000€) das
Empresas
,974 ,211 -,026
Rendibilidade das vendas % ,561 ,699 -,122
Produtividade aparente do trabalho € ,415 -,317 ,582
Custos com o pessoal 1000€ ,973 ,217 ,001
Nº de empresas ,916 ,336 ,131
FBC 1000€ ,968 ,210 -,041
Produção (1000€) das Empresas ,974 ,214 -,031
Resultado líquido do exercício 1000€ ,968 ,192 -,076
Taxa de sobrevivência (%) das Empresas
nascidas 2 anos antes
-,297 -,862 -,096
Peso dos custos com pessoal no valor
acrescentado bruto % das Empresas
-,238 ,170 ,852
Rotated Component Matrixa
Component
Extraction Method: Principal Component Analysis.
Rotation Method: Varimax with Kaiser Normalization.
a. Rotation converged in 7 iterations.
19.
19
Localização de novas empresas em Portugal Continental em 2010
O quadro Component Score Coeficient Matrix dá-nos os coeficientes que permitem
representar as componentes principais em combinação linear das variáveis originais que nos
fornece depois os valores da Component Score Covariance que nos diz que as componentes
são independentes pois apresentam correlações nulas entre si, resultado que será importante
para o método de classificação hierárquica e não hierárquica.
2.4.2.Método de Classificação Hierárquica e Não Hierárquica
2.4.2.1.Classificação Hierárquica
Os métodos de classificação Hierárquico e não Hierárquico permitem agrupar diferentes
unidades estatísticas em grupos o mais homogéneos possível internamente e o mais
heterogéneo possível entre si.
O que define estes dois métodos é o facto de o de classificação hierárquico definir uma
hierarquia de diferentes planos de classificação em que cada partição se agrupa
sucessivamente classes de partições anteriores em novas classes, sem definir à partida um
número determinado de classes a obter. Já no método de classificação não hierárquico o
número de classes é fixado previamente e ligação de cada unidade geográfica a cada classe é
determinada pelas interações sucessivas através de critérios de semelhança/dissemelhança
adaptadas ao que está a ser analisado neste caso às unidades estatísticas e à natureza dos
dados, concretamente para este estudo, dados quantitativos.
O estudo é feito novamente para as NUTS III e a análise de classificação tem como base
as variáveis extraídas no processo de Análise da Componentes Principais, as Component
Scores, evitando eventuais influencias nos resultados causados por diferentes unidades de
medida das variáveis, não existindo assim a necessidade de proceder à estandardização das
variáveis.
1 2 3
1 1,000 0,000 0,000
2 0,000 1,000 0,000
3 0,000 0,000 1,000
Component Score Covariance Matrix
Component
Extraction Method: Principal Component Analysis.
Rotation Method: Varimax with Kaiser Normalization.
Component Scores.
20.
20
Localização de novas empresas em Portugal Continental em 2010
A classificação hierárquica parte da correspondência inicial de uma só unidade
geográfica a uma classe. De forma sucessiva, o critério de separação entre classes vai sendo
relaxado e vão-se agrupando pares de classes mais semelhantes, até que todas as unidades
geográficas estejam afectas a uma só classe.
Tanto na Aglomeration Schedule como o Dendograma a partição deve ser feita no nível
hierárquico com maior distância relativamente ao nível hierárquico seguinte, dado que
pequenas distâncias apresentam ainda uma associação importante entre as unidades
geográficas. Assim conclui-se que a partição com maior diferença de agregação se encontra
na ordem 26 com 2 classes, de seguida na ordem 24 com 4 classes, e seguidamente na ordem
22 com 6 classes este resultado é comprovado pelo Dendograma.
2.4.2.2.Classificação Não Hierárquica – Método K-Means
O Método K-Means é um processo em que uma classificação inicial das unidades
estatísticas por grupos homogéneos sofre uma reclassificação/reafectação iterativa até à
altura em que uma reafectação adicional aumenta a heterogeneidade intra-classe e/ou a
homogeneidade entre classes que não é desejável. Esta reafectação é feita segundo o critério
da distância ao centro de classe, que se actualizará a cada iteração, em particular segundo o
critério das distâncias euclidianas simples.
Escolhendo o número de classes igual a 6 o indicado peça classificação hierárquica
temos:
Cluster 1 Cluster 2 Cluster 1 Cluster 2
1 12 13 ,029 0 0 6
2 17 24 ,036 0 0 4
3 8 15 ,065 0 0 9
4 17 25 ,069 2 0 7
5 19 27 ,071 0 0 11
6 7 12 ,092 0 1 11
7 17 26 ,130 4 0 12
8 16 18 ,151 0 0 15
9 8 20 ,176 3 0 15
10 1 6 ,198 0 0 17
11 7 19 ,240 6 5 17
12 9 17 ,255 0 7 19
13 2 11 ,287 0 0 21
14 3 5 ,304 0 0 18
15 8 16 ,317 9 8 20
16 10 23 ,547 0 0 19
17 1 7 ,609 10 11 20
18 3 14 ,652 14 0 21
19 9 10 ,763 12 16 22
20 1 8 1,388 17 15 22
21 2 3 1,543 13 18 23
22 1 9 1,661 20 19 23
23 1 2 4,180 22 21 24
24 1 4 6,420 23 0 25
25 1 22 12,106 24 0 26
26 1 28 17,170 25 0 27
27 1 21 27,714 26 0 0
Agglomeration Schedule
Stage
Cluster Combined
Coefficients
Stage Cluster First Appears
Next Stage
21.
21
Localização de novas empresas em Portugal Continental em 2010
A tabela Anova apenas nos fornece as variáveis
que mais contribuem para os resultados da classificação,
neste caso e por ordem decrescente de importância temos
a Dimensão das Empresas, depois a produtividade do
trabalho e fim a concorrência a relação inversa entre
rendibilidade das vendas e sobrevivência de empresas
nascidas 2 anos antes.
Clusters Finais:
-‐ O Cluster 1 é composto pelas NUTS III Douro, Trás os Montes, Baixo Vouga, Baixo
Mondego, Pinhal Interior, Dão-Lafões, Serra da Estrela, Beira Interior Norte; Beira
Interior Sul; Cova da Beira, Oeste, Médio Tejo, Alentejo Litoral, Alto Alentejo,
Alentejo Central, Baixo Alentejo e Lezíria do Tejo. Estas são unidades com fraca
dimensão económica e fraca produtividade do trabalho são zonas do interior onde
houve muita deslocalização de industria e de pessoas.
Unidade Geográfica Cluster Distance
1 Minho-Lima 5 ,679
2 Cávado 5 ,574
3 Ave 5 ,669
4 Grande Porto 4 0,000
5 Tâmega 5 ,333
6 Entre Douro e Vouga 5 ,458
7 Douro 1 ,627
8 Alto Trás-os-Montes 1 ,804
9 Baixo Vouga 1 ,730
10 Baixo Mondego 1 1,162
11 Pinhal Litoral 5 ,876
12 Pinhal Interior Norte 1 ,396
13 Dão-Lafões 1 ,433
14 Pinhal Interior Sul 5 ,896
15 Serra da Estrela 1 ,839
16 Beira Interior Norte 1 ,544
17 Beira Interior Sul 1 ,611
18 Cova da Beira 1 ,275
19 Oeste 1 ,888
20 Médio Tejo 1 ,959
21 Grande Lisboa 6 0,000
22 Península de Setúbal 2 0,000
23 Alentejo Litoral 1 ,716
24 Alto Alentejo 1 ,448
25 Alentejo Central 1 ,312
26 Baixo Alentejo 1 ,635
27 Lezíria do Tejo 1 ,683
28 Algarve 3 0,000
Cluster Membership
Case Number
Mean Square df Mean Square df
REGR factor
score 1 for
analysis 3
5,239 5 ,037 22 143,025 ,000
REGR factor
score 2 for
analysis 3
4,302 5 ,249 22 17,249 ,000
REGR factor
score 3 for
analysis 3
4,411 5 ,225 22 19,634 ,000
Error
F Sig.
The F tests should be used only for descriptive purposes because the clusters have been chosen to maximize the differences
among cases in different clusters.The observed significance levels are not corrected for this and thus cannot be interpreted as tes
ANOVA
Cluster
1 2 3 4 5 6
REGR factor
score 1 for
analysis 3
-,32549 -,42479 -,53778 1,04122 ,09750 4,77209
REGR factor
score 2 for
analysis 3
,04209 2,99534 1,93017 ,95467 -1,03300 ,63533
REGR factor
score 3 for
analysis 3
-,49635 -,73590 3,27066 1,38690 ,76079 -,80929
Final Cluster Centers
Cluster
1 2 3 4 5 6
1 2,965 4,219 2,499 1,707 5,142
2 2,965 4,147 3,289 4,329 5,708
3 4,219 4,147 2,644 3,935 6,820
4 2,499 3,289 2,644 2,288 4,341
5 1,707 4,329 3,935 2,288 5,206
6 5,142 5,708 6,820 4,341 5,206
Distances between Final Cluster Centers
Cluster
22.
22
Localização de novas empresas em Portugal Continental em 2010
-‐ O Cluster 2 é apenas a Peninsula de Setubal com pequena dimensão económica e
com fraca produtividade do trabalho, contudo tem um bom indicador de relação
inversa entre Rendibilidade das Vendas e Solvabilidade de empresas nascidas 2 anos
antes o que indicará que que há uma grande rendibilidade de vendas, mas poucas
sobrevivências, isto poderá acontecer pela localização da autoeuropa uma das
maiores empresas em Portugal continental e pela alta taxa de desemprego da região,
o que a torna um mercado fraco em termos finais e assim poderá indicar que há
muitas empresas que não se aguentam no mesmo.
-‐ O Cluster 3 é a Região do Algarve, é uma NUT com pequena dimensão económica,
mas boa produtivida do trabalho e rácio de rendibilidade das vendas inverso à
sobrevivência de empresas nasciadas 2 anos antes, isto poderá acontecer por ser uma
região de elevado trabalho sazonal, pois tem meses muito bons (meses da época alta)
e outros maus (época baixa) indiciando criação de empresas só para a altura boa do
ano.
-‐ O Cluster 4 é o Grande Porto tem uma boa dimensão económica e boa produtividade
do trabalho é a segunda região mais forte economicamente e o segundo centro de
decisões de Portugal.
-‐ O Cluster 5 é o conjunto das NUT III Minho-Lima, Cávado, Ave, Tâmega, Entre o
Douro e Vouga, Pinhal são regiões com alguma dimensão económica e com boa
produtividade do trabalho, são zonas com alguma industria o se que reflete nos
resultados.
-‐ O Cluster 6 é Lisboa é a região com maior dimensão económica, para comprovar os
resultados basta dizer que é a Capital e o centro de todas as decisões nacionais.
Quanto às distancias entre os Clusters, observa-se que a classe 6 é a mais afastada em
relação a todas as outras classes. O maior afastamento é entre a classe 6 e 3 ou seja a NUT
III Lisboa e a do Algarve e as classes mais próximas são a 1 e 5.
3. ANÁLISE ECONOMÉTRICA
3.1.Escolha das Variáveis
O objectivo do estudo é compreender de que forma os factores escolhidos influenciam a
constituição de novas empresas, em que medida e qual o sentido dessa influência.
Efetuou-se um estudo cross-section, ou seja num determinado momento (o ano de 2010,
onde foram recolhidos dados do número de sociedades constituídas por NUTS III, sendo
esta a variável dependente.
23.
23
Localização de novas empresas em Portugal Continental em 2010
O nosso objectivo agora é ver quais são os factores estão ligados ao nascimento de
novas sociedades, positiva e negativamente e quais os que têm maior ou menor peso.
Assim foram recolhidos dados estatísticos referentes à potencial comercialização de
bens e serviços intermédios e finais, à concorrência e ao funcionamento de mercado. O
objectivo é com estas variáveis dependentes explicar a localização de novas empresas nas
NUTs III.
Desta forma foram recolhidos os seguintes dados:
-‐ População Residente que representa o potencial de comércio final.
-‐ Número de empresas existente que representa a oportunidade de relações comerciais
intermédias.
-‐ Mortes de empresas que representa a oportunidade de entrada no mercado em
substituição de outras empresas.
-‐ Volume de negócio das empresas que representa o comércio intermédio de matérias
primas e bens intermédio e acabados entre empresas e o potencial empresarial da
região.
-‐ Densidade Populacional que representa a concentração de pessoas, ou seja um
potencial maior número de cliente concentrados no local.
Daqui serão formuladas hipóteses de evidencia empírica para vermos se estes factores
influenciam como teoricamente se prevê positiva ou negativamente e com que intensidade a
criação de novas empresas em Portugal continental.
A hipótese que se formula é a seguinte:
Hipótese H1: A População Residente é importante na escolha da localização quando se
pretende criar uma empresa, porque os empreendedores valorizam regiões com uma
população numerosa, o que lhes proporcionará teoricamente uma mercado final superior.
Hipótese H2:
O número de empresas existentes representa o mercado empresarial existente na região,
quanto maior for esse número maior será a rede empresarial e o potencial de relações
comerciais, a nova empresa terá mais oportunidade de negócio e maior facilidade em
adquirir know how e inovar. Este factor também tem uma relação positiva com o nascimento
de novas sociedades.
Hipótese H3: O número de mortes de empresas é uma oportunidade de entrar no
mercado substituindo existentes, é a oportunidade de captar clientes finais, trabalhadores e
know how de outras empresas. Há teoricamente uma relação positiva com a criação de
novas empresas.
24.
24
Localização de novas empresas em Portugal Continental em 2010
Hipótese H4: Volume Acrescentado das empresas , representa a dimensão do mercado
de intermédio e a a potencial criação de valor que existe na região , quanto maior for, maior
é o potencial de trocas comercias de matérias primas e intermédias e produtos finais e
serviços, logo a relação existente será teoricamente positiva, pois poderá gerar
oportunidades de negócios.
Hipótese H5: A Densidade Populacional a concentração de pessoas numa região,
potencializa o número de clientes situados numa determinada região. A relação deste factor
com a criação de empresas será positivo.
3.2. O modelo econométrico
Foi construída uma regressão linear
NEmp = b1 + b2 PopR + b3 Emp +b4 MEmp+ b5 VABEmp + b6 DenPop + e
- NEmp é a variável dependente e representa o nascimento de novas empresas numa região.
- Os coeficientes da regressão são b1; b2; b3; b4; b5; b6
- As variáveis independentes são:
PopR– População Residente
Emp – Empresas existentes
MEmp – Morte de empresas
VBA – Volume Acrescentado das empresas
DenP –Densidade Populacional
-‐ e representa os resíduos da regressão
Mais uma vez todos os dados foram retirados do INE na sua página da Internet
(www.ine.pt).
25.
25
Localização de novas empresas em Portugal Continental em 2010
3.3.Análise dos Resultados Econométricos
Modelo de Regressão Linear
Dado da função de regressão da criação de empresas não ser empiricamente observável,
pois os seu coeficientes são desconhecidos, foi necessário proceder á estimação desses
coeficientes. Utilizou-se o método enter e obtiveram-se os valores apresentados no quadro
seguinte:
Assim a equação de regressão do modelo linear é:
NEmp = -44,49182 +0,00185PopR+ 0,03536Emp+ 0,3345MEmp+ 0,01943VABE+
0,67584DenPop + e
Através destes resultados vemos que todos os factores tiveram a relação esperada, ou seja
positiva.
Qualidade do Ajustamento
Um critério da qualidade do ajustamento é a pertinência dos resultados obtidos, como
visto acima os dados estão de acordo com o esperado.
Assim se a população residente aumentar 1000 pessoas são criadas 1,85 empresas, se o
número de empresas da região aumentar 1000 serão criadas mais 35 novas empresas, se o
Valor acrescentado for mais 1.000.000 de Euros o nascerão 0,019 empresas, se fecharem
1000 empresas serão criadas 335 e por fim se viverem mais 10.000 pessoas por km2
6,8 de
novas empresas nascerão.
Outro critério é a análise a alguns indicadores como:
26.
26
Localização de novas empresas em Portugal Continental em 2010
A análise de bondade esta é vista através da proporção de variância explicada pela
regressão, no caso concreto o coeficiente de determinação é R2=
0,999, resultado óptimo.
A análise de significância que é caracterizada pelo contributo que as variáveis
explicativas têm no comportamento da variável dependente, pode ser individual (t student)
ou conjunta (FSnedecor), contudo os dois testes são complementares, assim os valores da
Tstudent e FSnedecor têm que ser inferiores a 5% para serem significantes. A significância
do teste pode ser comprovada pela tabela que fornece os coeficientes e na tabela Anova
analisando os valores da coluna p-nível (Sig. (λ)).
Modelos espaciais autoregressivos
Modelo OLS e Teste I de Moran
Nesta parte será analisado a presença de um factor de dependência espacial, realizando
testes de autocorrelação espacial, que é a correlação de uma variável numa certa área com
valores dessa mesma variável em áreas vizinhas. O teste baseado na estatística do I de
Moran analisa a presença de um factor de dependência espacial. Este teste baseia-se nos
resíduos da estimação OLS do modelo básico de regressão linear espacial, ele mede a
relação do desvio padronizado de uma variável numa área com o desvio padronizado das
áreas vizinhas para a mesma variável.
Assim o I de Moran é dado pela expressão seguinte e varia de -1 a 1.
27.
27
Localização de novas empresas em Portugal Continental em 2010
Depois de encontrado o valor de índice é necessário ver se o valor é significativo ou não
para isso pode utilizar-se o pseudo-significância dados que podemos ver no próximo quadro.
Ordinary Least-squares Estimates
Dependent Variable = NascE
R-squared = 0.9938
Rbar-squared = 0.9924
sigma^2 = 1330683587.5737
Durbin-Watson = 1.9771
Nobs, Nvars = 28, 6
***************************************************************
Variable Coefficient t-statistic t-probability
Const 25473.763939 1.625272 0.118346
POPR -6.976941 -1.917781 0.068212
Emp -104.647847 -5.070879 0.000044
MEmp -11.694059 -2.906626 0.008180
VABEmp -158.530835 -2.042007 0.053320
DenPop 309.923214 5.428388 0.000019
Moran I-test for spatial correlation in residuals
Moran I -0.01116183
Moran I-statistic 0.67689785
Marginal Probability 0.49847077
mean -0.07540182
standard deviation 0.09490352
28.
28
Localização de novas empresas em Portugal Continental em 2010
Através da análise dos dados vemos que poderia existir uma correlação espacial inversa
dado o valor de I ser negativo (-0,011), embora muito próximo de zero pelo que a correlação
negativa seria pequena, contudo não é possível tirar nenhuma conclusão porque o nível de
significância é muito elevado 9,5%.
Recorrendo agora ao Modelo SAR
O Modelo SAR (Mixed autogressive-regressive model) obtém-se a partir do modelo
geral impondo a restrição de λ=0.
Spatial autoregressive Model Estimates
Dependent Variable = NascE
R-squared = 0.9939
Rbar-squared = 0.9925
sigma^2 = 1032661224.0535
Nobs, Nvars = 28, 6
log-likelihood = -320.60317
***************************************************************
Variable Coefficient Asymptot t-stat z-probability
Const 28496.358515 1.927351 0.053936
POPR -6.692647 -2.068493 0.038594
Emp -107.111012 -5.755887 0.000000
MEmp -13.130607 -3.061332 0.002204
VABEmp -177.738763 -2.351863 0.018680
DenPop 314.475585 6.182080 0.000000
rho -0.021968 -0.596834 0.550618
LM error tests for spatial correlation in SAR model residuals
29.
29
Localização de novas empresas em Portugal Continental em 2010
LM value 0.03328480
Marginal Probability 0.85523648
chi(1) .01 value 6.63500000
Analisando os dados vemos que apesar de ter uma variância explicada ótima (0,99) o
factor de dependência espacial não é relevante pois rho apresenta um valor estatisticamente
não significativo (>5%, neste caso 5,5%), não é assim possível retirar conclusões quanto à
dependência espacial.
No que respeita à autocorrelação espacial, no modelo SAR realizada através do Teste
LM, os valores observados de 0,033 para o rácio LM, de 6,645 para o Quiquadrado e de
85% (>5%) revelam ausência de correlação espacial neste ajustamento pelo que não se
justifica a passagem ao modelo SAC.
Análise do Modelo SEM
Spatial error Model Estimates
Dependent Variable = NascE
R-squared = 0.9938
Rbar-squared = 0.9924
sigma^2 = 1044606914.0418
log-likelihood = -320.76823
Nobs, Nvars = 28, 6
***************************************************************
Variable Coefficient Asymptot t-stat z-probability
Const 25074.704492 1.842484 0.065404
POPR -6.885790 -2.154984 0.031163
Emp -104.979160 -5.813795 0.000000
MEmp -11.678871 -3.245884 0.001171
VABEmp -158.489444 -2.309474 0.020917
30.
30
Localização de novas empresas em Portugal Continental em 2010
DenPop 309.744506 6.186778 0.000000
lambda -0.044961 -0.149807 0.880917
Mais uma vez o valor da variância é ótimo (0,99), contudo o valor de λ é 88% (>5%)
tornando o factor de dependência espacial sem significado.
Assim podemos concluir que a introdução da dependência espacial não revelou a
existência de estruturas de correlação espacial, ou seja a probabilidade de construir uma
empresa em determinada NUT III não parece ser influenciada pela criação de empresas em
NUTS III vizinhas.
4. Possibilidade de Investigações Futuras
Os resultados econométricos mostram através da regressão linear que há vários factores
que influenciam o criação de empresas, mas seria interessante realizar um estudo que com
mais variáveis tais como os impostos pagos pelas empresas, custos com pessoal, produção
ou nível de estudos dos trabalhadores. E realiza-lo também por sectores de actividade.
Poderia ainda investigar-se as razões para a aparente inexistência de dependência espacial.
5. Bibliografia
Prof.
Flávio
Henrique
M
de
A
Freire,
Introdução
à
Estatística
Espacial,
http://www.observatoriodasmetropoles.ufrj.br
em
6/02/2013
<www.ine.pt>
em
05/02/2013