SlideShare una empresa de Scribd logo
1 de 81
Descargar para leer sin conexión
FACULDADE DE CIÊNCIAS
Departamento de Matemática e Informática
Trabalho de Licenciatura em Estatística
Aplicação do Modelo de Regressão de Poisson e
Sistemas de Informação Geográca (SIG) na Análise
e Georreferenciação da Ocorrência de Óbitos nos
Acidentes Rodoviários na Cidade de Maputo
no período de 2018 à 2020
Autor: Estevão Sérgio Zeco
Maputo, Dezembro de 2021
FACULDADE DE CIÊNCIAS
Departamento de Matemática e Informática
Trabalho de Licenciatura em Estatística
Aplicação do Modelo de Regressão de Poisson e
Sistemas de Informação Geográca (SIG) na Análise
e Georreferenciação da Ocorrência de Óbitos nos
Acidentes Rodoviários na Cidade de Maputo
no período de 2018 à 2020
Autor: Estevão Sérgio Zeco
Supervisor: Miranda Albino Martins Muaualo, PhD, UFRJ
Maputo, Dezembro de 2021
.
DECLARAÇÃO DE HONRA
Declaro por minha honra que o presente Trabalho de Licenciatura é resultado da minha
investigação e que o processo foi concebido para ser submetido apenas para a obtenção do
grau de Licenciatura em Estatística, na Faculdade de Ciências da Universidade Eduardo
Mondlane.
Maputo, Dezembro de 2021

(Estevão Sérgio Zeco)
i
.
Dedicatória
Dedico este trabalho para toda a minha família, em especial aos meus progenitores, Sérgio
Fernando Zeco e Arlinda Dalilo Comé, pelo apoio nanceiro, emocional e pelos ensinamentos
construtivos. Por terem conado em mim e apostado nos meus sonhos.
i
AGRADECIMENTOS
Primeiro agradecer à Deus pela vida, protecção e pela chuva de bênçãos que tem me pro-
porcionado, e por mais uma conquista alcançada por mim, mas pela graça do Senhor.
Aos meus pais, Sérgio Fernando Zeco e Arlinda Dalilo Comé, pelo amor incondicional, pelo
apoio, inspiração, conança, conselhos, força, ensinamentos construtivos, que levarei para
toda à vida e muito mais. Palavras me faltam para descrever a minha gratidão, pois se hoje
cheguei aqui, é graças a eles, então uma parte desse sucesso também é deles.
Aos meus irmãos, Ernesto Zeco, Ragildo Zeco, Rasmina Zeco e Sidónia Zeco, pelo apoio
incondicional e por terem acreditado e conado em mim. A toda a minha família.
Agradecer ao meu supervisor, Prof. Doutor Miranda Muaualo, pela paciência, disponibili-
dade e contributos dados no acto da elaboração deste trabalho e também pelos ensinamentos
transmitidos como meu professor ao longo do curso. Que para além de ter sido o meu su-
pervisor e meu professor, é uma das minhas fontes de inspiração, pois tem me dado muitos
conselhos construtivos, que pretendo levar para a vida toda e transmitir para os outros.
Aos professores da Secção de Estatística do DMI-UEM, por todo o saber ensinado, com
muito comprometimento e dedicação, em especial ao Prof. Doutor Alberto Mulenga, pelas
suas úteis recomendações práticas e teóricas, desde a escolha do tema até ao desenvolvimento
do trabalho, e pelos demais conhecimentos transmitidos, dentro e fora da academia.
Ao Dr. Jonas Nassabe e ao Prof. Doutor Rachid Muleia, pelos ensinamentos transmitidos
durante a formação e a todos os funcionários do DMI-UEM.
Ao Dr João Calenga, pelos vários conhecimentos transmitidos academicamente e prossio-
nalmente, desde o apoio durante a realização do curso e até o m do curso. Pelos conselhos,
apoio, conança e por ser uma das minhas fontes de inspiração, como pessoa e como um
bom prossional.
Ao Departamento de Trânsito, do Comando da PRM da Cidade de Maputo, por terem
me recebido para fazer a recolha de dados, em especial aos agentes Anibal Cumbe, Délcio
Guambe e Filomena Caferina, pelas instruções, disponibilidade e paciência.
A todos os meus colegas e amigos, Amélia Chichava, Alfredo Manhiça, Carmalino Ncuaze,
Charnice Mathe, David Mondlane, Esperança Zefanias, Januário Manhiça, José Luís, José
Tivane, Lindre Duarte, Nelson Basílio, Neima Candeia, Nelson Chone, Nunes Lisboa, Omar
Sucuma, em especial a Winna Mabunda, pelo companheirismo, ensinamento, amizade e por
lhe considerar como uma irmã para mim.
Aos meus vizinhos, Iazalde Lisboa e a sua esposa Belinda Lisboa, pelos conselhos, apoio e en-
ii
sinamentos. A todos aqueles que não foram mencionados, mas que directa ou indirectamente
contribuíram para a realização deste trabalho.
Muito obrigado a todos!
Na angústia, invoquei ao Senhor e clamei ao meu Deus;
desde o seu templo ouviu a minha voz e aos seus ouvidos
chegou o meu clamor perante a sua face
(Salmos 18:6)
Porque te não inclinarás diante de outro deus; pois
o nome do Senhor é Zeloso; Deus zeloso é ele
(Êxodo 34:14)
iii
Resumo
Os acidentes rodoviários são considerados um grande problema de saúde pública a nível
mundial, apesar do número exacto de acidentes e vítimas nunca vir a ser conhecido em
rigor. Este estudo tem como objectivo analisar e georreferenciar a ocorrência de óbitos nos
acidentes rodoviários na cidade de Maputo. Foram usados dados de acidentes rodoviários
da cidade de Maputo, no período de 2018 à 2020, fornecidos pelo Comando da PRM da
cidade de Maputo, Departamento de Trânsito. A análise foi feita mediante a aplicação
da Regressão de Poisson, desde a estimação dos parâmetros até a previsão (dentro e fora
da amostra) do número de óbitos, e a georreferenciação foi feita através da aplicação dos
Sistemas de Informação Geográca (SIG). Constatou-se que o número esperado de óbitos de
2018 à 2020 foi de 0.56 (1), com mínimo e moda 0 (zero), e máximo de cinco (5) óbitos por
acidente. A georreferenciação, mostrou que o distrito de Kamavota é que registou mais óbitos
(144), com média 0.50 (1). A previsão e georreferenciação feita dentro da amostra, resultou
em 21 óbitos, dos quais treze (13) no distrito de Kamubukwana e oito (8) no distrito de
Kalhamankulo, e fora da amostra 20 óbitos, dos quais dez (10) no distrito de Kamubukwana
e dez (10) no distrito de Kalhamankulo. O estudo mostra que há uma necessidade de criação
de campanhas educativas com o foco no comportamento dos condutores.
Palavras-chave: Regressão de Poisson; Georreferenciação; Acidentes Rodoviários; Óbitos.
iv
Abstract
Road accidents are considered a major public health problem worldwide, although the exact
number of accidents and victims will never be fully known. The study aims to analyze and
georeference the occurrence of deaths in road accidents in the city of Maputo. Data from
road accidents in the city of Maputo, in the period 2018 to 2020, provided by the Command
of the PRM of the city of Maputo, Department of Transit, were used. The analysis was
performed by applying the Poisson Regression, from the estimation of the parameters to the
prediction (inside and outside the sample) of the number of deaths, and the georeferencing
was done through the application of Geographic Information Systems (GIS). It was found
that the expected number of deaths from 2018 to 2020 was 0.56 (1), with a minimum and
mode of 0, and a maximum of ve (5) deaths by accident. The georeferencing showed
that the district of Kamavota registered more deaths (144), with an average of 0.50 (1).
The prediction and georeferencing made within the sample resulted in 21 deaths, of which
thirteen (13) in the district of Kamubukwana and eight (8) in the district of Kalhamankulo,
and out of the sample 20 deaths, of which ten (10) in the district of Kamubukwana and ten
(10) in Kalhamankulo district. The study shows that there is a need to create educational
campaigns focusing on drivers' behavior.
Keywords: Poisson Regression; Georeferencing; Road Accidents; Deaths.
v
Lista de Abreviaturas
AIC Akaike's Information Criterion
CIP Centro de Integridade Pública de Moçambique
Gl Graus de liberdade
EAM Erro Absoluto Médio
EAMP Erro Absoluto Médio Percentual
INAV Instituto Nacional de Viação
INE Instituto Nacional de Estatística
ITF Internacional Transport Forum
MLG Modelos Lineares Generalizados
OMS Organização Mundial da Saúde
PRM Polícia da República de Moçambique
QME Quadrado Médio do Erro
SIG Sistemas de Informação Geográca
WHO World Health Organization
vi
Índice
1 INTRODUÇÃO 1
1.1 Contextualização . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Problema de Pesquisa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.3 Objectivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.3.1 Objectivo Geral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.3.2 Objectivos Especícos . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.4 Relevância do Estudo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.5 Estrutura do Trabalho . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
2 REVISÃO DE LITERATURA 6
2.1 Acidentes Rodoviários . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2.1.1 Conceitos básicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2.1.2 Acidentes Rodoviários no Mundo . . . . . . . . . . . . . . . . . . . . 7
2.1.3 Acidentes Rodoviários em Moçambique . . . . . . . . . . . . . . . . . 9
2.1.4 Acidentes Rodoviários na Cidade de Maputo . . . . . . . . . . . . . . 12
2.2 Modelos Lineares Generalizados . . . . . . . . . . . . . . . . . . . . . . . . . 13
2.3 Regressão de Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2.3.1 Teste de Ajustamento a Distribuição de Poisson . . . . . . . . . . . . 16
2.3.2 Estimação dos Parâmetros do Modelo de Regressão de Poisson . . . . 16
2.3.3 Selecção de Modelos . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.3.4 Diagnóstico do Modelo de Regressão Poisson . . . . . . . . . . . . . . 18
2.4 Análise de Resíduos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.4.1 Resíduo de Pearson . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.4.2 Resíduo de Deviance . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.4.3 Resíduos Padronizados . . . . . . . . . . . . . . . . . . . . . . . . . . 21
vii
2.4.4 Analise Gráca dos Resíduos . . . . . . . . . . . . . . . . . . . . . . . 22
2.5 Simulação Monte Carlo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.5.1 Tipos de Geradores de Números Aleatórios . . . . . . . . . . . . . . . 23
2.6 Medidas de Erro de Previsão . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
2.6.1 Soma dos Quadrados dos Erros . . . . . . . . . . . . . . . . . . . . . 24
2.6.2 Quadrado Médio do Erro . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.6.3 Erro Absoluto Médio . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.6.4 Erro Absoluto Médio Percentual . . . . . . . . . . . . . . . . . . . . . 24
2.6.5 Erro Médio Percentual . . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.6.6 Viés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.7 Sistemas de Informação Geográca . . . . . . . . . . . . . . . . . . . . . . . 25
2.7.1 Georreferenciação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
2.8 Estudos Similares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
3 MATERIAL E MÉTODOS 28
3.1 Classicação da Pesquisa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
3.1.1 Quanto à abordagem . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
3.1.2 Quanto aos objectivos . . . . . . . . . . . . . . . . . . . . . . . . . . 28
3.1.3 Quanto aos procedimentos . . . . . . . . . . . . . . . . . . . . . . . . 28
3.2 Material . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
3.2.1 Fonte de dados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
3.2.2 Pacotes utilizados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
3.3 Métodos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
3.3.1 Estatística Descritiva . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
3.3.2 Sistemas de Informação Geográca . . . . . . . . . . . . . . . . . . . 30
3.3.3 Regressão de Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
4 RESULTADOS E DISCUSSÃO 33
4.1 Análise Descritiva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
4.1.1 Distribuição do Número de Óbitos por Ano . . . . . . . . . . . . . . 33
4.1.2 Distribuição do Número de Óbitos por Sexo e Idade do Condutor . . 34
4.1.3 Distribuição do Número de Óbitos por Tipo de Veículo . . . . . . . . 35
4.1.4 Distribuição do Número de Óbitos por Dia da Semana e Hora de Ocor-
rência . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
viii
4.1.5 Distribuição do Número de Óbitos por Tipo e Causa do Acidente . . 36
4.2 Georreferenciação dos Acidentes Rodoviários na Cidade de Maputo . . . . . 37
4.3 Modelo de Regressão de Poisson . . . . . . . . . . . . . . . . . . . . . . . . . 39
4.3.1 Teste de Ajustamento a Distribuição de Poisson . . . . . . . . . . . . 39
4.3.2 Estimação dos Parâmetros do Modelo . . . . . . . . . . . . . . . . . . 39
4.3.3 Selecção do Modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
4.3.4 Diagnósticos do Modelo . . . . . . . . . . . . . . . . . . . . . . . . . 42
4.3.5 Análise de Resíduos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
4.3.6 Interpretação dos Parâmetros Estimados . . . . . . . . . . . . . . . . 48
4.3.7 Previsão e Georreferenciação . . . . . . . . . . . . . . . . . . . . . . . 51
4.4 Discussão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
5 CONCLUSÕES e RECOMENDAÇÕES 55
5.1 Conclusões . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
5.2 Recomendações . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
REFERÊNCIAS BIBLIOGRÁFICAS 57
ANEXOS 61
ix
Lista de Figuras
2.1 Variação da distribuição do número de óbitos por tipo de utente rodoviário
com a região do Mundo - 2010. . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.2 Taxas de mortalidade nos países lusófonos e outros países em 2010: (a) por
habitante e (b) por veículo registado. . . . . . . . . . . . . . . . . . . . . . . 8
2.3 Evolução do número de acidentes rodoviários em Moçambique de 2010 à 2017. 10
2.4 Distribuição do número de óbitos nos acidentes rodoviários em Moçambique
de 2010 à 2017. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.5 Evolução do número de acidentes rodoviários na Cidade Maputo de 2010 à
2017. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
4.1 Distribuição do número de óbitos por ano. . . . . . . . . . . . . . . . . . . . 34
4.2 Distribuição do número de óbitos por Sexo (A) e Idade (B) do Condutor. . . 34
4.3 Distribuição do número de óbitos por Tipo de Veículo. . . . . . . . . . . . . 35
4.4 Distribuição do número de óbitos por Dia da Semana (A) e Hora de ocorrência
(B). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
4.5 Distribuição do Número de Óbitos por Distritos Urbanos. . . . . . . . . . . . 38
4.6 Distribuição do Número Esperado de Óbitos por Distritos Urbanos. . . . . . 38
4.7 Distribuição do número de óbitos. . . . . . . . . . . . . . . . . . . . . . . . . 39
4.8 Valores observados e modelo ajustado de Poisson. . . . . . . . . . . . . . . . 45
4.9 Grácos semi-normais para detectar outliers usando resíduos de Pearson (A)
e Deviance (B). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
4.10 Grácos semi-normais para detectar outliers usando resíduos padronizados de
Pearson (A) e Deviance (B). . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
4.11 Distâncias de Cook para as estimativas dos coecientes. . . . . . . . . . . . . 47
4.12 Georreferenciação do número de óbitos previsto dentro e fora da amostra. . . 52
5.1 Envelopes simulados para os resíduos de Pearson (A) e Deviance (B). . . . . 61
x
5.2 Envelopes simulados para os resíduos Padronizados Pearson (A) e Deviance
(B). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
5.3 Distâncias de Cook para as estimativas dos coecientes das variáveis Distrito
e Dias da Semana. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
5.4 Distâncias de Cook para as estimativas dos coecientes das variáveis Horas e
Causa do Acidente. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
5.5 Distâncias de Cook para as estimativas dos coecientes das variáveis Tipo de
Acidente e Idade do Condutor. . . . . . . . . . . . . . . . . . . . . . . . . . . 62
xi
Lista de Tabelas
2.1 Funções de ligação canônica de algumas distribuições da família exponencial. 14
3.1 Descrição e classicação das variáveis do estudo. . . . . . . . . . . . . . . . . 29
4.1 Estatísticas descritivas do número de óbitos. . . . . . . . . . . . . . . . . . . 33
4.2 Distribuição do número de óbitos por Tipo e Causa do Acidente. . . . . . . . 37
4.3 Teste de Qui-Quadrado para Ajustamento a Distribuição de Poisson. . . . . 39
4.4 Estimação dos parâmetros do modelo pelo método de máxima verossimilhança. 40
4.5 Selecção de modelos pelo método stepwise backward. . . . . . . . . . . . . . 41
4.6 Teste de Razão de Verossimilhança para signicância global. . . . . . . . . . 42
4.7 Teste de Wald para a signicância individual dos parâmetros. . . . . . . . . 43
4.8 Teste de Dispersão. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
4.9 Medidas de erro da previsão dentro da amostra. . . . . . . . . . . . . . . . . 51
5.1 Valores selecionadas dentro da amostra pela Simulação Monte Carlo. . . . . 63
5.2 Valores gerados fora da amostra pela Simulação Conte Carlo. . . . . . . . . . 64
5.3 Previsão do número de óbitos dentro e fora da amostra. . . . . . . . . . . . . 65
xii
Capítulo 1
INTRODUÇÃO
1.1 Contextualização
Os acidentes rodoviários constituem um fenómeno amplo e complexo, e encontram a sua
maior manifestação no espaço urbano. Apesar das medidas e políticas em matéria de Segu-
rança Rodoviária, os acidentes continuam a representar um grave problema da actualidade
quer na perspectiva económica, devido aos avultados custos e recursos envolvidos, quer na
perspectiva social tendo em conta o número de vidas perdidas a cada ano, pois são custos
inaceitáveis em qualquer sociedade moderna.
Nas cidades dos países em vias de desenvolvimento, como no caso de Moçambique, o cres-
cimento acelerado do número de veículos automóveis em circulação nas estradas, sem no
entanto, se fazer acompanhar pela devida expansão da rede rodoviária ou pelo melhora-
mento das vias existentes, têm resultado em congestionamento das rodovias que muitas
vezes culminam em acidentes rodoviários (Bonzo, 2004).
De acordo com WHO (2009), o elevado número de acidentes rodoviários observados em
Moçambique e no mundo revela a necessidade da realização de estudos técnico-cientícos
visando a redução, sobretudo, do número de vidas perdidas nessas ocorrências.
A ocorrência de acidentes rodoviários é de natureza multifactorial, sendo encontrada na
literatura referência aos factores ligados às condições ambientais das vias, às condições me-
cânicas dos veículos e aos factores humanos (WHO, 2015; Alavi et al., 2017). Embora seja
importante considerar o componente aleatório dos sinistros viários, a maior parte dos aci-
1
CAPÍTULO 1. INTRODUÇÃO 2
dentes de trânsito que ocorrem em todo o mundo é previsível e prevenível (WHO, 2015).
Há, em todo o mundo, uma necessidade de se melhorar a segurança rodoviária com o objec-
tivo de reduzir o número de mortes nas estradas. Muitos acidentes são causados por factores
que são conhecidos e podem ser evitados. Estes incluem o excesso de velocidade ou sob a
inuência de álcool, corte de prioridade, a má travessia dos peões, entre outros. Em muitos
países desenvolvidos o número de mortes em acidentes rodoviários tende a diminuir, devido
à aplicação de medidas adequadas para melhorar a segurança rodoviária.
De acordo com Vieira (2013), a utilização de Sistemas de Informação Geográca (SIG),
como ferramenta de georreferenciação de acidentes rodoviários, tendo como base uma rede
rodoviária em formato digital, apresenta vantagens assinaláveis, quer no que diz respeito à
rapidez e facilidade de visualização da disposição dos mesmos, quer na recolha e associação
de informação relevante segundo critérios de base geográca e de acordo com a informação
alojada em bases de dados existentes, que por sua vez se podem associar umas às outras,
permitindo relacionar informações importantes e provenientes de fontes distintas, desde que
contenham campos em comum.
1.2 Problema de Pesquisa
Diariamente, por todo o mundo, milhares de pessoas morrem por consequência de acidentes
rodoviários. Independentemente do sexo, idade ou condição social, esta é uma fatalidade que
atinge todos os utentes do sistema rodoviário, sejam eles condutores, passageiros ou peões.
Quer se desloquem a pé, de bicicleta ou em veículo motorizado, para a escola, ou a caminho
do trabalho, a caminhar nas ruas ou nas bermas das estradas, em pequenos trajectos ou em
viagens longas, são muitos os que nunca mais voltam para casa, deixando para trás famílias
e comunidades destroçadas.
Os acidentes rodoviários são considerados um grande problema de saúde pública a nível
mundial. Segundo WHO (2013), em 2030 os acidentes rodoviários estarão entre as cinco
principais causas de morte no mundo. Anualmente em Moçambique as autoridades têm
divulgado a morte de cerca de 1.700 pessoas nas diversas estradas do país. Mas a WHO
estima que o número real de mortes seja superior a 8.000 (WHO, 2015).
Autor: Estevão Zeco 2 Licenciatura em Estatística - UEM
CAPÍTULO 1. INTRODUÇÃO 3
Para o Instituto Nacional de Estatística (2018), de 2012 à 2017 quase em todas as províncias
houve redução do número de acidentes, mas em Maputo Província e Maputo Cidade, foram
as que mais acidentes registaram ao longo do período, Cabo Delgado e Niassa com menos
acidentes. Esse fenómeno tem sido proporcional ao número de mortes.
A georreferenciação de dados da ocorrência de óbitos nos acidentes rodoviários facilita a
interpretação dos dados e permite a utilização de ferramentas de análise espacial em ambiente
ArcGis, conseguindo-se trabalhar a informação de forma a obter os resultados pretendidos.
Nesse contexto, surgem as seguintes perguntas:
ˆ Qual é o número esperado de óbitos num acidente rodoviário na cidade de
Maputo?
ˆ Qual é a distribuição georreferencial de óbitos nos acidentes rodoviários na
cidade de Maputo?
1.3 Objectivos
1.3.1 Objectivo Geral
Analisar e georreferenciar a ocorrência de óbitos nos acidentes rodoviários na cidade de
Maputo no período de 2018 à 2020.
1.3.2 Objectivos Especícos
ˆ Caracterizar de óbitos nos acidentes rodoviários na cidade de Maputo no período de
2018 à 2020;
ˆ Georreferenciar de óbitos nos acidentes rodoviários na cidade de Maputo no período
de 2018 à 2020;
ˆ Estimar parâmetros de um modelo de Regressão de Poisson para o número de óbitos
num acidente rodoviário na cidade de Maputo;
ˆ Prever o número de óbitos em dez (10) acidentes rodoviários na cidade de Maputo e
fazer a sua georreferenciação.
Autor: Estevão Zeco 3 Licenciatura em Estatística - UEM
CAPÍTULO 1. INTRODUÇÃO 4
1.4 Relevância do Estudo
Todos os dias circulam nas estradas milhões de veículos, possibilitando a mobilidade de pes-
soas e mercadorias. Apesar das suas inegáveis vantagens, a intensa circulação rodoviária
resulta em altos níveis de acidentes, seja por circunstâncias afectas aos condutores, aos veí-
culos ou às condições das estradas.
Com o elevado número de óbitos provocados por acidentes rodoviários, surgiu a necessidade
de se fazer este estudo com o tema Aplicação do Modelo de Regressão de Poisson e Sistemas
de Informação Geográca (SIG) na Análise e Georreferenciação da Ocorrência de Óbitos nos
Acidentes Rodoviários na Cidade de Maputo no período de 2018 à 2020, com vista a pro-
porcionar um contributo à problemática acima referida. A motivação do foco na cidade de
Maputo deveu-se ao facto de ser a capital do país e com uma maior densidade populacional.
Julga-se pertinente o estudo, uma vez que existem poucos estudos em Moçambique que pro-
curam analisar a ocorrência de óbitos nos acidentes rodoviários na cidade de Maputo, desde
a sua caracterização, georreferenciação e a previsão dos mesmos.
A análise realizada e os resultados alcançados em relação a ocorrência de óbitos nos acidentes
rodoviários na cidade de Maputo, poderão servir de alerta ou guia aos órgãos gestores do
sistema rodoviário na planicação de acções adequadas com o objectivo de reduzir signica-
tivamente as mortes provocadas pelos acidentes rodoviários.
1.5 Estrutura do Trabalho
O presente trabalho está constituído por cinco capítulos, nomeadamente: O Capítulo 1 (In-
trodução), trata da contextualização, denição do problema, objectivos e a relevância do
estudo; O Capítulo 2 (Revisão de Literatura), trata de Acidentes Rodoviários no contexto
geral, Ocorrência de Óbitos nos Acidentes Rodoviários no Mundo, em Moçambique e no
caso concreto da Cidade de Maputo, conceitos básicos dos Modelos Lineares Generalizados
(MLG), Análise de Regressão de Poisson, desde os conceitos básicos, estimação dos parâme-
tros do modelo, selecção do modelo (stepwise), diagnóstico do modelo, Análise de Resíduos,
Simulação Monte Carlo, Medidas de Erro de Previsão, Sistemas de Informação Geográca
Autor: Estevão Zeco 4 Licenciatura em Estatística - UEM
CAPÍTULO 1. INTRODUÇÃO 5
(SIG) e por último Estudos Similares. O Capítulo 3 (Material e Métodos), apresenta a
Fonte de Dados, junto com a descrição das variáveis do estudo, softwares utilizados e por m
foi feita a descrição da metodologia usada (Estatística Descritiva, Sistemas de Informação
Geográca e Análise de Regressão de Poisson) e seus passos para o alcance dos objectivos
denido no trabalho. O Capítulo 4 (Resultados e Discussão) apresenta os resultados da aná-
lise de dados de forma estatística (Estatística Descritiva e Análise de Regressão de Poisson)
e geográca (mapas) e por m é feita a discussão dos resultados obtidos, comparando os re-
sultados obtidos com outros estudos existentes. Por último temos o Capítulo 5 (Conclusões
e Recomendações), onde são apresentadas as conclusões do trabalho e recomendações.
Autor: Estevão Zeco 5 Licenciatura em Estatística - UEM
Capítulo 2
REVISÃO DE LITERATURA
2.1 Acidentes Rodoviários
Nesta secção faz-se abordagem da ocorrência de óbitos nos acidentes rodoviários, porém,
antes dessa abordagem, existem alguns conceitos que importa conhecer para os contextualizar
nos capítulos a seguir apresentados. Assim, indicam-se de seguida algumas denições que se
julgam ser fundamentais (INE, 2020; INAV, 2010):
2.1.1 Conceitos básicos
ˆ Acidente rodoviário é a ocorrência na via pública ou que nela tenha origem envol-
vendo pelo menos um veículo, do conhecimento das entidades scalizadoras e da qual
resultem vítimas e/ou danos materiais.
ˆ Vítima é o ser humano que, em consequência de acidente, sofra danos corporais.
ˆ Morto/Vítima mortal é a vítima cujo óbito ocorre no local do acidente ou durante
o percurso até à unidade de saúde.
ˆ Ferido grave é a vítima de acidente cujos danos corporais obriguem a um período de
hospitalização superior a 24 horas.
ˆ Ferido ligeiro é a vítima de acidente que não seja considerada ferido grave.
ˆ Condutor é a pessoa que detém o comando de um veículo ou animal na via pública.
ˆ Peão é a pessoa que transita a pé na via pública e em locais sujeitos à legislação
rodoviária.
6
CAPÍTULO 2. REVISÃO DE LITERATURA 7
2.1.2 Acidentes Rodoviários no Mundo
Anualmente no mundo morrem quase 1.25 milhões de pessoas em resultado directo de aci-
dentes rodoviários. Admitindo a relação entre os números de mortos, os de feridos graves
e os feridos ligeiros, determinada por análise epidemiológica, globalmente os acidentes ro-
doviários originam 18 milhões de feridos graves e 85 milhões de feridos ligeiros (WHO, 2004).
As previsões realizadas pela Organização Mundial de Saúde em 2014 apontavam para que
entre 2000 e 2010 estes números tivessem um crescimento global de 65%, sendo que a taxa
prevista para os países de baixo e médio rendimento era de um aumento de 80% (WHO,
2004). Na realidade, fruto do reconhecimento mundial deste problema e das intervenções
havidas, aos níveis global, regional, nacional e local, o número anual de mortos em acidentes
rodoviários tem permanecido estável desde 2000, nos 1,25 milhões (WHO, 2015).
Georreferenciação da Distribuição do número de Óbitos por tipo de Utente Ro-
doviário com a Região do Mundo
Figura 2.1: Variação da distribuição do número de óbitos por tipo de utente rodoviário com
a região do Mundo - 2010.
Fonte: WHO (2015).
Autor: Estevão Zeco 7 Licenciatura em Estatística - UEM
CAPÍTULO 2. REVISÃO DE LITERATURA 8
Na Figura 2.1, evidencia-se um aspecto importante do fenómeno, que é o de haver diferenças
signicativas nas características da sinistralidade das várias regiões tradicionalmente consi-
deradas pela Organização Mundial de Saúde (OMS). Anota-se todas as referidas regiões são
homogéneas, havendo exemplos de estudos em que se revelou vantajosa a consideração de
apenas parte dos países de uma região, por haver diferenças muito marcadas em subconjun-
tos de países, é o caso de estudo promovido pelo Internacional Transport Forum (ITF),
em que apenas são considerados os países latino-americanos da região das Américas (Viera
e Cardoso, 2016).
Taxas de Mortalidade nos Países Lusófonos e Outros Países
Na Figura 2.2, apresentam-se as taxas de mortalidade, por habitante e por veículo do parque
automóvel. Nesta gura a escala das taxas de mortalidade por habitante (a) é natural; a das
taxas de mortalidade (b) por veículo é logarítmica (Viera e Cardoso, 2016).
Figura 2.2: Taxas de mortalidade nos países lusófonos e outros países em 2010: (a) por
habitante e (b) por veículo registado.
Fonte: Viera e Cardoso (2016).
Autor: Estevão Zeco 8 Licenciatura em Estatística - UEM
CAPÍTULO 2. REVISÃO DE LITERATURA 9
Os países lusófonos estão relativamente distribuídos no que se refere às taxas de mortos por
100.000 habitantes; já no caso das taxas de mortalidade por 100.000 veículos, vericou-se
que os países se agrupam nas extremidades da distribuição dos países analisados, com apenas
o Brasil e Cabo Verde situando-se nas taxas intermédias (Viera e Cardoso, 2016).
Comparando as taxas de mortalidade por habitante de cada país com a taxa média da região
do Mundo onde se situam vericou-se que Moçambique, São Tomé e Príncipe, Cabo Verde,
Angola e Açores têm valores inferiores à média das respectivas regiões; enquanto que Timor-
Leste, Guiné Bissau, Madeira, Portugal Continental e Brasil têm valores superiores (Viera e
Cardoso, 2016).
2.1.3 Acidentes Rodoviários em Moçambique
Moçambique é o país com elevada percentagem de mortes de peões com 68%, Zâmbia com
50%, Malawi com 45%, África do Sul com 39%, Tanzânia com 37%, seguindo por esta ordem
Suazilândia 35%, Maurícias com 29%, Seychelles com 28%, Namíbia com 27% e Zimbabwe
com 26%. No entanto, a elevada percentagem de mortes em Moçambique é o facto de o
ambiente de trânsito ser formado principalmente por peões, há um número elevado de pes-
soas vendendo pequenas mercadorias ao longo das estradas. Os peões formam uma massa
de caminhantes que reectem necessidades de circulação para efeitos de trabalho, compras,
negócios entre outras actividades (Machava, 2011).
No País os acidentes de rodoviários têm estado a aumentar, como resultado de crescimento
acelerado do parque automóvel, características do condutor do veículo, o estado de vias de
acesso, o estado do ambiente e de conservação dos veículos, entre outros. Como consequência
disso, anualmente são registados, em média, quatro mil acidentes de viação, resultando em
mais de duas mil vítimas, entre mortos e feridos graves (INE, 2018; CIP, 2014).
A Figura 2.3, mostra a evolução do número de acidentes rodoviários em Moçambique no
período de 2010 à 2017, onde constatou-se o número de acidentes registou uma redução a
partir do ano 2010 até 2017, ou seja, o número de acidentes têm tendência decrescente.
Autor: Estevão Zeco 9 Licenciatura em Estatística - UEM
CAPÍTULO 2. REVISÃO DE LITERATURA 10
Figura 2.3: Evolução do número de acidentes rodoviários em Moçambique de 2010 à 2017.
Fonte: CIP (2014); INE (2018).
Distribuição do Número de Óbitos nos Acidentes Rodoviários
Figura 2.4: Distribuição do número de óbitos nos acidentes rodoviários em Moçambique de
2010 à 2017.
Fonte: CIP (2014); INE (2018).
Autor: Estevão Zeco 10 Licenciatura em Estatística - UEM
CAPÍTULO 2. REVISÃO DE LITERATURA 11
Em Moçambique, as estatísticas consolidadas de acidentes rodoviários nos últimos 8 anos
(de 2010 à 2017) revelam que foram registados 24.182 acidentes, envolvendo cerca de 51.259
vítimas, tirando a vida de 16.019 pessoas. A Figura 2.4, mostra que o número de óbitos
reduziu em 2010 para 2012, de 2012 para 2014 aumento, atingindo um pico de 2.649 óbitos
e reduzindo de 2014 para 2017, atingindo deste modo o número mais baixo de 1.354 óbitos.
Ainda na Figura 2.4, constatou-se que em 2014 houveram mais óbitos, com mais de 2.649
pessoas, este acontecimento tem vindo a preocupar as autoridades policiais (Polícia de Trân-
sito), pois constitui um grande problema social e económico, ceifando milhares de vidas por
ano.
Tipo de Acidente e sua Frequência
As autoridades policiais moçambicanas (Polícia de Trânsito), perante um acidente, têm
considerando os seguintes acidentes: Atropelamento, Choque entre carros, Despiste e capo-
tamento, Choque entre carros e motos, Choque com obstáculos xos, Queda de passageiros,
entre outros.
Os atropelamentos são os que mais contribuem nas estatísticas dos acidentes rodoviários,
o que demonstra a vulnerabilidade do peão nas nossas estradas. Os acidentes rodoviários
registados pela Polícia da República de Moçambique em 2017, os acidentes de tipo atrope-
lamento ocorreram com maior frequência, correspondendo a 43,6%, os choques entre carros
seguiram com 26,4%. A menor frequência de acidentes foi do tipo queda de passageiros com
2,5% (INE, 2018).
Outro aspecto é o facto de as mortes por acidentes de viação afectarem principalmente a
população activa do sexo masculino, ou seja, a faixa etária dos 25 aos 31 anos de idade,
aparece como um maior contribuinte nas estatísticas das mortes por acidentes de viação em
muitos casos na condição de condutores (INAV, 2010).
Causas dos Acidentes Rodoviários
Para Moçambique segundo o balanço feito da quadra festiva 2009-2010 no dia 18 de janeiro
de 2010 que envolveu as instituições responsáveis pela segurança rodoviária nomeadamente
Ministério do Interior, Ministério dos Transportes e comunicações e Ministérios das obras
públicas e Habitação consideram principais causas de acidentes (Machava, 2011):
Autor: Estevão Zeco 11 Licenciatura em Estatística - UEM
CAPÍTULO 2. REVISÃO DE LITERATURA 12
ˆ Excesso de velocidade;
ˆ Álcool;
ˆ Ultrapassagem irregular;
ˆ Trânsito fora da mão;
ˆ Mau estado técnico de alguns veículos;
ˆ Transporte de passageiros em veículos não apropriado.
O Governo aponta o factor humano, excesso de velocidade, ultrapassagens irregulares, con-
dução em estado de embriaguez, má travessia do peão, como sendo o principal factor de
crescimento do número de acidentes rodoviários nos últimos dias (CIP, 2014).
2.1.4 Acidentes Rodoviários na Cidade de Maputo
A cidade Maputo é caracterizada por ter a menor superfície e uma maior densidade popula-
cional. De acordo com Figura 2.5, constatou-se que na Cidade de Maputo, de 2010 à 2014
houve uma redução no número de acidentes, de 2014 à 2015 houve um aumento de cerca de
92% e de 2015 à 2017 o número de acidentes rodoviários reduziu.
Figura 2.5: Evolução do número de acidentes rodoviários na Cidade Maputo de 2010 à 2017.
Fonte: CIP (2014); INE (2018).
Autor: Estevão Zeco 12 Licenciatura em Estatística - UEM
CAPÍTULO 2. REVISÃO DE LITERATURA 13
Óbitos nos Acidentes Rodoviários
De acordo com o relatório do INE (2018), na cidade de Maputo em 2015 registou-se em
média 9.9% de óbitos, em 2016 registou uma média de 10.1% de óbitos e em 2017 uma
média de 13.3%, mostrando deste modo uma tendência crescente. O que mostra que os
acidentes rodoviários vêm tirando muitas vidas.
2.2 Modelos Lineares Generalizados
Em problemas onde o objectivo é estudar a relação entre as variáveis, os estatísticos utilizam
modelos de regressão. Existem várias metodologias estatísticas que permitem explicar ou
descrever a relação entre uma variável de interesse (variável resposta) e uma ou mais variá-
veis (variáveis explicativas).
O modelo linear é talvez o mais utilizado para modelar esta relação. Este modelo assume,
entre outras, que o valor esperado da variável resposta é uma combinação linear das variáveis
explicativas e que a variável resposta segue a distribuição Normal. Esta teoria da modelação
estatística é limitada, pois não pode ser utilizada se a distribuição da variável resposta é
diferente da Normal. Para a resolução deste problema, o modelo linear generalizado foi in-
troduzido em 1972, por Nelder e Wedderburn. São vários os modelos lineares generalizados,
nesse estudo considera-se apenas a Regressão de Poisson.
De acordo com o Schmidt (2003) os modelos lineares generalizados representam a união de
modelos lineares e não-lineares com uma distribuição da família exponencial, que é formada
pela distribuição normal, poisson, binomial, gama, normal inversa e incluem modelos linea-
res tradicionais (erros com distribuição normal), bem como modelos logísticos.
Desde 1972, inúmeros trabalhos relacionados com modelos lineares generalizados foram pu-
blicados, resultando em diversas ferramentas computacionais, como por exemplo, GLIM
(Generalized Linear Interactive Models), S-Plus, R, SAS, STATA e SUDAAN, bem como
extensões desses modelos (Paula, 2004).
Os MLG são denidos por uma distribuição de probabilidade, membro da família exponencial
de distribuições, e são formados pelas seguintes componentes (Tadano et al., 2007):
Autor: Estevão Zeco 13 Licenciatura em Estatística - UEM
CAPÍTULO 2. REVISÃO DE LITERATURA 14
ˆ Componente aleatória- n variáveis explicativas x1, . . . , xn, de uma variável resposta
que segue uma distribuição da família exponencial com o valor esperado E(yi) = µ;
ˆ Componente sistemática- compõe uma estrutura linear para o modelo de regressão
η = βxT
, chamado de preditor linear, onde xT
= (xi1, xi2, . . . , xnp), i = 1, 2, . . . , n são
as chamadas variáveis explicativas;
ˆ Função de ligação- uma função monótona e diferenciável g, chamada de função de
ligação, capaz de conectar as componentes aleatória e sistemática, ou seja, relaciona
a média da variável resposta (µ) à estrutura linear, denida nos MLG por g(µ) = η,
onde:
η = β0 + β1xi1 + · · · + βpxnp (2.1)
ou na forma matricial
η = βxT
(2.2)
Cada distribuição tem uma função de ligação especial, chamada de função de ligação canônica
que ocorre quando η = θi, onde θ é o chamado parâmetro de localização ou parâmetro
canônico, conforme ilustra a Tabela 2.1 (McCullagh; Nelder, 1989).
Tabela 2.1: Funções de ligação canônica de algumas distribuições da família exponencial.
Distribuição Função de ligação canônica (η)
Normal µ
Poisson ln µ
Binomial ln µ/(1 − µ)
Gama µ−1
Gaussiana Inversa µ−2
De acordo com Myers e Montgomery (2002), a utilização da função de ligação canônica
implica algumas propriedades interessantes, porém não quer dizer que deva ser utilizada
sempre. Essa escolha é conveniente porque, além de simplicar as estimativas dos parâmetros
do modelo, também facilita o cálculo do intervalo de conança para a média da variável
resposta. Contudo, a conveniência não implica necessariamente em qualidade de ajuste do
modelo.
Autor: Estevão Zeco 14 Licenciatura em Estatística - UEM
CAPÍTULO 2. REVISÃO DE LITERATURA 15
2.3 Regressão de Poisson
Uma das técnicas bastante utilizada em estudos de previsão do número de acidentes rodo-
viários, são os Modelos Lineares Generalizados, concretamente a Regressão de Poisson.
De acordo com Turkman  Silva (2000), o modelo de regressão de Poisson desempenha um
papel fundamental na análise de dados de contagem. Estes tipos de dados assumem valores
discretos (0, 1, 2, . . . ), reectindo o número de ocorrências de um acontecimento em um
período de tempo xo.
De acordo com Gujarati (2008), distribuição de Poisson é dada por:
f(Y ) =
e−µ
µY
Y !
Y = 0, 1, 2, . . . (2.3)
em que f(Y ) denota a probabilidade de que a variável Y assuma valores inteiros não negativos
e Y! (lê-se factorial de Y) é representado por Y ! = Y ×(Y −1)×(Y −2)×(Y −3)×· · ·×2×1.
Pode ser demonstrado que
E(Y ) = µ
V ar(Y ) = µ
Note um aspecto interessante da distribuição de Poisson: sua variância é a mesma que o
valor médio. O modelo de regressão de Poisson pode ser escrito como:
Yi = E(Yi) + µi = µi + µi (2.4)
em que os Y são distribuídos independentemente como variáveis aleatórias de Poisson com
média µi para cada indivíduo expresso como
µi = E(Yi) = β0 + β1x1i + β2x2i + · · · + βkxkn (2.5)
em que os X são algumas das variáveis que poderiam afectar o valor médio.
Para ns de estimação, escrevemos o modelo como:
f(Y ) =
e−µ
µY
Y !
+ ui (2.6)
sendo µ substituído pela Equação (2.5) Como podemos ver, o modelo de regressão resultante
terá parâmetros não lineares, necessitando da estimação de uma regressão não linear.
Autor: Estevão Zeco 15 Licenciatura em Estatística - UEM
CAPÍTULO 2. REVISÃO DE LITERATURA 16
2.3.1 Teste de Ajustamento a Distribuição de Poisson
De acordo com Mulenga (2018), o teste de χ2
pode normalmente ser utilizado para vericar
se uma determinada distribuição de frequências obedece a correspondente distribuição de
probabilidades. Para testes de ajustamento de dados a distribuições teóricas, se a função
densidade da distribuição for completamente especicada, com um número de m parâmetros
desconhecidos têm-se:
χ2
obs =
X f0(yi) − fe(yi)
2
fe(yi)
∩ χ2
(n − m − 1, α) (2.7)
ˆ Hipóteses a testar
Ho : Y ∼ po(λ), (Y segue a distribuição de Poisson)
H1 : Y 6= po(λ), (Y não segue a distribuição de Poisson)
ˆ Regra de decisão: Rejeita-se a hipótese nula (H0), se o p-value associado à estatística
deste teste for menor que o nível de signicância escolhido, caso contrário não.
2.3.2 Estimação dos Parâmetros do Modelo de Regressão de Pois-
son
De acordo com Paulo (2019), para estimar os parâmetros, utiliza-se o método de estimação
de máxima verossimilhança. A função de verossimilhança para o modelo de regressão de
Poisson é dado por:
L(β) =
n
Y
i=1
exp (−µ)µyi
yi!
(2.8)
e a função de log-verossimilhança é dado por:
`(β) =
n
X
i=1
[−µi + yi ln (µi) − ln (yi!)] (2.9)
Como µi = exp(xT
i β), vem
`(β) =
n
X
i=1
[− exp(xT
i β) + yi(xT
i β) − ln (yi!)] (2.10)
Portanto, maximizando a função de log-verossimilhança `(β) com respeito a β temos:
∂`(β)
∂βj
=
n
X
i=1
[yi − exp(xT
i β)] xi = 0, j = 0, 1, 2, . . . , p (2.11)
Autor: Estevão Zeco 16 Licenciatura em Estatística - UEM
CAPÍTULO 2. REVISÃO DE LITERATURA 17
e as equações de verossimilhança para β são:
∂`(β)
∂βj
=
n
X
i=1
[yi − exp(xT
i β)] xi = 0, j = 0, 1, 2, . . . , p (2.12)
A função desvio no modelo de regressão de Poisson é denida pela seguinte expressão,
D(Y, µ̂) = 2
n
X
i=1
n
yi ln
 yi
µ̂i

− (yi − µ̂i)
o
(2.13)
A função desvio reduz-se a
(Y, µ̂) = 2
n
X
i=1
n
yi ln
 yi
µ̂i
o
(2.14)
para modelos com termo constante, β0, porque neste caso
n
X
i=1
(yi − µ̂i) = 0 (2.15)
A estatística de Pearson generalizada é denida por
χ2
=
n
X
i=1
(yi − µ̂i)2
µ̂i
(2.16)
2.3.3 Selecção de Modelos
A selecção de modelos é uma parte importante de toda a investigação em modelação estatís-
tica e envolve a procura de um modelo que seja o mais simples possível e que descreva bem os
dados observados. Na prática há geralmente um elevado número de variáveis que podem ser
potencialmente importantes para explicar a variabilidade da variável resposta. Isto implica
a existência de vários modelos com combinações diferentes das variáveis explicativas para
explicar o fenómeno em causa, o que torna o processo da selecção mais difícil e mais moroso.
Para facilitar o processo da selecção vários investigadores utilizaram o método de selecção
stepwise.
Método de Stepwise
O método stepwise é um procedimento automático de selecção de variáveis em direcção
backward, forward e both (Alvarenga, 2015).
ˆ A direcção forward inicia-se a partir de um modelo nulo e adiciona uma de cada vez as
variáveis que podem ser signicativas para explicar a variabilidade da variável resposta.
O modelo nulo é um modelo simples com apenas um parâmetro que representa o mesmo
valor médio µ para todas as observações yi.
Autor: Estevão Zeco 17 Licenciatura em Estatística - UEM
CAPÍTULO 2. REVISÃO DE LITERATURA 18
ˆ O caso da direcção backward é ao contrário da direcção forward, inicia-se a partir de
um modelo completo e verica a cada passo se uma variável pode ser ou não eliminada
do modelo. O modelo completo ou saturado é o maior modelo que temos a possibilidade
de considerar. Dada uma amostra com n observações, o número máximo de parâmetros
para esse modelo é igual a n, isto é, um parâmetro para cada observação.
ˆ O método both stepwise é uma combinação dos dois métodos (forward e backward).
A fase de incluir ou excluir a variável do modelo é a fase de avaliação da signicância
das variáveis ou comparação dos modelos. Para isso utilizam-se medidas estatísticas
adequadas para a sua avaliação.
2.3.4 Diagnóstico do Modelo de Regressão Poisson
Depois de obter as estimativas para os coecientes de Regressão de Poisson é necessário
avaliar a sua signicância e a qualidade do ajuste do modelo, isto é, determinar se as va-
riáveis independentes introduzidas no modelo estão signicativamente associadas à variável
dependente (Hosmer e Lemeshow, 2013). Para esse efeito recorremos à estatística da razão
de verossimilhança e à estatística de Wald.
Teste da Razão de Verossimilhança
De acordo com Alvarenga (2015), o teste da razão de verossimilhança é utilizado para com-
parar a qualidade do ajustamento de dois modelos, isto é, modelos em que um tem o subcon-
junto de variáveis do outro modelo. Também se pode dizer que este teste avalia a signicância
dos coecientes estimados simultaneamente, ou seja, verica se o modelo estimado é global-
mente signicativo.
Dados dois modelos , Mp e Mq, com um número de variáveis p e q respectivamente, tal
que p  q, para comparar a qualidade de ajustamento de dois modelos aplica-se o teste da
razão de verossimilhança, sob a hipótese de que as q −p variáveis no modelo não apresentam
acréscimo signicativo na qualidade do modelo (Alvarenga, 2015).
Autor: Estevão Zeco 18 Licenciatura em Estatística - UEM
CAPÍTULO 2. REVISÃO DE LITERATURA 19
ˆ Hipóteses a testar





Ho : β1 = β2 = β3 = · · · = βp = 0
H1 : Pelo menos um dos parametros difere de zero
A estatística de teste e a respectiva distribuição, sob a validade de H0
G = −2

ln LMp(β)

ln LMq(β)

#
∩ χ2
q−p (2.17)
onde ln LMp(β)

é a função logaritmo da verossimilhança do modelo Mp com p variáveis e
ln LMq(β)

é a função logaritmo da verossimilhança do modelo Mq com q variáveis.
Teste de Wald
De acordo com Alvarenga (2015), o teste de Wald é utilizado para testar a hipótese nula de
que o parâmetro βi estimado é igual a zero.
ˆ Hipóteses a testar





Ho : βi = 0
H1 : βi 6= 0
A estatística de teste e a respectiva distribuição, sob a validade de H0 são:
Wi =
β̂i
s(β̂i)
∩ N(0, 1) (2.18)
Teste de Dispersão
A superdispersão é um problema que ocorre frequentemente na prática quando se aplica o
modelo de regressão de Poisson, surgindo quando a variância da variável resposta é superior
ao valor esperado. Outro problema menos comum, mas que tem ganhado a atenção nos
estudos de regressão para dados de contagem é a subdispersão, surge quando a variância da
variável resposta é menor ao valor esperado (Paulo, 2019).
Os critérios que indicam a superdispersão aparente do modelo de regressão de Poisson são
(Hilbe, 2011):
Autor: Estevão Zeco 19 Licenciatura em Estatística - UEM
CAPÍTULO 2. REVISÃO DE LITERATURA 20
ˆ O modelo omite importantes variáveis explicativas;
ˆ Os dados incluem outliers;
ˆ O modelo não inclui um número suciente de termos de interação;
ˆ Uma variável explicativa precisa ser transformada em outra escala;
ˆ Há situações em que os dados são muito escassos e mais dados precisam ser recolhidos
e incluídos no modelo; e
ˆ Valores ausentes existem nos dados, mas não são distribuídos aleatoriamente nos dados.
De acordo com Santos (2013), para identicar a superdispersão nos dados, utiliza-se a devi-
ance. O cálculo é baseado na aproximação χ2
do desvio residual. Se existir a superdispersão,
então
D
φ
segue uma distribuição Qui-Quadrado com n - p graus de liberdade, e isso leva ao
seguinte estimador para φ .
φ =
D
n − p
(2.19)
Se a estimativa deste parâmetro for menor ou igual a um, então não existe superdispersão
nos dados, prosseguindo-se com o processo de validação do modelo. Caso seja maior que um,
é uma indicação da existência de superdispersão.
ˆ Hipóteses a testar
Ho : φ ≤ 1 (Há equidispersão nos dados)
H1 : φ  1 (Não há equidispersão nos dados)
ˆ Regra de decisão: Rejeita-se a hipótese nula (H0), se o p-value associado à estatística
deste teste for menor que o nível de signicância escolhido, caso contrário não.
2.4 Análise de Resíduos
De acordo com Turkman e Silva (2000), a análise de resíduos é útil, para avaliar a qualidade
de ajustamento de um modelo no que diz respeito à escolha da distribuição, da função de
ligação e de termos do preditor linear, como também identicar observações mal ajustadas
pelo modelo.
As técnicas usadas para a análise de resíduos nos modelos lineares generalizados são seme-
lhantes ao do modelo clássico de regressão. Para a i-ésima observação dene-se o resíduo
como a diferença entre o valor observado (Yi) e o valor estimado (Ŷi) pelo modelo.
Autor: Estevão Zeco 20 Licenciatura em Estatística - UEM
CAPÍTULO 2. REVISÃO DE LITERATURA 21
2.4.1 Resíduo de Pearson
O resíduo de Pearson é calculado pela seguinte expressão:
rip =
Yi − Ŷi
q
V (Ŷi)
, i = 1, 2, . . . , n (2.20)
O resíduo rip corresponde à contribuição da i-ésima observação para o cálculo da estatística
de Pearson generalizada, dada pela seguinte expressão:
χ2
=
n
X
i=1
(Yi − Ŷi)2
V (Ŷi)
, i = 1, 2, . . . , n (2.21)
onde V (Ŷi) é a função de variância estimada para a distribuição do modelo em estudo.
2.4.2 Resíduo de Deviance
O resíduo da deviance correspondente à i-ésima observação é dado por:
rD = sinal(Yi − Ŷi)
p
di (2.22)
Onde di é a contribuição da i-ésima observação para a medida deviance.
2.4.3 Resíduos Padronizados
Para uma análise adequada dos resíduos é necessário que eles sejam padronizados pelo res-
pectivo desvio padrão.
ˆ O resíduo de Pearson Padronizado é dado por:
riE =
Yi − Ŷi
q
V (Ŷi)(1 − hii)
(2.23)
Onde hii são os valores da diagonal da matriz de projecção:
H = W1/2
X(X0
WX)−1
X0W1/2
(2.24)
ˆ O resíduo da Deviance Padronizado é dado por:
riE =
rD
p
(1 − hii)
(2.25)
Autor: Estevão Zeco 21 Licenciatura em Estatística - UEM
CAPÍTULO 2. REVISÃO DE LITERATURA 22
2.4.4 Analise Gráca dos Resíduos
Gráco de índices
De acordo com Marciano (2009), o gráco de índices é utilizado para localizar observações
com resíduo, leverage hii, distância de Cook modicada. Pode ser útil na detecção de
observações que destoam da tendência geral das demais observações, indicando um possível
outlier.
Resíduos versus valores ajustados
Muito utilizado para vericar a constância de variância (McCullagh e Nelder, 1989) para
a distribuição em uso, e em geral se utiliza algum tipo de resíduo padronizado. O que se
espera é que o gráco apresente a distribuição dos resíduos em torno de zero com amplitude
constante, onde desvios sistemáticos podem ter algum tipo de curvatura ou uma amplitude
muito diferente com o valor ajustado.
Gráco semi-normal de probabilidades (Half Normal Plots)
De acordo com Marciano (2009), a construção do gráco semi-normal de probabilidades é o
resultado do conjunto de pontos obtidos por valores absolutos de um quantil amostral versus
os valores do quantil correspondente da distribuição normal zi em que zi = φ−1
(i + n −
0.125)/(2n + 0.5).
Gráco normal de probabilidades (Normal Plots) com envelopes
Weisberg (2005) analisa que o gráco normal de probabilidades se destaca por dois aspec-
tos: a identicação da distribuição originária dos dados e a identicação de valores que se
destacam no conjunto de observações. Os envelopes, no caso dos MLG's com distribuições
diferentes da normal, são construídos com os resíduos sendo gerados a partir do modelo
ajustado (Williams, 1987).
2.5 Simulação Monte Carlo
A técnica de Monte Carlo consiste em gerar valores aleatórios para cada distribuição de
probabilidades dentro de um modelo com o objectivo de produzir centenas ou milhares
de cenários. O método é especialmente bem-adaptado para a resolução de problemas de
Autor: Estevão Zeco 22 Licenciatura em Estatística - UEM
CAPÍTULO 2. REVISÃO DE LITERATURA 23
natureza estatística, mas pode também ser usado noutros tipos de problema, especialmente
quando a obtenção de uma solução exacta é muito difícil ou impossível de obter (Gentle,
2003). Dada a sua natureza estatística, a Simulação Monte Carlo é sobretudo um método
computacional de resolução de problemas, tendo o seu desenvolvimento e campo de aplicação,
acompanhado a evolução dos computadores (Prado, 2004).
2.5.1 Tipos de Geradores de Números Aleatórios
Os geradores de números aleatórios podem ser classicados de acordo com os tipos de nú-
meros que podem ser gerados (Gentle, 2003; Prado,2004):
ˆ Números Aleatórios: a principal característica desses números é o facto de serem
completamente imprevisíveis. Estes só podem ser gerados por algum processo físico
natural, como por exemplo decaimentos radioactivos.
ˆ Números Pseudo-Aleatórios: são os mais utilizados, sendo gerados em computador
por meio de algum algoritmo simples. Portanto, não são números aleatórios.
ˆ Números Quasi-Aleatórios: também são gerados por algum algoritmo numérico
simples. Contudo, eles são produzidos de maneira que sejam distribuídos o mais uni-
formemente possível. Esta metodologia é empregada no Método de Quasi-Monte Carlo.
2.6 Medidas de Erro de Previsão
Segundo Chopra (2003), um bom modelo de previsão deve captar a componente sistemática,
mas não o componente aleatório. Sendo que esse componente aleatório se manifesta na forma
de erro de previsão o qual deve ser acompanhado com critério.
Para isso foram desenvolvidas várias técnicas (indicadores) para dimensionar o erro e dessa
maneira conseguir-se melhorar as estimativas, comparando-se várias técnicas para gerar a
previsão e, assegurando-se a técnica utilizada é a com menor erro, além disso, pode-se através
do acompanhamento do erro (Pacheco, 2007).
Para tomar a decisão da melhor forma possível indica que se deve fazer uma análise completa
dos erros por dois motivos (Chopra, 2003):
ˆ Utilizar a análise de erros para determinar se o modelo de previsão adotado está pre-
vendo detalhadamente a componente sistemática;
Autor: Estevão Zeco 23 Licenciatura em Estatística - UEM
CAPÍTULO 2. REVISÃO DE LITERATURA 24
ˆ Estimar o erro de previsão para que possa ser desenhado um plano de contingência
responsável por tal erro.
Para avaliar a comparação entre modelos de previsão são utilizadas diversas estatísticas que
medem a distância entre o modelo e os dados sendo que as mais frequentes estão descritas
abaixo (Chopra, 2003; Pacheco, 2007):
2.6.1 Soma dos Quadrados dos Erros
Esse indicador é uma simples soma dos erros ao quadrado, dessa maneira consegue eliminar
os valores negativos dos erros e tem-se uma medida de erro que mede apenas a distância
não podendo medir o viés da previsão, tanto positivo quanto negativo, a expressão a seguir
é utilizada para esse cálculo:
SQE =
n
X
i=1
(Yi − Ŷi)2
(2.26)
2.6.2 Quadrado Médio do Erro
Essa métrica é a média dos erros calculada pela SQE, para melhorar a interpretação dos
resultados e é dado pela fórmula:
QME =
1
n
×
n
X
i=1
(Yi − Ŷi)2
(2.27)
2.6.3 Erro Absoluto Médio
Essa métrica é usada para avaliar as previsões através da soma dos erros absolutos. Utiliza-se
essa técnica quando o analista quer vericar a distância entre o predito e o realizado e, assim
utilizar a mesma unidade de medida dos dados, facilitando assim a compreensão do erro,
como as técnicas anteriores esse indicador não mostra o viés do modelo caso exista algum e
é dado pela fórmula:
EAM =
1
n
×
n
X
i=1
|Yi − Ŷi| (2.28)
2.6.4 Erro Absoluto Médio Percentual
O EAMP é um dos indicadores mais usados para vericar a acurácia da previsão, por ser de
fácil compreensão e interpretação podendo gerar uma comparação entre diferentes unidades
por se tratar de percentual. Esse indicador trata-se do erro absoluto divido pelo real assim
Autor: Estevão Zeco 24 Licenciatura em Estatística - UEM
CAPÍTULO 2. REVISÃO DE LITERATURA 25
você tem a distância em % do predito em relação ao realizado, para gerar um indicador único
é calculado a média desses percentuais, através da seguinte expressão:
EAMP =
Pn
i=1
Yi − Ŷi
Yi
× 100
n
(2.29)
2.6.5 Erro Médio Percentual
Quando é necessário vericar se um método de previsão está retornando uma previsão muito
alta ou muito baixa, utiliza-se esse método, assim é possível vericar se existe viés de alta
ou baixa na previsão.
Se a média encontrada for próxima de zero então não existe viés, se for uma percentagem
negativa, a previsão está errando para baixo, se for positivo então a previsão está errada
para cima. O EMP é calculado pela seguinte expressão:
EMP =
1
n
×
n
X
i=1
Yi − Ŷi
Yi
(2.30)
2.6.6 Viés
O Viés é utilizado para estimar se o modelo de previsão superestima ou subestima a demanda,
para estimar o Viés pode-se utilizar a soma dos erros da previsão:
V IES =
1
n
×
n
X
i=1
(Yi − ˆ
Yi) (2.31)
2.7 Sistemas de Informação Geográca
Sistemas de Informação Geográca é um conjunto de programas, equipamentos, metodolo-
gias, dados e pessoas (usuário), perfeitamente integrados, de forma a tornar possível a co-
lecta, o armazenamento, o processamento e a análise de dados georreferenciados, bem como
a produção de informação derivada de sua aplicação. A utilização dos SIGs vem crescendo
rapidamente em todo o mundo, uma vez que possibilita uma melhor gestão de informações e
consequente melhoria nos processos de tomada de decisões em várias áreas (Filho  Iochpe,
2008).
Autor: Estevão Zeco 25 Licenciatura em Estatística - UEM
CAPÍTULO 2. REVISÃO DE LITERATURA 26
2.7.1 Georreferenciação
De acordo com Braceiro (2015), entende-se por georreferenciação todo o processo de loca-
lização geográca de determinado objecto espacial, através da atribuição de coordenadas a
esses mesmos objectos.
Uma das vantagens claras da georreferenciação de dados é conseguir obter e trabalhar a
informação sob a forma de mapa, em formato digital, numa plataforma SIG, ou seja, facilita a
interpretação dos dados e permite a utilização de ferramentas de análise espacial em ambiente
ArcGis, conseguindo-se trabalhar a informação de forma a obter os resultados pretendidos
(Braceiro, 2015).
2.8 Estudos Similares
Em relação à ocorrência de acidentes, diversos autores se dedicam ao estudo de variáveis que
segundo eles se tornam mais relevantes que outras na participação em acidentes rodoviá-
rios. Esta preferência por determinadas variáveis no estudo de acidentes rodoviários ocorre
quase que naturalmente conforme a linha de investigação e de atuação prossional de cada
autor.
Um estudo similar, foi desenvolvido por Balaniuk. R et al (2018), cujo o objectivo era iden-
ticar os principais factores contribuintes dos acidentes e relatar acções governamentais para
a redução de mortes e lesões no trânsito. Onde tiveram como conclusão que à pista dupla,
tanto para condutores do sexo feminino quanto do sexo masculino, evidenciou-se a falta de
atenção como principal causa presumível dos acidentes. As evidências encontradas quanto à
falta de atenção de quem conduz o veículo, assim como também de velocidade incompatível,
ultrapassagem indevida e ingestão de álcool, nas causas presumíveis dos acidentes na amos-
tra deste estudo, reforçam a necessidade de investimento em campanhas educativas com o
foco no comportamento daqueles que conduzem veículos nas vias públicas, em uma direcção
defensiva e na obediência às regras de trânsito.
Um estudo desenvolvido pelo americano Zlatoper (1991), que tinha como objectivo o uso
da regressão de mínimos quadrados para estimar um modelo de mortes de indivíduos nos
veículos motorizados nos Estados Unidos. O modelo inclui vários factores considerados em
Autor: Estevão Zeco 26 Licenciatura em Estatística - UEM
CAPÍTULO 2. REVISÃO DE LITERATURA 27
estudos transversais anteriores dessas fatalidades. As estimativas sugerem que a renda, a
proporção entre direcção urbana e rural, gastos com polícia rodoviária e segurança, leis de
inspeção de veículos automotores e leis de uso de cinto de segurança para adultos com dispo-
sições secundárias de aplicação estão inversamente relacionadas às taxas de mortalidade de
veículos motorizados. Eles também indicam que o volume de direcção, velocidade, variação
de velocidade, densidade de direcção, consumo de álcool, temperatura e uma variável dummy
para estados ocidentais estão directamente relacionados às taxas.
Um outro estudo foi desenvolvido por Alvarenga (2015), que tinha como objectivo modelar a
ocorrência de acidentes rodoviários por dia, aplicando a metodologia de regressão de Poisson.
Onde concluiu-se que os modelos desenvolvidos apresentaram o problema de superdispersão
(regressão de Poisson) e a alternativa foi a regressão Binomial Negativa, onde foram mais
adequados para ajustar aos dados que os desenvolvidos com a regressão de Poisson. As
variáveis explicativas utilizadas foram o dia da semana, o facto desse dia ser feriado ou
não, os meses ou as estações do ano. Os resultados da análise demonstraram que o número
de acidentes ocorridos por dia é melhor explicado pelas variáveis dia da semana (com sete
categorias), meses do ano e os dias feriados.
Autor: Estevão Zeco 27 Licenciatura em Estatística - UEM
Capítulo 3
MATERIAL E MÉTODOS
3.1 Classicação da Pesquisa
3.1.1 Quanto à abordagem
Como o objectivo da pesquisa é analisar fenómenos a partir de quanticações, aplicando
técnicas estatísticas e geográcas, então trata-se de uma pesquisa com abordagem quanti-
tativa. De acordo com Fonseca (2002), os resultados da pesquisa quantitativa podem ser
quanticados. A pesquisa quantitativa recorre à linguagem matemática para descrever as
causas de um fenómeno, as relações entre variáveis, etc.
3.1.2 Quanto aos objectivos
Quanto aos objectivos, trata-se de uma pesquisa explicativa, uma vez que o estudo visa
analisar e georreferenciar a ocorrência de óbitos nos acidentes rodoviários. De acordo com
Gil (2007), este tipo de pesquisa preocupa-se em identicar os factores que determinam ou
que contribuem para a ocorrência dos fenómenos, ou seja, este tipo de pesquisa explica o
porquê das coisas através dos resultados oferecidos.
3.1.3 Quanto aos procedimentos
A pesquisa ex-post-facto tem por objectivo investigar possíveis relações de causa e efeito
entre um determinado facto identicado pelo pesquisador e um fenómeno que ocorre pos-
teriormente. A principal característica deste tipo de pesquisa é o facto de os dados serem
coletados após a ocorrência dos eventos (Fonseca, 2002). Assim sendo, o estudo da ocorrência
de óbitos nos acidentes rodoviários, quanto aos procedimentos é uma pesquisa ex-post-facto.
28
CAPÍTULO 3. MATERIAL E MÉTODOS 29
3.2 Material
3.2.1 Fonte de dados
O presente estudo, foi realizado com dados secundários de acidentes rodoviários da cidade
de Maputo, no período de 2018 à 2020, fornecidos pelo Comando da PRM da cidade de
Maputo, Departamento de Trânsito, na área de acidentes rodoviários. A base de dados é
composta por 995 observações e 10 variáveis. A Tabela 3.1 mostra a descrição das variáveis.
Tabela 3.1: Descrição e classicação das variáveis do estudo.
Variáveis Descrição Classicação
Ano* 2018, 2019 e 2020 Variável quantitativa
Distrito Kamavota, Kamaxaquene, Kampfumo, Variável qualitativa
urbano* Kalhamankulo e Kamububwuana
Tipo de veículo* Ligeiro, Pesado e Outros Variável qualitativa
Dia da semana* Domingo à Sábado Variável qualitativa
Hora de 00h00-05h59, 06h00-11h59, 12h00-17h59 e Variável quantitativa
ocorrência* 18h00-23h59
Óbitos** Número de óbitos Variável quantitativa
Idade do Menos de 18, 18-35 anos , 36-45 anos, Variável quantitativa
condutor* 46-55 anos, 56-65 anos e +65 anos
Sexo do condutor* Masculino e Feminino Variável qualitativa
Causa do Excesso de velocidade, Consumo de álcool,
acidente* Má travessia do peão, Corte de prioridade e Variável qualitativa
Outras causas
Atropelamento, Choque entre carros,
Despiste e capotamento,
Tipo de Choque entre carros e outros, Variável qualitativa
acidente* Choque entre carros e motos,
Choque com obstáculos xos,
Queda de passageiros e Outros tipos
(*) Variável independente
(**) Variável dependente
Autor: Estevão Zeco 29 Licenciatura em Estatística - UEM
CAPÍTULO 3. MATERIAL E MÉTODOS 30
3.2.2 Pacotes utilizados
No presente trabalho, foi utilizado o software ArcGis versão 10.8 para a produção de mapas;
Software R versão 3.6.0 para o processamento dos dados; Microsoft Excel 2019 para realização
de alguns cálculos e grácos; e LaTeX versão 4.0 para edição do texto.
3.3 Métodos
3.3.1 Estatística Descritiva
De acordo com Mulenga (2018), a estatística descritiva é o ramo ou parte da estatística cujo
o objectivo é a observação de fenómenos de mesma natureza, recolha, organização, classica-
ção, análise e interpretação de dados sem deixar de calcular algumas medidas (estatísticas),
que permitem resumidamente descrever o fenómeno estudado.
3.3.2 Sistemas de Informação Geográca
A georreferenciação de ocorrências de óbitos por via acidentes em redes viárias digitais traz
enormes vantagens, no que diz respeito à facilidade de visualização da distribuição dos mes-
mos e na extracção de informação importante, segundo critérios de base geográca.
A forma mais prática e directa de o fazer é carregar as coordenadas cartesianas dos locais onde
ocorreram os acidentes num SIG, o que permitiu o mapeamento das ocorrências dos óbitos
por via de acidentes rodoviários na rede, a identicação dos distritos com maior pretensão
para a ocorrência dessas mortes, sejam passados, bem como futuros (mortes previstas)
3.3.3 Regressão de Poisson
Diversos estudos sobre os dados de contagem utilizam a metodologia de regressão de Poisson
como modelo padrão para a análise deste tipo de dados. A razão pela qual o modelo de
regressão de Poisson é considerado a metodologia base na modelação de dados de contagens
é o facto de assumir apenas valores inteiros não negativos para o valor esperado da variável
resposta (Lord e Mannering, 2010).
Autor: Estevão Zeco 30 Licenciatura em Estatística - UEM
CAPÍTULO 3. MATERIAL E MÉTODOS 31
De acordo com Fávero e Belore (2017), poderemos estimar um modelo de regressão de
Poisson, denido da seguinte forma:
ln(Ŷi) = ln(µ̂i) = ˆ
β0 + ˆ
β1X1i + ˆ
β2X2i + · · · + ˆ
βkXkn (3.1)
que também é chamado de modelo log-linear. Sendo assim, o número esperado de ocorrências
em dada exposição, para determinada observação i, pode ser escrito como:
µ̂i = e
ˆ
β0+ ˆ
β1X1i+ ˆ
β2X2i+···+ ˆ
βkXkn
(3.2)
em que β̂i representa a constante, β̂i(i = 1, 2, . . . , k) são os parâmetros estimados de cada
variável explicativa, X são as variáveis explicativas e o subscrito i representa cada observação
da amostra (i = 1, 2, . . . , n, em que n é o tamanho da amostra).
Nota:Todos os testes foram realizados considerando um nível de signicância de 5% (α =
0.05) e com a seguinte regra de decisão: rejeita-se a hipótese nula (H0), se o p-value associado
à estatística deste teste for menor que o nível de signicância, caso contrário não.
ˆ Para vericar se a variável dependente (número de óbitos) segue a distribuição de
poisson, usou-se o teste de ajustamento a distribuição de Poisson descrito na
secção 2.3.1.
ˆ Para a estimação dos parâmetros do modelo de regressão foi utilizado o Método da
Máxima Verossimilhança descrito na secção 2.3.2.
ˆ Para facilitar o processo de decisão acerca de quais variáveis explicativas selecionar no
modelo de regressão, foi utilizado o método de stepwise, concretamente backward,
descrito na secção 2.3.3.
ˆ Para fazer o diagnóstico do modelo, testou-se a signicância global e individual dos
parâmetros utilizando os testes de Razão de Verossimilhança e Wald, e vericou-se
a existência de superdispersão, com o teste de Deviance, descrito na secção 2.3.4.
ˆ Para a análise de resíduos, usou-se os resíduos de Pearson, Deviance e Padroniza-
dos, conforme descrito na secção 2.4.
Autor: Estevão Zeco 31 Licenciatura em Estatística - UEM
CAPÍTULO 3. MATERIAL E MÉTODOS 32
Previsão
ˆ A previsão foi feita em dois critérios: (1) dentro da amostra, através de uma amostra
selecionada aleatoriamente dentro da base de dados e (2) fora da amostra, através de
valores gerados pela Simulação Monte Carlo. De salientar que a previsão foi feita para
uma amostra de 10 acidentes.
ˆ Nas simulações realizadas no trabalho, utilizou-se números pseudo-aleatórios, gerados
pela função runif(n, min, max), disponível no R studio. Essa função gera uma sequên-
cia de números com distribuição uniforme com um mínimo zero (0) e um máximo um
(1), conforme descrito na secção 2.5.1.
ˆ A m de avaliar as previsões e assim dimensionar o erro e dessa maneira conseguir-se
melhorar as estimativas e assegurando-se de que a técnica utilizada é a com menor erro,
calculou-se o Quadrado Médio do Erro (QME), Erro Absoluto Médio (EAM)
e o Erro Absoluto Médio Percentual (EAMP), conforme descrito na secção 2.6.
ˆ Por m foi feita a georreferenciação dos valores previstos (dentro e fora da amostra).
Autor: Estevão Zeco 32 Licenciatura em Estatística - UEM
Capítulo 4
RESULTADOS E DISCUSSÃO
4.1 Análise Descritiva
4.1.1 Distribuição do Número de Óbitos por Ano
A Tabela 4.1, mostra a distribuição global do número de óbitos nos acidentes rodoviários no
período de 2018 à 2020, na cidade de Maputo, onde constatou-se que o mínimo e a moda
é de zero (0) óbito por acidente rodoviário, (mediana = 1) tendo a metade dos acidentes
resultado em zero (0) óbito e a outra metade resultando em acima de um (1) óbito, com
um valor esperado de um (0.56 ≈ 1) óbito por acidente, uma variabilidade de 0.75 e tendo
atingido um máximo de cinco (5) óbitos por acidente.
Tabela 4.1: Estatísticas descritivas do número de óbitos.
Mínimo Moda Mediana Média Variância Desvio Padrão Máximo
0.00 0.00 1.00 0.56 0.56 0.75 5.00
Em relação a distribuição desagregada do número de óbitos nos acidentes rodoviários por ano
(2018 à 2020), constatou-se que a distribuição dos óbitos apresentou algumas similaridades
em alguns aspectos ao longo dos três anos, com um número mínimo de zero (0), central
(mediana) de um (1) e um máximo de dois (2) óbitos por acidente. Por outro lado, em 2018
observou-se um número de óbitos fora do comum (outlier), sendo de três (3) e cinco (5) num
só acidente, e em 2019 e 2020 registou-se um número de três (3) óbitos num só acidente,
sendo também fora do comum (outlier) conforme ilustrado na Figura 4.1.
33
CAPÍTULO 4. RESULTADOS E DISCUSSÃO 34
Figura 4.1: Distribuição do número de óbitos por ano.
4.1.2 Distribuição do Número de Óbitos por Sexo e Idade do Con-
dutor
De acordo com Figura 4.2, constatou-se que em relação a distribuição do número de óbitos
por sexo (A) e por idade (B) do condutor, cerca de 62.77% dos óbitos eram provocados por
condutores do sexo masculino e 37.23% por sexo feminino, e em relação a distribuição das
idades, cerca de 55.4% dos óbitos eram provocados por condutores dos seus 18 à 35 anos,
seguido de 36 à 45 anos com cerca de 28.1%, 46 à 55 anos com cerca de 10.6%, 56 à 65 anos
com cerca de 5.4% e cerca de 0.4% com mais de 65 anos, felizmente de 2018 à 2020 não foi
registado nenhum acidente com óbitos provocado por condutores com menos de 18 anos.
Figura 4.2: Distribuição do número de óbitos por Sexo (A) e Idade (B) do Condutor.
Autor: Estevão Zeco 34 Licenciatura em Estatística - UEM
CAPÍTULO 4. RESULTADOS E DISCUSSÃO 35
4.1.3 Distribuição do Número de Óbitos por Tipo de Veículo
Na cidade de Maputo no período de 2018 à 2020, constatou-se cerca de 68.61% dos óbitos
eram provocados por veículos de categoria ligeira, seguido da categoria pesada com cerca de
24.68% e por último cerca de 6.71% provocadas por outras categorias, conforme ilustra a
Figura 4.3.
Figura 4.3: Distribuição do número de óbitos por Tipo de Veículo.
4.1.4 Distribuição do Número de Óbitos por Dia da Semana e Hora
de Ocorrência
De acordo com a Figura 4.4, constatou-se que em relação a distribuição do número de
óbitos por dia da semana (A) e por hora de ocorrência (B), cerca de 20.3% dos óbitos foram
registados aos sábados e 17.7% aos domingos, a segunda-feira foi o dia da semana com menos
óbitos, com cerca de 10.8%, e em relação a distribuição da hora de ocorrência, no período
das 12h00 às 17h59 registou-se cerca de 32.7% dos óbitos, seguido das 18h00 às 23h59 cerca
de 36.6%, das 06h00 às 11h59 cerca de 24% e por último das 00h00 às 05h59 com menos
frequência, com cerca de 11.7% óbitos registados.
Autor: Estevão Zeco 35 Licenciatura em Estatística - UEM
CAPÍTULO 4. RESULTADOS E DISCUSSÃO 36
Figura 4.4: Distribuição do número de óbitos por Dia da Semana (A) e Hora de ocorrência
(B).
4.1.5 Distribuição do Número de Óbitos por Tipo e Causa do Aci-
dente
Quanto aos tipos de acidentes, constatou-se que os atropelamentos é que tem tirado mais
vidas em acidentes rodoviários, com cerca de 54.98% de óbitos, choque entre carros com
cerca de 21% de óbitos e uma média de 0.46 (0) óbito, despiste e capotamento 12.77% e 0.50
(1) óbito, choques entre carros e outros 3.03% e 0.56 (1) óbito, a queda de passageiros é que
foi a mais fatal, com uma média de 0.57 (1) óbito, o choque entre carros e motos foi a que
menos registou óbitos e foi a menos fatal, com cerca de 1.30% de óbitos e uma média de 0.35
(0) óbito. Em relação as causas dos acidentes, constatou-se que os acidentes provocados pelo
excesso de velocidade são os que tem tirado mais vidas, com cerca de 56.93% de óbitos com
uma média de 0.53 (1) óbito, seguido do consumo de álcool, com cerca de 15.37% de óbitos
e uma média de 0.49 (0) óbito, corte de prioridade com cerca de 13.85% de óbitos e uma
média de 0.41 (0) óbito, má travessia do peão com cerca de 10.17% de óbitos e uma média
de 0.40 (0) óbito e por último outras causas, com cerca de 3.68% de óbitos e uma média de
0.37 (0) óbito, conforme ilustrado na Tabela 4.2.
Autor: Estevão Zeco 36 Licenciatura em Estatística - UEM
CAPÍTULO 4. RESULTADOS E DISCUSSÃO 37
Tabela 4.2: Distribuição do número de óbitos por Tipo e Causa do Acidente.
Variáveis Categorias Frequência Média
Atropelamento 54.98% 0.46
Choque entre carros 21% 0.46
Despiste e capotamento 12.77% 0.50
Choques entres carros e outros 3.03% 0.56
Tipo de Acidente Choque entre carros e motos 1.30% 0.36
Choque com obstáculos xos 2.38% 0.38
Queda de passageiros 1.73% 0.57
Outros tipos 2.81% 0.46
Excesso de velocidade 56.93% 0.53
Consumo de álcool 15.37% 0.49
Causa do Acidente Má travessia do peão 10.17% 0.40
Corte de prioridade 13.85% 0.41
Outras causas 3.68% 0.37
4.2 Georreferenciação dos Acidentes Rodoviários na Ci-
dade de Maputo
As Figuras 4.5 e 4.6, mostram a distribuição do número de óbitos e óbitos esperados por
distrito, onde vericou-se que o distrito urbano de Kamavota foi o que mais apresentou
óbitos com aproximadamente 144 óbitos, com 55.6% (80) em 2018, 25.7% (37) em 2019 e
18.8% (27) em 2020, com um número esperado de 0.50 (1) óbito, seguido de Kampfumo com
aproximadamente 136 óbitos, com 57.4% (78) em 2018 e 21.3% (29) em 2019 e 2020, com um
número esperado de 0.45 (0), 94 óbitos em Kamubukwana, sendo 42.6% (40) em 2018, 29.8%
(28) em 2019 e 27.7% (26) em 2020, com um número esperado de 0.47 (0) óbito, e os distritos
de Kamaxaquene e Kalhamankulo apresentaram um número de óbitos muito reduzido, sendo
de 47 e 41, com os valores esperados de 0.47 (0) e 0.42 (0) óbito, respectivamente.
Autor: Estevão Zeco 37 Licenciatura em Estatística - UEM
CAPÍTULO 4. RESULTADOS E DISCUSSÃO 38
Figura 4.5: Distribuição do Número de Óbitos por Distritos Urbanos.
Figura 4.6: Distribuição do Número Esperado de Óbitos por Distritos Urbanos.
Autor: Estevão Zeco 38 Licenciatura em Estatística - UEM
CAPÍTULO 4. RESULTADOS E DISCUSSÃO 39
4.3 Modelo de Regressão de Poisson
4.3.1 Teste de Ajustamento a Distribuição de Poisson
Antes de se estimar os parâmetros do modelo de regressão de Poisson, é necessário vericar
se a variável dependente (número de óbitos) segue a distribuição de Poisson ou não. A Figura
4.7, sugere que o número de óbitos segue uma distribuição de Poisson.
Figura 4.7: Distribuição do número de óbitos.
De acordo com a Tabela 4.3, constatou-se que não se rejeita a hipótese nula de que o número
de óbitos segue uma distribuição de Poisson, pois o p-value (0.1484) foi superior que o nível
de signicância de 5%(0.05), sustentando deste modo o que foi sugerido na Figura 4.7, que
o número de óbitos segue uma distribuição de Poisson.
Tabela 4.3: Teste de Qui-Quadrado para Ajustamento a Distribuição de Poisson.
Qui-Quadrado Gl P-value
5.3414 3 0.1484
4.3.2 Estimação dos Parâmetros do Modelo
Com base no método de máxima verossimilhança, estimou-se os parâmetros do modelo de
regressão de Poisson para o número de óbitos nos acidentes rodoviários, conforme ilustrado
na Tabela 4.4, mais detalhes serão apresentadas na secção 4.3.6.
Autor: Estevão Zeco 39 Licenciatura em Estatística - UEM
CAPÍTULO 4. RESULTADOS E DISCUSSÃO 40
Tabela 4.4: Estimação dos parâmetros do modelo pelo método de máxima verossimilhança.
Variáveis Categorias Coecientes (B) Exp (B)
- Intercepto -0.62 0.54
Feminino (ref) - -
Sexo do condutor Masculino -0.17 0.84
Menos de 18 anos -13.30 0
18-35 anos (ref) - -
36-45 anos 0.40 1.49
Idade do condutor 46-55 anos 0.004 1.004
56-65 anos 0.14 1.50
Mais de 65 anos -0.63 0.53
Ligeiro (ref) - -
Tipo de veículo Pesado -0.01 0.99
Outros tipos -0.03 0.97
Segunda-feira -0.09 0.91
Terça-feira -0.01 0.99
Quarta-feira 0.02 1.02
Dia da semana Quinta-feira 0.14 1.15
Sexta-feira -0.04 0.96
Sábado -0.04 0.96
Domingo (ref) - -
00h00-05h59 (ref) - -
06h00-11h59 -0.31 0.73
Hora de ocorrência 12:00-17:59 -0.16 0.85
18h00-23:h59 -0.31 0.73
Kalhamankulo (ref) - -
Kamubukwana 0.70 2.01
Distrito urbano Kamaxaquene 0.04 1.04
Kamavota 0.12 1.13
Kampfumo 0.20 1.22
Autor: Estevão Zeco 40 Licenciatura em Estatística - UEM
CAPÍTULO 4. RESULTADOS E DISCUSSÃO 41
Variáveis Categorias Coecientes (B) Exp (B)
Atropelamentos (ref) - -
Choque entre carros -0.10 0.90
Despiste e capotamento 0.002 1.002
Choques entres carros e outros 0.30 1.35
Tipo de acidente Choque entre carros e motos -0.31 0.73
Choque com obstáculos xos -0.23 0.79
Queda de passageiros 0.12 1.13
Outros tipos -0.11 0.90
Álcool (ref) - -
Excesso de velocidade 0.92 2.51
Causa do acidente Má travessia do peão 0.87 2.39
Corte de prioridade -0.10 0.90
Outras causas 0.67 1.95
(ref) - Categoria de referência
4.3.3 Selecção do Modelo
A selecção de modelos é uma parte importante de toda a investigação em modelação estatística
e envolve a procura de um modelo que seja o mais simples possível e que descreva bem os dados
observados. Para facilitar o processo de selecção usou-se o método de stepwise backward, que inicia
a partir de um modelo completo e verica a cada passo se uma variável pode ser ou não eliminada
do modelo.
Tabela 4.5: Selecção de modelos pelo método stepwise backward.
Modelos Variáveis excluídas Gl Deviance AIC
Modelo 1  962 833.79 1492.72
Modelo 2 Sexo do condutor 963 833.82 1490.75
Modelo 3 Tipo de veículo; Sexo do condutor 965 836.81 1489.70
De acordo com Alvarenga (2015), a medida utilizada para avaliar o modelo é o Critério de Informação
de Akaike (AIC), quanto menor for este valor menor será a informação perdida e, portanto, melhor
será o ajustamento do modelo, contrariamente da medida Deviance.
Autor: Estevão Zeco 41 Licenciatura em Estatística - UEM
CAPÍTULO 4. RESULTADOS E DISCUSSÃO 42
Na Tabela 4.6, são apresentados três (3) modelos gerados pelo método stepwise backward, onde
constatou-se que o Modelo 3 foi o melhor modelo, com duas variáveis excluídas (Tipo de veículo e
Sexo do condutor), pois apresentou um maoir Deviance de 836.81 e o menor AIC de 1489.70.
4.3.4 Diagnósticos do Modelo
Após a obtenção das estimativas para os coecientes de Regressão de Poisson é necessário avaliar a
sua signicância e a qualidade do ajuste do modelo, isto é, determinar se as variáveis independentes
no modelo estão signicativamente associadas à variável dependente.
Teste de signicância dos parâmetros
De acordo com a Tabela 4.6, constatou-se que pelo menos um dos parâmetros é estatisticamente
signicativo, uma vez que p-value (9.801 × 10−13) associado ao teste de razão de verossimilhança
foi inferior que o nível de signicância de 5% (0.05).
Tabela 4.6: Teste de Razão de Verossimilhança para signicância global.
Qui-Quadrado Gl P-value
118.23 30 9.801 × 10−13
Em relação a signicância individual dos parâmetros, o teste de Wald ilustrado na Tabela 4.7, mos-
trou que o intercepto foi signicativo, quanto a idade do condutor, somente as idades compreendidas
entre 36 à 45 anos é que foram signicativas, nos dias da semana, segunda-feira, terça-feira, quarta-
feira, sexta-feira e sábado foram signicativos, quanto a hora de ocorrência dos acidentes, todos os
períodos foram signicativos, quanto ao distrito urbano, somente o distrito de Kamubukwana é que
foi signicativo, quanto ao tipo de acidente, somente os acidentes do tipo choque entre carros é que
foram signicativos e quanto a causa do acidentes, apenas o excesso de velocidade, má travessia do
peão e outras causas é que foram signicativas. Todas as variáveis consideradas estatisticamente
signicativas, foi pelo facto de terem apresentado um p-value inferior que o nível de signicância de
5% (0.05).
Autor: Estevão Zeco 42 Licenciatura em Estatística - UEM
CAPÍTULO 4. RESULTADOS E DISCUSSÃO 43
Tabela 4.7: Teste de Wald para a signicância individual dos parâmetros.
Variáveis Categorias B Exp (B) EP Wald P-value
- Intercepto -0.62 0.54 0.15 -4.08 0.0005*
Menos de 18 anos -13.30 0 665 -0.02 0.9805
18-35 anos (ref) - - - - -
Idade do 36-45 anos 0.40 1.49 0.12 3.32 0.0009*
condutor 46-55 anos 0.004 1.004 0.40 0.01 0.9938
56-65 anos 0.14 1.50 0.26 0.53 0.5934
Mais de 65 anos -0.63 0.53 0.71 -0.89 0.3758
Segunda-feira -0.09 0.91 0.21 -0.42 0.0153*
Terça-feira -0.01 0.99 0.01 -0.76 0.0058*
Dia da Quarta-feira 0.02 1.02 0.06 0.31 0.0212*
semana Quinta-feira 0.14 1.15 0.19 0.73 0.0828
Sexta-feira -0.04 0.96 0.10 -0.41 0.0159*
Sábado -0.04 0.96 0.05 -0.77 0.0056*
Domingo (ref) - - - - -
00h00-05h59 (ref) - - - - -
Hora de 06h00-11h59 -0.31 0.73 0.30 -1.05 0.0023*
ocorrência 12h00-17h59 -0.16 0.85 0.29 -0.55 0.0004*
18h00-23h59 -0.31 0.73 0.67 -0.46 0.0138*
Kalhamankulo (ref) - - - - -
Kamubukwana 0.70 2.01 0.35 1.99 0.0028*
Distrito Kamaxaquene 0.04 1.04 0.04 0.93 0.3530
urbano Kamavota 0.12 1.13 0.11 1.14 0.2559
Kampfumo 0.20 1.22 0.25 0.80 0.4265
Álcool (ref) - - - - -
Causa Excesso de velocidade 0.92 2.51 0.53 1.72 0.0002*
acidente Má travessia do peão 0.87 2.39 0.82 1.06 0.0022*
Corte de prioridade -0.10 0.90 0.16 -0.61 0.5442
Outras causas 0.67 1.95 0.56 1.20 0.0278*
Autor: Estevão Zeco 43 Licenciatura em Estatística - UEM
CAPÍTULO 4. RESULTADOS E DISCUSSÃO 44
Variáveis Categorias B Exp (B) EP Wald P-value
Atropelamentos (ref) - - - - -
Choque entre carros -0.10 0.90 0.09 -1.15 0.0016*
Despiste e capotamento 0.002 1.002 0.01 0.18 0.1143
capotamento
Choques entre 0.30 1.35 0.86 0.35 0.7293
Tipo de carros e outros
acidente Choque entre carros e motos -0.31 0.73 0.62 -0.50 0.9584
carros e motos
Choque com -0.23 0.79 0.19 -1.18 0.2392
obstáculos xos
Queda de passageiros 0.12 1.13 0.13 0.95 0.3444
Outros tipos -0.11 0.90 0.69 -0.16 0.8726
(*) Estatisticamente signicativo
(ref) - Categoria de referência
Teste de Dispersão
Am de garantir com que o modelo de Poisson estimado, não produza resultados incoerentes durante
a previsão, é sempre recomendável, que após a estimação de um modelo de regressão de Poisson,
seja feito um teste para vericação da existência de superdispersão ou subdispersão nos dados.
Neste contexto, a Tabela 4.8, mostra o teste de dispersão, onde constatou-se que não se rejeita a
hipótese nula, pois o p-value (0.5664) foi superior que o nível de signicância de 5% (0.05), ou seja,
há equidispersão nos dados da variável dependente (óbitos).
Tabela 4.8: Teste de Dispersão.
Estatística Z Dispersão P-value
-0.1671 0.9920 0.5664
Autor: Estevão Zeco 44 Licenciatura em Estatística - UEM
CAPÍTULO 4. RESULTADOS E DISCUSSÃO 45
4.3.5 Análise de Resíduos
A análise de resíduos é muito importante nos modelos de regressão, uma vez que eles ajudam a
detectar observações discrepantes que merecem uma análise mais detalhada. De acordo Cox e Snell
(1968), os resíduos devem expressar uma discrepância entre a observação (Yi) e o seu valor ajustado
(Ŷi).
De acordo com a Figura 4.8, constatou-se que o modelo de Poisson apresentou um bom ajuste aos
dados, pois os valores ajustados, aproximam-se aos observados.
Figura 4.8: Valores observados e modelo ajustado de Poisson.
Outliers
De acordo com Barnett e Lewis (1994), um outlier é uma observação inconsistente com todos os
dados. Tanto na variável resposta, bem como nas variáveis explicativas da regressão podem con-
ter outliers. De acordo com Faraway (2016), uma das formas de detectar outliers gracamente, é
usando o gráco QQ. Uma diferença dos diagnósticos dos modelos lineares gaussianos, não estamos
procurando uma linha recta no gráco QQ nos diagnósticos GLM porque os resíduos não devem ser
normalmente distribuídos. O único propósito do gráco QQ no GLM é encontrar os outliers nos
dados.
Os envelopes simulados para os resíduos de Pearson e Deviance (Figura 5.1, anexo A), mostraram
que os resíduos de Deviance estão quase todos praticamente sobre uma linha, evidenciando a su-
posição de distribuição adequada para o modelo em estudo, embora haja dois valores discrepantes
Autor: Estevão Zeco 45 Licenciatura em Estatística - UEM
CAPÍTULO 4. RESULTADOS E DISCUSSÃO 46
(outliers). Diferentemente dos resíduos de Pearson, que mostrou que muitos dos pontos estão fora
das bandas de conança de 95%. Os resíduos padronizados (Figura 5.2, anexo A), não mostraram
um comportamento diferente da Figura 5.1. Os resíduos Padronizados de Deviance mostraram que
a maioria dos pontos estão dentro das bandas de conança de 95% e nos resíduos Padronizados de
Pearson o comportamento é outro, tem muitos valores discrepantes (outliers).
Figura 4.9: Grácos semi-normais para detectar outliers usando resíduos de Pearson (A) e
Deviance (B).
Figura 4.10: Grácos semi-normais para detectar outliers usando resíduos padronizados de
Pearson (A) e Deviance (B).
Autor: Estevão Zeco 46 Licenciatura em Estatística - UEM
CAPÍTULO 4. RESULTADOS E DISCUSSÃO 47
As Figuras 4.9 e 4.10, mostram os grácos semi-normais dos resíduos de pearson, deviance e pa-
dronizados para detectar possíveis outliers nos dados, onde constatou-se que tanto nos resíduos
padronizados (Figura 4.10), bem como nos resíduos não padronizados (Figura 4.9), os pontos 274 e
113 apresentaram comportamento diferente dos outros pontos.
Observações Inuentes
Uma observação inuente é aquela que afecta as estimativas dos coecientes de regressão do modelo
ajustado, pois este possui valores incomuns para a variável resposta, explicativas ou mesmo para
ambas (Barnett e Lewis, 1994). A distância de Cook provê uma ordenação das observações em
termos da sua inuência sobre o vector das estimativas dos coecientes. A intenção não é aplicar
um teste formal, e sim fornecer uma ajuda para detectar as observações inuentes. Cook e Weisberg
(1999) armam que é conveniente analisar casos em que Di  0.5 e é sempre importante analisar
casos em que Di  1. Esta análise consiste em vericar se a observação é realmente inuente ou se
é consequência de um modelo inadequado.
A Figura 4.11, mostra que não há indicação de observações inuentes, pois apresentaram dis-
tâncias de Cook inferiores a 0.5.
Figura 4.11: Distâncias de Cook para as estimativas dos coecientes.
Em relação a distância de Cook para as estimativas dos coecientes das variáveis (distrito urbano,
dias da semana, horas, causa do acidente, tipo de acidente e idade do condutor) utilizadas no
modelo de regressão de Poisson (Figuras 5.3, 5.4 e 5.5, anexo A), constatou-se que não há indicação
de observações inuentes, pois apresentaram distâncias de Cook inferiores a 0.5.
Autor: Estevão Zeco 47 Licenciatura em Estatística - UEM
CAPÍTULO 4. RESULTADOS E DISCUSSÃO 48
4.3.6 Interpretação dos Parâmetros Estimados
Os diagnósticos realizados, mostraram que o modelo é bom para fazer previsões e deste modo será
apresentada a interpretação dos parâmetros estimados.
ln Ŷi = −0.62 + 0.40 × [36 − 45anos]i − 0.09 × Segundai − 0.01 × Tercai + 0.02 × Quartai
−0.04 × Sextai − 0.04 × Sabadoi − 0.31 × [06h00 − 11h59]i − 0.16 × [12h00 − 17h59]i
−0.31 × [18h00 − 23h59]i + 0.70 × Kamubukwanai − 0.01 × ChoqueCarrosi + 0.92×
ExcessoV elocidadei + 0.87 × MaTravessiai + 0.67 × OutrasCausasi
ˆ
β0 : e−0.62 (0.54) é a taxa de incidência de óbitos num acidente com as seguintes características:
um condutor com uma idade compreendida entre 18-35 anos, num domingo, num período das
00h00-05h59, no distrito de Kalhamankulo, acidente por atropelamento e como causa do aci-
dente o consumo de álcool, mantendo o resto nulo.
ˆ
β1 : a taxa de incidência de óbitos num acidente com as seguintes características: um condutor
com uma idade compreendida entre 36-45 anos, num domingo, num período das 00h00-05h59,
no distrito de Kalhamankulo, acidente por atropelamento e como causa do acidente o consumo de
álcool é de e0.40 (1.49) vezes que um acidente com as seguintes características: um condutor com
uma idade compreendida entre 18-35 anos, num domingo, num período das 00h00-05h59, no dis-
trito de Kalhamankulo, acidente por atropelamento e como causa do acidente o consumo de álcool,
mantendo o resto nulo.
ˆ
β2 : a taxa de incidência de óbitos num acidente com as seguintes características: um condutor com
uma idade compreendida entre 18-35 anos, numa segunda-feira, num período das 00h00-05h59,
no distrito de Kalhamankulo, acidente por atropelamento e como causa do acidente o consumo
de álcool é de e−0.09 (0.91) vezes que um acidente com todas as características das categorias de
referência do modelo, mantendo o resto nulo.
ˆ
β3 : a taxa de incidência de óbitos num acidente com as seguintes características: um condutor
com uma idade compreendida entre 18-35 anos, numa terça-feira, num período das 00h00-05h59,
no distrito de Kalhamankulo, acidente por atropelamento e como causa do acidente o consumo
de álcool é de e−0.01 (0.99) vezes que um acidente com todas as características das categorias de
referência do modelo, mantendo o resto nulo.
ˆ
β4 : a taxa de incidência de óbitos num acidente com as seguintes características: um condutor com
Autor: Estevão Zeco 48 Licenciatura em Estatística - UEM
CAPÍTULO 4. RESULTADOS E DISCUSSÃO 49
uma idade compreendida entre 18-35 anos, numa quarta-feira, num período das 00h00-05h59, no
distrito de Kalhamankulo, acidente por atropelamento e como causa do acidente o consumo de ál-
cool é de e0.02 (1.02) vezes que um acidente com todas as características das categorias de referência
do modelo, mantendo o resto nulo.
ˆ
β5 : a taxa de incidência de óbitos num acidente com as seguintes características: um condutor
com uma idade compreendida entre 18-35 anos, numa sexta-feira, num período das 00h00-05h59,
no distrito de Kalhamankulo, acidente por atropelamento e como causa do acidente o consumo
de álcool é de e−0.04 (0.96) vezes que um acidente com todas as características das categorias de
referência do modelo, mantendo o resto nulo.
ˆ
β6 : a taxa de incidência de óbitos num acidente com as seguintes características: um condutor com
uma idade compreendida entre 18-35 anos, num sábado, num período das 00h00-05h59, no distrito
de Kalhamankulo, acidente por atropelamento e como causa do acidente o consumo de álcool é de
e−0.04 (0.96) vezes que um acidente com todas as características das categorias de referência do
modelo, mantendo o resto nulo.
ˆ
β7 : a taxa de incidência de óbitos num acidente com as seguintes características: um condutor com
uma idade compreendida entre 18-35 anos, num domingo, num período das 06h00-11h59, no dis-
trito de Kalhamankulo, acidente por atropelamento e como causa do acidente o consumo de álcool
é de e−0.31 (0.73) vezes que um acidente com todas as características das categorias de referência
do modelo, mantendo o resto nulo.
ˆ
β8 : a taxa de incidência de óbitos num acidente com as seguintes características: um condutor com
uma idade compreendida entre 18-35 anos, num domingo, num período das 12h00-17h59, no dis-
trito de Kalhamankulo, acidente por atropelamento e como causa do acidente o consumo de álcool
é de e−0.16 (0.85) vezes que um acidente com todas as características das categorias de referência
do modelo, mantendo o resto nulo.
ˆ
β9 : a taxa de incidência de óbitos num acidente com as seguintes características: um condutor
com uma idade compreendida entre 18-35 anos, num domingo, num período das 18h00-23h59,
no distrito de Kalhamankulo, acidente por atropelamento e como causa do acidente o consumo de
álcool é e−0.31 (0.73) vezes que um acidente com todas as características das categorias de referência
do modelo, mantendo o resto nulo.
Autor: Estevão Zeco 49 Licenciatura em Estatística - UEM
CAPÍTULO 4. RESULTADOS E DISCUSSÃO 50
ˆ
β10 : a taxa de incidência de óbitos num acidente com as seguintes características: um condutor com
uma idade compreendida entre 18-35 anos, num domingo, num período das 00h00-05h59, no distrito
de Kamubukwana, acidente por atropelamento e como causa do acidente o consumo de álcool é
de e0.70 (2.01) vezes que um acidente com todas as características das categorias de referência do
modelo, mantendo o resto nulo.
ˆ
β11 : a taxa de incidência de óbitos num acidente com as seguintes características: um condutor
com uma idade compreendida entre 18-35 anos, num domingo, num período das 00h00-05h59, no
distrito de Kalhamankulo, acidente de choque entre carros e como causa do acidente o consumo
de álcool é de e−0.01 (0.99) vezes que um acidente com todas as características das categorias de
referência do modelo, mantendo o resto nulo.
ˆ
β12 : a taxa de incidência de óbitos num acidente com as seguintes características: um condutor com
uma idade compreendida entre 18-35 anos, num domingo, num período das 00h00-05h59, no distrito
de Kalhamankulo, acidente por atropelamento e como causa do acidente o excesso de velocidade
é e0.92 (2.51) vezes que um acidente com todas as características das categorias de referência do
modelo, mantendo o resto nulo.
ˆ
β13 : a taxa de incidência de óbitos num acidente com as seguintes características: um condutor
com uma idade compreendida entre 18-35 anos, num domingo, num período das 00h00-05h59, no
distrito de Kalhamankulo, acidente por atropelamento e como causa do acidente a má travessia
do peão é de e0.87 (2.39) vezes que um acidente com todas as características das categorias de
referência do modelo, mantendo o resto nulo.
ˆ
β14 : a taxa de incidência de óbitos num acidente com as seguintes características: um condutor
com uma idade compreendida entre 18-35 anos, num domingo, num período das 00h00-05h59, no
distrito de Kalhamankulo, acidente por atropelamento e como causa do acidente outras causas é
de e0.67 (1.95) vezes que um acidente com todas as características das categorias de referência do
modelo, mantendo o resto nulo.
Autor: Estevão Zeco 50 Licenciatura em Estatística - UEM
Estevão Zeco (Monografia)- Regressão de Poisson e SIG
Estevão Zeco (Monografia)- Regressão de Poisson e SIG
Estevão Zeco (Monografia)- Regressão de Poisson e SIG
Estevão Zeco (Monografia)- Regressão de Poisson e SIG
Estevão Zeco (Monografia)- Regressão de Poisson e SIG
Estevão Zeco (Monografia)- Regressão de Poisson e SIG
Estevão Zeco (Monografia)- Regressão de Poisson e SIG
Estevão Zeco (Monografia)- Regressão de Poisson e SIG
Estevão Zeco (Monografia)- Regressão de Poisson e SIG
Estevão Zeco (Monografia)- Regressão de Poisson e SIG
Estevão Zeco (Monografia)- Regressão de Poisson e SIG
Estevão Zeco (Monografia)- Regressão de Poisson e SIG
Estevão Zeco (Monografia)- Regressão de Poisson e SIG
Estevão Zeco (Monografia)- Regressão de Poisson e SIG
Estevão Zeco (Monografia)- Regressão de Poisson e SIG
Estevão Zeco (Monografia)- Regressão de Poisson e SIG

Más contenido relacionado

La actualidad más candente

Calor sensivel e calor latente
Calor sensivel e calor latenteCalor sensivel e calor latente
Calor sensivel e calor latenteReinaldoMassayuki1
 
Gráficos do MU e MUV
Gráficos do MU e MUVGráficos do MU e MUV
Gráficos do MU e MUVMiky Mine
 
14.3 derivadas parciais [pt. 1]
14.3 derivadas parciais [pt. 1]14.3 derivadas parciais [pt. 1]
14.3 derivadas parciais [pt. 1]Cristiano Miranda
 
Introdução a mecânica i 10 dias de mecânica
Introdução a mecânica i   10 dias de mecânicaIntrodução a mecânica i   10 dias de mecânica
Introdução a mecânica i 10 dias de mecânicaHelder Guerreiro
 
Transformações lineares
Transformações linearesTransformações lineares
Transformações linearesnaygno
 
Cadeia de Markov em Tempo Contínuo
Cadeia de Markov em Tempo ContínuoCadeia de Markov em Tempo Contínuo
Cadeia de Markov em Tempo ContínuoWadiley Nascimento
 
01 relatório de laboratório nº 02 movimento uniforme (protected) (1)
01 relatório de laboratório nº 02   movimento uniforme (protected) (1)01 relatório de laboratório nº 02   movimento uniforme (protected) (1)
01 relatório de laboratório nº 02 movimento uniforme (protected) (1)Fernanda Souza
 
Questões de progressão geometrica 01
Questões de progressão geometrica 01Questões de progressão geometrica 01
Questões de progressão geometrica 01Deusvaldo Junior
 
Cálculo Numérico - Introdução
Cálculo Numérico - IntroduçãoCálculo Numérico - Introdução
Cálculo Numérico - IntroduçãoKleber Jacinto
 
Física 2º ano ensino médio ondulatória comprimento, frequência, amplitude e...
Física 2º ano ensino médio   ondulatória comprimento, frequência, amplitude e...Física 2º ano ensino médio   ondulatória comprimento, frequência, amplitude e...
Física 2º ano ensino médio ondulatória comprimento, frequência, amplitude e...Tiago Gomes da Silva
 

La actualidad más candente (20)

Calor sensivel e calor latente
Calor sensivel e calor latenteCalor sensivel e calor latente
Calor sensivel e calor latente
 
Distribuição normal
Distribuição normalDistribuição normal
Distribuição normal
 
Gráficos do MU e MUV
Gráficos do MU e MUVGráficos do MU e MUV
Gráficos do MU e MUV
 
Aceleração Escalar
Aceleração EscalarAceleração Escalar
Aceleração Escalar
 
14.3 derivadas parciais [pt. 1]
14.3 derivadas parciais [pt. 1]14.3 derivadas parciais [pt. 1]
14.3 derivadas parciais [pt. 1]
 
Proporcionalidade 19032013
Proporcionalidade 19032013Proporcionalidade 19032013
Proporcionalidade 19032013
 
Apresentacao da aula 1
Apresentacao da aula 1Apresentacao da aula 1
Apresentacao da aula 1
 
Introdução a mecânica i 10 dias de mecânica
Introdução a mecânica i   10 dias de mecânicaIntrodução a mecânica i   10 dias de mecânica
Introdução a mecânica i 10 dias de mecânica
 
Ligaã§ãµes metã¡licas
Ligaã§ãµes metã¡licasLigaã§ãµes metã¡licas
Ligaã§ãµes metã¡licas
 
Transformações lineares
Transformações linearesTransformações lineares
Transformações lineares
 
Cadeia de Markov em Tempo Contínuo
Cadeia de Markov em Tempo ContínuoCadeia de Markov em Tempo Contínuo
Cadeia de Markov em Tempo Contínuo
 
01 relatório de laboratório nº 02 movimento uniforme (protected) (1)
01 relatório de laboratório nº 02   movimento uniforme (protected) (1)01 relatório de laboratório nº 02   movimento uniforme (protected) (1)
01 relatório de laboratório nº 02 movimento uniforme (protected) (1)
 
Capítulo 3
Capítulo 3Capítulo 3
Capítulo 3
 
Matemática básica derivada e integral
Matemática básica   derivada e integralMatemática básica   derivada e integral
Matemática básica derivada e integral
 
Termoquímica
TermoquímicaTermoquímica
Termoquímica
 
Eletrodinâmica
EletrodinâmicaEletrodinâmica
Eletrodinâmica
 
Questões de progressão geometrica 01
Questões de progressão geometrica 01Questões de progressão geometrica 01
Questões de progressão geometrica 01
 
Cálculo Numérico - Introdução
Cálculo Numérico - IntroduçãoCálculo Numérico - Introdução
Cálculo Numérico - Introdução
 
Física 2º ano ensino médio ondulatória comprimento, frequência, amplitude e...
Física 2º ano ensino médio   ondulatória comprimento, frequência, amplitude e...Física 2º ano ensino médio   ondulatória comprimento, frequência, amplitude e...
Física 2º ano ensino médio ondulatória comprimento, frequência, amplitude e...
 
Óptica Geométrica
Óptica GeométricaÓptica Geométrica
Óptica Geométrica
 

Similar a Estevão Zeco (Monografia)- Regressão de Poisson e SIG

Máira Barbosa - Eng. Ambiental
Máira Barbosa - Eng. AmbientalMáira Barbosa - Eng. Ambiental
Máira Barbosa - Eng. AmbientalMáira Barbosa
 
Estimação do parâmetro de perfusão sanguínea em tumores por meio de um algori...
Estimação do parâmetro de perfusão sanguínea em tumores por meio de um algori...Estimação do parâmetro de perfusão sanguínea em tumores por meio de um algori...
Estimação do parâmetro de perfusão sanguínea em tumores por meio de um algori...Ana Roberta Melo
 
Rodolpho barbosa moreira (3)
Rodolpho barbosa moreira (3)Rodolpho barbosa moreira (3)
Rodolpho barbosa moreira (3)Emisael Braulio
 
Analise de sobrevivência pacientes renais Ramires, T.G 2010
Analise de sobrevivência pacientes renais Ramires, T.G 2010Analise de sobrevivência pacientes renais Ramires, T.G 2010
Analise de sobrevivência pacientes renais Ramires, T.G 2010Thiago Gentil Ramires
 
Livro analise de dados amostrais complexos
Livro analise de dados amostrais complexosLivro analise de dados amostrais complexos
Livro analise de dados amostrais complexosDiogo Freire
 
PROTÓTIPO DE SISTEMA WEB PARA UNIFICAR AS INFORMAÇÕES DAS UNIDADES DE SAÚDE M...
PROTÓTIPO DE SISTEMA WEB PARA UNIFICAR AS INFORMAÇÕES DAS UNIDADES DE SAÚDE M...PROTÓTIPO DE SISTEMA WEB PARA UNIFICAR AS INFORMAÇÕES DAS UNIDADES DE SAÚDE M...
PROTÓTIPO DE SISTEMA WEB PARA UNIFICAR AS INFORMAÇÕES DAS UNIDADES DE SAÚDE M...Artur Rocha
 
Impressora 3D no ensino de Física.pdf
Impressora 3D no ensino de Física.pdfImpressora 3D no ensino de Física.pdf
Impressora 3D no ensino de Física.pdfIgoHenrique1
 
A educação ambiental conceitos e abordagens pelos alunos de licenciatura da uff
A educação ambiental conceitos e abordagens pelos alunos de licenciatura da uffA educação ambiental conceitos e abordagens pelos alunos de licenciatura da uff
A educação ambiental conceitos e abordagens pelos alunos de licenciatura da uffVanessa Marcondes
 
Livro Ecofrota
Livro EcofrotaLivro Ecofrota
Livro Ecofrotatrans_smt
 
Segurança da informação aplicação em órgão público
Segurança da informação aplicação em órgão públicoSegurança da informação aplicação em órgão público
Segurança da informação aplicação em órgão públicoIsraelCunha
 
dissertacao_renan_xavier_cortes
dissertacao_renan_xavier_cortesdissertacao_renan_xavier_cortes
dissertacao_renan_xavier_cortesRenan Cortes
 
dissertacao_renan_xavier_cortes
dissertacao_renan_xavier_cortesdissertacao_renan_xavier_cortes
dissertacao_renan_xavier_cortesRenan Cortes
 
FECHANDO O CICLO Os benefícios da economia circular para os países em desen...
FECHANDO O CICLO Os benefícios da economia circular para os países em desen...FECHANDO O CICLO Os benefícios da economia circular para os países em desen...
FECHANDO O CICLO Os benefícios da economia circular para os países em desen...Alexandre Fernandes
 
Estimativa 2016 câncer
Estimativa 2016 câncer Estimativa 2016 câncer
Estimativa 2016 câncer Lidyanne Chaves
 

Similar a Estevão Zeco (Monografia)- Regressão de Poisson e SIG (20)

Máira Barbosa - Eng. Ambiental
Máira Barbosa - Eng. AmbientalMáira Barbosa - Eng. Ambiental
Máira Barbosa - Eng. Ambiental
 
Estimação do parâmetro de perfusão sanguínea em tumores por meio de um algori...
Estimação do parâmetro de perfusão sanguínea em tumores por meio de um algori...Estimação do parâmetro de perfusão sanguínea em tumores por meio de um algori...
Estimação do parâmetro de perfusão sanguínea em tumores por meio de um algori...
 
Estatística
EstatísticaEstatística
Estatística
 
Estatística
EstatísticaEstatística
Estatística
 
Rodolpho barbosa moreira (3)
Rodolpho barbosa moreira (3)Rodolpho barbosa moreira (3)
Rodolpho barbosa moreira (3)
 
Analise de sobrevivência pacientes renais Ramires, T.G 2010
Analise de sobrevivência pacientes renais Ramires, T.G 2010Analise de sobrevivência pacientes renais Ramires, T.G 2010
Analise de sobrevivência pacientes renais Ramires, T.G 2010
 
Livro analise de dados amostrais complexos
Livro analise de dados amostrais complexosLivro analise de dados amostrais complexos
Livro analise de dados amostrais complexos
 
PROTÓTIPO DE SISTEMA WEB PARA UNIFICAR AS INFORMAÇÕES DAS UNIDADES DE SAÚDE M...
PROTÓTIPO DE SISTEMA WEB PARA UNIFICAR AS INFORMAÇÕES DAS UNIDADES DE SAÚDE M...PROTÓTIPO DE SISTEMA WEB PARA UNIFICAR AS INFORMAÇÕES DAS UNIDADES DE SAÚDE M...
PROTÓTIPO DE SISTEMA WEB PARA UNIFICAR AS INFORMAÇÕES DAS UNIDADES DE SAÚDE M...
 
Impressora 3D no ensino de Física.pdf
Impressora 3D no ensino de Física.pdfImpressora 3D no ensino de Física.pdf
Impressora 3D no ensino de Física.pdf
 
A educação ambiental conceitos e abordagens pelos alunos de licenciatura da uff
A educação ambiental conceitos e abordagens pelos alunos de licenciatura da uffA educação ambiental conceitos e abordagens pelos alunos de licenciatura da uff
A educação ambiental conceitos e abordagens pelos alunos de licenciatura da uff
 
Livro Ecofrota
Livro EcofrotaLivro Ecofrota
Livro Ecofrota
 
Edicleia aparecida
Edicleia aparecidaEdicleia aparecida
Edicleia aparecida
 
Segurança da informação aplicação em órgão público
Segurança da informação aplicação em órgão públicoSegurança da informação aplicação em órgão público
Segurança da informação aplicação em órgão público
 
dissertacao_renan_xavier_cortes
dissertacao_renan_xavier_cortesdissertacao_renan_xavier_cortes
dissertacao_renan_xavier_cortes
 
dissertacao_renan_xavier_cortes
dissertacao_renan_xavier_cortesdissertacao_renan_xavier_cortes
dissertacao_renan_xavier_cortes
 
TCC_Edwin-Prado
TCC_Edwin-PradoTCC_Edwin-Prado
TCC_Edwin-Prado
 
Tg rqcl
Tg rqclTg rqcl
Tg rqcl
 
FECHANDO O CICLO Os benefícios da economia circular para os países em desen...
FECHANDO O CICLO Os benefícios da economia circular para os países em desen...FECHANDO O CICLO Os benefícios da economia circular para os países em desen...
FECHANDO O CICLO Os benefícios da economia circular para os países em desen...
 
Estimativa 2016
Estimativa 2016Estimativa 2016
Estimativa 2016
 
Estimativa 2016 câncer
Estimativa 2016 câncer Estimativa 2016 câncer
Estimativa 2016 câncer
 

Último

BRASIL - DOMÍNIOS MORFOCLIMÁTICOS - Fund 2.pdf
BRASIL - DOMÍNIOS MORFOCLIMÁTICOS - Fund 2.pdfBRASIL - DOMÍNIOS MORFOCLIMÁTICOS - Fund 2.pdf
BRASIL - DOMÍNIOS MORFOCLIMÁTICOS - Fund 2.pdfHenrique Pontes
 
Grupo Tribalhista - Música Velha Infância (cruzadinha e caça palavras)
Grupo Tribalhista - Música Velha Infância (cruzadinha e caça palavras)Grupo Tribalhista - Música Velha Infância (cruzadinha e caça palavras)
Grupo Tribalhista - Música Velha Infância (cruzadinha e caça palavras)Mary Alvarenga
 
CRÔNICAS DE UMA TURMA - TURMA DE 9ºANO - EASB
CRÔNICAS DE UMA TURMA - TURMA DE 9ºANO - EASBCRÔNICAS DE UMA TURMA - TURMA DE 9ºANO - EASB
CRÔNICAS DE UMA TURMA - TURMA DE 9ºANO - EASBAline Santana
 
A experiência amorosa e a reflexão sobre o Amor.pptx
A experiência amorosa e a reflexão sobre o Amor.pptxA experiência amorosa e a reflexão sobre o Amor.pptx
A experiência amorosa e a reflexão sobre o Amor.pptxfabiolalopesmartins1
 
QUARTA - 1EM SOCIOLOGIA - Aprender a pesquisar.pptx
QUARTA - 1EM SOCIOLOGIA - Aprender a pesquisar.pptxQUARTA - 1EM SOCIOLOGIA - Aprender a pesquisar.pptx
QUARTA - 1EM SOCIOLOGIA - Aprender a pesquisar.pptxIsabellaGomes58
 
cartilha-pdi-plano-de-desenvolvimento-individual-do-estudante.pdf
cartilha-pdi-plano-de-desenvolvimento-individual-do-estudante.pdfcartilha-pdi-plano-de-desenvolvimento-individual-do-estudante.pdf
cartilha-pdi-plano-de-desenvolvimento-individual-do-estudante.pdfIedaGoethe
 
O Universo Cuckold - Compartilhando a Esposas Com Amigo.pdf
O Universo Cuckold - Compartilhando a Esposas Com Amigo.pdfO Universo Cuckold - Compartilhando a Esposas Com Amigo.pdf
O Universo Cuckold - Compartilhando a Esposas Com Amigo.pdfPastor Robson Colaço
 
ATIVIDADE AVALIATIVA VOZES VERBAIS 7º ano.pptx
ATIVIDADE AVALIATIVA VOZES VERBAIS 7º ano.pptxATIVIDADE AVALIATIVA VOZES VERBAIS 7º ano.pptx
ATIVIDADE AVALIATIVA VOZES VERBAIS 7º ano.pptxOsnilReis1
 
Época Realista y la obra de Madame Bovary.
Época Realista y la obra de Madame Bovary.Época Realista y la obra de Madame Bovary.
Época Realista y la obra de Madame Bovary.keislayyovera123
 
Sociologia Contemporânea - Uma Abordagem dos principais autores
Sociologia Contemporânea - Uma Abordagem dos principais autoresSociologia Contemporânea - Uma Abordagem dos principais autores
Sociologia Contemporânea - Uma Abordagem dos principais autoresaulasgege
 
LEMBRANDO A MORTE E CELEBRANDO A RESSUREIÇÃO
LEMBRANDO A MORTE E CELEBRANDO A RESSUREIÇÃOLEMBRANDO A MORTE E CELEBRANDO A RESSUREIÇÃO
LEMBRANDO A MORTE E CELEBRANDO A RESSUREIÇÃOColégio Santa Teresinha
 
Apresentação | Eleições Europeias 2024-2029
Apresentação | Eleições Europeias 2024-2029Apresentação | Eleições Europeias 2024-2029
Apresentação | Eleições Europeias 2024-2029Centro Jacques Delors
 
Programa de Intervenção com Habilidades Motoras
Programa de Intervenção com Habilidades MotorasPrograma de Intervenção com Habilidades Motoras
Programa de Intervenção com Habilidades MotorasCassio Meira Jr.
 
HORA DO CONTO5_BECRE D. CARLOS I_2023_2024
HORA DO CONTO5_BECRE D. CARLOS I_2023_2024HORA DO CONTO5_BECRE D. CARLOS I_2023_2024
HORA DO CONTO5_BECRE D. CARLOS I_2023_2024Sandra Pratas
 
Modelos de Desenvolvimento Motor - Gallahue, Newell e Tani
Modelos de Desenvolvimento Motor - Gallahue, Newell e TaniModelos de Desenvolvimento Motor - Gallahue, Newell e Tani
Modelos de Desenvolvimento Motor - Gallahue, Newell e TaniCassio Meira Jr.
 
Gerenciando a Aprendizagem Organizacional
Gerenciando a Aprendizagem OrganizacionalGerenciando a Aprendizagem Organizacional
Gerenciando a Aprendizagem OrganizacionalJacqueline Cerqueira
 
trabalho wanda rocha ditadura
trabalho wanda rocha ditaduratrabalho wanda rocha ditadura
trabalho wanda rocha ditaduraAdryan Luiz
 
Regência Nominal e Verbal português .pdf
Regência Nominal e Verbal português .pdfRegência Nominal e Verbal português .pdf
Regência Nominal e Verbal português .pdfmirandadudu08
 
Slides Lição 03, Central Gospel, O Arrebatamento, 1Tr24.pptx
Slides Lição 03, Central Gospel, O Arrebatamento, 1Tr24.pptxSlides Lição 03, Central Gospel, O Arrebatamento, 1Tr24.pptx
Slides Lição 03, Central Gospel, O Arrebatamento, 1Tr24.pptxLuizHenriquedeAlmeid6
 
Investimentos. EDUCAÇÃO FINANCEIRA 8º ANO
Investimentos. EDUCAÇÃO FINANCEIRA 8º ANOInvestimentos. EDUCAÇÃO FINANCEIRA 8º ANO
Investimentos. EDUCAÇÃO FINANCEIRA 8º ANOMarcosViniciusLemesL
 

Último (20)

BRASIL - DOMÍNIOS MORFOCLIMÁTICOS - Fund 2.pdf
BRASIL - DOMÍNIOS MORFOCLIMÁTICOS - Fund 2.pdfBRASIL - DOMÍNIOS MORFOCLIMÁTICOS - Fund 2.pdf
BRASIL - DOMÍNIOS MORFOCLIMÁTICOS - Fund 2.pdf
 
Grupo Tribalhista - Música Velha Infância (cruzadinha e caça palavras)
Grupo Tribalhista - Música Velha Infância (cruzadinha e caça palavras)Grupo Tribalhista - Música Velha Infância (cruzadinha e caça palavras)
Grupo Tribalhista - Música Velha Infância (cruzadinha e caça palavras)
 
CRÔNICAS DE UMA TURMA - TURMA DE 9ºANO - EASB
CRÔNICAS DE UMA TURMA - TURMA DE 9ºANO - EASBCRÔNICAS DE UMA TURMA - TURMA DE 9ºANO - EASB
CRÔNICAS DE UMA TURMA - TURMA DE 9ºANO - EASB
 
A experiência amorosa e a reflexão sobre o Amor.pptx
A experiência amorosa e a reflexão sobre o Amor.pptxA experiência amorosa e a reflexão sobre o Amor.pptx
A experiência amorosa e a reflexão sobre o Amor.pptx
 
QUARTA - 1EM SOCIOLOGIA - Aprender a pesquisar.pptx
QUARTA - 1EM SOCIOLOGIA - Aprender a pesquisar.pptxQUARTA - 1EM SOCIOLOGIA - Aprender a pesquisar.pptx
QUARTA - 1EM SOCIOLOGIA - Aprender a pesquisar.pptx
 
cartilha-pdi-plano-de-desenvolvimento-individual-do-estudante.pdf
cartilha-pdi-plano-de-desenvolvimento-individual-do-estudante.pdfcartilha-pdi-plano-de-desenvolvimento-individual-do-estudante.pdf
cartilha-pdi-plano-de-desenvolvimento-individual-do-estudante.pdf
 
O Universo Cuckold - Compartilhando a Esposas Com Amigo.pdf
O Universo Cuckold - Compartilhando a Esposas Com Amigo.pdfO Universo Cuckold - Compartilhando a Esposas Com Amigo.pdf
O Universo Cuckold - Compartilhando a Esposas Com Amigo.pdf
 
ATIVIDADE AVALIATIVA VOZES VERBAIS 7º ano.pptx
ATIVIDADE AVALIATIVA VOZES VERBAIS 7º ano.pptxATIVIDADE AVALIATIVA VOZES VERBAIS 7º ano.pptx
ATIVIDADE AVALIATIVA VOZES VERBAIS 7º ano.pptx
 
Época Realista y la obra de Madame Bovary.
Época Realista y la obra de Madame Bovary.Época Realista y la obra de Madame Bovary.
Época Realista y la obra de Madame Bovary.
 
Sociologia Contemporânea - Uma Abordagem dos principais autores
Sociologia Contemporânea - Uma Abordagem dos principais autoresSociologia Contemporânea - Uma Abordagem dos principais autores
Sociologia Contemporânea - Uma Abordagem dos principais autores
 
LEMBRANDO A MORTE E CELEBRANDO A RESSUREIÇÃO
LEMBRANDO A MORTE E CELEBRANDO A RESSUREIÇÃOLEMBRANDO A MORTE E CELEBRANDO A RESSUREIÇÃO
LEMBRANDO A MORTE E CELEBRANDO A RESSUREIÇÃO
 
Apresentação | Eleições Europeias 2024-2029
Apresentação | Eleições Europeias 2024-2029Apresentação | Eleições Europeias 2024-2029
Apresentação | Eleições Europeias 2024-2029
 
Programa de Intervenção com Habilidades Motoras
Programa de Intervenção com Habilidades MotorasPrograma de Intervenção com Habilidades Motoras
Programa de Intervenção com Habilidades Motoras
 
HORA DO CONTO5_BECRE D. CARLOS I_2023_2024
HORA DO CONTO5_BECRE D. CARLOS I_2023_2024HORA DO CONTO5_BECRE D. CARLOS I_2023_2024
HORA DO CONTO5_BECRE D. CARLOS I_2023_2024
 
Modelos de Desenvolvimento Motor - Gallahue, Newell e Tani
Modelos de Desenvolvimento Motor - Gallahue, Newell e TaniModelos de Desenvolvimento Motor - Gallahue, Newell e Tani
Modelos de Desenvolvimento Motor - Gallahue, Newell e Tani
 
Gerenciando a Aprendizagem Organizacional
Gerenciando a Aprendizagem OrganizacionalGerenciando a Aprendizagem Organizacional
Gerenciando a Aprendizagem Organizacional
 
trabalho wanda rocha ditadura
trabalho wanda rocha ditaduratrabalho wanda rocha ditadura
trabalho wanda rocha ditadura
 
Regência Nominal e Verbal português .pdf
Regência Nominal e Verbal português .pdfRegência Nominal e Verbal português .pdf
Regência Nominal e Verbal português .pdf
 
Slides Lição 03, Central Gospel, O Arrebatamento, 1Tr24.pptx
Slides Lição 03, Central Gospel, O Arrebatamento, 1Tr24.pptxSlides Lição 03, Central Gospel, O Arrebatamento, 1Tr24.pptx
Slides Lição 03, Central Gospel, O Arrebatamento, 1Tr24.pptx
 
Investimentos. EDUCAÇÃO FINANCEIRA 8º ANO
Investimentos. EDUCAÇÃO FINANCEIRA 8º ANOInvestimentos. EDUCAÇÃO FINANCEIRA 8º ANO
Investimentos. EDUCAÇÃO FINANCEIRA 8º ANO
 

Estevão Zeco (Monografia)- Regressão de Poisson e SIG

  • 1. FACULDADE DE CIÊNCIAS Departamento de Matemática e Informática Trabalho de Licenciatura em Estatística Aplicação do Modelo de Regressão de Poisson e Sistemas de Informação Geográca (SIG) na Análise e Georreferenciação da Ocorrência de Óbitos nos Acidentes Rodoviários na Cidade de Maputo no período de 2018 à 2020 Autor: Estevão Sérgio Zeco Maputo, Dezembro de 2021
  • 2. FACULDADE DE CIÊNCIAS Departamento de Matemática e Informática Trabalho de Licenciatura em Estatística Aplicação do Modelo de Regressão de Poisson e Sistemas de Informação Geográca (SIG) na Análise e Georreferenciação da Ocorrência de Óbitos nos Acidentes Rodoviários na Cidade de Maputo no período de 2018 à 2020 Autor: Estevão Sérgio Zeco Supervisor: Miranda Albino Martins Muaualo, PhD, UFRJ Maputo, Dezembro de 2021
  • 3. . DECLARAÇÃO DE HONRA Declaro por minha honra que o presente Trabalho de Licenciatura é resultado da minha investigação e que o processo foi concebido para ser submetido apenas para a obtenção do grau de Licenciatura em Estatística, na Faculdade de Ciências da Universidade Eduardo Mondlane. Maputo, Dezembro de 2021 (Estevão Sérgio Zeco) i
  • 4. . Dedicatória Dedico este trabalho para toda a minha família, em especial aos meus progenitores, Sérgio Fernando Zeco e Arlinda Dalilo Comé, pelo apoio nanceiro, emocional e pelos ensinamentos construtivos. Por terem conado em mim e apostado nos meus sonhos. i
  • 5. AGRADECIMENTOS Primeiro agradecer à Deus pela vida, protecção e pela chuva de bênçãos que tem me pro- porcionado, e por mais uma conquista alcançada por mim, mas pela graça do Senhor. Aos meus pais, Sérgio Fernando Zeco e Arlinda Dalilo Comé, pelo amor incondicional, pelo apoio, inspiração, conança, conselhos, força, ensinamentos construtivos, que levarei para toda à vida e muito mais. Palavras me faltam para descrever a minha gratidão, pois se hoje cheguei aqui, é graças a eles, então uma parte desse sucesso também é deles. Aos meus irmãos, Ernesto Zeco, Ragildo Zeco, Rasmina Zeco e Sidónia Zeco, pelo apoio incondicional e por terem acreditado e conado em mim. A toda a minha família. Agradecer ao meu supervisor, Prof. Doutor Miranda Muaualo, pela paciência, disponibili- dade e contributos dados no acto da elaboração deste trabalho e também pelos ensinamentos transmitidos como meu professor ao longo do curso. Que para além de ter sido o meu su- pervisor e meu professor, é uma das minhas fontes de inspiração, pois tem me dado muitos conselhos construtivos, que pretendo levar para a vida toda e transmitir para os outros. Aos professores da Secção de Estatística do DMI-UEM, por todo o saber ensinado, com muito comprometimento e dedicação, em especial ao Prof. Doutor Alberto Mulenga, pelas suas úteis recomendações práticas e teóricas, desde a escolha do tema até ao desenvolvimento do trabalho, e pelos demais conhecimentos transmitidos, dentro e fora da academia. Ao Dr. Jonas Nassabe e ao Prof. Doutor Rachid Muleia, pelos ensinamentos transmitidos durante a formação e a todos os funcionários do DMI-UEM. Ao Dr João Calenga, pelos vários conhecimentos transmitidos academicamente e prossio- nalmente, desde o apoio durante a realização do curso e até o m do curso. Pelos conselhos, apoio, conança e por ser uma das minhas fontes de inspiração, como pessoa e como um bom prossional. Ao Departamento de Trânsito, do Comando da PRM da Cidade de Maputo, por terem me recebido para fazer a recolha de dados, em especial aos agentes Anibal Cumbe, Délcio Guambe e Filomena Caferina, pelas instruções, disponibilidade e paciência. A todos os meus colegas e amigos, Amélia Chichava, Alfredo Manhiça, Carmalino Ncuaze, Charnice Mathe, David Mondlane, Esperança Zefanias, Januário Manhiça, José Luís, José Tivane, Lindre Duarte, Nelson Basílio, Neima Candeia, Nelson Chone, Nunes Lisboa, Omar Sucuma, em especial a Winna Mabunda, pelo companheirismo, ensinamento, amizade e por lhe considerar como uma irmã para mim. Aos meus vizinhos, Iazalde Lisboa e a sua esposa Belinda Lisboa, pelos conselhos, apoio e en- ii
  • 6. sinamentos. A todos aqueles que não foram mencionados, mas que directa ou indirectamente contribuíram para a realização deste trabalho. Muito obrigado a todos! Na angústia, invoquei ao Senhor e clamei ao meu Deus; desde o seu templo ouviu a minha voz e aos seus ouvidos chegou o meu clamor perante a sua face (Salmos 18:6) Porque te não inclinarás diante de outro deus; pois o nome do Senhor é Zeloso; Deus zeloso é ele (Êxodo 34:14) iii
  • 7. Resumo Os acidentes rodoviários são considerados um grande problema de saúde pública a nível mundial, apesar do número exacto de acidentes e vítimas nunca vir a ser conhecido em rigor. Este estudo tem como objectivo analisar e georreferenciar a ocorrência de óbitos nos acidentes rodoviários na cidade de Maputo. Foram usados dados de acidentes rodoviários da cidade de Maputo, no período de 2018 à 2020, fornecidos pelo Comando da PRM da cidade de Maputo, Departamento de Trânsito. A análise foi feita mediante a aplicação da Regressão de Poisson, desde a estimação dos parâmetros até a previsão (dentro e fora da amostra) do número de óbitos, e a georreferenciação foi feita através da aplicação dos Sistemas de Informação Geográca (SIG). Constatou-se que o número esperado de óbitos de 2018 à 2020 foi de 0.56 (1), com mínimo e moda 0 (zero), e máximo de cinco (5) óbitos por acidente. A georreferenciação, mostrou que o distrito de Kamavota é que registou mais óbitos (144), com média 0.50 (1). A previsão e georreferenciação feita dentro da amostra, resultou em 21 óbitos, dos quais treze (13) no distrito de Kamubukwana e oito (8) no distrito de Kalhamankulo, e fora da amostra 20 óbitos, dos quais dez (10) no distrito de Kamubukwana e dez (10) no distrito de Kalhamankulo. O estudo mostra que há uma necessidade de criação de campanhas educativas com o foco no comportamento dos condutores. Palavras-chave: Regressão de Poisson; Georreferenciação; Acidentes Rodoviários; Óbitos. iv
  • 8. Abstract Road accidents are considered a major public health problem worldwide, although the exact number of accidents and victims will never be fully known. The study aims to analyze and georeference the occurrence of deaths in road accidents in the city of Maputo. Data from road accidents in the city of Maputo, in the period 2018 to 2020, provided by the Command of the PRM of the city of Maputo, Department of Transit, were used. The analysis was performed by applying the Poisson Regression, from the estimation of the parameters to the prediction (inside and outside the sample) of the number of deaths, and the georeferencing was done through the application of Geographic Information Systems (GIS). It was found that the expected number of deaths from 2018 to 2020 was 0.56 (1), with a minimum and mode of 0, and a maximum of ve (5) deaths by accident. The georeferencing showed that the district of Kamavota registered more deaths (144), with an average of 0.50 (1). The prediction and georeferencing made within the sample resulted in 21 deaths, of which thirteen (13) in the district of Kamubukwana and eight (8) in the district of Kalhamankulo, and out of the sample 20 deaths, of which ten (10) in the district of Kamubukwana and ten (10) in Kalhamankulo district. The study shows that there is a need to create educational campaigns focusing on drivers' behavior. Keywords: Poisson Regression; Georeferencing; Road Accidents; Deaths. v
  • 9. Lista de Abreviaturas AIC Akaike's Information Criterion CIP Centro de Integridade Pública de Moçambique Gl Graus de liberdade EAM Erro Absoluto Médio EAMP Erro Absoluto Médio Percentual INAV Instituto Nacional de Viação INE Instituto Nacional de Estatística ITF Internacional Transport Forum MLG Modelos Lineares Generalizados OMS Organização Mundial da Saúde PRM Polícia da República de Moçambique QME Quadrado Médio do Erro SIG Sistemas de Informação Geográca WHO World Health Organization vi
  • 10. Índice 1 INTRODUÇÃO 1 1.1 Contextualização . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1.2 Problema de Pesquisa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 1.3 Objectivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 1.3.1 Objectivo Geral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 1.3.2 Objectivos Especícos . . . . . . . . . . . . . . . . . . . . . . . . . . 3 1.4 Relevância do Estudo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 1.5 Estrutura do Trabalho . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 2 REVISÃO DE LITERATURA 6 2.1 Acidentes Rodoviários . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 2.1.1 Conceitos básicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 2.1.2 Acidentes Rodoviários no Mundo . . . . . . . . . . . . . . . . . . . . 7 2.1.3 Acidentes Rodoviários em Moçambique . . . . . . . . . . . . . . . . . 9 2.1.4 Acidentes Rodoviários na Cidade de Maputo . . . . . . . . . . . . . . 12 2.2 Modelos Lineares Generalizados . . . . . . . . . . . . . . . . . . . . . . . . . 13 2.3 Regressão de Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 2.3.1 Teste de Ajustamento a Distribuição de Poisson . . . . . . . . . . . . 16 2.3.2 Estimação dos Parâmetros do Modelo de Regressão de Poisson . . . . 16 2.3.3 Selecção de Modelos . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 2.3.4 Diagnóstico do Modelo de Regressão Poisson . . . . . . . . . . . . . . 18 2.4 Análise de Resíduos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20 2.4.1 Resíduo de Pearson . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 2.4.2 Resíduo de Deviance . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 2.4.3 Resíduos Padronizados . . . . . . . . . . . . . . . . . . . . . . . . . . 21 vii
  • 11. 2.4.4 Analise Gráca dos Resíduos . . . . . . . . . . . . . . . . . . . . . . . 22 2.5 Simulação Monte Carlo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 2.5.1 Tipos de Geradores de Números Aleatórios . . . . . . . . . . . . . . . 23 2.6 Medidas de Erro de Previsão . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 2.6.1 Soma dos Quadrados dos Erros . . . . . . . . . . . . . . . . . . . . . 24 2.6.2 Quadrado Médio do Erro . . . . . . . . . . . . . . . . . . . . . . . . . 24 2.6.3 Erro Absoluto Médio . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 2.6.4 Erro Absoluto Médio Percentual . . . . . . . . . . . . . . . . . . . . . 24 2.6.5 Erro Médio Percentual . . . . . . . . . . . . . . . . . . . . . . . . . . 25 2.6.6 Viés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 2.7 Sistemas de Informação Geográca . . . . . . . . . . . . . . . . . . . . . . . 25 2.7.1 Georreferenciação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 2.8 Estudos Similares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 3 MATERIAL E MÉTODOS 28 3.1 Classicação da Pesquisa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 3.1.1 Quanto à abordagem . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 3.1.2 Quanto aos objectivos . . . . . . . . . . . . . . . . . . . . . . . . . . 28 3.1.3 Quanto aos procedimentos . . . . . . . . . . . . . . . . . . . . . . . . 28 3.2 Material . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 3.2.1 Fonte de dados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 3.2.2 Pacotes utilizados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30 3.3 Métodos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30 3.3.1 Estatística Descritiva . . . . . . . . . . . . . . . . . . . . . . . . . . . 30 3.3.2 Sistemas de Informação Geográca . . . . . . . . . . . . . . . . . . . 30 3.3.3 Regressão de Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . 30 4 RESULTADOS E DISCUSSÃO 33 4.1 Análise Descritiva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 4.1.1 Distribuição do Número de Óbitos por Ano . . . . . . . . . . . . . . 33 4.1.2 Distribuição do Número de Óbitos por Sexo e Idade do Condutor . . 34 4.1.3 Distribuição do Número de Óbitos por Tipo de Veículo . . . . . . . . 35 4.1.4 Distribuição do Número de Óbitos por Dia da Semana e Hora de Ocor- rência . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35 viii
  • 12. 4.1.5 Distribuição do Número de Óbitos por Tipo e Causa do Acidente . . 36 4.2 Georreferenciação dos Acidentes Rodoviários na Cidade de Maputo . . . . . 37 4.3 Modelo de Regressão de Poisson . . . . . . . . . . . . . . . . . . . . . . . . . 39 4.3.1 Teste de Ajustamento a Distribuição de Poisson . . . . . . . . . . . . 39 4.3.2 Estimação dos Parâmetros do Modelo . . . . . . . . . . . . . . . . . . 39 4.3.3 Selecção do Modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41 4.3.4 Diagnósticos do Modelo . . . . . . . . . . . . . . . . . . . . . . . . . 42 4.3.5 Análise de Resíduos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 4.3.6 Interpretação dos Parâmetros Estimados . . . . . . . . . . . . . . . . 48 4.3.7 Previsão e Georreferenciação . . . . . . . . . . . . . . . . . . . . . . . 51 4.4 Discussão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52 5 CONCLUSÕES e RECOMENDAÇÕES 55 5.1 Conclusões . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 5.2 Recomendações . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56 REFERÊNCIAS BIBLIOGRÁFICAS 57 ANEXOS 61 ix
  • 13. Lista de Figuras 2.1 Variação da distribuição do número de óbitos por tipo de utente rodoviário com a região do Mundo - 2010. . . . . . . . . . . . . . . . . . . . . . . . . . 7 2.2 Taxas de mortalidade nos países lusófonos e outros países em 2010: (a) por habitante e (b) por veículo registado. . . . . . . . . . . . . . . . . . . . . . . 8 2.3 Evolução do número de acidentes rodoviários em Moçambique de 2010 à 2017. 10 2.4 Distribuição do número de óbitos nos acidentes rodoviários em Moçambique de 2010 à 2017. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 2.5 Evolução do número de acidentes rodoviários na Cidade Maputo de 2010 à 2017. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 4.1 Distribuição do número de óbitos por ano. . . . . . . . . . . . . . . . . . . . 34 4.2 Distribuição do número de óbitos por Sexo (A) e Idade (B) do Condutor. . . 34 4.3 Distribuição do número de óbitos por Tipo de Veículo. . . . . . . . . . . . . 35 4.4 Distribuição do número de óbitos por Dia da Semana (A) e Hora de ocorrência (B). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36 4.5 Distribuição do Número de Óbitos por Distritos Urbanos. . . . . . . . . . . . 38 4.6 Distribuição do Número Esperado de Óbitos por Distritos Urbanos. . . . . . 38 4.7 Distribuição do número de óbitos. . . . . . . . . . . . . . . . . . . . . . . . . 39 4.8 Valores observados e modelo ajustado de Poisson. . . . . . . . . . . . . . . . 45 4.9 Grácos semi-normais para detectar outliers usando resíduos de Pearson (A) e Deviance (B). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46 4.10 Grácos semi-normais para detectar outliers usando resíduos padronizados de Pearson (A) e Deviance (B). . . . . . . . . . . . . . . . . . . . . . . . . . . . 46 4.11 Distâncias de Cook para as estimativas dos coecientes. . . . . . . . . . . . . 47 4.12 Georreferenciação do número de óbitos previsto dentro e fora da amostra. . . 52 5.1 Envelopes simulados para os resíduos de Pearson (A) e Deviance (B). . . . . 61 x
  • 14. 5.2 Envelopes simulados para os resíduos Padronizados Pearson (A) e Deviance (B). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61 5.3 Distâncias de Cook para as estimativas dos coecientes das variáveis Distrito e Dias da Semana. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62 5.4 Distâncias de Cook para as estimativas dos coecientes das variáveis Horas e Causa do Acidente. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62 5.5 Distâncias de Cook para as estimativas dos coecientes das variáveis Tipo de Acidente e Idade do Condutor. . . . . . . . . . . . . . . . . . . . . . . . . . . 62 xi
  • 15. Lista de Tabelas 2.1 Funções de ligação canônica de algumas distribuições da família exponencial. 14 3.1 Descrição e classicação das variáveis do estudo. . . . . . . . . . . . . . . . . 29 4.1 Estatísticas descritivas do número de óbitos. . . . . . . . . . . . . . . . . . . 33 4.2 Distribuição do número de óbitos por Tipo e Causa do Acidente. . . . . . . . 37 4.3 Teste de Qui-Quadrado para Ajustamento a Distribuição de Poisson. . . . . 39 4.4 Estimação dos parâmetros do modelo pelo método de máxima verossimilhança. 40 4.5 Selecção de modelos pelo método stepwise backward. . . . . . . . . . . . . . 41 4.6 Teste de Razão de Verossimilhança para signicância global. . . . . . . . . . 42 4.7 Teste de Wald para a signicância individual dos parâmetros. . . . . . . . . 43 4.8 Teste de Dispersão. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44 4.9 Medidas de erro da previsão dentro da amostra. . . . . . . . . . . . . . . . . 51 5.1 Valores selecionadas dentro da amostra pela Simulação Monte Carlo. . . . . 63 5.2 Valores gerados fora da amostra pela Simulação Conte Carlo. . . . . . . . . . 64 5.3 Previsão do número de óbitos dentro e fora da amostra. . . . . . . . . . . . . 65 xii
  • 16. Capítulo 1 INTRODUÇÃO 1.1 Contextualização Os acidentes rodoviários constituem um fenómeno amplo e complexo, e encontram a sua maior manifestação no espaço urbano. Apesar das medidas e políticas em matéria de Segu- rança Rodoviária, os acidentes continuam a representar um grave problema da actualidade quer na perspectiva económica, devido aos avultados custos e recursos envolvidos, quer na perspectiva social tendo em conta o número de vidas perdidas a cada ano, pois são custos inaceitáveis em qualquer sociedade moderna. Nas cidades dos países em vias de desenvolvimento, como no caso de Moçambique, o cres- cimento acelerado do número de veículos automóveis em circulação nas estradas, sem no entanto, se fazer acompanhar pela devida expansão da rede rodoviária ou pelo melhora- mento das vias existentes, têm resultado em congestionamento das rodovias que muitas vezes culminam em acidentes rodoviários (Bonzo, 2004). De acordo com WHO (2009), o elevado número de acidentes rodoviários observados em Moçambique e no mundo revela a necessidade da realização de estudos técnico-cientícos visando a redução, sobretudo, do número de vidas perdidas nessas ocorrências. A ocorrência de acidentes rodoviários é de natureza multifactorial, sendo encontrada na literatura referência aos factores ligados às condições ambientais das vias, às condições me- cânicas dos veículos e aos factores humanos (WHO, 2015; Alavi et al., 2017). Embora seja importante considerar o componente aleatório dos sinistros viários, a maior parte dos aci- 1
  • 17. CAPÍTULO 1. INTRODUÇÃO 2 dentes de trânsito que ocorrem em todo o mundo é previsível e prevenível (WHO, 2015). Há, em todo o mundo, uma necessidade de se melhorar a segurança rodoviária com o objec- tivo de reduzir o número de mortes nas estradas. Muitos acidentes são causados por factores que são conhecidos e podem ser evitados. Estes incluem o excesso de velocidade ou sob a inuência de álcool, corte de prioridade, a má travessia dos peões, entre outros. Em muitos países desenvolvidos o número de mortes em acidentes rodoviários tende a diminuir, devido à aplicação de medidas adequadas para melhorar a segurança rodoviária. De acordo com Vieira (2013), a utilização de Sistemas de Informação Geográca (SIG), como ferramenta de georreferenciação de acidentes rodoviários, tendo como base uma rede rodoviária em formato digital, apresenta vantagens assinaláveis, quer no que diz respeito à rapidez e facilidade de visualização da disposição dos mesmos, quer na recolha e associação de informação relevante segundo critérios de base geográca e de acordo com a informação alojada em bases de dados existentes, que por sua vez se podem associar umas às outras, permitindo relacionar informações importantes e provenientes de fontes distintas, desde que contenham campos em comum. 1.2 Problema de Pesquisa Diariamente, por todo o mundo, milhares de pessoas morrem por consequência de acidentes rodoviários. Independentemente do sexo, idade ou condição social, esta é uma fatalidade que atinge todos os utentes do sistema rodoviário, sejam eles condutores, passageiros ou peões. Quer se desloquem a pé, de bicicleta ou em veículo motorizado, para a escola, ou a caminho do trabalho, a caminhar nas ruas ou nas bermas das estradas, em pequenos trajectos ou em viagens longas, são muitos os que nunca mais voltam para casa, deixando para trás famílias e comunidades destroçadas. Os acidentes rodoviários são considerados um grande problema de saúde pública a nível mundial. Segundo WHO (2013), em 2030 os acidentes rodoviários estarão entre as cinco principais causas de morte no mundo. Anualmente em Moçambique as autoridades têm divulgado a morte de cerca de 1.700 pessoas nas diversas estradas do país. Mas a WHO estima que o número real de mortes seja superior a 8.000 (WHO, 2015). Autor: Estevão Zeco 2 Licenciatura em Estatística - UEM
  • 18. CAPÍTULO 1. INTRODUÇÃO 3 Para o Instituto Nacional de Estatística (2018), de 2012 à 2017 quase em todas as províncias houve redução do número de acidentes, mas em Maputo Província e Maputo Cidade, foram as que mais acidentes registaram ao longo do período, Cabo Delgado e Niassa com menos acidentes. Esse fenómeno tem sido proporcional ao número de mortes. A georreferenciação de dados da ocorrência de óbitos nos acidentes rodoviários facilita a interpretação dos dados e permite a utilização de ferramentas de análise espacial em ambiente ArcGis, conseguindo-se trabalhar a informação de forma a obter os resultados pretendidos. Nesse contexto, surgem as seguintes perguntas: ˆ Qual é o número esperado de óbitos num acidente rodoviário na cidade de Maputo? ˆ Qual é a distribuição georreferencial de óbitos nos acidentes rodoviários na cidade de Maputo? 1.3 Objectivos 1.3.1 Objectivo Geral Analisar e georreferenciar a ocorrência de óbitos nos acidentes rodoviários na cidade de Maputo no período de 2018 à 2020. 1.3.2 Objectivos Especícos ˆ Caracterizar de óbitos nos acidentes rodoviários na cidade de Maputo no período de 2018 à 2020; ˆ Georreferenciar de óbitos nos acidentes rodoviários na cidade de Maputo no período de 2018 à 2020; ˆ Estimar parâmetros de um modelo de Regressão de Poisson para o número de óbitos num acidente rodoviário na cidade de Maputo; ˆ Prever o número de óbitos em dez (10) acidentes rodoviários na cidade de Maputo e fazer a sua georreferenciação. Autor: Estevão Zeco 3 Licenciatura em Estatística - UEM
  • 19. CAPÍTULO 1. INTRODUÇÃO 4 1.4 Relevância do Estudo Todos os dias circulam nas estradas milhões de veículos, possibilitando a mobilidade de pes- soas e mercadorias. Apesar das suas inegáveis vantagens, a intensa circulação rodoviária resulta em altos níveis de acidentes, seja por circunstâncias afectas aos condutores, aos veí- culos ou às condições das estradas. Com o elevado número de óbitos provocados por acidentes rodoviários, surgiu a necessidade de se fazer este estudo com o tema Aplicação do Modelo de Regressão de Poisson e Sistemas de Informação Geográca (SIG) na Análise e Georreferenciação da Ocorrência de Óbitos nos Acidentes Rodoviários na Cidade de Maputo no período de 2018 à 2020, com vista a pro- porcionar um contributo à problemática acima referida. A motivação do foco na cidade de Maputo deveu-se ao facto de ser a capital do país e com uma maior densidade populacional. Julga-se pertinente o estudo, uma vez que existem poucos estudos em Moçambique que pro- curam analisar a ocorrência de óbitos nos acidentes rodoviários na cidade de Maputo, desde a sua caracterização, georreferenciação e a previsão dos mesmos. A análise realizada e os resultados alcançados em relação a ocorrência de óbitos nos acidentes rodoviários na cidade de Maputo, poderão servir de alerta ou guia aos órgãos gestores do sistema rodoviário na planicação de acções adequadas com o objectivo de reduzir signica- tivamente as mortes provocadas pelos acidentes rodoviários. 1.5 Estrutura do Trabalho O presente trabalho está constituído por cinco capítulos, nomeadamente: O Capítulo 1 (In- trodução), trata da contextualização, denição do problema, objectivos e a relevância do estudo; O Capítulo 2 (Revisão de Literatura), trata de Acidentes Rodoviários no contexto geral, Ocorrência de Óbitos nos Acidentes Rodoviários no Mundo, em Moçambique e no caso concreto da Cidade de Maputo, conceitos básicos dos Modelos Lineares Generalizados (MLG), Análise de Regressão de Poisson, desde os conceitos básicos, estimação dos parâme- tros do modelo, selecção do modelo (stepwise), diagnóstico do modelo, Análise de Resíduos, Simulação Monte Carlo, Medidas de Erro de Previsão, Sistemas de Informação Geográca Autor: Estevão Zeco 4 Licenciatura em Estatística - UEM
  • 20. CAPÍTULO 1. INTRODUÇÃO 5 (SIG) e por último Estudos Similares. O Capítulo 3 (Material e Métodos), apresenta a Fonte de Dados, junto com a descrição das variáveis do estudo, softwares utilizados e por m foi feita a descrição da metodologia usada (Estatística Descritiva, Sistemas de Informação Geográca e Análise de Regressão de Poisson) e seus passos para o alcance dos objectivos denido no trabalho. O Capítulo 4 (Resultados e Discussão) apresenta os resultados da aná- lise de dados de forma estatística (Estatística Descritiva e Análise de Regressão de Poisson) e geográca (mapas) e por m é feita a discussão dos resultados obtidos, comparando os re- sultados obtidos com outros estudos existentes. Por último temos o Capítulo 5 (Conclusões e Recomendações), onde são apresentadas as conclusões do trabalho e recomendações. Autor: Estevão Zeco 5 Licenciatura em Estatística - UEM
  • 21. Capítulo 2 REVISÃO DE LITERATURA 2.1 Acidentes Rodoviários Nesta secção faz-se abordagem da ocorrência de óbitos nos acidentes rodoviários, porém, antes dessa abordagem, existem alguns conceitos que importa conhecer para os contextualizar nos capítulos a seguir apresentados. Assim, indicam-se de seguida algumas denições que se julgam ser fundamentais (INE, 2020; INAV, 2010): 2.1.1 Conceitos básicos ˆ Acidente rodoviário é a ocorrência na via pública ou que nela tenha origem envol- vendo pelo menos um veículo, do conhecimento das entidades scalizadoras e da qual resultem vítimas e/ou danos materiais. ˆ Vítima é o ser humano que, em consequência de acidente, sofra danos corporais. ˆ Morto/Vítima mortal é a vítima cujo óbito ocorre no local do acidente ou durante o percurso até à unidade de saúde. ˆ Ferido grave é a vítima de acidente cujos danos corporais obriguem a um período de hospitalização superior a 24 horas. ˆ Ferido ligeiro é a vítima de acidente que não seja considerada ferido grave. ˆ Condutor é a pessoa que detém o comando de um veículo ou animal na via pública. ˆ Peão é a pessoa que transita a pé na via pública e em locais sujeitos à legislação rodoviária. 6
  • 22. CAPÍTULO 2. REVISÃO DE LITERATURA 7 2.1.2 Acidentes Rodoviários no Mundo Anualmente no mundo morrem quase 1.25 milhões de pessoas em resultado directo de aci- dentes rodoviários. Admitindo a relação entre os números de mortos, os de feridos graves e os feridos ligeiros, determinada por análise epidemiológica, globalmente os acidentes ro- doviários originam 18 milhões de feridos graves e 85 milhões de feridos ligeiros (WHO, 2004). As previsões realizadas pela Organização Mundial de Saúde em 2014 apontavam para que entre 2000 e 2010 estes números tivessem um crescimento global de 65%, sendo que a taxa prevista para os países de baixo e médio rendimento era de um aumento de 80% (WHO, 2004). Na realidade, fruto do reconhecimento mundial deste problema e das intervenções havidas, aos níveis global, regional, nacional e local, o número anual de mortos em acidentes rodoviários tem permanecido estável desde 2000, nos 1,25 milhões (WHO, 2015). Georreferenciação da Distribuição do número de Óbitos por tipo de Utente Ro- doviário com a Região do Mundo Figura 2.1: Variação da distribuição do número de óbitos por tipo de utente rodoviário com a região do Mundo - 2010. Fonte: WHO (2015). Autor: Estevão Zeco 7 Licenciatura em Estatística - UEM
  • 23. CAPÍTULO 2. REVISÃO DE LITERATURA 8 Na Figura 2.1, evidencia-se um aspecto importante do fenómeno, que é o de haver diferenças signicativas nas características da sinistralidade das várias regiões tradicionalmente consi- deradas pela Organização Mundial de Saúde (OMS). Anota-se todas as referidas regiões são homogéneas, havendo exemplos de estudos em que se revelou vantajosa a consideração de apenas parte dos países de uma região, por haver diferenças muito marcadas em subconjun- tos de países, é o caso de estudo promovido pelo Internacional Transport Forum (ITF), em que apenas são considerados os países latino-americanos da região das Américas (Viera e Cardoso, 2016). Taxas de Mortalidade nos Países Lusófonos e Outros Países Na Figura 2.2, apresentam-se as taxas de mortalidade, por habitante e por veículo do parque automóvel. Nesta gura a escala das taxas de mortalidade por habitante (a) é natural; a das taxas de mortalidade (b) por veículo é logarítmica (Viera e Cardoso, 2016). Figura 2.2: Taxas de mortalidade nos países lusófonos e outros países em 2010: (a) por habitante e (b) por veículo registado. Fonte: Viera e Cardoso (2016). Autor: Estevão Zeco 8 Licenciatura em Estatística - UEM
  • 24. CAPÍTULO 2. REVISÃO DE LITERATURA 9 Os países lusófonos estão relativamente distribuídos no que se refere às taxas de mortos por 100.000 habitantes; já no caso das taxas de mortalidade por 100.000 veículos, vericou-se que os países se agrupam nas extremidades da distribuição dos países analisados, com apenas o Brasil e Cabo Verde situando-se nas taxas intermédias (Viera e Cardoso, 2016). Comparando as taxas de mortalidade por habitante de cada país com a taxa média da região do Mundo onde se situam vericou-se que Moçambique, São Tomé e Príncipe, Cabo Verde, Angola e Açores têm valores inferiores à média das respectivas regiões; enquanto que Timor- Leste, Guiné Bissau, Madeira, Portugal Continental e Brasil têm valores superiores (Viera e Cardoso, 2016). 2.1.3 Acidentes Rodoviários em Moçambique Moçambique é o país com elevada percentagem de mortes de peões com 68%, Zâmbia com 50%, Malawi com 45%, África do Sul com 39%, Tanzânia com 37%, seguindo por esta ordem Suazilândia 35%, Maurícias com 29%, Seychelles com 28%, Namíbia com 27% e Zimbabwe com 26%. No entanto, a elevada percentagem de mortes em Moçambique é o facto de o ambiente de trânsito ser formado principalmente por peões, há um número elevado de pes- soas vendendo pequenas mercadorias ao longo das estradas. Os peões formam uma massa de caminhantes que reectem necessidades de circulação para efeitos de trabalho, compras, negócios entre outras actividades (Machava, 2011). No País os acidentes de rodoviários têm estado a aumentar, como resultado de crescimento acelerado do parque automóvel, características do condutor do veículo, o estado de vias de acesso, o estado do ambiente e de conservação dos veículos, entre outros. Como consequência disso, anualmente são registados, em média, quatro mil acidentes de viação, resultando em mais de duas mil vítimas, entre mortos e feridos graves (INE, 2018; CIP, 2014). A Figura 2.3, mostra a evolução do número de acidentes rodoviários em Moçambique no período de 2010 à 2017, onde constatou-se o número de acidentes registou uma redução a partir do ano 2010 até 2017, ou seja, o número de acidentes têm tendência decrescente. Autor: Estevão Zeco 9 Licenciatura em Estatística - UEM
  • 25. CAPÍTULO 2. REVISÃO DE LITERATURA 10 Figura 2.3: Evolução do número de acidentes rodoviários em Moçambique de 2010 à 2017. Fonte: CIP (2014); INE (2018). Distribuição do Número de Óbitos nos Acidentes Rodoviários Figura 2.4: Distribuição do número de óbitos nos acidentes rodoviários em Moçambique de 2010 à 2017. Fonte: CIP (2014); INE (2018). Autor: Estevão Zeco 10 Licenciatura em Estatística - UEM
  • 26. CAPÍTULO 2. REVISÃO DE LITERATURA 11 Em Moçambique, as estatísticas consolidadas de acidentes rodoviários nos últimos 8 anos (de 2010 à 2017) revelam que foram registados 24.182 acidentes, envolvendo cerca de 51.259 vítimas, tirando a vida de 16.019 pessoas. A Figura 2.4, mostra que o número de óbitos reduziu em 2010 para 2012, de 2012 para 2014 aumento, atingindo um pico de 2.649 óbitos e reduzindo de 2014 para 2017, atingindo deste modo o número mais baixo de 1.354 óbitos. Ainda na Figura 2.4, constatou-se que em 2014 houveram mais óbitos, com mais de 2.649 pessoas, este acontecimento tem vindo a preocupar as autoridades policiais (Polícia de Trân- sito), pois constitui um grande problema social e económico, ceifando milhares de vidas por ano. Tipo de Acidente e sua Frequência As autoridades policiais moçambicanas (Polícia de Trânsito), perante um acidente, têm considerando os seguintes acidentes: Atropelamento, Choque entre carros, Despiste e capo- tamento, Choque entre carros e motos, Choque com obstáculos xos, Queda de passageiros, entre outros. Os atropelamentos são os que mais contribuem nas estatísticas dos acidentes rodoviários, o que demonstra a vulnerabilidade do peão nas nossas estradas. Os acidentes rodoviários registados pela Polícia da República de Moçambique em 2017, os acidentes de tipo atrope- lamento ocorreram com maior frequência, correspondendo a 43,6%, os choques entre carros seguiram com 26,4%. A menor frequência de acidentes foi do tipo queda de passageiros com 2,5% (INE, 2018). Outro aspecto é o facto de as mortes por acidentes de viação afectarem principalmente a população activa do sexo masculino, ou seja, a faixa etária dos 25 aos 31 anos de idade, aparece como um maior contribuinte nas estatísticas das mortes por acidentes de viação em muitos casos na condição de condutores (INAV, 2010). Causas dos Acidentes Rodoviários Para Moçambique segundo o balanço feito da quadra festiva 2009-2010 no dia 18 de janeiro de 2010 que envolveu as instituições responsáveis pela segurança rodoviária nomeadamente Ministério do Interior, Ministério dos Transportes e comunicações e Ministérios das obras públicas e Habitação consideram principais causas de acidentes (Machava, 2011): Autor: Estevão Zeco 11 Licenciatura em Estatística - UEM
  • 27. CAPÍTULO 2. REVISÃO DE LITERATURA 12 ˆ Excesso de velocidade; ˆ Álcool; ˆ Ultrapassagem irregular; ˆ Trânsito fora da mão; ˆ Mau estado técnico de alguns veículos; ˆ Transporte de passageiros em veículos não apropriado. O Governo aponta o factor humano, excesso de velocidade, ultrapassagens irregulares, con- dução em estado de embriaguez, má travessia do peão, como sendo o principal factor de crescimento do número de acidentes rodoviários nos últimos dias (CIP, 2014). 2.1.4 Acidentes Rodoviários na Cidade de Maputo A cidade Maputo é caracterizada por ter a menor superfície e uma maior densidade popula- cional. De acordo com Figura 2.5, constatou-se que na Cidade de Maputo, de 2010 à 2014 houve uma redução no número de acidentes, de 2014 à 2015 houve um aumento de cerca de 92% e de 2015 à 2017 o número de acidentes rodoviários reduziu. Figura 2.5: Evolução do número de acidentes rodoviários na Cidade Maputo de 2010 à 2017. Fonte: CIP (2014); INE (2018). Autor: Estevão Zeco 12 Licenciatura em Estatística - UEM
  • 28. CAPÍTULO 2. REVISÃO DE LITERATURA 13 Óbitos nos Acidentes Rodoviários De acordo com o relatório do INE (2018), na cidade de Maputo em 2015 registou-se em média 9.9% de óbitos, em 2016 registou uma média de 10.1% de óbitos e em 2017 uma média de 13.3%, mostrando deste modo uma tendência crescente. O que mostra que os acidentes rodoviários vêm tirando muitas vidas. 2.2 Modelos Lineares Generalizados Em problemas onde o objectivo é estudar a relação entre as variáveis, os estatísticos utilizam modelos de regressão. Existem várias metodologias estatísticas que permitem explicar ou descrever a relação entre uma variável de interesse (variável resposta) e uma ou mais variá- veis (variáveis explicativas). O modelo linear é talvez o mais utilizado para modelar esta relação. Este modelo assume, entre outras, que o valor esperado da variável resposta é uma combinação linear das variáveis explicativas e que a variável resposta segue a distribuição Normal. Esta teoria da modelação estatística é limitada, pois não pode ser utilizada se a distribuição da variável resposta é diferente da Normal. Para a resolução deste problema, o modelo linear generalizado foi in- troduzido em 1972, por Nelder e Wedderburn. São vários os modelos lineares generalizados, nesse estudo considera-se apenas a Regressão de Poisson. De acordo com o Schmidt (2003) os modelos lineares generalizados representam a união de modelos lineares e não-lineares com uma distribuição da família exponencial, que é formada pela distribuição normal, poisson, binomial, gama, normal inversa e incluem modelos linea- res tradicionais (erros com distribuição normal), bem como modelos logísticos. Desde 1972, inúmeros trabalhos relacionados com modelos lineares generalizados foram pu- blicados, resultando em diversas ferramentas computacionais, como por exemplo, GLIM (Generalized Linear Interactive Models), S-Plus, R, SAS, STATA e SUDAAN, bem como extensões desses modelos (Paula, 2004). Os MLG são denidos por uma distribuição de probabilidade, membro da família exponencial de distribuições, e são formados pelas seguintes componentes (Tadano et al., 2007): Autor: Estevão Zeco 13 Licenciatura em Estatística - UEM
  • 29. CAPÍTULO 2. REVISÃO DE LITERATURA 14 ˆ Componente aleatória- n variáveis explicativas x1, . . . , xn, de uma variável resposta que segue uma distribuição da família exponencial com o valor esperado E(yi) = µ; ˆ Componente sistemática- compõe uma estrutura linear para o modelo de regressão η = βxT , chamado de preditor linear, onde xT = (xi1, xi2, . . . , xnp), i = 1, 2, . . . , n são as chamadas variáveis explicativas; ˆ Função de ligação- uma função monótona e diferenciável g, chamada de função de ligação, capaz de conectar as componentes aleatória e sistemática, ou seja, relaciona a média da variável resposta (µ) à estrutura linear, denida nos MLG por g(µ) = η, onde: η = β0 + β1xi1 + · · · + βpxnp (2.1) ou na forma matricial η = βxT (2.2) Cada distribuição tem uma função de ligação especial, chamada de função de ligação canônica que ocorre quando η = θi, onde θ é o chamado parâmetro de localização ou parâmetro canônico, conforme ilustra a Tabela 2.1 (McCullagh; Nelder, 1989). Tabela 2.1: Funções de ligação canônica de algumas distribuições da família exponencial. Distribuição Função de ligação canônica (η) Normal µ Poisson ln µ Binomial ln µ/(1 − µ) Gama µ−1 Gaussiana Inversa µ−2 De acordo com Myers e Montgomery (2002), a utilização da função de ligação canônica implica algumas propriedades interessantes, porém não quer dizer que deva ser utilizada sempre. Essa escolha é conveniente porque, além de simplicar as estimativas dos parâmetros do modelo, também facilita o cálculo do intervalo de conança para a média da variável resposta. Contudo, a conveniência não implica necessariamente em qualidade de ajuste do modelo. Autor: Estevão Zeco 14 Licenciatura em Estatística - UEM
  • 30. CAPÍTULO 2. REVISÃO DE LITERATURA 15 2.3 Regressão de Poisson Uma das técnicas bastante utilizada em estudos de previsão do número de acidentes rodo- viários, são os Modelos Lineares Generalizados, concretamente a Regressão de Poisson. De acordo com Turkman Silva (2000), o modelo de regressão de Poisson desempenha um papel fundamental na análise de dados de contagem. Estes tipos de dados assumem valores discretos (0, 1, 2, . . . ), reectindo o número de ocorrências de um acontecimento em um período de tempo xo. De acordo com Gujarati (2008), distribuição de Poisson é dada por: f(Y ) = e−µ µY Y ! Y = 0, 1, 2, . . . (2.3) em que f(Y ) denota a probabilidade de que a variável Y assuma valores inteiros não negativos e Y! (lê-se factorial de Y) é representado por Y ! = Y ×(Y −1)×(Y −2)×(Y −3)×· · ·×2×1. Pode ser demonstrado que E(Y ) = µ V ar(Y ) = µ Note um aspecto interessante da distribuição de Poisson: sua variância é a mesma que o valor médio. O modelo de regressão de Poisson pode ser escrito como: Yi = E(Yi) + µi = µi + µi (2.4) em que os Y são distribuídos independentemente como variáveis aleatórias de Poisson com média µi para cada indivíduo expresso como µi = E(Yi) = β0 + β1x1i + β2x2i + · · · + βkxkn (2.5) em que os X são algumas das variáveis que poderiam afectar o valor médio. Para ns de estimação, escrevemos o modelo como: f(Y ) = e−µ µY Y ! + ui (2.6) sendo µ substituído pela Equação (2.5) Como podemos ver, o modelo de regressão resultante terá parâmetros não lineares, necessitando da estimação de uma regressão não linear. Autor: Estevão Zeco 15 Licenciatura em Estatística - UEM
  • 31. CAPÍTULO 2. REVISÃO DE LITERATURA 16 2.3.1 Teste de Ajustamento a Distribuição de Poisson De acordo com Mulenga (2018), o teste de χ2 pode normalmente ser utilizado para vericar se uma determinada distribuição de frequências obedece a correspondente distribuição de probabilidades. Para testes de ajustamento de dados a distribuições teóricas, se a função densidade da distribuição for completamente especicada, com um número de m parâmetros desconhecidos têm-se: χ2 obs = X f0(yi) − fe(yi) 2 fe(yi) ∩ χ2 (n − m − 1, α) (2.7) ˆ Hipóteses a testar Ho : Y ∼ po(λ), (Y segue a distribuição de Poisson) H1 : Y 6= po(λ), (Y não segue a distribuição de Poisson) ˆ Regra de decisão: Rejeita-se a hipótese nula (H0), se o p-value associado à estatística deste teste for menor que o nível de signicância escolhido, caso contrário não. 2.3.2 Estimação dos Parâmetros do Modelo de Regressão de Pois- son De acordo com Paulo (2019), para estimar os parâmetros, utiliza-se o método de estimação de máxima verossimilhança. A função de verossimilhança para o modelo de regressão de Poisson é dado por: L(β) = n Y i=1 exp (−µ)µyi yi! (2.8) e a função de log-verossimilhança é dado por: `(β) = n X i=1 [−µi + yi ln (µi) − ln (yi!)] (2.9) Como µi = exp(xT i β), vem `(β) = n X i=1 [− exp(xT i β) + yi(xT i β) − ln (yi!)] (2.10) Portanto, maximizando a função de log-verossimilhança `(β) com respeito a β temos: ∂`(β) ∂βj = n X i=1 [yi − exp(xT i β)] xi = 0, j = 0, 1, 2, . . . , p (2.11) Autor: Estevão Zeco 16 Licenciatura em Estatística - UEM
  • 32. CAPÍTULO 2. REVISÃO DE LITERATURA 17 e as equações de verossimilhança para β são: ∂`(β) ∂βj = n X i=1 [yi − exp(xT i β)] xi = 0, j = 0, 1, 2, . . . , p (2.12) A função desvio no modelo de regressão de Poisson é denida pela seguinte expressão, D(Y, µ̂) = 2 n X i=1 n yi ln yi µ̂i − (yi − µ̂i) o (2.13) A função desvio reduz-se a (Y, µ̂) = 2 n X i=1 n yi ln yi µ̂i o (2.14) para modelos com termo constante, β0, porque neste caso n X i=1 (yi − µ̂i) = 0 (2.15) A estatística de Pearson generalizada é denida por χ2 = n X i=1 (yi − µ̂i)2 µ̂i (2.16) 2.3.3 Selecção de Modelos A selecção de modelos é uma parte importante de toda a investigação em modelação estatís- tica e envolve a procura de um modelo que seja o mais simples possível e que descreva bem os dados observados. Na prática há geralmente um elevado número de variáveis que podem ser potencialmente importantes para explicar a variabilidade da variável resposta. Isto implica a existência de vários modelos com combinações diferentes das variáveis explicativas para explicar o fenómeno em causa, o que torna o processo da selecção mais difícil e mais moroso. Para facilitar o processo da selecção vários investigadores utilizaram o método de selecção stepwise. Método de Stepwise O método stepwise é um procedimento automático de selecção de variáveis em direcção backward, forward e both (Alvarenga, 2015). ˆ A direcção forward inicia-se a partir de um modelo nulo e adiciona uma de cada vez as variáveis que podem ser signicativas para explicar a variabilidade da variável resposta. O modelo nulo é um modelo simples com apenas um parâmetro que representa o mesmo valor médio µ para todas as observações yi. Autor: Estevão Zeco 17 Licenciatura em Estatística - UEM
  • 33. CAPÍTULO 2. REVISÃO DE LITERATURA 18 ˆ O caso da direcção backward é ao contrário da direcção forward, inicia-se a partir de um modelo completo e verica a cada passo se uma variável pode ser ou não eliminada do modelo. O modelo completo ou saturado é o maior modelo que temos a possibilidade de considerar. Dada uma amostra com n observações, o número máximo de parâmetros para esse modelo é igual a n, isto é, um parâmetro para cada observação. ˆ O método both stepwise é uma combinação dos dois métodos (forward e backward). A fase de incluir ou excluir a variável do modelo é a fase de avaliação da signicância das variáveis ou comparação dos modelos. Para isso utilizam-se medidas estatísticas adequadas para a sua avaliação. 2.3.4 Diagnóstico do Modelo de Regressão Poisson Depois de obter as estimativas para os coecientes de Regressão de Poisson é necessário avaliar a sua signicância e a qualidade do ajuste do modelo, isto é, determinar se as va- riáveis independentes introduzidas no modelo estão signicativamente associadas à variável dependente (Hosmer e Lemeshow, 2013). Para esse efeito recorremos à estatística da razão de verossimilhança e à estatística de Wald. Teste da Razão de Verossimilhança De acordo com Alvarenga (2015), o teste da razão de verossimilhança é utilizado para com- parar a qualidade do ajustamento de dois modelos, isto é, modelos em que um tem o subcon- junto de variáveis do outro modelo. Também se pode dizer que este teste avalia a signicância dos coecientes estimados simultaneamente, ou seja, verica se o modelo estimado é global- mente signicativo. Dados dois modelos , Mp e Mq, com um número de variáveis p e q respectivamente, tal que p q, para comparar a qualidade de ajustamento de dois modelos aplica-se o teste da razão de verossimilhança, sob a hipótese de que as q −p variáveis no modelo não apresentam acréscimo signicativo na qualidade do modelo (Alvarenga, 2015). Autor: Estevão Zeco 18 Licenciatura em Estatística - UEM
  • 34. CAPÍTULO 2. REVISÃO DE LITERATURA 19 ˆ Hipóteses a testar      Ho : β1 = β2 = β3 = · · · = βp = 0 H1 : Pelo menos um dos parametros difere de zero A estatística de teste e a respectiva distribuição, sob a validade de H0 G = −2 ln LMp(β) ln LMq(β) # ∩ χ2 q−p (2.17) onde ln LMp(β) é a função logaritmo da verossimilhança do modelo Mp com p variáveis e ln LMq(β) é a função logaritmo da verossimilhança do modelo Mq com q variáveis. Teste de Wald De acordo com Alvarenga (2015), o teste de Wald é utilizado para testar a hipótese nula de que o parâmetro βi estimado é igual a zero. ˆ Hipóteses a testar      Ho : βi = 0 H1 : βi 6= 0 A estatística de teste e a respectiva distribuição, sob a validade de H0 são: Wi = β̂i s(β̂i) ∩ N(0, 1) (2.18) Teste de Dispersão A superdispersão é um problema que ocorre frequentemente na prática quando se aplica o modelo de regressão de Poisson, surgindo quando a variância da variável resposta é superior ao valor esperado. Outro problema menos comum, mas que tem ganhado a atenção nos estudos de regressão para dados de contagem é a subdispersão, surge quando a variância da variável resposta é menor ao valor esperado (Paulo, 2019). Os critérios que indicam a superdispersão aparente do modelo de regressão de Poisson são (Hilbe, 2011): Autor: Estevão Zeco 19 Licenciatura em Estatística - UEM
  • 35. CAPÍTULO 2. REVISÃO DE LITERATURA 20 ˆ O modelo omite importantes variáveis explicativas; ˆ Os dados incluem outliers; ˆ O modelo não inclui um número suciente de termos de interação; ˆ Uma variável explicativa precisa ser transformada em outra escala; ˆ Há situações em que os dados são muito escassos e mais dados precisam ser recolhidos e incluídos no modelo; e ˆ Valores ausentes existem nos dados, mas não são distribuídos aleatoriamente nos dados. De acordo com Santos (2013), para identicar a superdispersão nos dados, utiliza-se a devi- ance. O cálculo é baseado na aproximação χ2 do desvio residual. Se existir a superdispersão, então D φ segue uma distribuição Qui-Quadrado com n - p graus de liberdade, e isso leva ao seguinte estimador para φ . φ = D n − p (2.19) Se a estimativa deste parâmetro for menor ou igual a um, então não existe superdispersão nos dados, prosseguindo-se com o processo de validação do modelo. Caso seja maior que um, é uma indicação da existência de superdispersão. ˆ Hipóteses a testar Ho : φ ≤ 1 (Há equidispersão nos dados) H1 : φ 1 (Não há equidispersão nos dados) ˆ Regra de decisão: Rejeita-se a hipótese nula (H0), se o p-value associado à estatística deste teste for menor que o nível de signicância escolhido, caso contrário não. 2.4 Análise de Resíduos De acordo com Turkman e Silva (2000), a análise de resíduos é útil, para avaliar a qualidade de ajustamento de um modelo no que diz respeito à escolha da distribuição, da função de ligação e de termos do preditor linear, como também identicar observações mal ajustadas pelo modelo. As técnicas usadas para a análise de resíduos nos modelos lineares generalizados são seme- lhantes ao do modelo clássico de regressão. Para a i-ésima observação dene-se o resíduo como a diferença entre o valor observado (Yi) e o valor estimado (Ŷi) pelo modelo. Autor: Estevão Zeco 20 Licenciatura em Estatística - UEM
  • 36. CAPÍTULO 2. REVISÃO DE LITERATURA 21 2.4.1 Resíduo de Pearson O resíduo de Pearson é calculado pela seguinte expressão: rip = Yi − Ŷi q V (Ŷi) , i = 1, 2, . . . , n (2.20) O resíduo rip corresponde à contribuição da i-ésima observação para o cálculo da estatística de Pearson generalizada, dada pela seguinte expressão: χ2 = n X i=1 (Yi − Ŷi)2 V (Ŷi) , i = 1, 2, . . . , n (2.21) onde V (Ŷi) é a função de variância estimada para a distribuição do modelo em estudo. 2.4.2 Resíduo de Deviance O resíduo da deviance correspondente à i-ésima observação é dado por: rD = sinal(Yi − Ŷi) p di (2.22) Onde di é a contribuição da i-ésima observação para a medida deviance. 2.4.3 Resíduos Padronizados Para uma análise adequada dos resíduos é necessário que eles sejam padronizados pelo res- pectivo desvio padrão. ˆ O resíduo de Pearson Padronizado é dado por: riE = Yi − Ŷi q V (Ŷi)(1 − hii) (2.23) Onde hii são os valores da diagonal da matriz de projecção: H = W1/2 X(X0 WX)−1 X0W1/2 (2.24) ˆ O resíduo da Deviance Padronizado é dado por: riE = rD p (1 − hii) (2.25) Autor: Estevão Zeco 21 Licenciatura em Estatística - UEM
  • 37. CAPÍTULO 2. REVISÃO DE LITERATURA 22 2.4.4 Analise Gráca dos Resíduos Gráco de índices De acordo com Marciano (2009), o gráco de índices é utilizado para localizar observações com resíduo, leverage hii, distância de Cook modicada. Pode ser útil na detecção de observações que destoam da tendência geral das demais observações, indicando um possível outlier. Resíduos versus valores ajustados Muito utilizado para vericar a constância de variância (McCullagh e Nelder, 1989) para a distribuição em uso, e em geral se utiliza algum tipo de resíduo padronizado. O que se espera é que o gráco apresente a distribuição dos resíduos em torno de zero com amplitude constante, onde desvios sistemáticos podem ter algum tipo de curvatura ou uma amplitude muito diferente com o valor ajustado. Gráco semi-normal de probabilidades (Half Normal Plots) De acordo com Marciano (2009), a construção do gráco semi-normal de probabilidades é o resultado do conjunto de pontos obtidos por valores absolutos de um quantil amostral versus os valores do quantil correspondente da distribuição normal zi em que zi = φ−1 (i + n − 0.125)/(2n + 0.5). Gráco normal de probabilidades (Normal Plots) com envelopes Weisberg (2005) analisa que o gráco normal de probabilidades se destaca por dois aspec- tos: a identicação da distribuição originária dos dados e a identicação de valores que se destacam no conjunto de observações. Os envelopes, no caso dos MLG's com distribuições diferentes da normal, são construídos com os resíduos sendo gerados a partir do modelo ajustado (Williams, 1987). 2.5 Simulação Monte Carlo A técnica de Monte Carlo consiste em gerar valores aleatórios para cada distribuição de probabilidades dentro de um modelo com o objectivo de produzir centenas ou milhares de cenários. O método é especialmente bem-adaptado para a resolução de problemas de Autor: Estevão Zeco 22 Licenciatura em Estatística - UEM
  • 38. CAPÍTULO 2. REVISÃO DE LITERATURA 23 natureza estatística, mas pode também ser usado noutros tipos de problema, especialmente quando a obtenção de uma solução exacta é muito difícil ou impossível de obter (Gentle, 2003). Dada a sua natureza estatística, a Simulação Monte Carlo é sobretudo um método computacional de resolução de problemas, tendo o seu desenvolvimento e campo de aplicação, acompanhado a evolução dos computadores (Prado, 2004). 2.5.1 Tipos de Geradores de Números Aleatórios Os geradores de números aleatórios podem ser classicados de acordo com os tipos de nú- meros que podem ser gerados (Gentle, 2003; Prado,2004): ˆ Números Aleatórios: a principal característica desses números é o facto de serem completamente imprevisíveis. Estes só podem ser gerados por algum processo físico natural, como por exemplo decaimentos radioactivos. ˆ Números Pseudo-Aleatórios: são os mais utilizados, sendo gerados em computador por meio de algum algoritmo simples. Portanto, não são números aleatórios. ˆ Números Quasi-Aleatórios: também são gerados por algum algoritmo numérico simples. Contudo, eles são produzidos de maneira que sejam distribuídos o mais uni- formemente possível. Esta metodologia é empregada no Método de Quasi-Monte Carlo. 2.6 Medidas de Erro de Previsão Segundo Chopra (2003), um bom modelo de previsão deve captar a componente sistemática, mas não o componente aleatório. Sendo que esse componente aleatório se manifesta na forma de erro de previsão o qual deve ser acompanhado com critério. Para isso foram desenvolvidas várias técnicas (indicadores) para dimensionar o erro e dessa maneira conseguir-se melhorar as estimativas, comparando-se várias técnicas para gerar a previsão e, assegurando-se a técnica utilizada é a com menor erro, além disso, pode-se através do acompanhamento do erro (Pacheco, 2007). Para tomar a decisão da melhor forma possível indica que se deve fazer uma análise completa dos erros por dois motivos (Chopra, 2003): ˆ Utilizar a análise de erros para determinar se o modelo de previsão adotado está pre- vendo detalhadamente a componente sistemática; Autor: Estevão Zeco 23 Licenciatura em Estatística - UEM
  • 39. CAPÍTULO 2. REVISÃO DE LITERATURA 24 ˆ Estimar o erro de previsão para que possa ser desenhado um plano de contingência responsável por tal erro. Para avaliar a comparação entre modelos de previsão são utilizadas diversas estatísticas que medem a distância entre o modelo e os dados sendo que as mais frequentes estão descritas abaixo (Chopra, 2003; Pacheco, 2007): 2.6.1 Soma dos Quadrados dos Erros Esse indicador é uma simples soma dos erros ao quadrado, dessa maneira consegue eliminar os valores negativos dos erros e tem-se uma medida de erro que mede apenas a distância não podendo medir o viés da previsão, tanto positivo quanto negativo, a expressão a seguir é utilizada para esse cálculo: SQE = n X i=1 (Yi − Ŷi)2 (2.26) 2.6.2 Quadrado Médio do Erro Essa métrica é a média dos erros calculada pela SQE, para melhorar a interpretação dos resultados e é dado pela fórmula: QME = 1 n × n X i=1 (Yi − Ŷi)2 (2.27) 2.6.3 Erro Absoluto Médio Essa métrica é usada para avaliar as previsões através da soma dos erros absolutos. Utiliza-se essa técnica quando o analista quer vericar a distância entre o predito e o realizado e, assim utilizar a mesma unidade de medida dos dados, facilitando assim a compreensão do erro, como as técnicas anteriores esse indicador não mostra o viés do modelo caso exista algum e é dado pela fórmula: EAM = 1 n × n X i=1 |Yi − Ŷi| (2.28) 2.6.4 Erro Absoluto Médio Percentual O EAMP é um dos indicadores mais usados para vericar a acurácia da previsão, por ser de fácil compreensão e interpretação podendo gerar uma comparação entre diferentes unidades por se tratar de percentual. Esse indicador trata-se do erro absoluto divido pelo real assim Autor: Estevão Zeco 24 Licenciatura em Estatística - UEM
  • 40. CAPÍTULO 2. REVISÃO DE LITERATURA 25 você tem a distância em % do predito em relação ao realizado, para gerar um indicador único é calculado a média desses percentuais, através da seguinte expressão: EAMP = Pn i=1 Yi − Ŷi Yi × 100 n (2.29) 2.6.5 Erro Médio Percentual Quando é necessário vericar se um método de previsão está retornando uma previsão muito alta ou muito baixa, utiliza-se esse método, assim é possível vericar se existe viés de alta ou baixa na previsão. Se a média encontrada for próxima de zero então não existe viés, se for uma percentagem negativa, a previsão está errando para baixo, se for positivo então a previsão está errada para cima. O EMP é calculado pela seguinte expressão: EMP = 1 n × n X i=1 Yi − Ŷi Yi (2.30) 2.6.6 Viés O Viés é utilizado para estimar se o modelo de previsão superestima ou subestima a demanda, para estimar o Viés pode-se utilizar a soma dos erros da previsão: V IES = 1 n × n X i=1 (Yi − ˆ Yi) (2.31) 2.7 Sistemas de Informação Geográca Sistemas de Informação Geográca é um conjunto de programas, equipamentos, metodolo- gias, dados e pessoas (usuário), perfeitamente integrados, de forma a tornar possível a co- lecta, o armazenamento, o processamento e a análise de dados georreferenciados, bem como a produção de informação derivada de sua aplicação. A utilização dos SIGs vem crescendo rapidamente em todo o mundo, uma vez que possibilita uma melhor gestão de informações e consequente melhoria nos processos de tomada de decisões em várias áreas (Filho Iochpe, 2008). Autor: Estevão Zeco 25 Licenciatura em Estatística - UEM
  • 41. CAPÍTULO 2. REVISÃO DE LITERATURA 26 2.7.1 Georreferenciação De acordo com Braceiro (2015), entende-se por georreferenciação todo o processo de loca- lização geográca de determinado objecto espacial, através da atribuição de coordenadas a esses mesmos objectos. Uma das vantagens claras da georreferenciação de dados é conseguir obter e trabalhar a informação sob a forma de mapa, em formato digital, numa plataforma SIG, ou seja, facilita a interpretação dos dados e permite a utilização de ferramentas de análise espacial em ambiente ArcGis, conseguindo-se trabalhar a informação de forma a obter os resultados pretendidos (Braceiro, 2015). 2.8 Estudos Similares Em relação à ocorrência de acidentes, diversos autores se dedicam ao estudo de variáveis que segundo eles se tornam mais relevantes que outras na participação em acidentes rodoviá- rios. Esta preferência por determinadas variáveis no estudo de acidentes rodoviários ocorre quase que naturalmente conforme a linha de investigação e de atuação prossional de cada autor. Um estudo similar, foi desenvolvido por Balaniuk. R et al (2018), cujo o objectivo era iden- ticar os principais factores contribuintes dos acidentes e relatar acções governamentais para a redução de mortes e lesões no trânsito. Onde tiveram como conclusão que à pista dupla, tanto para condutores do sexo feminino quanto do sexo masculino, evidenciou-se a falta de atenção como principal causa presumível dos acidentes. As evidências encontradas quanto à falta de atenção de quem conduz o veículo, assim como também de velocidade incompatível, ultrapassagem indevida e ingestão de álcool, nas causas presumíveis dos acidentes na amos- tra deste estudo, reforçam a necessidade de investimento em campanhas educativas com o foco no comportamento daqueles que conduzem veículos nas vias públicas, em uma direcção defensiva e na obediência às regras de trânsito. Um estudo desenvolvido pelo americano Zlatoper (1991), que tinha como objectivo o uso da regressão de mínimos quadrados para estimar um modelo de mortes de indivíduos nos veículos motorizados nos Estados Unidos. O modelo inclui vários factores considerados em Autor: Estevão Zeco 26 Licenciatura em Estatística - UEM
  • 42. CAPÍTULO 2. REVISÃO DE LITERATURA 27 estudos transversais anteriores dessas fatalidades. As estimativas sugerem que a renda, a proporção entre direcção urbana e rural, gastos com polícia rodoviária e segurança, leis de inspeção de veículos automotores e leis de uso de cinto de segurança para adultos com dispo- sições secundárias de aplicação estão inversamente relacionadas às taxas de mortalidade de veículos motorizados. Eles também indicam que o volume de direcção, velocidade, variação de velocidade, densidade de direcção, consumo de álcool, temperatura e uma variável dummy para estados ocidentais estão directamente relacionados às taxas. Um outro estudo foi desenvolvido por Alvarenga (2015), que tinha como objectivo modelar a ocorrência de acidentes rodoviários por dia, aplicando a metodologia de regressão de Poisson. Onde concluiu-se que os modelos desenvolvidos apresentaram o problema de superdispersão (regressão de Poisson) e a alternativa foi a regressão Binomial Negativa, onde foram mais adequados para ajustar aos dados que os desenvolvidos com a regressão de Poisson. As variáveis explicativas utilizadas foram o dia da semana, o facto desse dia ser feriado ou não, os meses ou as estações do ano. Os resultados da análise demonstraram que o número de acidentes ocorridos por dia é melhor explicado pelas variáveis dia da semana (com sete categorias), meses do ano e os dias feriados. Autor: Estevão Zeco 27 Licenciatura em Estatística - UEM
  • 43. Capítulo 3 MATERIAL E MÉTODOS 3.1 Classicação da Pesquisa 3.1.1 Quanto à abordagem Como o objectivo da pesquisa é analisar fenómenos a partir de quanticações, aplicando técnicas estatísticas e geográcas, então trata-se de uma pesquisa com abordagem quanti- tativa. De acordo com Fonseca (2002), os resultados da pesquisa quantitativa podem ser quanticados. A pesquisa quantitativa recorre à linguagem matemática para descrever as causas de um fenómeno, as relações entre variáveis, etc. 3.1.2 Quanto aos objectivos Quanto aos objectivos, trata-se de uma pesquisa explicativa, uma vez que o estudo visa analisar e georreferenciar a ocorrência de óbitos nos acidentes rodoviários. De acordo com Gil (2007), este tipo de pesquisa preocupa-se em identicar os factores que determinam ou que contribuem para a ocorrência dos fenómenos, ou seja, este tipo de pesquisa explica o porquê das coisas através dos resultados oferecidos. 3.1.3 Quanto aos procedimentos A pesquisa ex-post-facto tem por objectivo investigar possíveis relações de causa e efeito entre um determinado facto identicado pelo pesquisador e um fenómeno que ocorre pos- teriormente. A principal característica deste tipo de pesquisa é o facto de os dados serem coletados após a ocorrência dos eventos (Fonseca, 2002). Assim sendo, o estudo da ocorrência de óbitos nos acidentes rodoviários, quanto aos procedimentos é uma pesquisa ex-post-facto. 28
  • 44. CAPÍTULO 3. MATERIAL E MÉTODOS 29 3.2 Material 3.2.1 Fonte de dados O presente estudo, foi realizado com dados secundários de acidentes rodoviários da cidade de Maputo, no período de 2018 à 2020, fornecidos pelo Comando da PRM da cidade de Maputo, Departamento de Trânsito, na área de acidentes rodoviários. A base de dados é composta por 995 observações e 10 variáveis. A Tabela 3.1 mostra a descrição das variáveis. Tabela 3.1: Descrição e classicação das variáveis do estudo. Variáveis Descrição Classicação Ano* 2018, 2019 e 2020 Variável quantitativa Distrito Kamavota, Kamaxaquene, Kampfumo, Variável qualitativa urbano* Kalhamankulo e Kamububwuana Tipo de veículo* Ligeiro, Pesado e Outros Variável qualitativa Dia da semana* Domingo à Sábado Variável qualitativa Hora de 00h00-05h59, 06h00-11h59, 12h00-17h59 e Variável quantitativa ocorrência* 18h00-23h59 Óbitos** Número de óbitos Variável quantitativa Idade do Menos de 18, 18-35 anos , 36-45 anos, Variável quantitativa condutor* 46-55 anos, 56-65 anos e +65 anos Sexo do condutor* Masculino e Feminino Variável qualitativa Causa do Excesso de velocidade, Consumo de álcool, acidente* Má travessia do peão, Corte de prioridade e Variável qualitativa Outras causas Atropelamento, Choque entre carros, Despiste e capotamento, Tipo de Choque entre carros e outros, Variável qualitativa acidente* Choque entre carros e motos, Choque com obstáculos xos, Queda de passageiros e Outros tipos (*) Variável independente (**) Variável dependente Autor: Estevão Zeco 29 Licenciatura em Estatística - UEM
  • 45. CAPÍTULO 3. MATERIAL E MÉTODOS 30 3.2.2 Pacotes utilizados No presente trabalho, foi utilizado o software ArcGis versão 10.8 para a produção de mapas; Software R versão 3.6.0 para o processamento dos dados; Microsoft Excel 2019 para realização de alguns cálculos e grácos; e LaTeX versão 4.0 para edição do texto. 3.3 Métodos 3.3.1 Estatística Descritiva De acordo com Mulenga (2018), a estatística descritiva é o ramo ou parte da estatística cujo o objectivo é a observação de fenómenos de mesma natureza, recolha, organização, classica- ção, análise e interpretação de dados sem deixar de calcular algumas medidas (estatísticas), que permitem resumidamente descrever o fenómeno estudado. 3.3.2 Sistemas de Informação Geográca A georreferenciação de ocorrências de óbitos por via acidentes em redes viárias digitais traz enormes vantagens, no que diz respeito à facilidade de visualização da distribuição dos mes- mos e na extracção de informação importante, segundo critérios de base geográca. A forma mais prática e directa de o fazer é carregar as coordenadas cartesianas dos locais onde ocorreram os acidentes num SIG, o que permitiu o mapeamento das ocorrências dos óbitos por via de acidentes rodoviários na rede, a identicação dos distritos com maior pretensão para a ocorrência dessas mortes, sejam passados, bem como futuros (mortes previstas) 3.3.3 Regressão de Poisson Diversos estudos sobre os dados de contagem utilizam a metodologia de regressão de Poisson como modelo padrão para a análise deste tipo de dados. A razão pela qual o modelo de regressão de Poisson é considerado a metodologia base na modelação de dados de contagens é o facto de assumir apenas valores inteiros não negativos para o valor esperado da variável resposta (Lord e Mannering, 2010). Autor: Estevão Zeco 30 Licenciatura em Estatística - UEM
  • 46. CAPÍTULO 3. MATERIAL E MÉTODOS 31 De acordo com Fávero e Belore (2017), poderemos estimar um modelo de regressão de Poisson, denido da seguinte forma: ln(Ŷi) = ln(µ̂i) = ˆ β0 + ˆ β1X1i + ˆ β2X2i + · · · + ˆ βkXkn (3.1) que também é chamado de modelo log-linear. Sendo assim, o número esperado de ocorrências em dada exposição, para determinada observação i, pode ser escrito como: µ̂i = e ˆ β0+ ˆ β1X1i+ ˆ β2X2i+···+ ˆ βkXkn (3.2) em que β̂i representa a constante, β̂i(i = 1, 2, . . . , k) são os parâmetros estimados de cada variável explicativa, X são as variáveis explicativas e o subscrito i representa cada observação da amostra (i = 1, 2, . . . , n, em que n é o tamanho da amostra). Nota:Todos os testes foram realizados considerando um nível de signicância de 5% (α = 0.05) e com a seguinte regra de decisão: rejeita-se a hipótese nula (H0), se o p-value associado à estatística deste teste for menor que o nível de signicância, caso contrário não. ˆ Para vericar se a variável dependente (número de óbitos) segue a distribuição de poisson, usou-se o teste de ajustamento a distribuição de Poisson descrito na secção 2.3.1. ˆ Para a estimação dos parâmetros do modelo de regressão foi utilizado o Método da Máxima Verossimilhança descrito na secção 2.3.2. ˆ Para facilitar o processo de decisão acerca de quais variáveis explicativas selecionar no modelo de regressão, foi utilizado o método de stepwise, concretamente backward, descrito na secção 2.3.3. ˆ Para fazer o diagnóstico do modelo, testou-se a signicância global e individual dos parâmetros utilizando os testes de Razão de Verossimilhança e Wald, e vericou-se a existência de superdispersão, com o teste de Deviance, descrito na secção 2.3.4. ˆ Para a análise de resíduos, usou-se os resíduos de Pearson, Deviance e Padroniza- dos, conforme descrito na secção 2.4. Autor: Estevão Zeco 31 Licenciatura em Estatística - UEM
  • 47. CAPÍTULO 3. MATERIAL E MÉTODOS 32 Previsão ˆ A previsão foi feita em dois critérios: (1) dentro da amostra, através de uma amostra selecionada aleatoriamente dentro da base de dados e (2) fora da amostra, através de valores gerados pela Simulação Monte Carlo. De salientar que a previsão foi feita para uma amostra de 10 acidentes. ˆ Nas simulações realizadas no trabalho, utilizou-se números pseudo-aleatórios, gerados pela função runif(n, min, max), disponível no R studio. Essa função gera uma sequên- cia de números com distribuição uniforme com um mínimo zero (0) e um máximo um (1), conforme descrito na secção 2.5.1. ˆ A m de avaliar as previsões e assim dimensionar o erro e dessa maneira conseguir-se melhorar as estimativas e assegurando-se de que a técnica utilizada é a com menor erro, calculou-se o Quadrado Médio do Erro (QME), Erro Absoluto Médio (EAM) e o Erro Absoluto Médio Percentual (EAMP), conforme descrito na secção 2.6. ˆ Por m foi feita a georreferenciação dos valores previstos (dentro e fora da amostra). Autor: Estevão Zeco 32 Licenciatura em Estatística - UEM
  • 48. Capítulo 4 RESULTADOS E DISCUSSÃO 4.1 Análise Descritiva 4.1.1 Distribuição do Número de Óbitos por Ano A Tabela 4.1, mostra a distribuição global do número de óbitos nos acidentes rodoviários no período de 2018 à 2020, na cidade de Maputo, onde constatou-se que o mínimo e a moda é de zero (0) óbito por acidente rodoviário, (mediana = 1) tendo a metade dos acidentes resultado em zero (0) óbito e a outra metade resultando em acima de um (1) óbito, com um valor esperado de um (0.56 ≈ 1) óbito por acidente, uma variabilidade de 0.75 e tendo atingido um máximo de cinco (5) óbitos por acidente. Tabela 4.1: Estatísticas descritivas do número de óbitos. Mínimo Moda Mediana Média Variância Desvio Padrão Máximo 0.00 0.00 1.00 0.56 0.56 0.75 5.00 Em relação a distribuição desagregada do número de óbitos nos acidentes rodoviários por ano (2018 à 2020), constatou-se que a distribuição dos óbitos apresentou algumas similaridades em alguns aspectos ao longo dos três anos, com um número mínimo de zero (0), central (mediana) de um (1) e um máximo de dois (2) óbitos por acidente. Por outro lado, em 2018 observou-se um número de óbitos fora do comum (outlier), sendo de três (3) e cinco (5) num só acidente, e em 2019 e 2020 registou-se um número de três (3) óbitos num só acidente, sendo também fora do comum (outlier) conforme ilustrado na Figura 4.1. 33
  • 49. CAPÍTULO 4. RESULTADOS E DISCUSSÃO 34 Figura 4.1: Distribuição do número de óbitos por ano. 4.1.2 Distribuição do Número de Óbitos por Sexo e Idade do Con- dutor De acordo com Figura 4.2, constatou-se que em relação a distribuição do número de óbitos por sexo (A) e por idade (B) do condutor, cerca de 62.77% dos óbitos eram provocados por condutores do sexo masculino e 37.23% por sexo feminino, e em relação a distribuição das idades, cerca de 55.4% dos óbitos eram provocados por condutores dos seus 18 à 35 anos, seguido de 36 à 45 anos com cerca de 28.1%, 46 à 55 anos com cerca de 10.6%, 56 à 65 anos com cerca de 5.4% e cerca de 0.4% com mais de 65 anos, felizmente de 2018 à 2020 não foi registado nenhum acidente com óbitos provocado por condutores com menos de 18 anos. Figura 4.2: Distribuição do número de óbitos por Sexo (A) e Idade (B) do Condutor. Autor: Estevão Zeco 34 Licenciatura em Estatística - UEM
  • 50. CAPÍTULO 4. RESULTADOS E DISCUSSÃO 35 4.1.3 Distribuição do Número de Óbitos por Tipo de Veículo Na cidade de Maputo no período de 2018 à 2020, constatou-se cerca de 68.61% dos óbitos eram provocados por veículos de categoria ligeira, seguido da categoria pesada com cerca de 24.68% e por último cerca de 6.71% provocadas por outras categorias, conforme ilustra a Figura 4.3. Figura 4.3: Distribuição do número de óbitos por Tipo de Veículo. 4.1.4 Distribuição do Número de Óbitos por Dia da Semana e Hora de Ocorrência De acordo com a Figura 4.4, constatou-se que em relação a distribuição do número de óbitos por dia da semana (A) e por hora de ocorrência (B), cerca de 20.3% dos óbitos foram registados aos sábados e 17.7% aos domingos, a segunda-feira foi o dia da semana com menos óbitos, com cerca de 10.8%, e em relação a distribuição da hora de ocorrência, no período das 12h00 às 17h59 registou-se cerca de 32.7% dos óbitos, seguido das 18h00 às 23h59 cerca de 36.6%, das 06h00 às 11h59 cerca de 24% e por último das 00h00 às 05h59 com menos frequência, com cerca de 11.7% óbitos registados. Autor: Estevão Zeco 35 Licenciatura em Estatística - UEM
  • 51. CAPÍTULO 4. RESULTADOS E DISCUSSÃO 36 Figura 4.4: Distribuição do número de óbitos por Dia da Semana (A) e Hora de ocorrência (B). 4.1.5 Distribuição do Número de Óbitos por Tipo e Causa do Aci- dente Quanto aos tipos de acidentes, constatou-se que os atropelamentos é que tem tirado mais vidas em acidentes rodoviários, com cerca de 54.98% de óbitos, choque entre carros com cerca de 21% de óbitos e uma média de 0.46 (0) óbito, despiste e capotamento 12.77% e 0.50 (1) óbito, choques entre carros e outros 3.03% e 0.56 (1) óbito, a queda de passageiros é que foi a mais fatal, com uma média de 0.57 (1) óbito, o choque entre carros e motos foi a que menos registou óbitos e foi a menos fatal, com cerca de 1.30% de óbitos e uma média de 0.35 (0) óbito. Em relação as causas dos acidentes, constatou-se que os acidentes provocados pelo excesso de velocidade são os que tem tirado mais vidas, com cerca de 56.93% de óbitos com uma média de 0.53 (1) óbito, seguido do consumo de álcool, com cerca de 15.37% de óbitos e uma média de 0.49 (0) óbito, corte de prioridade com cerca de 13.85% de óbitos e uma média de 0.41 (0) óbito, má travessia do peão com cerca de 10.17% de óbitos e uma média de 0.40 (0) óbito e por último outras causas, com cerca de 3.68% de óbitos e uma média de 0.37 (0) óbito, conforme ilustrado na Tabela 4.2. Autor: Estevão Zeco 36 Licenciatura em Estatística - UEM
  • 52. CAPÍTULO 4. RESULTADOS E DISCUSSÃO 37 Tabela 4.2: Distribuição do número de óbitos por Tipo e Causa do Acidente. Variáveis Categorias Frequência Média Atropelamento 54.98% 0.46 Choque entre carros 21% 0.46 Despiste e capotamento 12.77% 0.50 Choques entres carros e outros 3.03% 0.56 Tipo de Acidente Choque entre carros e motos 1.30% 0.36 Choque com obstáculos xos 2.38% 0.38 Queda de passageiros 1.73% 0.57 Outros tipos 2.81% 0.46 Excesso de velocidade 56.93% 0.53 Consumo de álcool 15.37% 0.49 Causa do Acidente Má travessia do peão 10.17% 0.40 Corte de prioridade 13.85% 0.41 Outras causas 3.68% 0.37 4.2 Georreferenciação dos Acidentes Rodoviários na Ci- dade de Maputo As Figuras 4.5 e 4.6, mostram a distribuição do número de óbitos e óbitos esperados por distrito, onde vericou-se que o distrito urbano de Kamavota foi o que mais apresentou óbitos com aproximadamente 144 óbitos, com 55.6% (80) em 2018, 25.7% (37) em 2019 e 18.8% (27) em 2020, com um número esperado de 0.50 (1) óbito, seguido de Kampfumo com aproximadamente 136 óbitos, com 57.4% (78) em 2018 e 21.3% (29) em 2019 e 2020, com um número esperado de 0.45 (0), 94 óbitos em Kamubukwana, sendo 42.6% (40) em 2018, 29.8% (28) em 2019 e 27.7% (26) em 2020, com um número esperado de 0.47 (0) óbito, e os distritos de Kamaxaquene e Kalhamankulo apresentaram um número de óbitos muito reduzido, sendo de 47 e 41, com os valores esperados de 0.47 (0) e 0.42 (0) óbito, respectivamente. Autor: Estevão Zeco 37 Licenciatura em Estatística - UEM
  • 53. CAPÍTULO 4. RESULTADOS E DISCUSSÃO 38 Figura 4.5: Distribuição do Número de Óbitos por Distritos Urbanos. Figura 4.6: Distribuição do Número Esperado de Óbitos por Distritos Urbanos. Autor: Estevão Zeco 38 Licenciatura em Estatística - UEM
  • 54. CAPÍTULO 4. RESULTADOS E DISCUSSÃO 39 4.3 Modelo de Regressão de Poisson 4.3.1 Teste de Ajustamento a Distribuição de Poisson Antes de se estimar os parâmetros do modelo de regressão de Poisson, é necessário vericar se a variável dependente (número de óbitos) segue a distribuição de Poisson ou não. A Figura 4.7, sugere que o número de óbitos segue uma distribuição de Poisson. Figura 4.7: Distribuição do número de óbitos. De acordo com a Tabela 4.3, constatou-se que não se rejeita a hipótese nula de que o número de óbitos segue uma distribuição de Poisson, pois o p-value (0.1484) foi superior que o nível de signicância de 5%(0.05), sustentando deste modo o que foi sugerido na Figura 4.7, que o número de óbitos segue uma distribuição de Poisson. Tabela 4.3: Teste de Qui-Quadrado para Ajustamento a Distribuição de Poisson. Qui-Quadrado Gl P-value 5.3414 3 0.1484 4.3.2 Estimação dos Parâmetros do Modelo Com base no método de máxima verossimilhança, estimou-se os parâmetros do modelo de regressão de Poisson para o número de óbitos nos acidentes rodoviários, conforme ilustrado na Tabela 4.4, mais detalhes serão apresentadas na secção 4.3.6. Autor: Estevão Zeco 39 Licenciatura em Estatística - UEM
  • 55. CAPÍTULO 4. RESULTADOS E DISCUSSÃO 40 Tabela 4.4: Estimação dos parâmetros do modelo pelo método de máxima verossimilhança. Variáveis Categorias Coecientes (B) Exp (B) - Intercepto -0.62 0.54 Feminino (ref) - - Sexo do condutor Masculino -0.17 0.84 Menos de 18 anos -13.30 0 18-35 anos (ref) - - 36-45 anos 0.40 1.49 Idade do condutor 46-55 anos 0.004 1.004 56-65 anos 0.14 1.50 Mais de 65 anos -0.63 0.53 Ligeiro (ref) - - Tipo de veículo Pesado -0.01 0.99 Outros tipos -0.03 0.97 Segunda-feira -0.09 0.91 Terça-feira -0.01 0.99 Quarta-feira 0.02 1.02 Dia da semana Quinta-feira 0.14 1.15 Sexta-feira -0.04 0.96 Sábado -0.04 0.96 Domingo (ref) - - 00h00-05h59 (ref) - - 06h00-11h59 -0.31 0.73 Hora de ocorrência 12:00-17:59 -0.16 0.85 18h00-23:h59 -0.31 0.73 Kalhamankulo (ref) - - Kamubukwana 0.70 2.01 Distrito urbano Kamaxaquene 0.04 1.04 Kamavota 0.12 1.13 Kampfumo 0.20 1.22 Autor: Estevão Zeco 40 Licenciatura em Estatística - UEM
  • 56. CAPÍTULO 4. RESULTADOS E DISCUSSÃO 41 Variáveis Categorias Coecientes (B) Exp (B) Atropelamentos (ref) - - Choque entre carros -0.10 0.90 Despiste e capotamento 0.002 1.002 Choques entres carros e outros 0.30 1.35 Tipo de acidente Choque entre carros e motos -0.31 0.73 Choque com obstáculos xos -0.23 0.79 Queda de passageiros 0.12 1.13 Outros tipos -0.11 0.90 Álcool (ref) - - Excesso de velocidade 0.92 2.51 Causa do acidente Má travessia do peão 0.87 2.39 Corte de prioridade -0.10 0.90 Outras causas 0.67 1.95 (ref) - Categoria de referência 4.3.3 Selecção do Modelo A selecção de modelos é uma parte importante de toda a investigação em modelação estatística e envolve a procura de um modelo que seja o mais simples possível e que descreva bem os dados observados. Para facilitar o processo de selecção usou-se o método de stepwise backward, que inicia a partir de um modelo completo e verica a cada passo se uma variável pode ser ou não eliminada do modelo. Tabela 4.5: Selecção de modelos pelo método stepwise backward. Modelos Variáveis excluídas Gl Deviance AIC Modelo 1 962 833.79 1492.72 Modelo 2 Sexo do condutor 963 833.82 1490.75 Modelo 3 Tipo de veículo; Sexo do condutor 965 836.81 1489.70 De acordo com Alvarenga (2015), a medida utilizada para avaliar o modelo é o Critério de Informação de Akaike (AIC), quanto menor for este valor menor será a informação perdida e, portanto, melhor será o ajustamento do modelo, contrariamente da medida Deviance. Autor: Estevão Zeco 41 Licenciatura em Estatística - UEM
  • 57. CAPÍTULO 4. RESULTADOS E DISCUSSÃO 42 Na Tabela 4.6, são apresentados três (3) modelos gerados pelo método stepwise backward, onde constatou-se que o Modelo 3 foi o melhor modelo, com duas variáveis excluídas (Tipo de veículo e Sexo do condutor), pois apresentou um maoir Deviance de 836.81 e o menor AIC de 1489.70. 4.3.4 Diagnósticos do Modelo Após a obtenção das estimativas para os coecientes de Regressão de Poisson é necessário avaliar a sua signicância e a qualidade do ajuste do modelo, isto é, determinar se as variáveis independentes no modelo estão signicativamente associadas à variável dependente. Teste de signicância dos parâmetros De acordo com a Tabela 4.6, constatou-se que pelo menos um dos parâmetros é estatisticamente signicativo, uma vez que p-value (9.801 × 10−13) associado ao teste de razão de verossimilhança foi inferior que o nível de signicância de 5% (0.05). Tabela 4.6: Teste de Razão de Verossimilhança para signicância global. Qui-Quadrado Gl P-value 118.23 30 9.801 × 10−13 Em relação a signicância individual dos parâmetros, o teste de Wald ilustrado na Tabela 4.7, mos- trou que o intercepto foi signicativo, quanto a idade do condutor, somente as idades compreendidas entre 36 à 45 anos é que foram signicativas, nos dias da semana, segunda-feira, terça-feira, quarta- feira, sexta-feira e sábado foram signicativos, quanto a hora de ocorrência dos acidentes, todos os períodos foram signicativos, quanto ao distrito urbano, somente o distrito de Kamubukwana é que foi signicativo, quanto ao tipo de acidente, somente os acidentes do tipo choque entre carros é que foram signicativos e quanto a causa do acidentes, apenas o excesso de velocidade, má travessia do peão e outras causas é que foram signicativas. Todas as variáveis consideradas estatisticamente signicativas, foi pelo facto de terem apresentado um p-value inferior que o nível de signicância de 5% (0.05). Autor: Estevão Zeco 42 Licenciatura em Estatística - UEM
  • 58. CAPÍTULO 4. RESULTADOS E DISCUSSÃO 43 Tabela 4.7: Teste de Wald para a signicância individual dos parâmetros. Variáveis Categorias B Exp (B) EP Wald P-value - Intercepto -0.62 0.54 0.15 -4.08 0.0005* Menos de 18 anos -13.30 0 665 -0.02 0.9805 18-35 anos (ref) - - - - - Idade do 36-45 anos 0.40 1.49 0.12 3.32 0.0009* condutor 46-55 anos 0.004 1.004 0.40 0.01 0.9938 56-65 anos 0.14 1.50 0.26 0.53 0.5934 Mais de 65 anos -0.63 0.53 0.71 -0.89 0.3758 Segunda-feira -0.09 0.91 0.21 -0.42 0.0153* Terça-feira -0.01 0.99 0.01 -0.76 0.0058* Dia da Quarta-feira 0.02 1.02 0.06 0.31 0.0212* semana Quinta-feira 0.14 1.15 0.19 0.73 0.0828 Sexta-feira -0.04 0.96 0.10 -0.41 0.0159* Sábado -0.04 0.96 0.05 -0.77 0.0056* Domingo (ref) - - - - - 00h00-05h59 (ref) - - - - - Hora de 06h00-11h59 -0.31 0.73 0.30 -1.05 0.0023* ocorrência 12h00-17h59 -0.16 0.85 0.29 -0.55 0.0004* 18h00-23h59 -0.31 0.73 0.67 -0.46 0.0138* Kalhamankulo (ref) - - - - - Kamubukwana 0.70 2.01 0.35 1.99 0.0028* Distrito Kamaxaquene 0.04 1.04 0.04 0.93 0.3530 urbano Kamavota 0.12 1.13 0.11 1.14 0.2559 Kampfumo 0.20 1.22 0.25 0.80 0.4265 Álcool (ref) - - - - - Causa Excesso de velocidade 0.92 2.51 0.53 1.72 0.0002* acidente Má travessia do peão 0.87 2.39 0.82 1.06 0.0022* Corte de prioridade -0.10 0.90 0.16 -0.61 0.5442 Outras causas 0.67 1.95 0.56 1.20 0.0278* Autor: Estevão Zeco 43 Licenciatura em Estatística - UEM
  • 59. CAPÍTULO 4. RESULTADOS E DISCUSSÃO 44 Variáveis Categorias B Exp (B) EP Wald P-value Atropelamentos (ref) - - - - - Choque entre carros -0.10 0.90 0.09 -1.15 0.0016* Despiste e capotamento 0.002 1.002 0.01 0.18 0.1143 capotamento Choques entre 0.30 1.35 0.86 0.35 0.7293 Tipo de carros e outros acidente Choque entre carros e motos -0.31 0.73 0.62 -0.50 0.9584 carros e motos Choque com -0.23 0.79 0.19 -1.18 0.2392 obstáculos xos Queda de passageiros 0.12 1.13 0.13 0.95 0.3444 Outros tipos -0.11 0.90 0.69 -0.16 0.8726 (*) Estatisticamente signicativo (ref) - Categoria de referência Teste de Dispersão Am de garantir com que o modelo de Poisson estimado, não produza resultados incoerentes durante a previsão, é sempre recomendável, que após a estimação de um modelo de regressão de Poisson, seja feito um teste para vericação da existência de superdispersão ou subdispersão nos dados. Neste contexto, a Tabela 4.8, mostra o teste de dispersão, onde constatou-se que não se rejeita a hipótese nula, pois o p-value (0.5664) foi superior que o nível de signicância de 5% (0.05), ou seja, há equidispersão nos dados da variável dependente (óbitos). Tabela 4.8: Teste de Dispersão. Estatística Z Dispersão P-value -0.1671 0.9920 0.5664 Autor: Estevão Zeco 44 Licenciatura em Estatística - UEM
  • 60. CAPÍTULO 4. RESULTADOS E DISCUSSÃO 45 4.3.5 Análise de Resíduos A análise de resíduos é muito importante nos modelos de regressão, uma vez que eles ajudam a detectar observações discrepantes que merecem uma análise mais detalhada. De acordo Cox e Snell (1968), os resíduos devem expressar uma discrepância entre a observação (Yi) e o seu valor ajustado (Ŷi). De acordo com a Figura 4.8, constatou-se que o modelo de Poisson apresentou um bom ajuste aos dados, pois os valores ajustados, aproximam-se aos observados. Figura 4.8: Valores observados e modelo ajustado de Poisson. Outliers De acordo com Barnett e Lewis (1994), um outlier é uma observação inconsistente com todos os dados. Tanto na variável resposta, bem como nas variáveis explicativas da regressão podem con- ter outliers. De acordo com Faraway (2016), uma das formas de detectar outliers gracamente, é usando o gráco QQ. Uma diferença dos diagnósticos dos modelos lineares gaussianos, não estamos procurando uma linha recta no gráco QQ nos diagnósticos GLM porque os resíduos não devem ser normalmente distribuídos. O único propósito do gráco QQ no GLM é encontrar os outliers nos dados. Os envelopes simulados para os resíduos de Pearson e Deviance (Figura 5.1, anexo A), mostraram que os resíduos de Deviance estão quase todos praticamente sobre uma linha, evidenciando a su- posição de distribuição adequada para o modelo em estudo, embora haja dois valores discrepantes Autor: Estevão Zeco 45 Licenciatura em Estatística - UEM
  • 61. CAPÍTULO 4. RESULTADOS E DISCUSSÃO 46 (outliers). Diferentemente dos resíduos de Pearson, que mostrou que muitos dos pontos estão fora das bandas de conança de 95%. Os resíduos padronizados (Figura 5.2, anexo A), não mostraram um comportamento diferente da Figura 5.1. Os resíduos Padronizados de Deviance mostraram que a maioria dos pontos estão dentro das bandas de conança de 95% e nos resíduos Padronizados de Pearson o comportamento é outro, tem muitos valores discrepantes (outliers). Figura 4.9: Grácos semi-normais para detectar outliers usando resíduos de Pearson (A) e Deviance (B). Figura 4.10: Grácos semi-normais para detectar outliers usando resíduos padronizados de Pearson (A) e Deviance (B). Autor: Estevão Zeco 46 Licenciatura em Estatística - UEM
  • 62. CAPÍTULO 4. RESULTADOS E DISCUSSÃO 47 As Figuras 4.9 e 4.10, mostram os grácos semi-normais dos resíduos de pearson, deviance e pa- dronizados para detectar possíveis outliers nos dados, onde constatou-se que tanto nos resíduos padronizados (Figura 4.10), bem como nos resíduos não padronizados (Figura 4.9), os pontos 274 e 113 apresentaram comportamento diferente dos outros pontos. Observações Inuentes Uma observação inuente é aquela que afecta as estimativas dos coecientes de regressão do modelo ajustado, pois este possui valores incomuns para a variável resposta, explicativas ou mesmo para ambas (Barnett e Lewis, 1994). A distância de Cook provê uma ordenação das observações em termos da sua inuência sobre o vector das estimativas dos coecientes. A intenção não é aplicar um teste formal, e sim fornecer uma ajuda para detectar as observações inuentes. Cook e Weisberg (1999) armam que é conveniente analisar casos em que Di 0.5 e é sempre importante analisar casos em que Di 1. Esta análise consiste em vericar se a observação é realmente inuente ou se é consequência de um modelo inadequado. A Figura 4.11, mostra que não há indicação de observações inuentes, pois apresentaram dis- tâncias de Cook inferiores a 0.5. Figura 4.11: Distâncias de Cook para as estimativas dos coecientes. Em relação a distância de Cook para as estimativas dos coecientes das variáveis (distrito urbano, dias da semana, horas, causa do acidente, tipo de acidente e idade do condutor) utilizadas no modelo de regressão de Poisson (Figuras 5.3, 5.4 e 5.5, anexo A), constatou-se que não há indicação de observações inuentes, pois apresentaram distâncias de Cook inferiores a 0.5. Autor: Estevão Zeco 47 Licenciatura em Estatística - UEM
  • 63. CAPÍTULO 4. RESULTADOS E DISCUSSÃO 48 4.3.6 Interpretação dos Parâmetros Estimados Os diagnósticos realizados, mostraram que o modelo é bom para fazer previsões e deste modo será apresentada a interpretação dos parâmetros estimados. ln Ŷi = −0.62 + 0.40 × [36 − 45anos]i − 0.09 × Segundai − 0.01 × Tercai + 0.02 × Quartai −0.04 × Sextai − 0.04 × Sabadoi − 0.31 × [06h00 − 11h59]i − 0.16 × [12h00 − 17h59]i −0.31 × [18h00 − 23h59]i + 0.70 × Kamubukwanai − 0.01 × ChoqueCarrosi + 0.92× ExcessoV elocidadei + 0.87 × MaTravessiai + 0.67 × OutrasCausasi ˆ β0 : e−0.62 (0.54) é a taxa de incidência de óbitos num acidente com as seguintes características: um condutor com uma idade compreendida entre 18-35 anos, num domingo, num período das 00h00-05h59, no distrito de Kalhamankulo, acidente por atropelamento e como causa do aci- dente o consumo de álcool, mantendo o resto nulo. ˆ β1 : a taxa de incidência de óbitos num acidente com as seguintes características: um condutor com uma idade compreendida entre 36-45 anos, num domingo, num período das 00h00-05h59, no distrito de Kalhamankulo, acidente por atropelamento e como causa do acidente o consumo de álcool é de e0.40 (1.49) vezes que um acidente com as seguintes características: um condutor com uma idade compreendida entre 18-35 anos, num domingo, num período das 00h00-05h59, no dis- trito de Kalhamankulo, acidente por atropelamento e como causa do acidente o consumo de álcool, mantendo o resto nulo. ˆ β2 : a taxa de incidência de óbitos num acidente com as seguintes características: um condutor com uma idade compreendida entre 18-35 anos, numa segunda-feira, num período das 00h00-05h59, no distrito de Kalhamankulo, acidente por atropelamento e como causa do acidente o consumo de álcool é de e−0.09 (0.91) vezes que um acidente com todas as características das categorias de referência do modelo, mantendo o resto nulo. ˆ β3 : a taxa de incidência de óbitos num acidente com as seguintes características: um condutor com uma idade compreendida entre 18-35 anos, numa terça-feira, num período das 00h00-05h59, no distrito de Kalhamankulo, acidente por atropelamento e como causa do acidente o consumo de álcool é de e−0.01 (0.99) vezes que um acidente com todas as características das categorias de referência do modelo, mantendo o resto nulo. ˆ β4 : a taxa de incidência de óbitos num acidente com as seguintes características: um condutor com Autor: Estevão Zeco 48 Licenciatura em Estatística - UEM
  • 64. CAPÍTULO 4. RESULTADOS E DISCUSSÃO 49 uma idade compreendida entre 18-35 anos, numa quarta-feira, num período das 00h00-05h59, no distrito de Kalhamankulo, acidente por atropelamento e como causa do acidente o consumo de ál- cool é de e0.02 (1.02) vezes que um acidente com todas as características das categorias de referência do modelo, mantendo o resto nulo. ˆ β5 : a taxa de incidência de óbitos num acidente com as seguintes características: um condutor com uma idade compreendida entre 18-35 anos, numa sexta-feira, num período das 00h00-05h59, no distrito de Kalhamankulo, acidente por atropelamento e como causa do acidente o consumo de álcool é de e−0.04 (0.96) vezes que um acidente com todas as características das categorias de referência do modelo, mantendo o resto nulo. ˆ β6 : a taxa de incidência de óbitos num acidente com as seguintes características: um condutor com uma idade compreendida entre 18-35 anos, num sábado, num período das 00h00-05h59, no distrito de Kalhamankulo, acidente por atropelamento e como causa do acidente o consumo de álcool é de e−0.04 (0.96) vezes que um acidente com todas as características das categorias de referência do modelo, mantendo o resto nulo. ˆ β7 : a taxa de incidência de óbitos num acidente com as seguintes características: um condutor com uma idade compreendida entre 18-35 anos, num domingo, num período das 06h00-11h59, no dis- trito de Kalhamankulo, acidente por atropelamento e como causa do acidente o consumo de álcool é de e−0.31 (0.73) vezes que um acidente com todas as características das categorias de referência do modelo, mantendo o resto nulo. ˆ β8 : a taxa de incidência de óbitos num acidente com as seguintes características: um condutor com uma idade compreendida entre 18-35 anos, num domingo, num período das 12h00-17h59, no dis- trito de Kalhamankulo, acidente por atropelamento e como causa do acidente o consumo de álcool é de e−0.16 (0.85) vezes que um acidente com todas as características das categorias de referência do modelo, mantendo o resto nulo. ˆ β9 : a taxa de incidência de óbitos num acidente com as seguintes características: um condutor com uma idade compreendida entre 18-35 anos, num domingo, num período das 18h00-23h59, no distrito de Kalhamankulo, acidente por atropelamento e como causa do acidente o consumo de álcool é e−0.31 (0.73) vezes que um acidente com todas as características das categorias de referência do modelo, mantendo o resto nulo. Autor: Estevão Zeco 49 Licenciatura em Estatística - UEM
  • 65. CAPÍTULO 4. RESULTADOS E DISCUSSÃO 50 ˆ β10 : a taxa de incidência de óbitos num acidente com as seguintes características: um condutor com uma idade compreendida entre 18-35 anos, num domingo, num período das 00h00-05h59, no distrito de Kamubukwana, acidente por atropelamento e como causa do acidente o consumo de álcool é de e0.70 (2.01) vezes que um acidente com todas as características das categorias de referência do modelo, mantendo o resto nulo. ˆ β11 : a taxa de incidência de óbitos num acidente com as seguintes características: um condutor com uma idade compreendida entre 18-35 anos, num domingo, num período das 00h00-05h59, no distrito de Kalhamankulo, acidente de choque entre carros e como causa do acidente o consumo de álcool é de e−0.01 (0.99) vezes que um acidente com todas as características das categorias de referência do modelo, mantendo o resto nulo. ˆ β12 : a taxa de incidência de óbitos num acidente com as seguintes características: um condutor com uma idade compreendida entre 18-35 anos, num domingo, num período das 00h00-05h59, no distrito de Kalhamankulo, acidente por atropelamento e como causa do acidente o excesso de velocidade é e0.92 (2.51) vezes que um acidente com todas as características das categorias de referência do modelo, mantendo o resto nulo. ˆ β13 : a taxa de incidência de óbitos num acidente com as seguintes características: um condutor com uma idade compreendida entre 18-35 anos, num domingo, num período das 00h00-05h59, no distrito de Kalhamankulo, acidente por atropelamento e como causa do acidente a má travessia do peão é de e0.87 (2.39) vezes que um acidente com todas as características das categorias de referência do modelo, mantendo o resto nulo. ˆ β14 : a taxa de incidência de óbitos num acidente com as seguintes características: um condutor com uma idade compreendida entre 18-35 anos, num domingo, num período das 00h00-05h59, no distrito de Kalhamankulo, acidente por atropelamento e como causa do acidente outras causas é de e0.67 (1.95) vezes que um acidente com todas as características das categorias de referência do modelo, mantendo o resto nulo. Autor: Estevão Zeco 50 Licenciatura em Estatística - UEM