Fatores relacionados à criminalidade em Santarém-Pa: Uma abordagem multivariada
1. Fatores relacionados `a criminalidade em Santar´em-Pa: Uma
abordagem multivariada
Edilan de Sant’Ana Quaresma - ESALQ/USP1
Carlos Tadeu dos Santos Dias - ESALQ/USP
Simone Daniela Sartorio - ESALQ/USP
Ezequiel Abraham L´opez Bautista - ESALQ/USP
Marina Rodrigues Maestre - ESALQ/USP
Renata Alcarde - ESALQ/USP
Jarsen Luis Castro Guimar˜aes - ICS/UFOPA
Resumo: Este trabalho teve como objetivo, utilizar metodologias multivariadas para analisar
conjunto de dados provenientes de detentos da Penitenci´aria Agr´ıcola S´ılvio Hall de Moura, no
munic´ıpio de Santar´em, estado do Par´a, no ano de 2005. A popula¸c˜ao pesquisada foi classificada
segundo o tipo de crime que gerou a condena¸c˜ao: crimes contra a vida, contra o patrimˆonio,
contra costumes e crime de entorpecentes. Coeficientes de correla¸c˜ao de Pearson foram obtidos,
mostrando dependˆencias significativas entre as vari´aveis. Utilizando-se a MANOVA observou-se
a existˆencia de diferen¸ca significativas entre os quatro tipos de crimes analisados, considerando
todas as vari´aveis em conjunto. Em seguida realizou-se a An´alise de Componentes Principais,
em que 83% da variabilidade total dos dados foi explicada por duas componentes. Gr´afico Biplot
foi gerado, mostrando a rela¸c˜ao entre os tipos de crime e as vari´aveis analisadas.
Palavras-chave: Crimes, MANOVA, An´alise de Componentes Principais, Biplot.
1 Introdu¸c˜ao
O termo “crime” ´e definido juridicamente com “toda conduta t´ıpica, antijur´ıdica - ou il´ıcita
- e culp´avel, praticada por um ser humano” (Wikipedia, 2011). Desde as primeiras civiliza¸c˜oes
esfor¸cos vem sendo direcionados ao combate deste ato il´ıcito, tendo registros que datam do ano
2100 a.C., como, por exemplo, o C´odigo Sumeriano.
Estudos sobre os motivos determinantes dos crimes vem sendo realizados por diversos pesqui-
sadores, que buscam identificar os reais motivos que induzem sujeitos `a pr´atica de atos dessa na-
tureza. Diagnosticar as reais causas pode conduzir a medidas preventivas, reduzindo a violˆencia
e consequentemente, melhorando a qualidade de vida de cidad˜aos. Objetivando tra¸car o perfil
do criminoso condenado na regi˜ao Oeste do Par´a, Guimar˜aes (2009) implementou pesquisa junto
1
Agradecimento a capes apoio financeiro 2
ontato: equaresm@ufpa.br
2. aos detentos do Pres´ıdio Agr´ıcola S´ılvio Hall de Moura, no munic´ıpio de Santar´em-Par´a, cole-
tando junto aos detentos, uma gama de vari´aveis que poderiam estar relacionadas aos motivos
determinantes.
Para compreender como as vari´aveis coletadas se relacionam com os tipos de crimes, o uso de
t´ecnicas estat´ısticas multivariadas, como a an´alise de componentes principais e biplot, torna-se
uma ferramenta interessante.
Dessa forma, este trabalho tem o objetivo de utilizar t´ecnicas multivariadas para compreender
o fenˆomeno criminalidade, praticados por detentos de uma penitenci´aria localizada no interior
da Amazˆonia brasileira.
2 Metodologia
Para a realiza¸c˜ao deste trabalho, foram coletadas informa¸c˜oes, por meio de aplica¸c˜ao de
question´arios a 344 detentos da Penitenci´aria S´ılvio Hall de Moura localizada em Santar´em-PA,
nos meses de novembro de 2004 a abril de 2005, estudando-se o agente ativo do crime e n˜ao
a v´ıtima. Os crimes foram divididos em quatro categorias: crimes contra a vida (homic´ıdio
e tentativa de homic´ıdio), contra o patrimˆonio (roubo, furto e extors˜ao), contra os costumes
(estupro e atentado violento ao pudor) e tr´afico de entorpecentes.
Em estudos dessa natureza, parece razo´avel compreender que um elenco de vari´aveis eco-
nˆomicas e sociais, apresentam algum tipo de rela¸c˜ao com o fato do sujeito cometer um delito.
Sabe-se que quando as vari´aveis s˜ao correlacionadas, deve-se pressupor multicolinearidade dos
dados e, ent˜ao, realizar a An´alise de Variˆancia Multivariada (MANOVA), que permite maior
aproveitamento das informa¸c˜oes conjuntas das vari´aveis. Testes de correla¸c˜ao foram realiza-
dos, identificando-se as vari´aveis que apresentavam correla¸c˜ao significativa, as quais foram sele-
cionadas para o estudo multivariado.
A MANOVA ´e uma importante ferramenta que permite estudar e comparar m´edias de duas
ou mais popula¸c˜oes normais multivariadas independentes (HAIR JUNIOR et al, 2005). A for-
mula¸c˜ao de um teste estat´ıstico para comparar vetores de m´edias, depende da parti¸c˜ao da
variˆancia total em variˆancia devido aos efeitos dos grupos e variˆancia devida ao erro (JOHNSON
e WICHERN, 2002). Um dos pontos mais importantes da an´alise multivariada ´e o aproveita-
mento conjunto das vari´aveis envolvidas.
O uso da MANOVA foi utilizado para testar a hip´otese de que n˜ao existem diferen¸cas signi-
ficativas entre os quatro tipos de crime (vida, patrimˆonio, costumes e tr´afico de entorpecentes),
considerando as vari´aveis conjuntamente. Esta hip´otese envolve a variˆancia generalizada
Λ∗
=
|SAPCRES|
|SQPCint + SAPCres|
.
Rejeita-se a hip´otese se a raz˜ao de variˆancia generalizada for muito pequena.
Os testes multivariados sobre a igualdade dos vetores de m´edias foram desenvolvidos uti-
lizando os crit´erios de Wilks, Pillai, Hotteling-Lowley e Roy, sendo o crit´erio de Wilks um teste
via raz˜ao de verossimilhan¸ca.
Ap´os testar se os grupos apresentavam ou n˜ao diferen¸cas significativas, uma an´alise de com-
ponentes principais (ACP) foi realizada, objetivando reduzir a dimensionalidade dos dados, obter
3. combina¸c˜oes interpret´aveis das vari´aveis e descrever o entendimento da estrutura de correla¸c˜ao
dos dados.
A ACP depende somente da matriz de covariˆancia ( ) ou da matriz de correla¸c˜ao (ρ)
de X1, ..., Xp, n˜ao requerendo qualquer suposi¸c˜ao sobre a forma da distribui¸c˜ao multivariada
dessas vari´aveis. A utiliza¸c˜ao da matriz de correla¸c˜ao em alternativa `a matriz de variˆancia e
covariˆancia, faz com que se trabalhe com as vari´aveis padronizadas, evitando, dessa maneira,
a ocorrˆencia de erros quando se trabalha com escalas diferentes. Neste estudo, padronizou-se
os dados e se trabalhou com a matriz de covariˆancia. O objetivo desta t´ecnica ´e utilizar p
vari´aveis X1, X2, .., Xp correlacionadas, encontrando combina¸c˜oes lineares destas para produzir
novas vari´aveis Z1, Z2, ..., Zp, denominadas componentes principais, que sejam n˜ao correlaciona-
dos e arranjadas em ordem decrescente de sua variˆancia. Assim, o primeiro componente principal
´e escrito como:
Z1 = a11X1 + a12X2 + a13X3 + ... + a1pXp
que varia tanto quanto poss´ıvel para os indiv´ıduos, sujeitos `a condi¸c˜ao de que
a2
11 + a2
12 + ... + a2
1p = 1
O procedimento seguinte consistiu em utilizar o Biplot, gr´afico estat´ıstico desenvolvido por
Gabriel (1971), que ´e uma generaliza¸c˜ao da dispers˜ao de duas vari´aveis simples, permitindo que
as informa¸c˜oes sobre as amostras e as vari´aveis de uma matriz de dados, possam ser exibidas
graficamente. ´E constru´ıdo usando a decomposi¸c˜ao em valores singulares.
3 Resultados e Discuss˜ao
´E comum entre os cientistas pol´ıticos, elencar dentre os motivos determinantes do crime,
aspectos s´ocio-econˆomicos. Mis´eria, fome, desigualdade gritante podem gerar ´odio e desespero,
e quem experimenta essas mazelas pode querer privar os mais favorecidos do que possuem,
cometendo aquilo que, no linguajar jur´ıdico, ´e definido como crime.
No estudo aqui apresentado, onde se trabalhou com vari´aveis eminentemente socio-econˆomicas,
´e constatada a existˆencia de correla¸c˜ao entre as vari´aveis, conforme mostrado na tabela 1.
Tabela 1: Matriz de Correla¸c˜ao (Coeficiente de Correla¸c˜ao de Pearson) para vari´aveis s´ocio-econˆomicas relacionadas `a criminalidade. Santar´em-
Par´a.
Vari´aveis Pris˜ao Drogas Idade Est.Civil Religi˜ao Cor Tempo Estudo Filhos Emprego Renda Per-Capita
Pris˜ao anterior 1,00 . . . . . . . . .
Uso de drogas 0,23 1,0 . . . . . . . .
Idade 0,23 0,22 1,0 . . . . . . .
Est.Civil 0,11 0,23 0,35 1,0 . . . . . .
Religi˜ao -0,25 -0,13 -0,26 -0,16 1,0 . . . . .
Cor -0,09 -0,11 -0,07 -0,01 0,08 1,0 . . . .
Tempo Estudo 0,06 0,17 -0,02 0,06 -0,07 -0,12 1,0 . . .
Possui Filhos -0,07 -0,13 -0,37 -0,39 0,11 -0,04 -0,02 1,0 . .
Emprego Formal -0,12 0,02 -0,08 -0,05 0,08 -0,01 -0,13 0,04 1,0 .
Renda Per-Capita 0,20 0,10 0,09 -0,07 -011 -0,12 -0,17 -0,09 -0,15 1,0
Constatada a existˆencia de correla¸c˜ao entre vari´aveis, tornou-se poss´ıvel o uso de t´ecnicas
multivariadas. Iniciou-se a verifica¸c˜ao de igualdade entre as m´edias dos grupos de crimes. Para
as quatro estat´ısticas usuais na MANOVA (Wilks, Pillai, Hotteling-Lawley e Roy), a hip´otese
de igualdade multivariada entre m´edias dos quatro tipos de crime foi rejeitada (Tabela 2), enfa-
tizando diferen¸cas significativas (p < 0, 001) entre os tipos de crime, considerando as vari´aveis
4. analisadas conjuntamente.
Tabela 2: Estat´ıstica para testar a hip´otese de igualdade multivariada entre as m´edias para os diferentes
tipos de crime
Crit´erios Estat´ısticas Estat´ıstica de F ν1 ν2 Valores-p
Wilk’s Lambda 0,63 5,45 30 966 < 0, 0001
Pillai’s Trace 0,42 5,32 30 993 < 0, 0001
Hotelling-Lawley Trace 0,51 5,57 30 983 < 0, 0001
Roys Greatest Root 0,31 10,24 10 331 < 0, 0001
O m´etodo de componentes principais com dados padronizados foi realizado e, utilizando
um ponto de corte de 80%, foi sugerido dois componentes principais que explicam 83% da
variabilidade total dos dados e gerado, dessa forma, autovetores mostrados na tabela 3. O uso
dos dois componentes principais reduziu o n´umero de vari´aveis de dez para duas combina¸c˜oes
lineares de algumas delas.
Tabela 3: Estimativas da Variˆancia (autovalores) e porcentagem acumulada da variˆancia total, obtidas
por meio da An´alise de Componentes Principais
Autovalor Propor¸c˜ao Propor¸c˜ao Acumulada
5,13 0,47 0,47
4,02 0,36 0,83
1,86 0,17 1,00
0,00 0,00 1,00
...
...
...
0,00 0,00 1,00
Com os valores da tabela 3, os componentes ficaram assim especificados:
CP1 = −0, 33(Drogas)−0, 36(Idade)−0, 36(EstCiv)+0, 34(Religiao)+0, 36(Filhos)−0, 31(Renda)
CP2 = −0, 34(PresoAnter) − 0, 45(Cor) + 0, 48(Estudo) + 0, 42(Emprego)
Aparentemente, a primeira componente principal contempla um elenco maior de vari´aveis
relacionadas ao per´ıodo presente do detento, no ato do crime, podendo ser nomeada de Fator
Presente, enquanto que a segunda componente principal contempla um elenco maior de vari´aveis
relacionadas ao passado do detendo, no ato do crime, podendo ser nomeada de Fatores Passados.
O gr´afico Biplot foi constru´ıdo, objetivando uma an´alise conjunta das vari´aveis e dos grupos
estudados.
Assim, as vari´aveis tempo de estudo, renda per-capita, pris˜ao anterior e uso de drogas tem
uma rela¸c˜ao positiva para a primeira componente, enquanto que, para a segunda componente,
estas mesmas vari´aveis apresentam rela¸c˜ao negativa (Ver Figura 1).
5. −15 −10 −5 0 5 10 15
−15−10−5051015
PC1
PC2
aaa
a
a
a
aa
a
aa
a
a
a
aa
a
a
a
a
a
aa
a
a
a a
a
aa
a
a
a aa
a
a
a
a aa
a
a
a a
a
a
a
a
a
a
a
a
a
a
a
a a
aa
a
a
a
a
aaa
a
a
a
a
a
a
a
a
a
a
a
aa
a
a
aa a a
a
a
a
aa
a
a
aa
a
a a
a
a
a
a
a
a
a
aaa
a
aa
a
a
a
a
a a
a
a a
a
a
a
a
a
a
a
a
a
aa
a
a
a
a
a
a
a
a a
a
a
a
a
a
b
b
b
b
b
b
bb
b
b
b
b
b
b
b
b
b
b
b b b
b
b
b
b
bb
b
b
bb
b
b
b
b
b
b
b
b
b
b
b
b
b
b b
bb
b
b
bb
b
b
b
bbbb
bbb
bb
bb
b
bbb
b
b
b
b
b
b
b
b
b
b
b b
b
bb
b
b
b
b
b
b
bb
b
bb
b
bb
bb
b
bb
b
b
b
b b
b
b
b
b
b
c
c
c
c
c
c
c
cc
c
c
c
c
c
c
cc c
c c
c
c
c c
c
c
c
c
cc
c
c
c c
ccc
c
d
d
dd
d
d
d
dd
dd
dd
d
d
d d
d
dd
d
d
d
d
d
d
d d
d
d
d
d
d
d
d
d d
d
dd
d
d
d
d
d
dd
PresoAn
UsavaDr
Idade
estciv
religiao
cor
TempoEstud
PossuiF
EmprgForm
rendpercapita
a
b
c
d
Crime contra a vida
Crime contra o patrimônio
Crime contra costumes
Tráfico de entorpecentes
Figura 1: Biplot: Fatores Relacionados `a Criminalidade
4 Conclus˜oes
O uso de m´etodos multivariados mostrou-se interessante para avaliar fatores relacionados `a
criminalidade. A an´alise de componentes principais conseguiu reduzir a dimens˜ao das vari´aveis
de dez para duas combina¸c˜oes lineares de algumas delas.
O biplot mostrou-se uma ferramenta eficiente para melhor compreens˜ao da associa¸c˜ao entre
as vari´aveis e os tipos de crimes.
Referˆencias
[1] GUIMAR˜AES, J.L.C., Criminalidade econˆomica: an´alise de fatores econˆomicos
e sociais que influenciam as categorias de crimes no munic´ıpio de San-
tar´em-Pa, Revista Jus Navigandi, Porto Alegre, 2009. Disponivel em:
<http://www.viajus.com.br/viajus.php?pagina=artigos&id=1993>. Acessado em
07.04.2011
[2] HAIR JUNIOR, J. F.; ANDERSON, R. E.; TATHAM, R. L.; BLACK, W. C., An´alise
Multivariada de Dados. 5 ed. Porto Alegre: Bookman, 2005. 593 p.
[3] JOHNSON, R. A.; WICHERN, D. W., Applied multivariate statistical analysis. 2003 4th
ed. New Jersey: Prentice Hall.
[4] Wikipedia, Crime, 2011. Dispon´ıvel em http://pt.wikipedia.org/wiki/Crime. Acessado em
01.04.2011