Este documento apresenta um resumo de um estudo que utilizou a análise fatorial para explorar os indicadores do Sistema Nacional de Informações sobre Saneamento (SNIS) e correlacioná-los com variáveis externas como o Índice de Desenvolvimento Humano Municipal (IDHM) e a mortalidade infantil. O objetivo era reduzir os dados e identificar dimensões latentes nos serviços de saneamento brasileiro.
O Geoprocessamento no Contexto do Saneamento Básico
Análise de indicadores do SNIS
1. 25º Congresso Brasileiro de Engenharia Sanitária e Ambiental
V-069 – ANÁLISE EXPLORATÓRIA DOS INDICADORES DO SNIS – SISTEMA
NACIONAL DE INFORMAÇÕES SOBRE SANEAMENTO
Marcos Ubirajara(1)
Mestre em Tecnologia Nuclear pelo IPEN/USP e Bacharel em Física pela PUC-SP. Consultor Especializado
em Geoprocessamento e Tecnologias Correlatas Aplicadas ao Saneamento Básico e Ambiental.
Jucélia Cabral Mendonça
Engenheira Civil pela Escola de Engenharia da Universidade Federal de Goiânia (UFG-GO). Especialização
em Educação Ambiental (CREA/SHS/EESC/USP). Mestre em Ciências da Engenharia Ambiental
(EESC/USP). Engenheira do Ministério das Cidades.
Cynthia Regina Araújo Melo
Economista - Universidade Católica de Brasília - UCB - Especialização em Matemática para economia e
administração - Universidade de Brasília - UnB - Economista do Ministério das Cidades.
Endereço(1): Av. João Samaha, 702 - Apto 202 - São João Batista - Belo Horizonte - MG - CEP: 31520-100 -
Brasil – Telefone: (31) 34357-3944 - e-mail: mucamargo@oi.com.br
RESUMO
O presente trabalho apresenta uma metodologia para a elaboração de um diagnóstico da abrangência e
qualidade dos serviços de saneamento básico brasileiro a partir da análise exploratória multivariada dos
indicadores do SNIS - Sistema Nacional de Informações sobre Saneamento. O método utilizado para a
consecução do trabalho apresentado foi o da Análise Fatorial dos Componentes Principais tendo como
principais objetivos a redução dos dados, a verificação da consistência interna dos indicadores do SNIS e a
sua correlação com variáveis exógenas afetas ao saneamento básico e, por fim, traçar um quadro que expresse
os profundos diferenciais existentes quanto à qualidade e abrangência dos serviços básicos de saneamento
prestados no Brasil.
PALAVRAS-CHAVE: Análise Fatorial e Exploratória, Indicadores do SNIS, Serviços de Saneamento
Básico, Qualidade dos Serviços, Universalização.
INTRODUÇÃO
A análise fatorial é um dos métodos muito utilizado da análise exploratória multivariada, nos mais diversos
campos do conhecimento, para a elaboração de estudos visando, principalmente, a redução de dados e a
simplificação de casos envolvendo muitas variáveis e respondentes. No caso do Sistema Nacional de
Informações sobre Saneamento, o SNIS, são mais de 4.000 (quatro mil) municípios respondentes, centenas de
informações primárias e dezenas de indicadores calculados para formar a base de dados de informações. Com
tantas informações, o desafio que se coloca é como utilizá-las na produção de um diagnóstico global que
exiba os diferenciais que sabemos existir quanto à qualidade e abrangência dos serviços prestados pelo setor
do saneamento, mas que também revele que outras dimensões latentes estariam associadas às dificuldades
para a melhoria da qualidade e para a universalização dos serviços de saneamento no país.
Com isso a proposta é traçar um quadro do saneamento brasileiro a partir de um conjunto mínimo de
indicadores que, a priori, não sabemos quais são. O que se coloca como pré-condição para validação desse
estudo, é que esse conjunto mínimo seja representativo do ponto de vista da grande quantidade de
informações e indicadores disponíveis no SNIS; e que expresse os profundos diferenciais existentes quanto à
qualidade e abrangência dos serviços básicos de saneamento prestados no Brasil. Isto quer dizer que um dos
focos principais do trabalho a ser apresentado está na redução de dados e, por essa razão, apresenta-se a
análise fatorial como um método eficaz para isso.
ABES – Associação Brasileira de Engenharia Sanitária e Ambiental 1
2. 25º Congresso Brasileiro de Engenharia Sanitária e Ambiental
Como hipóteses iniciais, as quais estão respaldadas na vasta experiência adquirida para a construção da longa
série histórica do SNIS, tem-se que fatores sociais e geopolíticos potencialmente estariam acoplados naquelas
dimensões latentes que desejamos revelar. Todavia, tais informações sobre variáveis e indicadores sociais e
da geopolítica não integram a base de dados do SNIS. Por essa razão, também colocou-se uma hipótese
inicial a possível correlação entre as variáveis e indicadores do SNIS, e aquelas do IDHM – Índice de
Desenvolvimento Humano Municipal e da MI – Mortalidade Infantil Estimada para os municípios
brasileiros. O passo inicial para a comprovação dessas hipóteses, e que no futuro poderá ser feita através de
modelagens matemáticas mais sofisticadas, é uma análise exploratória das informações disponíveis visando à
depuração de conceitos e à redução de dados. Este trabalho está comprometido com a consecução desse passo
inicial.
Então, e antes de mais nada, procedeu-se uma análise exploratória das informações que hoje formam uma
série histórica de mais de 10 (dez) anos, no sentido de encontrar um subconjunto de dados e indicadores que,
em primeiro lugar, estejam correlacionados entre si e que, em segundo lugar, sejam passíveis de se
correlacionarem com variáveis exógenas indispensáveis para a formação de um modelo de conhecimento que
contemple as dimensões sociais e geopolíticas, tão fundamentais para a compreensão do quadro que está para
emergir desse estudo. Tendo sido realizada em várias etapas, a análise exploratória, realizada primeiramente
com dados do Diagnóstico dos Serviços de Água e Esgoto - Ano de Referência 2005 do SNIS, demonstrou ser
a análise fatorial um método adequado para a redução dos dados e para o posterior cruzamento e
estabelecimento de correlações entre os indicadores do saneamento básico e as variáveis exógenas em estudo.
A partir da comprovação da adequação do método da análise fatorial, procedeu-se a Análise dos
Componentes Principais (ACP) com o objetivo de revelar dimensões latentes emergentes das correlações
entre variáveis ou grupos de variáveis e, a partir da análise dessas correlações, revelar as estruturas dessas
grandezas latentes não evidentes através das variáveis manifestas em estudo.
Com isso, o presente trabalho tem como objetivo principal promover uma análise exploratória envolvendo os
indicadores da série histórica do SNIS – Sistema Nacional de Informações Sobre Saneamento, e outros
indicadores amplamente aceitos e utilizados no Planejamento Integrado e no desenvolvimento de Políticas
Setoriais afetas ao Saneamento Básico, como é o caso do IDHM - Índice de Desenvolvimento Humano
Municipal do PNUD e o MI – Indicador da Mortalidade Infantil Estimada da FIOCRUZ para os municípios
brasileiros. Enquanto desenvolvimento metodológico objetiva-se especificamente validar a metodologia da
análise exploratória baseada na Análise Fatorial dos Componentes Principais na criação de um modelo
respaldado nas técnicas apresentadas, e que reflita os aspectos multidisciplinares da complexa rede de inter-
relações formada pelo saneamento básico e seus interferentes. Como conseqüência da validação da citada
metodologia utilizada, apresenta-se como um subproduto a consistência dos dados do SNIS utilizados neste
trabalho ante as variáveis exógenas pesquisadas e integradas ao modelo.
DESENVOLVIMENTO
A análise fatorial é um método muito utilizado e considerado eficaz na elaboração de estudos visando,
principalmente, a redução de dados e a simplificação de casos envolvendo muitas variáveis e respondentes.
Procedendo a Análise dos Componentes Principais (ACP), objetiva-se revelar correlações entre variáveis e
grupos das variáveis em estudo e, a partir dessas correlações, identificar as estruturas das grandezas latentes
não evidentes através das variáveis manifestas.
Por que a análise fatorial?
Determinados conceitos, como a exclusão social e urbana, não são bem definidos em razão até da diversidade
de cenários apresentados pelas cidades. Não sendo diretamente observáveis, esses conceitos são
freqüentemente chamados de variáveis latentes e espera-se que seus efeitos se revelem através das variáveis
manifestas. O método mais conhecido para investigar a dependência de um conjunto de variáveis manifestas
em relação a um número menor de variáveis latentes é a chamada análise fatorial. A análise fatorial pode
identificar a estrutura subjacente de um conjunto de uma matriz de dados, bem como fornecer um processo
para a redução dos dados. No nosso caso, o principal objetivo é, de fato, a redução dos dados e isso pressupõe
que exista alguma ordem latente nos dados em análise. A redução aos fatores principais favorece muito a
2 ABES – Associação Brasileira de Engenharia Sanitária e Ambiental
3. 25º Congresso Brasileiro de Engenharia Sanitária e Ambiental
retroação aos períodos anteriores, reduzindo sobremaneira a necessidade de dados para as análises de
evolução dos indicadores no tempo.
Os tópicos que seguem têm como principal objetivo introduzir os conceitos e outros elementos teóricos da
análise fatorial, visando à sua aplicação e posterior avaliação dos resultados como uma medida da adequação
do método. Sabe-se que a estatística em si, qualquer que seja o método utilizado, não assegura bons
resultados. Por essa razão, alguns cuidados devem ser tomados nos passos iniciais, sob pena de perda do
potencial de generalização dos resultados obtidos ou mesmo da confiabilidade dos mesmos. Esse potencial de
generalização coloca-se também como uma pré-condição para a validação do estudo que segue, à semelhança
da necessidade de estarmos trabalhando com um conjunto mínimo de informações.
FASE I – ELEMENTOS DA ANÁLISE FATORIAL
O objetivo desta fase foi introduzir conceitos e outros elementos teóricos da Análise Fatorial, culminando
com a recomendação do método para promover a análise exploratória apresentada neste trabalho. A principal
recomendação resultante desta fase inicial foi à realização de um estudo mais detalhado envolvendo apenas
as variáveis operacionais de água e de esgoto do SNIS, no sentido de apurar aquelas que, ao longo da série
histórica, guardassem correlações entre si.
Com isto, além da busca das possíveis correlações, visava-se também à redução dos dados, uma vez que
muitos indicadores, embora indispensáveis para a compreensão do quadro do saneamento brasileiro, possuem
uma estrutura de cálculo semelhante, o que acaba por se revelar através da Análise Fatorial. Então, somente
após o estudo recomendado, partir para o estudo da possível e esperada correlação de um grupo já reduzido
de variáveis com as variáveis exógenas. Sabendo-se também que um grande número de variáveis não iria
assegurar a obtenção de resultados consistentes, partiu-se para segunda fase.
Como objetivo secundário, buscou-se validar a metodologia da análise exploratória baseada na Análise
Fatorial dos Componentes Principais, bem como envolver a equipe de especialistas do SNIS na criação de um
modelo respaldado nas técnicas apresentadas, e que reflita os aspectos multidisciplinares da complexa rede de
inter-relações formada pelo saneamento básico e seus interferentes. Como conseqüência da validação da
metodologia utilizada, torna-se um importante objetivo a verificação da consistência dos dados do SNIS
utilizados neste trabalho, o qual se pretende aferir a partir da medida da adequação da amostra utilizada
(MSA), que decorre naturalmente da aplicação da Análise Fatorial.
A Seleção de Variáveis
Na fase de seleção das variáveis, sendo este um passo crucial, algumas recomendações para a adequação do
método da análise fatorial aos objetivos do trabalho devem ser seguidas:
O pesquisador deve saber como as variáveis estão inter-relacionadas para melhor interpretar os resultados.
Sendo assim, esse pesquisador deverá estar em permanente contato com os especialistas para assegurar a
qualidade e a confiabilidade dos resultados. Hoje a base de dados do SNIS corresponde a mais de 4.500
(quatro mil e quinhentos) municípios respondentes, centenas de informações primárias e dezenas de
indicadores calculados para formar a base de dados de informações sobre saneamento. Dentre esses muitos
respondentes, alguns respondem parcialmente aos questionários, significando que alguns critérios devam ser
estabelecidos para inclusão na amostra em estudo. Sendo assim, procedeu-se uma análise exploratória dessas
informações que hoje formam uma série histórica de mais de 10 (dez) anos, no sentido de encontrar um
subconjunto de dados e indicadores que, em primeiro lugar, estejam correlacionados entre si e, em segundo
lugar, sejam passíveis de se correlacionarem com variáveis exógenas indispensáveis para a formação de um
modelo de conhecimento que contemple as dimensões sociais e geopolíticas;
A qualidade e o significado dos fatores determinados refletem as estruturas conceituais das variáveis
incluídas na análise. Isto deixa claro que a seleção de variáveis é uma tarefa para especialistas. Quando feita
por um analista, deverá ser assistida pelos especialistas. No nosso caso, a seleção foi assistida pelos
especialistas da equipe de técnicos e consultores da UGP/PMSS;
ABES – Associação Brasileira de Engenharia Sanitária e Ambiental 3
4. 25º Congresso Brasileiro de Engenharia Sanitária e Ambiental
Deve-se desenvolver um modelo conceitual que evite a omissão de uma variável preditora crítica, bem como
a inserção indiscriminada de variáveis esperando que a técnica “revele” as variáveis relevantes. Em primeiro
lugar porque as variáveis irrelevantes podem aumentar o ajuste dos dados da amostra, mas torná-los menos
generalizáveis. Em segundo lugar, as variáveis irrelevantes, embora não afetem as estimativas das variáveis
relevantes, podem mascarar os verdadeiros efeitos em razão da multicolinearidade. Assim, incluir
indiscriminadamente variáveis conceitualmente irrelevantes pode provocar vários efeitos indesejáveis, ainda
que essas variáveis adicionais não influenciem diretamente os resultados do modelo. Após discussões
preliminares com a equipe técnica, decidiu-se iniciar o estudo explorando apenas o sub-conjunto de
indicadores e variáveis operacionais de água e de esgoto, que são os mais antigos e completos integrantes da
base de dados do SNIS;
Os resultados obtidos serão tão bons e confiáveis quanto os dados introduzidos na análise. Bons conjuntos de
dados premiam o pesquisador com bons resultados. A qualidade e a confiabilidade dos indicadores e dados do
SNIS, de fato, é uma das teses deste estudo, cujos resultados trazem uma confirmação da mesma.
A Captura das Informações
O Banco de Dados do SNIS – Sistema Nacional de Informações sobre Saneamento mantém em sua série
histórica indicadores municipais calculados somente quando da suficiência de dados primários necessários
para a sua consecução. Por essa razão, a captura das informações para o presente estudo obedece ao critério
de seleção dos respondentes (municípios) com suficiência de dados. Após várias simulações foram
selecionadas para o estudo as variáveis apresentadas na Tabela 01, tendo como referência a base de dados do
SNIS do ano de 2005.
Tabela 1: Variáveis Selecionadas.
Ordem Variável Descrição Origem
1 I10 Índice de Micro-medição Relativo ao Volume SNIS
Disponibilizado
2 I13 Índice de Perdas de Faturamento SNIS
3 I25 Volume de Água Disponibilizado por Economia SNIS
4 I49 Índice de Perdas na Distribuição SNIS
5 I15 Índice de Coleta de Esgotos SNIS
6 I24 Índice de Atendimento Urbano de Esgoto SNIS
7 I56 Índice de Atendimento Total de Esgoto SNIS
8 MI Mortalidade Infantil Estimada FIOCRUZ
9 IDHM_RENDA Componente de Renda do IDHM IDHM_2000
10 IDHM_LOGEVIDADE Componente de Longevidade do IDHM IDHM_2000
11 IDHM_EDUCACAO Componente de Educação do IDHM IDHM_2000
Fonte: SNIS, 2006; IBGE; FIOCRUZ.
Ao analisar a Tabela 1, percebe-se o foco em três dimensões principais, a saber: desempenho dos serviços de
abastecimento de água, cobertura e desempenho dos serviços de esgotamento sanitário e, como indicadores da
dimensão social, o índice de desenvolvimento humano e da mortalidade infantil das populações atendidas.
Conforme o critério apresentado, a coleção de dados foi feita a partir de uma consulta ao banco de dados do
SNIS, a qual filtrou todos os municípios com valores não nulos para as variáveis em estudo.
A tabela obtida foi exportada para o Excel, servindo então como dados de entrada para o software de
estatística avançada. Neste estudo foi utilizado o programa SPSS.
A Análise Fatorial
Na análise fatorial as variáveis que não carregam significativamente em nenhum fator ou que apresentem
comunalidades muito baixas devem ser ignoradas ou eliminadas. Ignorar uma variável pode ser apropriado se
o objetivo for apenas a redução dos dados. Eliminar a variável pode ser apropriado quando esta é de menor
importância para o objetivo do estudo ou quando apresenta valor de comunalidade muito baixo. Quando
4 ABES – Associação Brasileira de Engenharia Sanitária e Ambiental
5. 25º Congresso Brasileiro de Engenharia Sanitária e Ambiental
eliminada uma ou mais variáveis, o conjunto de dados deve ser processado novamente.
Significância das Cargas Fatoriais
Significância Prática: Considera-se que os valores das cargas fatoriais possuem as significâncias práticas
apresentadas na Tabela 2.
Tabela 2: Cargas Fatoriais e Significâncias Práticas.
Valor da Carga Significância Prática
> +- 0.30 Nível Mínimo
> +- 0.40 Importantes
> +- 0.50 Possuem Significância Prática
O quadrado das cargas fatoriais representa a quantia da variância total da variável explicada pelo fator.
Significância Estatística: Em termos da significância estatística, podemos trabalhar em duas dimensões: o
tamanho da amostra e o número de variáveis. Assim, considera-se a seguinte tabela de significância das
cargas em função do tamanho da amostra, conforme apresentado na Tabela 3.
Tabela 3: Valor da Carga e Tamanho da Amostra
Valor da Carga Tamanho da Amostra
(respondentes)
0.30 350
0.35 250
0.40 200
0.45 150
0.50 120
0.55 100
0.60 85
0.65 70
0.70 60
0.75 50
No nosso estudo, estamos trabalhando com uma amostra maior que 350 respondentes, sugerindo que valores
das cargas fatoriais < 0.30 têm significância estatística (1).
O número de variáveis em análise também é importante na significância das cargas, guardando a seguinte
relação:
número de variáveis < o valor das cargas significantes
Sobre as Comunalidades
A comunalidade mostra a quantia da variância em uma variável que é explicada pelos fatores extraídos
juntos. Em outras palavras, significa o quanto da variância de uma dada variável é explicada pela solução
fatorial.
Análise de Componentes
A matriz geral de correlação é transformada por meio de estimação de um modelo fatorial para obtenção de
uma matriz fatorial. As cargas fatoriais de cada variável nos fatores são interpretadas para identificar a
estrutura latente das variáveis. De forma geral, quanto maior o número de fatores extraídos, melhor será o
ajuste e maior será a porcentagem da variância do dado explicado pela solução fatorial. Todavia, quanto
maior o número de fatores extraídos, menor a parcimônia da solução. Evidentemente, isto pressupõe a
existência de critérios para a limitação do número ideal de fatores. No nosso estudo adotamos o critério da
raiz latente.
ABES – Associação Brasileira de Engenharia Sanitária e Ambiental 5
6. 25º Congresso Brasileiro de Engenharia Sanitária e Ambiental
Raiz Latente: Pelo critério da raiz latente, somente autovalores > 1.0 são considerados na seleção de
componentes para análise posterior.
Teste de Scree: Este teste poderá indicar outros fatores com valores próximos de 1.0 como sendo apropriados.
A Interpretação dos Fatores
Quando variáveis são muito diferentes, ou seja, não guardam correlações consideráveis entre si, o índice
obtido pela soma dos traços será baixo. Do contrário, se as variáveis recaírem em um ou mais grupos
altamente relacionados, esse índice se aproximará de 100%. Todavia, o aprofundamento dessa discussão
impõe a necessidade de se proceder uma análise da importância e da consistência interna dos fatores. A
importância de um fator (ou um conjunto de fatores) é avaliada pela proporção da variância representada pelo
fator após a rotação. Se for uma rotação ortogonal, a importância do fator estará relacionada com o tamanho
dos seus SSLs (Soma das Cargas Quadráticas da Matriz de Componentes Após a Rotação). Essa somas
(SSLs) são convertidas para uma grandeza da proporção de variância para um fator, dividindo-as pelo
número de variáveis (2).
Sobre a Rotação da Matriz de Componentes
A importância de um fator é avaliada pela proporção da variância representada pelo fator após a rotação. A
rotação favorece a análise dos componentes na medida em que revela as dimensões subjacentes da solução
fatorial apresentada. A partir da rotação, poderemos inclusive dar nomes aos fatores até então identificados
por números. Esses fatores, evidentemente, estarão associados àquelas dimensões latentes que buscamos
medir.
FASE II – ANÁLISE DA MATRIZ DE CORRELAÇÃO DOS INDICADORES OPERACIONAIS DE
ÁGUA E ESGOTO DO SNIS ANO 2005
Conforme ficou recomendado na FASE I, passamos a estudar o conjunto de indicadores do SNIS objetivando
verificar a sua consistência interna e completude. Para esse efeito, escolhemos começar pelo conjunto de
indicadores operacionais de água e esgoto, uma vez que acreditamos ser o desempenho operacional um dos
fatores responsáveis pelo registro de grandes perdas nos sistemas e pela dificuldade de universalizar os
serviços no país. Foram processados 30 (trinta) indicadores operacionais do SNIS, do ano de referência de
2005, para uma amostra de 721 (municípios) respondentes. Procedeu-se a análise obtendo-se a matriz de
correlação apresentada na Tabela 4.
A Análise das Comunalidades entre os Indicadores Operacionais de Água e Esgoto do SNIS
O quadro que segue faz uma análise das comunalidades. Consideramos neste estudo que os níveis de
explicação aceitáveis estariam acima de 50%. Sendo assim, todas as variáveis com comunalidades iguais ou
menores a 0.50 são consideradas como tendo um nível de explicação insuficiente. Se há variáveis com
comunalidades consideradas baixas, há duas opções possíveis: (1) interpretar a solução ignorando essas
variáveis, ou (2) eliminar a variável, o que exigirá um novo processamento do conjunto reduzido [1].
Considerando sempre a contribuição de cada variável para os objetivos do estudo, optamos pela eliminação
quando apropriada, pois, um dos nossos objetivos principais está na redução dos dados. A Tabela 5 apresenta
a análise das comunalidades.
6 ABES – Associação Brasileira de Engenharia Sanitária e Ambiental
7. 25º Congresso Brasileiro de Engenharia Sanitária e Ambiental
ABES – Associação Brasileira de Engenharia Sanitária e Ambiental 7
8. 25º Congresso Brasileiro de Engenharia Sanitária e Ambiental
Tabela 5: Análise das Comunalidades
Inicia Correlação
Indicadores l Comunalidade
I01-Densidade de Economias Esta variável apresenta baixa comunalidade,
de Água por Ligação confirmando a pouca correlação que mantém com
os demais fatores em estudo. Apresenta uma
1,000 ,601
correlação, ainda pouco significativa, com a
variável I51-Índice de Perdas por Ligação.
Tornou-se uma candidata a sair da amostra.
I09-Índice de Hidrometração A alta comunalidade já recomenda. Essa variável
apresenta cargas fatoriais bastante significativas
para os fatores I44-Índice de Micromedição
Relativo ao Consumo e I10-Índice de
1,000 ,840
Micromedição Relativo ao Volume
Disponibilizado. Apresenta também uma carga
considerável para o fator I57-Índice de
Fluoretação da Água.
I10- Índice de Micromedição A comunalidade está dizendo. Esta variável
Relativo ao Volume apresenta as maiores cargas para os fatores I13-
Disponibilizado Índice de Perdas de Faturamento (observar o
sinal trocado, significando que quando um
aumenta, o outro diminui) e com o I28-Índice de
Faturamento de Água (notar que apresentam a
mesma carga fatorial, significando que são
grandezas da mesma natureza e muito
1,000 ,910 próximas na definição). Apresenta também forte
correlação inversa com I51-Índice de Perdas por
Ligação, e direta com I52-Índice de Consumo de
Água. Apresenta ainda considerável relação
inversa com I25-Volume de Água Disponibilizado
por Economia, e direta com I09-Índice de
Hidrometração e I44-Índice de Micromedição
Relativo ao Consumo. É forte candidata a
permanecer na análise.
I11-Índice de Macromedição Notar como essa variável não mantém correlação
1,000 ,527 significativa com nenhuma das outras. É
candidata a sair da análise.
I13-Índice de Perdas de Essa variável também vem com uma forte
Faturamento comunalidade. Apresenta as maiores cargas para
os fatores I49-Índice de Perdas na Distribuição
e I52-Índice de Consumo de Água (inversa).
Apresenta também fortes correlações com I10-
Índice de Micromedição Relativo ao Volume
Disponibilizado (inversa) e com I51-Índice de
Perdas por ligação. Uma curiosidade: a matriz de
correlação está dizendo que essa grandeza é
1,000 ,905 perfeitamente explicada pelo inverso da grandeza
em I28-Índice de Faturamento de Água. Em
outras palavras, significa que são medidas
complementares de uma mesma grandeza. É forte
candidata a permanecer na análise, mas I28-
Índice de Faturamento de Água pode sair.
Embora algumas coisas pareçam óbvias, é bom
lembrar que essas relações surgiram da análise
estatística dos dados do SNIS, o que mostra a
consistência desses dados.
8 ABES – Associação Brasileira de Engenharia Sanitária e Ambiental
9. 25º Congresso Brasileiro de Engenharia Sanitária e Ambiental
Tabela 5: Análise das Comunalidades. (continuação)
Inicia Correlação
Indicadores l Comunalidade
I14-Consumo Micromedido Com uma comunalidade menor, essa variável
por Economia apresenta a maior carga fatorial para o fator I53-
Consumo Médio de Água por Economia,
1,000 ,753
seguida pelo fator I17-Consumo de Água
Faturado por Economia e por I22-Consumo
Médio per Capta de Água.
I17-Consumo de Água Apresentando um perfil muito parecido com o do
Faturado por Economia I14-Consumo Micromedido por Economia, essa
variável tem a maior carga fatorial para o fator
I53-Consumo Médio de Água por Economia,
seguida pelo fator I14- Consumo Micromedido
por Economia e por I22-Consumo Médio per
1,000 ,823 Capta de Água; deve-se observar que essa
variável apresenta maior comunalidade do que
I14, significando que ela pode ser melhor
explicada pela solução fatorial. É candidata a
sair em favor de I53. Se permanecer, será em
detrimento de I14- Consumo Micromedido por
Economia, evidentemente.
I20-Extensão de Rede de Água Com comunalidade muito baixa, essa variável não
por Ligação apresenta correlação significativa com nenhuma
1,000 ,505
das outras. É forte candidata a ficar fora da
análise.
I22-Consumo Médio per Comunalidade razoável. Em comparação com
Capta de Água outras variáveis, apresenta cargas apenas
razoáveis para os fatores I53-Consumo Médio de
Água por Economia, I17-Consumo de Água
Faturado por Economia e I14- Consumo
1,000 ,786
Micromedido por Economia, respectivamente.
Como sugerimos ficar com I17 em detrimento de
I14, o argumento para a manutenção dessa
variável fica enfraquecido. Candidata a sair da
análise.
I23-Índice de Atendimento Comunalidade apenas razoável. Essa variável
Urbano de Água apresenta correlação significativa apenas com o
1,000 ,767
fator I55-Índice de Atendimento Total de Água.
É candidata a ficar fora da análise.
I25-Volume de Água Com uma comunalidade alta, apresenta a maior
Disponibilizado por Economia carga para o fator I51-Índice de Perdas por
ligação. Essa forte correlação, em si, é uma tese
dos nossos estudos. A seguir, apresenta altas
cargas para I13-Índice de Perdas de
Faturamento e para I28-Índice de Faturamento
1,000 ,913
de Água (inversa), as quais demonstraram ser
redundantes nesta análise. Segue-se a correlação
razoável com I49-Índice de Perdas na
Distribuição e I52-Índice de Consumo de Água
(inversa). Deve permanecer na análise em
defesa da tese citada acima.
I43-Partcipação das Comunalidade muito baixa. Não mantém
1,000 ,565
Economias Residenciais de correlação significativa com nenhuma das outras
ABES – Associação Brasileira de Engenharia Sanitária e Ambiental 9
10. 25º Congresso Brasileiro de Engenharia Sanitária e Ambiental
Água no Total de Economias variáveis. É candidata a ficar fora da análise.
de Água
Tabela 5: Análise das Comunalidades. (continuação)
Inicia Correlação
Indicadores l Comunalidade
I44-Índice de Micromedição Apresentando alta comunalidade, essa variável
Relativo ao Consumo apresenta cargas fatoriais bastante significativas
para os fatores I09- Índice de Hidrometração e
I10-Índice de Micromedição Relativo ao
1,000 ,882 Volume Disponibilizado. Apresenta também uma
carga considerável para o fator I57-Índice de
Fluoretação da Água. Mas, observe-se que essa
variável poderia estar bem representada por
I09 ou I10.
I49-Índice de Perdas na Com alta comunalidade, essa variável apresenta as
Distribuição maiores cargas nos fatores I13 e I28 (em relação
inversa), a qual se recomenda sair da amostra.
Apresenta ainda forte correlação com I51-Índice
de Perdas por ligação e uma relação inversa com
1,000 ,956 I10-Índice de Micromedição Relativo ao
Volume Disponibilizado. A análise mostra uma
redundância numa relação inversa com a variável
I52-Índice de Consumo de Água. São, de fato,
grandezas complementares. Pode permanecer
na Amostra em detrimento de I52.
I50-Índice Bruto de Perdas Apresenta a comunalidade mais baixa dessa
Lineares amostra. Consequentemente, não mantém
1,000 ,269
correlação significativa com nenhuma das outras
variáveis. Deve ficar fora da análise.
I51-Índice de Perdas por Com a maior carga fatorial em I25-Volume de
Ligação Água Disponibilizado por Economia, observar
como ela reproduz as correlações daquela
1,000 ,860
variável, mas com uma comunalidade menor.
Poderia estar representada por I25. Candidata a
sair da análise.
I52-Índice de Consumo de A matriz de correlação está dizendo que esses
Água indicadores são “idênticos”. De fato, ao observar a
composição de ambos, vemos que I49 = 1 – I52;
1,000 ,956
isto é, como eles são expressos em percentagem,
então são complementares. Sugere-se excluí-lo da
amostra.
I53-Consumo Médio de Água Com alta comunalidade, essa variável apresenta a
por Economia mesma composição de I17-Consumo de Água
Faturado por Economia, mas com uma
1,000 ,922
comunalidade muito maior. Sugere-se mantê-la
em detrimento de I17 e em detrimento de I14-
Consumo Micromedido por Economia.
I55-Índice de Atendimento Comunalidade razoável. Apresenta a maior carga
Total de Água no fator I23-Índice de Atendimento Urbano de
1,000 ,790
Água, que é uma candidata a ficar fora.
Apresenta uma carga razoável no fator I56-Índice
10 ABES – Associação Brasileira de Engenharia Sanitária e Ambiental
11. 25º Congresso Brasileiro de Engenharia Sanitária e Ambiental
de Atendimento Total de Esgoto Referido aos
Municípios Atendidos com Água. Perde, porém,
em comunalidade para I-56. Candidata a ficar
fora, em favor de I-56.
I57-Índice de Fluoretação da Comunalidade baixa, justificando as baixas cargas
1,000 ,611
Água dos demais fatores. Candidata a ficar fora.
I58-Índice de Consumo de Apresenta baixas cargas para os fatores em estudo.
Energia Elétrica em Sistemas 1,000 ,856 Candidata a ficar fora.
de Abastecimento de Água
Tabela 5: Análise das Comunalidades. (continuação)
Inicia Correlação
Indicadores l Comunalidade
I15- Índice de Coleta de Com comunalidade alta, apresenta cargas bastante
Esgoto significativas para os fatores I24-Índice de
Atendimento Urbano de Esgoto Referido aos
Municípios Atendidos com Água e I47- Índice
de Atendimento Urbano de Esgoto Referido aos
1,000 ,907
Municípios Atendidos com Esgoto. Apresenta
também uma carga bastante alta para o fator I56-
Índice de Atendimento Total de Esgoto
Referido aos Municípios Atendidos com Água.
Deve permanecer na amostra.
I28-Índice de Faturamento de Recomendada sair pela semelhança com I13-
1,000 ,905
Água Índice de Perdas de Faturamento
I16-Índice de Tratamento de Apresenta uma carga razoável apenas no fator
Esgoto 1,000 ,933 I46-Índice de Esgoto Tratado Referido a Água
Consumida. Candidata a ficar fora.
I21-Extensão da Rede de Com comunalidade alta, apresenta uma carga alta
Esgoto por Ligação apenas no fator I59-Índice de Consumo de
1,000 ,932
Energia Elétrica em Sistemas de Esgotamento
Sanitário. Candidata a sair.
I24- Índice de Atendimento Com comunalidade alta, observar como a
Urbano de Esgoto Referido composição de I24 e I47 são idênticas em termos
1,000 ,957
aos Municípios Atendidos com das cargas fatoriais, sendo que uma explica
Água totalmente a outra.
I46-Índice de Esgoto Tratado Apresenta carga fatorial razoável apenas para a
Referido a Água Consumida 1,000 ,957 variável I16, que é candidata a ficar fora. Deve
sair.
I47-Índice de Atendimento Pela sua própria definição, deve sair em favor de
Urbano de Esgoto Referido I-24.
1,000 ,957
aos Municípios Atendidos com
Esgoto
I56-Índice de Atendimento Apresenta elevadas cargas para os fatores I24 e
Total de Esgoto Referido aos I47, as quais, por sua vez, são intercambiáveis.
Municípios Atendidos com 1,000 ,946 Apresenta carga elevada também para o fator I15-
Água Índice de Coleta de Esgoto, que deve
permanecer na amostra.
I59-Índice de Consumo de Com comunalidade alta, apresenta uma carga alta
Energia Elétrica em Sistemas 1,000 ,929 apenas no fator I21-Extensão da Rede de Esgoto
de Esgotamento Sanitário por Ligação. Deve sair.
Método de Extração: Análise do Componente Principal
ABES – Associação Brasileira de Engenharia Sanitária e Ambiental 11
12. 25º Congresso Brasileiro de Engenharia Sanitária e Ambiental
FASE III – ANÁLISE DA MATRIZ DE CORRELAÇÃO DO CONJUNTO REDUZIDO DOS
INDICADORES DO SNIS
Conforme as recomendações da FASE II, passamos a estudar um subconjunto dos indicadores operacionais
de água e esgoto que seja representativo dos demais, e que apresente uma consistência interna, antes de uma
nova tentativa de estabelecer as suas correlações com variáveis exógenas. Sendo assim, procedeu-se um novo
processamento dos dados, mantendo-se os mesmos 721 (municípios) respondentes para um conjunto de 8
(oito) indicadores selecionados da fase anterior para o ano de referência de 2005. Como poderá ser verificado
doravante, esse subconjunto já está muito próximo de ser o mais representativo do conjunto de indicadores
operacionais de água e esgoto analisado na Fase II.
Devemos sempre lembrar que um dos nossos objetivos, de fato, é a redução de dados. A primeira razão para a
busca de uma redução dos dados parece óbvia: a grande quantidade de informações que são coletadas,
consistidas e sistematizadas pelo SNIS. A segunda forte razão é mais sutil: conforme verificado nas análises
anteriores, muitos indicadores possuem estruturas semelhantes (como é o caso de grandezas
complementares), sendo recomendável a sua exclusão da análise; mas isso não invalida a sua presença na
série histórica do SNIS por uma questão conceitual. Sendo assim, devemos prosseguir com as análises tendo
em mente que algumas restrições aqui colocadas aos indicadores pré-existentes no SNIS, o são em função de
necessidades do tipo de análise que está sendo feita.
Não se pode afirmar, a partir dessa análise exploratória, que determinado indicador seja dispensável, quer
seja pela sua semelhança com outros indicadores, quer seja pela sua baixa correlação com o conjunto
explorado. O que, de fato, justifica a existência de um indicador é o próprio conceito que ele encerra. Isto
posto, como na fase anterior, passamos a analisar a matriz de correlação e as comunalidades do subconjunto
dos indicadores operacionais de água e de esgoto resultante das discussões da Fase II.
A Análise Fatorial e a Matriz de Correlação do Conjunto Reduzido
A Tabela 6 apresenta os resultados da Matriz de correlação e a Tabela 7 os resultados da análise de
comunalidades do conjunto reduzido de indicadores do SNIS.
Tabela 6: Matriz de Correlação(a).
I10 I13 I25 I49 I53 I15 I24 I56
Correlação I10 1,000 -,795 -,686 -,773 -,122 ,160 ,221 ,160
I13 -,795 1,000 ,730 ,848 ,130 -,063 -,150 -,031
I25 -,686 ,730 1,000 ,606 ,567 -,037 -,104 ,001
I49 -,773 ,848 ,606 1,000 -,184 -,081 -,159 -,093
I53 -,122 ,130 ,567 -,184 1,000 ,093 ,103 ,180
I15 ,160 -,063 -,037 -,081 ,093 1,000 ,890 ,873
I24 ,221 -,150 -,104 -,159 ,103 ,890 1,000 ,932
I56 ,160 -,031 ,001 -,093 ,180 ,873 ,932 1,000
a Determinant = ,000
Tabela 7: Análise das Comunalidades do Conjunto Reduzido de Indicadores do SNIS.
Inicia Comunalidad Correlação
Indicadores l e
I10- Índice de Micromedição Com a comunalidade menor do que na fase
Relativo ao Volume anterior, mas ainda alta, esta variável apresenta
Disponibilizado as maiores cargas para os fatores I13-Índice de
Perdas de Faturamento, I49-Índice de Perdas na
Distribuição e I25-Volume de Água
1,000 ,831
Disponibilizado por Economia (observar o sinal
trocado em todos os componentes, significando
que quando I10 aumenta, os fatores acima
diminuem). Isto, em hipótese, significa que a
micromedição reduz as perdas e inibe o
12 ABES – Associação Brasileira de Engenharia Sanitária e Ambiental
13. 25º Congresso Brasileiro de Engenharia Sanitária e Ambiental
desperdício. Deve-se atentar para o fato de que
neste estudo, isto não é uma questão conceitual ou
um postulado, mas sim aquilo que a amostra do
SNIS está traduzindo através de um construto,
um ente estatístico. A compreensão disto é
fundamental para qualquer discussão posterior.
I13-Índice de Perdas de A variável I13-Índice de Perdas de Faturamento
Faturamento apresenta a maior carga para o fator I49-Índice de
Perdas na Distribuição. Pelos mesmos motivos
acima, pode-se inferir que, ainda em hipótese, a
maior componente das perdas de faturamento
1,000 ,895 é a perda na distribuição. Também apresenta
cargas significativas para os fatores I10- Índice
de Micromedição Relativo ao Volume
Disponibilizado (agora com o sinal trocado) e
I25-Volume de Água Disponibilizado por
Economia.
Tabela 7: Análise das Comunalidades do Conjunto Reduzido de Indicadores do SNIS (continuação).
Inicia Comunalidad Correlação
Indicadores l e
I25-Volume de Água O que essa variável I25-Volume de Água
Disponibilizado por Economia Disponibilizado por Economia apresenta de
diferente é uma carga significativa no fator I53-
Consumo Médio de Água por Economia. Como
essa carga tem sinal positivo, podemos inferir que
o aumento da disponibilização de água
aumenta o consumo. Embutido neste aumento
1,000 ,918
de consumo, devemos considerar, encontra-se
uma parcela devida à demanda reprimida;
mas também, uma parcela devida ao
desperdício. São hipóteses da mais alta
relevância para o nosso estudo, e que não
emergem da erudição, mas sim dos dados
contidos na amostra.
I49-Índice de Perdas na Como não poderia deixar de ser, a maior carga
Distribuição 1,000 ,943 para essa variável está no fator I13-Índice de
Perdas de Faturamento.
I53-Consumo Médio de Água Por sua vez, a maior carga para essa variável está
por Economia no fator I25-Volume de Água Disponibilizado por
1,000 ,979
Economia. Sobre isso, são importantes as
considerações anteriores em I25.
I15- Índice de Coleta de Da análise anterior do conjunto completo, o I15-
Esgoto Índice de Coleta de Esgoto demonstra estar
fortemente correlacionado com o Atendimento
Referido aos Municípios Atendidos com Água
expresso pelos fatores I24 e I56. Esses
indicadores, por definição, surgem de uma
relação entre as populações atendidas por
1,000 ,911
esgotamento sanitário e as atendidas por
abastecimento de água. A amostra em estudo
demonstra não haver uma correlação
considerável entre os indicadores de esgoto e
aqueles da água. Isto é sintomático e revela
uma quadro preocupante para o saneamento
brasileiro.
ABES – Associação Brasileira de Engenharia Sanitária e Ambiental 13
14. 25º Congresso Brasileiro de Engenharia Sanitária e Ambiental
I24- Índice de Atendimento Possivelmente, essa variável estaria bem
Urbano de Esgoto Referido representada por I15.
1,000 ,952
aos Municípios Atendidos com
Água
I56-Índice de Atendimento Possivelmente, essa variável estaria bem
Total de Esgoto Referido aos representada por I15.
1,000 ,943
Municípios Atendidos com
Água
Método de Extração: Análise do Componente Principal
Partindo de um conjunto de 30 (trinta) indicadores operacionais de água e esgoto na FASE II, reduzimos
aquele conjunto para 8 (oito) indicadores nesta FASE III, cuja solução fatorial revela 3(três) componentes
capazes de explicar 92,14% da variância total do conjunto. Em vista das constatações da FASE I, esse
resultado se mostra bastante animador, uma vez que sugere termos encontrado um conjunto mínimo de
indicadores muito representativo da totalidade dos indicadores operacionais de água e esgoto do SNIS. Na
próxima fase, voltaremos a estudar a matriz de correlação com as variáveis exógenas, mas agora seguros de
termos um conjunto de indicadores consistentes entre si e representativos do conjunto maior.
Tabela 8: Variância Total Explicada
Comp Autovalores Iniciais Extração das SSL Rotação das SSL
% da % da % da
Variânci Cumulativ Variânci Cumulativ Variânci Cumulativ
Total a o% Total a o% Total a o%
1 3,451 43,139 43,139 3,451 43,139 43,139 3,150 39,373 39,373
2 2,677 33,464 76,602 2,677 33,464 76,602 2,810 35,126 74,499
3 1,243 15,543 92,145 1,243 15,543 92,145 1,412 17,647 92,145
4 ,229 2,867 95,012
5 ,156 1,949 96,961
6 ,129 1,613 98,575
7 ,061 ,762 99,337
8 ,053 ,663 100,000
Método de Extração: Análise do Componente Principal
FASE IV – ANÁLISE DA MATRIZ DE CORRELAÇÃO ENTRE OS INDICADORES DO SNIS, DO
IDHM E DO MI
Antes de partir para um conjunto mais amplo de variáveis exógenas, uma vez que já temos um conjunto
reduzido de indicadores do SNIS, daremos um passo intermediário que é proceder a análise de correlação
com 2 (dois) dos mais importantes indicadores municipais utilizados no Brasil, a saber: IDHM – Índice de
Desenvolvimento Humano Municipal do PNUD, e o MI – Indicador de Mortalidade Infantil Estimada dos
Municípios Brasileiros – do Sistema de Monitoramento dos Indicadores de Mortalidade Infantil da Fiocruz.
Nesta fase, trabalhamos com uma amostra de 860 municípios, ou seja, todos aqueles municípios para os quais
há suficiência de dados primários para o cálculo dos indicadores selecionados para este estudo, e relativos ao
ano de referência de 2005. Como se trata de uma análise exploratória, o objetivo deste passo é estabelecer
referências para a comparação dos efeitos dos fatores nas variáveis em função de tamanho e adequação da
amostra. Não nos detemos na análise dos componentes desta fase em favor de um aprofundamento das
discussões a partir de uma amostra otimizada estudada na Fase V.
Com relação às variáveis exógenas introduzidas na análise, temos a considerar que:
14 ABES – Associação Brasileira de Engenharia Sanitária e Ambiental
15. 25º Congresso Brasileiro de Engenharia Sanitária e Ambiental
O Índice de Desenvolvimento Humano foi criado originalmente para medir o nível de desenvolvimento
humano dos países a partir de indicadores de educação (alfabetização e taxa de matrícula), longevidade
(esperança de vida ao nascer) e renda (PIB per capita). O índice varia de 0 (nenhum desenvolvimento
humano) a 1 (desenvolvimento humano total). Países com IDH até 0,499 têm desenvolvimento humano
considerado baixo; os países com índices entre 0,500 e 0,799 são considerados de médio desenvolvimento
humano; países com IDH maior que 0,800 têm desenvolvimento humano considerado alto.
No caso da MI – Estimativa da Mortalidade Infantil dos Municípios Brasileiros, os indicadores foram
classificados em cinco grandes dimensões: I. Contextuais, que estabelece o contexto em que ocorrem os
óbitos infantis, sendo representada por características sócio-demográficas da população; II. Mortalidade
Proporcional, que é composta por indicadores relativos à estrutura de causas de morte e à distribuição etária
dos óbitos entre os menores de um ano; III. Relacionados ao Nascimento, para caracterizar as condições do
nascimento e da assistência à gestação e ao parto; IV. Indicadores de adequação das informações vitais, que
tem o propósito de estabelecer a adequação das informações vitais no nível municipal com vistas ao cálculo
direto da mortalidade infantil; V. Indicadores de completitude e consistência das variáveis constantes nas
declarações de óbito infantil e de nascimento, que visa monitorar a qualidade de preenchimento dos campos
das declarações de óbito infantil e de nascimento.
A Análise Fatorial e a Matriz de Correlação da Fase IV
A Tabela 9 apresenta a Matriz de Correlação referente à Fase IV e a Tabela 10 a variância total explicada.
Tabela 9: Matriz de Correlação(a)
IDHM IDHM IDHM MI
I10 I13 I25 I49 I15 I24 I56 RENDA LONGE EDUCA 1000
Corr. I10 1,000 -,790 -,578 -,730 ,214 ,287 ,223 ,057 ,116 -,014 -,148
I13 -,790 1,000 ,599 ,824 -,117 -,212 -,106 ,127 ,048 ,191 ,015
I25 -,578 ,599 1,000 ,522 -,076 -,136 -,071 ,072 ,006 ,121 ,082
I49 -,730 ,824 ,522 1,000 -,135 -,220 -,161 ,060 -,002 ,123 ,027
I15 ,214 -,117 -,076 -,135 1,000 ,886 ,871 ,400 ,325 ,254 -,236
I24 ,287 -,212 -,136 -,220 ,886 1,000 ,939 ,352 ,333 ,197 -,262
I56 ,223 -,106 -,071 -,161 ,871 ,939 1,000 ,480 ,404 ,338 -,309
IDHM_RENDA ,057 ,127 ,072 ,060 ,400 ,352 ,480 1,000 ,626 ,843 -,530
IDHM_LONGE ,116 ,048 ,006 -,002 ,325 ,333 ,404 ,626 1,000 ,599 -,462
IDHM_EDUCA -,014 ,191 ,121 ,123 ,254 ,197 ,338 ,843 ,599 1,000 -,542
MI_1000 -,148 ,015 ,082 ,027 -,236 -,262 -,309 -,530 -,462 -,542 1,000
a Determinant = 8,34E-005
Tabela 10: Variância Total Explicada
Comp
. Autovalores Iniciais Extração das SSL Rotação das SSL
% da % da % da
Variânci Cumulativ Variânci Cumulativ Variânci Cumulativ
Total a o% Total a o% Total a o%
1 4,082 37,107 37,107 4,082 37,107 37,107 3,075 27,955 27,955
2 3,107 28,249 65,356 3,107 28,249 65,356 2,862 26,019 53,974
3 1,550 14,089 79,445 1,550 14,089 79,445 2,802 25,470 79,445
4 ,584 5,310 84,755
5 ,501 4,554 89,309
6 ,446 4,052 93,362
7 ,255 2,317 95,679
ABES – Associação Brasileira de Engenharia Sanitária e Ambiental 15
16. 25º Congresso Brasileiro de Engenharia Sanitária e Ambiental
8 ,156 1,418 97,097
9 ,141 1,283 98,380
10 ,135 1,230 99,610
11 ,043 ,390 100,000
Extraction Method: Principal Component Analysis.
FASE V – REFINAMENTO DA AMOSTRA E ANÁLISE DOS COMPONENTES
O Tamanho e Dimensões da Amostra
Entre os pesquisadores há muita discussão sobre o tamanho ideal da amostra. Alguns defendem que a
amostra deve ter um número de respondentes no mínimo de 10(dez) vezes o número de variáveis em análise.
Outros defendem que esse número deverá ser de 20(vinte) vezes, ou até mais em alguns casos. De qualquer
forma, uma coisa é certa: amostras grandes em número de variáveis poderão produzir o que se chama de um
“super ajuste” que irá aparecer através da multicolinearidade. Quando isso ocorre, ou quando o número de
respondentes é muito grande, cargas fatoriais menores passam a ter significância, podendo ocorrer o
mascaramento de efeitos que desejamos medir.
A nossa amostra, usada na Fase IV, com 860 respondentes, mostra-se muito grande segundo as
recomendações. Esses 860 municípios são aqueles que apresentam suficiência de informações na base de
dados do SNIS para efeito do cálculo dos indicadores selecionados para este estudo, não representando,
todavia, a totalidade da base do SNIS. Sendo assim, ainda como uma medida exploratória, procuramos
reduzi-la utilizando vários critérios, e o que se mostrou mais adequado ao problema em estudo foi o “corte”
pela população. Ao filtrar os municípios com populações acima de 50.000 habitantes, reduzimos a amostra
para 316 respondentes, um tamanho bem mais adequado se consideradas as argumentações teóricas. Todavia,
devemos salientar que essa medida não pode implicar em perda do potencial de generalização dos resultados
para o conjunto dos municípios brasileiros. Na realidade, isto se coloca como uma condição indispensável
para o uso continuado desta metodologia na exploração dos dados da série histórica do SNIS.
Tabela 11: Matriz de Correlação Antes da Redução(a)
IDHM IDHM IDHM MI
I10 I13 I25 I49 I15 I24 I56 RENDA LONGE EDUCA 1000
I10 1,000 -,790 -,578 -,730 ,214 ,287 ,223 ,057 ,116 -,014 -,148
I13 -,790 1,000 ,599 ,824 -,117 -,212 -,106 ,127 ,048 ,191 ,015
I25 -,578 ,599 1,000 ,522 -,076 -,136 -,071 ,072 ,006 ,121 ,082
I49 -,730 ,824 ,522 1,000 -,135 -,220 -,161 ,060 -,002 ,123 ,027
I15 ,214 -,117 -,076 -,135 1,000 ,886 ,871 ,400 ,325 ,254 -,236
I24 ,287 -,212 -,136 -,220 ,886 1,000 ,939 ,352 ,333 ,197 -,262
I56 ,223 -,106 -,071 -,161 ,871 ,939 1,000 ,480 ,404 ,338 -,309
IDHM_RENDA ,057 ,127 ,072 ,060 ,400 ,352 ,480 1,000 ,626 ,843 -,530
IDHM_LONGE ,116 ,048 ,006 -,002 ,325 ,333 ,404 ,626 1,000 ,599 -,462
IDHM_EDUCA -,014 ,191 ,121 ,123 ,254 ,197 ,338 ,843 ,599 1,000 -,542
MI_1000 -,148 ,015 ,082 ,027 -,236 -,262 -,309 -,530 -,462 -,542 1,000
a Determinant = 8,34E-005
Tabela 12: Matriz de Correlação Depois da Redução(a)
IDHM IDHM IDHM MI
I13 I10 I25 I49 I15 I24 I56 RENDA LONGE EDUCA 1000
I13 1,000 -,813 ,616 ,801 -,137 -,271 -,252 -,039 -,033 ,054 ,035
I10 -,813 1,000 -,648 -,776 ,241 ,373 ,375 ,193 ,181 ,095 -,173
I25 ,616 -,648 1,000 ,534 -,067 -,148 -,138 ,003 -,089 ,096 ,071
I49 ,801 -,776 ,534 1,000 -,122 -,246 -,234 -,055 -,034 ,020 ,023
16 ABES – Associação Brasileira de Engenharia Sanitária e Ambiental
17. 25º Congresso Brasileiro de Engenharia Sanitária e Ambiental
I15 -,137 ,241 -,067 -,122 1,000 ,869 ,875 ,529 ,362 ,385 -,336
I24 -,271 ,373 -,148 -,246 ,869 1,000 ,985 ,519 ,410 ,369 -,367
I56 -,252 ,375 -,138 -,234 ,875 ,985 1,000 ,564 ,437 ,422 -,403
IDHM_RENDA -,039 ,193 ,003 -,055 ,529 ,519 ,564 1,000 ,601 ,843 -,631
IDHM_LONGE -,033 ,181 -,089 -,034 ,362 ,410 ,437 ,601 1,000 ,608 -,632
IDHM_EDUCA ,054 ,095 ,096 ,020 ,385 ,369 ,422 ,843 ,608 1,000 -,676
MI_1000 ,035 -,173 ,071 ,023 -,336 -,367 -,403 -,631 -,632 -,676 1,000
a Determinant = 1,29E-005
A partir de uma análise visual, considerando apenas o padrão de cor, percebe-se que a redução da amostra
resultou num sensível aumento das cargas fatoriais dos componentes. Como havíamos afirmado antes, de
fato, um super ajuste provocado pelo tamanho da amostra pode mascarar os efeitos dos fatores sobre as
variáveis em estudo.
A Medida da Adequação da Amostra
Uma medida para quantificar o grau de inter-correlações entre as variáveis e da adequação da análise fatorial
é a medida de adequação da amostra (MSA). Esse índice varia de 0 a 1, alcançando 1 quando cada variável
é perfeitamente prevista sem erro pelas outras variáveis.
Nesse estudo, o valor para a MSA pode ser observado pela Tabela 13, antes da redução, e Tabela 14, após a
redução.
Tabela 13: Testes de KMO e Bartlett (antes da redução)
Medida da Adequação da Amostra de Kaiser-
,802
Meyer-Olkin - KMO
Approx. Chi-Square 8024,909
df 55
Sig. ,000
Tabela 14: Testes de KMO e Bartlett (após a redução)
Medida da Adequação da Amostra de Kaiser-
Meyer-Olkin - KMO ,822
Approx. Chi-Square 3494,851
df 55
Sig. ,000
Comparadas as medidas de adequação da amostra (MSA), vê-se que, após a redução da amostra deste estudo,
essa medida aumenta, acusando uma melhora do KMO de 0.802 para 0.822, o que vem reforçar a idéia de ser
bastante adequado o emprego da análise fatorial no caso em estudo. Já o teste de esfericidade de Bartlett
fornece um nível de significância (Sig.=0,000), que é inferior a 0,05, concluindo-se que as variáveis são
correlacionáveis (rejeitando-se a hipótese nula).
Com o MSA = 0.822, acreditamos que podemos prosseguir as análises dos resultados obtidos, com a
segurança de que estamos com uma boa medida de adequação da amostra (ver quadro abaixo). A medida
pode ser interpretada com as orientações apresentadas na Tabela 15.
Tabela 15: Valores de MSA
Valor Adequação
>= 0.80 admirável
ABES – Associação Brasileira de Engenharia Sanitária e Ambiental 17
18. 25º Congresso Brasileiro de Engenharia Sanitária e Ambiental
>= 0.70 < 0.80 mediano
>= 0.60 < 0.70 medíocre
>= 0.50 < 0.60 ruim
< 0.50 inaceitável
Considerando as estreitas faixas da medida da adequação da amostra indicadas na tabela, mostra-se bastante
relevante o salto qualitativo da amostra reduzida; bem como, no sentido contrário, revela-se ser a amostra
abrangente (com maior número de municípios), um importante indicador da qualidade e consistência
da base de dados do SNIS utilizada neste estudo.
O Método da Análise dos Componentes Principais (ACP)
É importante observar que o principal objetivo da análise fatorial é reduzir o número de variáveis para
explicar o fenômeno de interesse, além de gerar hipóteses por meio da análise exploratória dos dados. A
análise fatorial não comprova, necessariamente, hipóteses. O que se busca é, em primeiro lugar, a
recomendação ou não da aplicação do método em si; e, em segundo lugar, se o mesmo corresponde às
predições possíveis a partir de um profundo conhecimento das questões em análise. Um trabalho inicial de
prospecção como este deve ser submetido ao exame de especialistas com diferentes inserções no campo de
conhecimento explorado aqui.
CONSIDERAÇÕES GERAIS
1. A técnica da Análise Fatorial produz coeficientes de regressão (cargas fatoriais) que indicam a relação
entre o fator e cada variável original. Adotamos as cores: verde para indicar as cargas mais significativas (>=
0.60); amarelo para aquelas importantes (>= 0.40 < 0.60); e ocre para aquelas ainda relevantes (>= 0.30 <
0.4), considerando o tamanho da amostra inicial de 860 municípios para os quais existem informações para
cálculo dos indicadores selecionados na base de dados do SNIS, ano de referência 2005; e 316 municípios
com mais de 50.000 habitantes na amostra reduzida. A partir disto, o primeiro passo da análise é um exame
visual da matriz de correlação, quando se pode observar a significância das cargas de cada fator nas variáveis
correspondentes.
2. Como já evidenciado na FASE III, a solução fatorial está indicando não haver uma correlação muito
significativa entre os indicadores operacionais da água e os demais envolvidos na análise, quais sejam os de
esgoto e as variáveis IDHM_RENDA, IDHM_LONGEVIDADE, IDHM_EDUCAÇÃO e MI_1000. Todavia,
esse grupo de indicadores da água demonstra existir uma dimensão latente bem definida, com ênfase para a
oposição que se revela nesta dimensão entre a micromedição (I10 – Índice de Micromedição Relativo ao
Volume Disponibilizado) e o complexo de perdas (I13 – Índice de Perdas de Faturamento, I25 – Volume
de Água Disponibilizado por Economia e I49 – Índice de Perdas na Distribuição).
3. Do exame visual da matriz de acima se pode ainda verificar que existe uma correlação significativa entre
o grupo de indicadores operacionais de esgoto e o grupo de variáveis estrangeiras. Mas não deixa de ser
notada uma curiosidade: o atendimento total de esgoto está relacionado com fatores representativos do
IDHM, com ênfase para a componente IDHM_RENDA, com carga = 0.56, seguida pela componente
IDHM_LONGE, com carga = 0.43, evidenciando a hipótese de carência de serviços pela população
mais pobre, relacionando-a com a longevidade/salubridade. Encontra-se, todavia, em oposição, ou
inversamente proporcional, à mortalidade infantil, como era de se esperar, com a significativa carga =
- 0.40.
4. Observar como o grupo de indicadores operacionais de esgoto encontra-se em oposição ao complexo de
perdas. Isto também é sintomático. Isto, em hipótese, poderia indicar a falta de capacidade de
investimento decorrente do mal desempenho operacional?
5. Dentre as componentes do IDHM, a variável IDHM_RENDA é a que apresenta as maiores cargas para
os fatores correspondentes aos indicadores de esgotamento sanitário do SNIS. Todavia, no conjunto das
variáveis estudadas, seu fator mais importante é o representado pela componente IDHM_EDUCA, como era
de se esperar.
18 ABES – Associação Brasileira de Engenharia Sanitária e Ambiental
19. 25º Congresso Brasileiro de Engenharia Sanitária e Ambiental
6. A longevidade, que pode estar relacionada com as condições de salubridade também, apresenta como
principais fatores a renda, a educação, a mortalidade infantil (em oposição), e significativas cargas nos
fatores correspondentes aos indicadores de esgotamento sanitário do SNIS.
7. A mortalidade infantil, por sua vez, apresenta-se em oposição às dimensões do IDHM e dos fatores
correspondentes às condições de esgotamento sanitário do SNIS. Apresenta como seus principais fatores a
educação e a renda, respectivamente, com implicância na longevidade, e com relevantes cargas dos fatores
correspondentes aos indicadores de esgotamento sanitário do SNIS.
8. Mesmo no grupo de indicadores da água, que já apresentavam uma forte correlação, percebe-se um
sensível aumento das cargas fatoriais quando da redução da amostra.
9. O atendimento total de esgoto mostra-se mais fortemente relacionado com os fatores representativos do
IDHM e da MI – Mortalidade Infantil, para os municípios respondentes com mais de 50.000 habitantes. Para
a componente IDHM_RENDA, a carga fatorial passa de 0.48 para 0.56; seguida pela componente
IDHM_LONGE, que passa de 0.40 para 0.43; pela componente IDHM_EDUCA, que passa de 0.33 para
0.42; e pela componente MI_1000, que passa de -0.30 para -0.40. Observe-se que as maiores variações estão
nos fatores da mortalidade, educação e renda respectivamente.
Comunalidades da Amostra Reduzida
A soma em linha das cargas fatoriais ao quadrado resulta num número chamado comunalidade. A
comunalidade mostra a quantia da variância em uma variável que é explicada pelos fatores extraídos juntos;
isto é, o quanto da variância em uma dada variável é explicada pela solução fatorial. Quanto a isso, a variável
que apresenta o maior salto na sua comunalidade após a redução da amostra, de 0.577 para 0.740, é a MI -
mortalidade infantil; isto é, essa variável é melhor explicada pelos fatores em estudo nas cidades com mais de
50.000 habitantes, como pode ser observado na Tabela 16.
Tabela 16: Comunalidades
Inicial Extração
I13 1,000 ,852
I10 1,000 ,869
I25 1,000 ,632
I49 1,000 ,786
I15 1,000 ,897
I24 1,000 ,962
I56 1,000 ,967
IDHM_RENDA 1,000 ,803
IDHM_LONGE 1,000 ,669
IDHM_EDUCA 1,000 ,829
MI_1000 1,000 ,740
Método de Extração: Análise do Componente Principal.
Variância Total Explicada
Segundo o critério da raiz latente, somente autovalores > 1.0 são considerados na seleção de componentes
para análise posterior. Assim, na solução fatorial apresentada abaixo, somente três componentes devem ser
considerados. Na nossa matriz vemos que esses componentes explicam 82% da variância total do conjunto de
variáveis, o que torna um dos nossos principais objetivos, que é a redução de dados, bastante plausível graças
ao método escolhido. A Tabela 17 apresenta a variância total explicada e a Tabela 18 a matriz de
componentes.
ABES – Associação Brasileira de Engenharia Sanitária e Ambiental 19
20. 25º Congresso Brasileiro de Engenharia Sanitária e Ambiental
Tabela 17: Variância Total Explicada
Comp
. Autovalores Iniciais Extração das SSL Rotação das SSL
% da % da % da
Variânci Cumulativ Variânci Cumulativ Variânci Cumulativ
Total a o% Total a o% Total a o%
1 4,721 42,921 42,921 4,721 42,921 42,921 3,135 28,497 28,497
2 2,930 26,634 69,555 2,930 26,634 69,555 3,035 27,586 56,083
3 1,356 12,326 81,881 1,356 12,326 81,881 2,838 25,798 81,881
4 ,574 5,219 87,101
5 ,409 3,718 90,818
6 ,352 3,203 94,021
7 ,197 1,793 95,814
8 ,168 1,530 97,345
9 ,145 1,321 98,666
10 ,134 1,217 99,883
11 ,013 ,117 100,000
Extraction Method: Principal Component Analysis.
Tabela 18: Matriz de Componentes(a)
Componentes
1 2 3
I13 -,427 ,813 ,100
I10 ,576 -,719 -,147
I25 -,320 ,698 ,207
I49 -,411 ,777 ,115
I15 ,773 ,165 ,522
I24 ,847 ,047 ,492
I56 ,868 ,079 ,454
IDHM_RENDA ,764 ,400 -,242
IDHM_LONGE ,655 ,325 -,367
IDHM_EDUCA ,658 ,489 -,395
MI_1000 -,648 -,349 ,446
Traço 42,921 26,634 12,326
Método de Extração: Análise do Componente Principal.
3 componentes extraídos.
Como já visto anteriormente, a importância de um fator é avaliada pela proporção da variância representada
pelo fator após a rotação. A rotação favorece a análise dos componentes na medida em que revela as
dimensões subjacentes da solução fatorial apresentada. Se nos permitimos anteriormente identificar essas
dimensões, agora, com muito mais razão e propriedade, poderemos inclusive dar nomes aos fatores até aqui
identificados por números. Esses fatores, evidentemente, estarão associados àquelas dimensões latentes que
buscamos medir (3), como pode ser visto na Tabela 19.
Tabela 19: Matriz de Componentes Rotacionada (a)
Componentes
1 2 3
I13 ,914 ,038 -,124
I10 -,902 ,129 ,197
I25 ,795 -,014 ,015
20 ABES – Associação Brasileira de Engenharia Sanitária e Ambiental
21. 25º Congresso Brasileiro de Engenharia Sanitária e Ambiental
I49 ,880 ,021 -,106
I15 -,043 ,239 ,916
I24 -,185 ,251 ,930
I56 -,173 ,303 ,919
IDHM_RENDA -,011 ,818 ,366
IDHM_LONGE -,063 ,792 ,192
IDHM_EDUCA ,074 ,887 ,191
MI_1000 ,058 -,848 -,131
SSLs 3,135 3,035 2,838
% da
28,497 27,586 25,798
Variância
Método de Extração: Análise do Componente Principal.
Método de Rotação: Varimax com Normalização de Kaiser.
Rotação convergiu em 5 iterações.
A Análise dos Componentes
Da matriz de componentes rotacionada depreende-se um grande equilíbrio na proporção da variância
representada por cada um dos três fatores em análise. Isto significa que esses fatores adquirem praticamente a
mesma importância e juntos, parcimoniosamente, explicam aproximadamente 82% da variância total do
conjunto de variáveis originais Essa parcimônia é de fundamental importância em nosso estudo,
demonstrando equilíbrio dos fatores analisados.
O Componente 1
Como tem sido observado desde os estudos preliminares, o componente 1 revela uma dimensão relativa ao
abastecimento de água tratada, que poucas correlações tem demonstrado ter com as demais variáveis em
estudo. Todavia, nessa dimensão, aparece uma forte correlação (inversa) entre I13 – Índice de Perdas de
Faturamento e I10 – Índice de Micromedição Relativo ao Volume Disponibilizado. A hipótese que se levanta
é a de que o aumento do Índice de Micromedição pode reduzir o Índice de Perdas de Faturamento.
O Componente 2
O componente 2 revela-se claramente estar na dimensão social, alinhando, em oposição, o IDHM – Índice
de Desenvolvimento Humano Municipal e MI – Mortalidade Infantil Estimada para os municípios. Todavia,
diferente da dimensão da água, a dimensão social apresenta um entrelaçamento com a dimensão do esgoto,
aqui representada pelo componente 3, com ênfase para o I56 – Índice de Atendimento Total de Esgoto
Referido aos Municípios Atendidos com Água.
O Componente 3
Na dimensão das condições de esgotamento sanitário, o componente 3, reciprocamente apresenta
entrelaçamento com a dimensão social, com um evidente destaque para o fator renda. É importante observar
que a análise fatorial não testa hipóteses, mas, permite formulá-las.
Com isso, a Tabela 20 apresenta a matriz de transformação dos componentes.
Tabela 20: Matriz de Transformação dos Componentes
Componente 1 2 3
1 -,404 ,634 ,660
2 ,884 ,456 ,103
3 ,235 -,625 ,744
Método de Extração: Análise do Componente Principal.
Método de Rotação: Varimax com Normalização de Kaiser.
ABES – Associação Brasileira de Engenharia Sanitária e Ambiental 21
22. 25º Congresso Brasileiro de Engenharia Sanitária e Ambiental
FASE VI – ANÁLISE DOS ESCORES FATORIAIS PARA O ANO DE 2005
Procedemos a análise dos escores resultantes dos fatores principais. Para a obtenção dos estratos, utilizou-se a
técnica chamada análise hierárquica de agrupamento, a qual agrupa casos relativamente homogêneos de uma
determinada variável, no caso, os escores relativos aos fatores principais.
Essa amostra de 316 municípios com mais de 50.000 habitantes, inclui 24(vinte e quatro) capitais,
abrangendo uma população de 75.205.434 hab. A seguir uma análise sucinta do Fator 1.
FATOR 1 – Dimensão do Desempenho dos Sistemas de Abastecimento de Água
Deve-se lembrar que, neste estudo, esse desempenho é medido ponderando apenas os Indicadores de Perdas
de Faturamento, Perda na Distribuição, o Índice de Micromedição do Volume Disponibilizado e o Volume
Disponibilizado por Economia.
Péssimo: com relação às variáveis que compõem o Fator 1, e dentro da amostra reduzida para 316
municípios com mais de 50.000 hab, o Cluster 3 revela uma situação extrema: Índices de Perdas de
Faturamento e de Perdas na Distribuição altíssimos; Índice de Micromedição do Volume Disponibilizado
baixo; e um altíssimo Volume Disponibilizado por Economia. Realmente, sugere uma situação extrema de
mal desempenho para um serviço tão essencial como é o abastecimento de água tratada. Naquele
agrupamento a situação do baixo desempenho dos serviços de saneamento básico é agravada por índices
muito baixos de coleta de esgotos, atendimento urbano de esgoto e atendimento total de esgoto. Como
resultado, verificamos um alto índice de mortalidade infantil para cada 1.000 nascidos vivos.
Ruim: na seqüência, e sempre lembrando que estamos trabalhando com uma amostra de 316 municípios com
mais de 50.000 habitantes, aparece o Cluster 1. É bastante surpreendente que nesse agrupamento apareçam
3(três) capitais. Ali os indicadores de perdas de faturamento (I13) e na distribuição (I49) são altíssimos,
comparáveis ao do caso extremo. Mas, como pode ser verificado, não se trata mais de pequenos municípios,
mas de três capitais totalizando 870.130 hab. Observe-se os baixíssimos índices de micromedição sempre
associados com altos índices de volume disponibilizado. Essa associação, hipoteticamente, aponta para um
quadro de desperdício. Os indicadores de esgotamento sanitário neste grupo são muito baixos e assim, como
não poderia deixar de ser, os indicadores de mortalidade infantil estão muito acima do desejável.
Mediano: no caso do desempenho dos sistemas de abastecimento de água para a amostra em estudo, o
Cluster 2 mostra um quadro bastante preocupante do saneamento brasileiro. Numa amostra de 316
municípios, são 133 neste agrupamento, correspondendo a 42% dos municípios em número; mas contendo
14(quatorze) das 24(vinte e quatro) capitais da amostra (58%); e 38.944.847 de habitantes, correspondendo a
52% da amostra em população. Esse agrupamento é maior que a soma de todos os outros, recebendo uma
classificação apenas mediana. Os índices de perdas são muito elevados, os volumes micromedidos muito
baixos para altos volumes disponibilizados.
Bom: no Cluster 4 aparecem os municípios com desempenho de mediano para bom. É maior em termos do
número de municípios em relação à amostra: 174 municípios, correspondendo a 55% da amostra. O Cluster
4, juntamente com o Cluster 2, é bastante representativo da situação do saneamento brasileiro. Sete grandes
capitais estão ai incluídas. Neste agrupamento temos um total de 34.750.943 de habitantes, correspondendo a
46% da amostra. A passagem por esses agrupamentos mostra uma queda acentuada no indicador de
mortalidade infantil, e um avanço bastante significativo dos indicadores de esgotamento sanitário. Dos piores
desempenhos do Cluster 2 para os melhores do Cluster 4, deve-se notar, além da brutal melhora dos
indicadores de perdas, esse grande salto qualitativo e quantitativo dos indicadores de esgotamento sanitário e
da mortalidade infantil. Isto, inegavelmente, coloca a universalização do abastecimento de água tratada como
uma condição indispensável para a consecução dos objetivos do milênio.
Ótimo: de fato, neste Cluster 5 encontram-se situações bastante atípicas, infelizmente. Sabemos que índices
de perdas negativos não existem, salvo como um efeito contábil. Tampouco, em sistemas reais, podem esses
índices cair para números de 1(um) dígito, ou seja, menores que 10%. Mas, vale a pena observar neste grupo
o alto índice de micromedição e o baixo volume disponibilizado por economia. A despeito disso, todavia,
22 ABES – Associação Brasileira de Engenharia Sanitária e Ambiental
23. 25º Congresso Brasileiro de Engenharia Sanitária e Ambiental
nota-se uma grande variância, ou mesmo disparidade, entre os indicadores de esgoto e de mortalidade
infantil dentro do grupo. Por essa razão, consideramo-lo atípico.
FATOR 2 - A Dimensão Social
Ao analisar o Fator 2, percebe-se uma clara associação entre pobreza (renda, longevidade e educação em
baixa), altas taxas de mortalidade infantil e mal desempenho dos serviços de saneamento básico na maioria
dos casos em análise. Devemos, todavia, lembrar que estamos trabalhando com uma amostra de 316
municípios.
Péssimo: extremo do extremo, para nesse Cluster só aparece um município. Essa cidade se caracteriza em
relação a extremos: extremo da pobreza, baixa expectativa de vida, pouca educação, mal desempenho dos
serviços de saneamento básico, alto índice de mortalidade infantil. Não sendo uma cidade tão pequena, com
seus 110.761 hab, torna-se uma má referência com relação aos indicadores analisados.
Ruim: ainda como um reflexo das condições precárias nas três dimensões em análise, o Cluster 3, com
7(sete) cidades, é pequeno deveras. Entretanto, vem evidenciar os profundos diferenciais existentes no Brasil.
Não podemos esquecer também que os municípios que fornecem informações para o SNIS – Sistema
Nacional de Informações sobre Saneamento, o fazem por já terem esclarecimento sobre a importância desse
diagnóstico. Inúmeros são os casos onde a falta desse esclarecimento acaba por ocultar situações ainda piores
do que os casos dessa amostra. Esse Cluster totaliza 630.335 hab, correspondendo a 0.8% da população da
amostra.
Mediano: com 50 cidades, o Cluster 2 é o primeiro agrupamento representativo da amostra, com 16% do
número de cidades e 6.579.271 hab, correspondendo a 8,7% da população da amostra. Neste grupo
aparecem duas capitais. As cidades desse agrupamento, no geral, estão ainda muito longe das metas do
milênio. Nessa dimensão social, mediano fica melhor traduzido como medíocre; pois, o diferencial a ser
superado no caso da mortalidade infantil, só como exemplo, requer muito investimento e tempo para a
consecução das metas. Deve-se observar que 47 dessas cidades, ou seja, 94% se encontram na região Norte-
Nordeste do país. As cidades do Cluster 3 e Cluster 4 estão todas naquela região também.
Bom: incomparavelmente maior que os outros, com 224 cidades, correspondendo a 71% da amostra em
número, e com 58.792.771 hab, correspondendo a 78% da população da amostra, o Cluster 1 pode ser
considerado como o perfil das cidades que fornecem informações para o SNIS. São cidades com um
considerável grau de desenvolvimento humano, cidades que apresentam condições de saneamento básico de
mediana para melhor, muitas das quais já se encontram próximas, ou até já atingiram, as metas do milênio
nos setores em estudo. Uns totais de 24 capitais da amostra encontram-se neste Cluster.
Ótimo: a dimensão social, das três dimensões em análise, é a única que apresenta um agrupamento
consistente de cidades na condição de excelência. De fato, ao examinar o quadro, verificamos que ali estão
cidades já muito conhecidas pela excelência de alguns indicadores. Mas, o que desejamos de fato enfatizar é
que essas cidades, em relação à amostra em estudo, no geral, apresentam melhores desempenhos nas
dimensões do saneamento básico e, consequentemente, baixos índices de mortalidade infantil, alta renda, alta
expectativa de vida e alto grau de educação. O Cluster 5 tem 34 cidades, ou 10,7% da amostra em número, e
9.092.296 hab, correspondendo a 12% da amostra em população.
FATOR 3 – Dimensão da Cobertura e Atendimento por Esgotamento Sanitário
Péssimo: a dimensão do esgotamento sanitário, neste estudo, exibe toda a sua complexidade. O Cluster 3,
que apresenta os maiores déficits de coleta e atendimento por esgoto sanitário, agrupa cidades que vão de um
extremo ao outro no que tange às outras dimensões em estudo, quais sejam as dimensões sociais e do
atendimento com água tratada. O grupo abrange ainda tanto cidades pequenas, com pouco mais de 50.000
habitantes, quanto grandes cidades e aglomerações urbanas, incluindo uma capital do Norte e outra do
Nordeste. Ao todo, são 73 cidades numa amostra de 316, 23% em número, e 13.433.254 hab,
correspondendo a 18% da amostra. Nada desprezível considerando os péssimos dados sobre cobertura e
atendimento.
Ruim: O Cluster 1, que agrupa cidades em condições consideradas ruins de atendimento de esgoto,
ABES – Associação Brasileira de Engenharia Sanitária e Ambiental 23