SlideShare una empresa de Scribd logo
1 de 25
Descargar para leer sin conexión
25º Congresso Brasileiro de Engenharia Sanitária e Ambiental




  V-069 – ANÁLISE EXPLORATÓRIA DOS INDICADORES DO SNIS – SISTEMA
            NACIONAL DE INFORMAÇÕES SOBRE SANEAMENTO

Marcos Ubirajara(1)
Mestre em Tecnologia Nuclear pelo IPEN/USP e Bacharel em Física pela PUC-SP. Consultor Especializado
em Geoprocessamento e Tecnologias Correlatas Aplicadas ao Saneamento Básico e Ambiental.

Jucélia Cabral Mendonça
Engenheira Civil pela Escola de Engenharia da Universidade Federal de Goiânia (UFG-GO). Especialização
em Educação Ambiental (CREA/SHS/EESC/USP). Mestre em Ciências da Engenharia Ambiental
(EESC/USP). Engenheira do Ministério das Cidades.

Cynthia Regina Araújo Melo
Economista - Universidade Católica de Brasília - UCB - Especialização em Matemática para economia e
administração - Universidade de Brasília - UnB - Economista do Ministério das Cidades.

Endereço(1): Av. João Samaha, 702 - Apto 202 - São João Batista - Belo Horizonte - MG - CEP: 31520-100 -
Brasil – Telefone: (31) 34357-3944 - e-mail: mucamargo@oi.com.br


RESUMO
O presente trabalho apresenta uma metodologia para a elaboração de um diagnóstico da abrangência e
qualidade dos serviços de saneamento básico brasileiro a partir da análise exploratória multivariada dos
indicadores do SNIS - Sistema Nacional de Informações sobre Saneamento. O método utilizado para a
consecução do trabalho apresentado foi o da Análise Fatorial dos Componentes Principais tendo como
principais objetivos a redução dos dados, a verificação da consistência interna dos indicadores do SNIS e a
sua correlação com variáveis exógenas afetas ao saneamento básico e, por fim, traçar um quadro que expresse
os profundos diferenciais existentes quanto à qualidade e abrangência dos serviços básicos de saneamento
prestados no Brasil.

PALAVRAS-CHAVE: Análise Fatorial e Exploratória, Indicadores do SNIS, Serviços de Saneamento
Básico, Qualidade dos Serviços, Universalização.


INTRODUÇÃO
A análise fatorial é um dos métodos muito utilizado da análise exploratória multivariada, nos mais diversos
campos do conhecimento, para a elaboração de estudos visando, principalmente, a redução de dados e a
simplificação de casos envolvendo muitas variáveis e respondentes. No caso do Sistema Nacional de
Informações sobre Saneamento, o SNIS, são mais de 4.000 (quatro mil) municípios respondentes, centenas de
informações primárias e dezenas de indicadores calculados para formar a base de dados de informações. Com
tantas informações, o desafio que se coloca é como utilizá-las na produção de um diagnóstico global que
exiba os diferenciais que sabemos existir quanto à qualidade e abrangência dos serviços prestados pelo setor
do saneamento, mas que também revele que outras dimensões latentes estariam associadas às dificuldades
para a melhoria da qualidade e para a universalização dos serviços de saneamento no país.

Com isso a proposta é traçar um quadro do saneamento brasileiro a partir de um conjunto mínimo de
indicadores que, a priori, não sabemos quais são. O que se coloca como pré-condição para validação desse
estudo, é que esse conjunto mínimo seja representativo do ponto de vista da grande quantidade de
informações e indicadores disponíveis no SNIS; e que expresse os profundos diferenciais existentes quanto à
qualidade e abrangência dos serviços básicos de saneamento prestados no Brasil. Isto quer dizer que um dos
focos principais do trabalho a ser apresentado está na redução de dados e, por essa razão, apresenta-se a
análise fatorial como um método eficaz para isso.




ABES – Associação Brasileira de Engenharia Sanitária e Ambiental                                          1
25º Congresso Brasileiro de Engenharia Sanitária e Ambiental


Como hipóteses iniciais, as quais estão respaldadas na vasta experiência adquirida para a construção da longa
série histórica do SNIS, tem-se que fatores sociais e geopolíticos potencialmente estariam acoplados naquelas
dimensões latentes que desejamos revelar. Todavia, tais informações sobre variáveis e indicadores sociais e
da geopolítica não integram a base de dados do SNIS. Por essa razão, também colocou-se uma hipótese
inicial a possível correlação entre as variáveis e indicadores do SNIS, e aquelas do IDHM – Índice de
Desenvolvimento Humano Municipal e da MI – Mortalidade Infantil Estimada para os municípios
brasileiros. O passo inicial para a comprovação dessas hipóteses, e que no futuro poderá ser feita através de
modelagens matemáticas mais sofisticadas, é uma análise exploratória das informações disponíveis visando à
depuração de conceitos e à redução de dados. Este trabalho está comprometido com a consecução desse passo
inicial.

Então, e antes de mais nada, procedeu-se uma análise exploratória das informações que hoje formam uma
série histórica de mais de 10 (dez) anos, no sentido de encontrar um subconjunto de dados e indicadores que,
em primeiro lugar, estejam correlacionados entre si e que, em segundo lugar, sejam passíveis de se
correlacionarem com variáveis exógenas indispensáveis para a formação de um modelo de conhecimento que
contemple as dimensões sociais e geopolíticas, tão fundamentais para a compreensão do quadro que está para
emergir desse estudo. Tendo sido realizada em várias etapas, a análise exploratória, realizada primeiramente
com dados do Diagnóstico dos Serviços de Água e Esgoto - Ano de Referência 2005 do SNIS, demonstrou ser
a análise fatorial um método adequado para a redução dos dados e para o posterior cruzamento e
estabelecimento de correlações entre os indicadores do saneamento básico e as variáveis exógenas em estudo.

A partir da comprovação da adequação do método da análise fatorial, procedeu-se a Análise dos
Componentes Principais (ACP) com o objetivo de revelar dimensões latentes emergentes das correlações
entre variáveis ou grupos de variáveis e, a partir da análise dessas correlações, revelar as estruturas dessas
grandezas latentes não evidentes através das variáveis manifestas em estudo.

Com isso, o presente trabalho tem como objetivo principal promover uma análise exploratória envolvendo os
indicadores da série histórica do SNIS – Sistema Nacional de Informações Sobre Saneamento, e outros
indicadores amplamente aceitos e utilizados no Planejamento Integrado e no desenvolvimento de Políticas
Setoriais afetas ao Saneamento Básico, como é o caso do IDHM - Índice de Desenvolvimento Humano
Municipal do PNUD e o MI – Indicador da Mortalidade Infantil Estimada da FIOCRUZ para os municípios
brasileiros. Enquanto desenvolvimento metodológico objetiva-se especificamente validar a metodologia da
análise exploratória baseada na Análise Fatorial dos Componentes Principais na criação de um modelo
respaldado nas técnicas apresentadas, e que reflita os aspectos multidisciplinares da complexa rede de inter-
relações formada pelo saneamento básico e seus interferentes. Como conseqüência da validação da citada
metodologia utilizada, apresenta-se como um subproduto a consistência dos dados do SNIS utilizados neste
trabalho ante as variáveis exógenas pesquisadas e integradas ao modelo.


DESENVOLVIMENTO
A análise fatorial é um método muito utilizado e considerado eficaz na elaboração de estudos visando,
principalmente, a redução de dados e a simplificação de casos envolvendo muitas variáveis e respondentes.
Procedendo a Análise dos Componentes Principais (ACP), objetiva-se revelar correlações entre variáveis e
grupos das variáveis em estudo e, a partir dessas correlações, identificar as estruturas das grandezas latentes
não evidentes através das variáveis manifestas.

Por que a análise fatorial?
Determinados conceitos, como a exclusão social e urbana, não são bem definidos em razão até da diversidade
de cenários apresentados pelas cidades. Não sendo diretamente observáveis, esses conceitos são
freqüentemente chamados de variáveis latentes e espera-se que seus efeitos se revelem através das variáveis
manifestas. O método mais conhecido para investigar a dependência de um conjunto de variáveis manifestas
em relação a um número menor de variáveis latentes é a chamada análise fatorial. A análise fatorial pode
identificar a estrutura subjacente de um conjunto de uma matriz de dados, bem como fornecer um processo
para a redução dos dados. No nosso caso, o principal objetivo é, de fato, a redução dos dados e isso pressupõe
que exista alguma ordem latente nos dados em análise. A redução aos fatores principais favorece muito a


2                                     ABES – Associação Brasileira de Engenharia Sanitária e Ambiental
25º Congresso Brasileiro de Engenharia Sanitária e Ambiental


retroação aos períodos anteriores, reduzindo sobremaneira a necessidade de dados para as análises de
evolução dos indicadores no tempo.

Os tópicos que seguem têm como principal objetivo introduzir os conceitos e outros elementos teóricos da
análise fatorial, visando à sua aplicação e posterior avaliação dos resultados como uma medida da adequação
do método. Sabe-se que a estatística em si, qualquer que seja o método utilizado, não assegura bons
resultados. Por essa razão, alguns cuidados devem ser tomados nos passos iniciais, sob pena de perda do
potencial de generalização dos resultados obtidos ou mesmo da confiabilidade dos mesmos. Esse potencial de
generalização coloca-se também como uma pré-condição para a validação do estudo que segue, à semelhança
da necessidade de estarmos trabalhando com um conjunto mínimo de informações.


FASE I – ELEMENTOS DA ANÁLISE FATORIAL
O objetivo desta fase foi introduzir conceitos e outros elementos teóricos da Análise Fatorial, culminando
com a recomendação do método para promover a análise exploratória apresentada neste trabalho. A principal
recomendação resultante desta fase inicial foi à realização de um estudo mais detalhado envolvendo apenas
as variáveis operacionais de água e de esgoto do SNIS, no sentido de apurar aquelas que, ao longo da série
histórica, guardassem correlações entre si.

Com isto, além da busca das possíveis correlações, visava-se também à redução dos dados, uma vez que
muitos indicadores, embora indispensáveis para a compreensão do quadro do saneamento brasileiro, possuem
uma estrutura de cálculo semelhante, o que acaba por se revelar através da Análise Fatorial. Então, somente
após o estudo recomendado, partir para o estudo da possível e esperada correlação de um grupo já reduzido
de variáveis com as variáveis exógenas. Sabendo-se também que um grande número de variáveis não iria
assegurar a obtenção de resultados consistentes, partiu-se para segunda fase.

Como objetivo secundário, buscou-se validar a metodologia da análise exploratória baseada na Análise
Fatorial dos Componentes Principais, bem como envolver a equipe de especialistas do SNIS na criação de um
modelo respaldado nas técnicas apresentadas, e que reflita os aspectos multidisciplinares da complexa rede de
inter-relações formada pelo saneamento básico e seus interferentes. Como conseqüência da validação da
metodologia utilizada, torna-se um importante objetivo a verificação da consistência dos dados do SNIS
utilizados neste trabalho, o qual se pretende aferir a partir da medida da adequação da amostra utilizada
(MSA), que decorre naturalmente da aplicação da Análise Fatorial.

A Seleção de Variáveis
Na fase de seleção das variáveis, sendo este um passo crucial, algumas recomendações para a adequação do
método da análise fatorial aos objetivos do trabalho devem ser seguidas:

O pesquisador deve saber como as variáveis estão inter-relacionadas para melhor interpretar os resultados.
Sendo assim, esse pesquisador deverá estar em permanente contato com os especialistas para assegurar a
qualidade e a confiabilidade dos resultados. Hoje a base de dados do SNIS corresponde a mais de 4.500
(quatro mil e quinhentos) municípios respondentes, centenas de informações primárias e dezenas de
indicadores calculados para formar a base de dados de informações sobre saneamento. Dentre esses muitos
respondentes, alguns respondem parcialmente aos questionários, significando que alguns critérios devam ser
estabelecidos para inclusão na amostra em estudo. Sendo assim, procedeu-se uma análise exploratória dessas
informações que hoje formam uma série histórica de mais de 10 (dez) anos, no sentido de encontrar um
subconjunto de dados e indicadores que, em primeiro lugar, estejam correlacionados entre si e, em segundo
lugar, sejam passíveis de se correlacionarem com variáveis exógenas indispensáveis para a formação de um
modelo de conhecimento que contemple as dimensões sociais e geopolíticas;

A qualidade e o significado dos fatores determinados refletem as estruturas conceituais das variáveis
incluídas na análise. Isto deixa claro que a seleção de variáveis é uma tarefa para especialistas. Quando feita
por um analista, deverá ser assistida pelos especialistas. No nosso caso, a seleção foi assistida pelos
especialistas da equipe de técnicos e consultores da UGP/PMSS;




ABES – Associação Brasileira de Engenharia Sanitária e Ambiental                                             3
25º Congresso Brasileiro de Engenharia Sanitária e Ambiental


Deve-se desenvolver um modelo conceitual que evite a omissão de uma variável preditora crítica, bem como
a inserção indiscriminada de variáveis esperando que a técnica “revele” as variáveis relevantes. Em primeiro
lugar porque as variáveis irrelevantes podem aumentar o ajuste dos dados da amostra, mas torná-los menos
generalizáveis. Em segundo lugar, as variáveis irrelevantes, embora não afetem as estimativas das variáveis
relevantes, podem mascarar os verdadeiros efeitos em razão da multicolinearidade. Assim, incluir
indiscriminadamente variáveis conceitualmente irrelevantes pode provocar vários efeitos indesejáveis, ainda
que essas variáveis adicionais não influenciem diretamente os resultados do modelo. Após discussões
preliminares com a equipe técnica, decidiu-se iniciar o estudo explorando apenas o sub-conjunto de
indicadores e variáveis operacionais de água e de esgoto, que são os mais antigos e completos integrantes da
base de dados do SNIS;

Os resultados obtidos serão tão bons e confiáveis quanto os dados introduzidos na análise. Bons conjuntos de
dados premiam o pesquisador com bons resultados. A qualidade e a confiabilidade dos indicadores e dados do
SNIS, de fato, é uma das teses deste estudo, cujos resultados trazem uma confirmação da mesma.

A Captura das Informações
O Banco de Dados do SNIS – Sistema Nacional de Informações sobre Saneamento mantém em sua série
histórica indicadores municipais calculados somente quando da suficiência de dados primários necessários
para a sua consecução. Por essa razão, a captura das informações para o presente estudo obedece ao critério
de seleção dos respondentes (municípios) com suficiência de dados. Após várias simulações foram
selecionadas para o estudo as variáveis apresentadas na Tabela 01, tendo como referência a base de dados do
SNIS do ano de 2005.


                                Tabela 1: Variáveis Selecionadas.
    Ordem            Variável                          Descrição                               Origem
      1                I10          Índice de Micro-medição Relativo ao Volume                  SNIS
                                    Disponibilizado
    2                 I13           Índice de Perdas de Faturamento                             SNIS
    3                 I25           Volume de Água Disponibilizado por Economia                 SNIS
    4                 I49           Índice de Perdas na Distribuição                            SNIS
    5                 I15           Índice de Coleta de Esgotos                                 SNIS
    6                 I24           Índice de Atendimento Urbano de Esgoto                      SNIS
    7                 I56           Índice de Atendimento Total de Esgoto                       SNIS
    8                 MI            Mortalidade Infantil Estimada                             FIOCRUZ
    9           IDHM_RENDA          Componente de Renda do IDHM                              IDHM_2000
   10        IDHM_LOGEVIDADE        Componente de Longevidade do IDHM                        IDHM_2000
   11         IDHM_EDUCACAO         Componente de Educação do IDHM                           IDHM_2000
Fonte: SNIS, 2006; IBGE; FIOCRUZ.

Ao analisar a Tabela 1, percebe-se o foco em três dimensões principais, a saber: desempenho dos serviços de
abastecimento de água, cobertura e desempenho dos serviços de esgotamento sanitário e, como indicadores da
dimensão social, o índice de desenvolvimento humano e da mortalidade infantil das populações atendidas.

Conforme o critério apresentado, a coleção de dados foi feita a partir de uma consulta ao banco de dados do
SNIS, a qual filtrou todos os municípios com valores não nulos para as variáveis em estudo.

A tabela obtida foi exportada para o Excel, servindo então como dados de entrada para o software de
estatística avançada. Neste estudo foi utilizado o programa SPSS.

A Análise Fatorial
Na análise fatorial as variáveis que não carregam significativamente em nenhum fator ou que apresentem
comunalidades muito baixas devem ser ignoradas ou eliminadas. Ignorar uma variável pode ser apropriado se
o objetivo for apenas a redução dos dados. Eliminar a variável pode ser apropriado quando esta é de menor
importância para o objetivo do estudo ou quando apresenta valor de comunalidade muito baixo. Quando

4                                    ABES – Associação Brasileira de Engenharia Sanitária e Ambiental
25º Congresso Brasileiro de Engenharia Sanitária e Ambiental


eliminada uma ou mais variáveis, o conjunto de dados deve ser processado novamente.

Significância das Cargas Fatoriais
Significância Prática: Considera-se que os valores das cargas fatoriais possuem as significâncias práticas
apresentadas na Tabela 2.


                           Tabela 2: Cargas Fatoriais e Significâncias Práticas.
                            Valor da Carga         Significância Prática
                               > +- 0.30               Nível Mínimo
                               > +- 0.40                Importantes
                               > +- 0.50       Possuem Significância Prática

O quadrado das cargas fatoriais representa a quantia da variância total da variável explicada pelo fator.

Significância Estatística: Em termos da significância estatística, podemos trabalhar em duas dimensões: o
tamanho da amostra e o número de variáveis. Assim, considera-se a seguinte tabela de significância das
cargas em função do tamanho da amostra, conforme apresentado na Tabela 3.

                            Tabela 3: Valor da Carga e Tamanho da Amostra
                               Valor da Carga Tamanho da Amostra
                                                     (respondentes)
                                      0.30                350
                                      0.35                250
                                      0.40                200
                                      0.45                150
                                      0.50                120
                                      0.55                100
                                      0.60                 85
                                      0.65                 70
                                      0.70                 60
                                      0.75                 50

No nosso estudo, estamos trabalhando com uma amostra maior que 350 respondentes, sugerindo que valores
das cargas fatoriais < 0.30 têm significância estatística (1).

O número de variáveis em análise também é importante na significância das cargas, guardando a seguinte
relação:

                               número de variáveis < o valor das cargas significantes

Sobre as Comunalidades
A comunalidade mostra a quantia da variância em uma variável que é explicada pelos fatores extraídos
juntos. Em outras palavras, significa o quanto da variância de uma dada variável é explicada pela solução
fatorial.

Análise de Componentes
A matriz geral de correlação é transformada por meio de estimação de um modelo fatorial para obtenção de
uma matriz fatorial. As cargas fatoriais de cada variável nos fatores são interpretadas para identificar a
estrutura latente das variáveis. De forma geral, quanto maior o número de fatores extraídos, melhor será o
ajuste e maior será a porcentagem da variância do dado explicado pela solução fatorial. Todavia, quanto
maior o número de fatores extraídos, menor a parcimônia da solução. Evidentemente, isto pressupõe a
existência de critérios para a limitação do número ideal de fatores. No nosso estudo adotamos o critério da
raiz latente.


ABES – Associação Brasileira de Engenharia Sanitária e Ambiental                                            5
25º Congresso Brasileiro de Engenharia Sanitária e Ambiental




Raiz Latente: Pelo critério da raiz latente, somente autovalores > 1.0 são considerados na seleção de
componentes para análise posterior.

Teste de Scree: Este teste poderá indicar outros fatores com valores próximos de 1.0 como sendo apropriados.

A Interpretação dos Fatores
Quando variáveis são muito diferentes, ou seja, não guardam correlações consideráveis entre si, o índice
obtido pela soma dos traços será baixo. Do contrário, se as variáveis recaírem em um ou mais grupos
altamente relacionados, esse índice se aproximará de 100%. Todavia, o aprofundamento dessa discussão
impõe a necessidade de se proceder uma análise da importância e da consistência interna dos fatores. A
importância de um fator (ou um conjunto de fatores) é avaliada pela proporção da variância representada pelo
fator após a rotação. Se for uma rotação ortogonal, a importância do fator estará relacionada com o tamanho
dos seus SSLs (Soma das Cargas Quadráticas da Matriz de Componentes Após a Rotação). Essa somas
(SSLs) são convertidas para uma grandeza da proporção de variância para um fator, dividindo-as pelo
número de variáveis (2).

Sobre a Rotação da Matriz de Componentes
A importância de um fator é avaliada pela proporção da variância representada pelo fator após a rotação. A
rotação favorece a análise dos componentes na medida em que revela as dimensões subjacentes da solução
fatorial apresentada. A partir da rotação, poderemos inclusive dar nomes aos fatores até então identificados
por números. Esses fatores, evidentemente, estarão associados àquelas dimensões latentes que buscamos
medir.


FASE II – ANÁLISE DA MATRIZ DE CORRELAÇÃO DOS INDICADORES OPERACIONAIS DE
ÁGUA E ESGOTO DO SNIS ANO 2005
Conforme ficou recomendado na FASE I, passamos a estudar o conjunto de indicadores do SNIS objetivando
verificar a sua consistência interna e completude. Para esse efeito, escolhemos começar pelo conjunto de
indicadores operacionais de água e esgoto, uma vez que acreditamos ser o desempenho operacional um dos
fatores responsáveis pelo registro de grandes perdas nos sistemas e pela dificuldade de universalizar os
serviços no país. Foram processados 30 (trinta) indicadores operacionais do SNIS, do ano de referência de
2005, para uma amostra de 721 (municípios) respondentes. Procedeu-se a análise obtendo-se a matriz de
correlação apresentada na Tabela 4.

A Análise das Comunalidades entre os Indicadores Operacionais de Água e Esgoto do SNIS
O quadro que segue faz uma análise das comunalidades. Consideramos neste estudo que os níveis de
explicação aceitáveis estariam acima de 50%. Sendo assim, todas as variáveis com comunalidades iguais ou
menores a 0.50 são consideradas como tendo um nível de explicação insuficiente. Se há variáveis com
comunalidades consideradas baixas, há duas opções possíveis: (1) interpretar a solução ignorando essas
variáveis, ou (2) eliminar a variável, o que exigirá um novo processamento do conjunto reduzido [1].
Considerando sempre a contribuição de cada variável para os objetivos do estudo, optamos pela eliminação
quando apropriada, pois, um dos nossos objetivos principais está na redução dos dados. A Tabela 5 apresenta
a análise das comunalidades.




6                                    ABES – Associação Brasileira de Engenharia Sanitária e Ambiental
25º Congresso Brasileiro de Engenharia Sanitária e Ambiental




ABES – Associação Brasileira de Engenharia Sanitária e Ambiental   7
25º Congresso Brasileiro de Engenharia Sanitária e Ambiental



                              Tabela 5: Análise das Comunalidades
                              Inicia                                      Correlação
Indicadores                     l     Comunalidade
I01-Densidade de Economias                            Esta variável apresenta baixa comunalidade,
de Água por Ligação                                   confirmando a pouca correlação que mantém com
                                                      os demais fatores em estudo. Apresenta uma
                              1,000             ,601
                                                      correlação, ainda pouco significativa, com a
                                                      variável I51-Índice de Perdas por Ligação.
                                                      Tornou-se uma candidata a sair da amostra.
I09-Índice de Hidrometração                           A alta comunalidade já recomenda. Essa variável
                                                      apresenta cargas fatoriais bastante significativas
                                                      para os fatores I44-Índice de Micromedição
                                                      Relativo ao Consumo e I10-Índice de
                              1,000             ,840
                                                      Micromedição        Relativo      ao     Volume
                                                      Disponibilizado. Apresenta também uma carga
                                                      considerável para o fator I57-Índice de
                                                      Fluoretação da Água.
I10- Índice de Micromedição                           A comunalidade está dizendo. Esta variável
Relativo ao Volume                                    apresenta as maiores cargas para os fatores I13-
Disponibilizado                                       Índice de Perdas de Faturamento (observar o
                                                      sinal trocado, significando que quando um
                                                      aumenta, o outro diminui) e com o I28-Índice de
                                                      Faturamento de Água (notar que apresentam a
                                                      mesma carga fatorial, significando que são
                                                      grandezas da mesma natureza e muito
                              1,000             ,910 próximas na definição). Apresenta também forte
                                                      correlação inversa com I51-Índice de Perdas por
                                                      Ligação, e direta com I52-Índice de Consumo de
                                                      Água. Apresenta ainda considerável relação
                                                      inversa com I25-Volume de Água Disponibilizado
                                                      por Economia, e direta com I09-Índice de
                                                      Hidrometração e I44-Índice de Micromedição
                                                      Relativo ao Consumo. É forte candidata a
                                                      permanecer na análise.
I11-Índice de Macromedição                            Notar como essa variável não mantém correlação
                              1,000             ,527 significativa com nenhuma das outras. É
                                                      candidata a sair da análise.
I13-Índice de Perdas de                               Essa variável também vem com uma forte
Faturamento                                           comunalidade. Apresenta as maiores cargas para
                                                      os fatores I49-Índice de Perdas na Distribuição
                                                      e I52-Índice de Consumo de Água (inversa).
                                                      Apresenta também fortes correlações com I10-
                                                      Índice de Micromedição Relativo ao Volume
                                                      Disponibilizado (inversa) e com I51-Índice de
                                                      Perdas por ligação. Uma curiosidade: a matriz de
                                                      correlação está dizendo que essa grandeza é
                              1,000             ,905 perfeitamente explicada pelo inverso da grandeza
                                                      em I28-Índice de Faturamento de Água. Em
                                                      outras palavras, significa que são medidas
                                                      complementares de uma mesma grandeza. É forte
                                                      candidata a permanecer na análise, mas I28-
                                                      Índice de Faturamento de Água pode sair.
                                                      Embora algumas coisas pareçam óbvias, é bom
                                                      lembrar que essas relações surgiram da análise
                                                      estatística dos dados do SNIS, o que mostra a
                                                      consistência desses dados.

8                                ABES – Associação Brasileira de Engenharia Sanitária e Ambiental
25º Congresso Brasileiro de Engenharia Sanitária e Ambiental




                        Tabela 5: Análise das Comunalidades. (continuação)
                               Inicia                                     Correlação
Indicadores                       l    Comunalidade
I14-Consumo Micromedido                               Com uma comunalidade menor, essa variável
por Economia                                          apresenta a maior carga fatorial para o fator I53-
                                                      Consumo Médio de Água por Economia,
                               1,000             ,753
                                                      seguida pelo fator I17-Consumo de Água
                                                      Faturado por Economia e por I22-Consumo
                                                      Médio per Capta de Água.
I17-Consumo de Água                                   Apresentando um perfil muito parecido com o do
Faturado por Economia                                 I14-Consumo Micromedido por Economia, essa
                                                      variável tem a maior carga fatorial para o fator
                                                      I53-Consumo Médio de Água por Economia,
                                                      seguida pelo fator I14- Consumo Micromedido
                                                      por Economia e por I22-Consumo Médio per
                               1,000             ,823 Capta de Água; deve-se observar que essa
                                                      variável apresenta maior comunalidade do que
                                                      I14, significando que ela pode ser melhor
                                                      explicada pela solução fatorial. É candidata a
                                                      sair em favor de I53. Se permanecer, será em
                                                      detrimento de I14- Consumo Micromedido por
                                                      Economia, evidentemente.
I20-Extensão de Rede de Água                          Com comunalidade muito baixa, essa variável não
por Ligação                                           apresenta correlação significativa com nenhuma
                               1,000             ,505
                                                      das outras. É forte candidata a ficar fora da
                                                      análise.
I22-Consumo Médio per                                 Comunalidade razoável. Em comparação com
Capta de Água                                         outras variáveis, apresenta cargas apenas
                                                      razoáveis para os fatores I53-Consumo Médio de
                                                      Água por Economia, I17-Consumo de Água
                                                      Faturado por Economia e I14- Consumo
                               1,000             ,786
                                                      Micromedido por Economia, respectivamente.
                                                      Como sugerimos ficar com I17 em detrimento de
                                                      I14, o argumento para a manutenção dessa
                                                      variável fica enfraquecido. Candidata a sair da
                                                      análise.
I23-Índice de Atendimento                             Comunalidade apenas razoável. Essa variável
Urbano de Água                                        apresenta correlação significativa apenas com o
                               1,000             ,767
                                                      fator I55-Índice de Atendimento Total de Água.
                                                      É candidata a ficar fora da análise.
I25-Volume de Água                                    Com uma comunalidade alta, apresenta a maior
Disponibilizado por Economia                          carga para o fator I51-Índice de Perdas por
                                                      ligação. Essa forte correlação, em si, é uma tese
                                                      dos nossos estudos. A seguir, apresenta altas
                                                      cargas para I13-Índice de Perdas de
                                                      Faturamento e para I28-Índice de Faturamento
                               1,000             ,913
                                                      de Água (inversa), as quais demonstraram ser
                                                      redundantes nesta análise. Segue-se a correlação
                                                      razoável com I49-Índice de Perdas na
                                                      Distribuição e I52-Índice de Consumo de Água
                                                      (inversa). Deve permanecer na análise em
                                                      defesa da tese citada acima.
I43-Partcipação das                                   Comunalidade muito baixa. Não mantém
                               1,000             ,565
Economias Residenciais de                             correlação significativa com nenhuma das outras


ABES – Associação Brasileira de Engenharia Sanitária e Ambiental                                   9
25º Congresso Brasileiro de Engenharia Sanitária e Ambiental



Água no Total de Economias                                variáveis. É candidata a ficar fora da análise.
de Água




                         Tabela 5: Análise das Comunalidades. (continuação)
                                Inicia                                     Correlação
Indicadores                        l    Comunalidade
I44-Índice de Micromedição                             Apresentando alta comunalidade, essa variável
Relativo ao Consumo                                    apresenta cargas fatoriais bastante significativas
                                                       para os fatores I09- Índice de Hidrometração e
                                                       I10-Índice de Micromedição Relativo ao
                                1,000             ,882 Volume Disponibilizado. Apresenta também uma
                                                       carga considerável para o fator I57-Índice de
                                                       Fluoretação da Água. Mas, observe-se que essa
                                                       variável poderia estar bem representada por
                                                       I09 ou I10.
I49-Índice de Perdas na                                Com alta comunalidade, essa variável apresenta as
Distribuição                                           maiores cargas nos fatores I13 e I28 (em relação
                                                       inversa), a qual se recomenda sair da amostra.
                                                       Apresenta ainda forte correlação com I51-Índice
                                                       de Perdas por ligação e uma relação inversa com
                                1,000             ,956 I10-Índice de Micromedição Relativo ao
                                                       Volume Disponibilizado. A análise mostra uma
                                                       redundância numa relação inversa com a variável
                                                       I52-Índice de Consumo de Água. São, de fato,
                                                       grandezas complementares. Pode permanecer
                                                       na Amostra em detrimento de I52.
I50-Índice Bruto de Perdas                             Apresenta a comunalidade mais baixa dessa
Lineares                                               amostra. Consequentemente, não mantém
                                1,000             ,269
                                                       correlação significativa com nenhuma das outras
                                                       variáveis. Deve ficar fora da análise.
I51-Índice de Perdas por                               Com a maior carga fatorial em I25-Volume de
Ligação                                                Água Disponibilizado por Economia, observar
                                                       como ela reproduz as correlações daquela
                                1,000             ,860
                                                       variável, mas com uma comunalidade menor.
                                                       Poderia estar representada por I25. Candidata a
                                                       sair da análise.
I52-Índice de Consumo de                               A matriz de correlação está dizendo que esses
Água                                                   indicadores são “idênticos”. De fato, ao observar a
                                                       composição de ambos, vemos que I49 = 1 – I52;
                                1,000             ,956
                                                       isto é, como eles são expressos em percentagem,
                                                       então são complementares. Sugere-se excluí-lo da
                                                       amostra.
I53-Consumo Médio de Água                              Com alta comunalidade, essa variável apresenta a
por Economia                                           mesma composição de I17-Consumo de Água
                                                       Faturado por Economia, mas com uma
                                1,000             ,922
                                                       comunalidade muito maior. Sugere-se mantê-la
                                                       em detrimento de I17 e em detrimento de I14-
                                                       Consumo Micromedido por Economia.
I55-Índice de Atendimento                              Comunalidade razoável. Apresenta a maior carga
Total de Água                                          no fator I23-Índice de Atendimento Urbano de
                                1,000             ,790
                                                       Água, que é uma candidata a ficar fora.
                                                       Apresenta uma carga razoável no fator I56-Índice


10                                  ABES – Associação Brasileira de Engenharia Sanitária e Ambiental
25º Congresso Brasileiro de Engenharia Sanitária e Ambiental



                                                       de Atendimento Total de Esgoto Referido aos
                                                       Municípios Atendidos com Água. Perde, porém,
                                                       em comunalidade para I-56. Candidata a ficar
                                                       fora, em favor de I-56.
I57-Índice de Fluoretação da                           Comunalidade baixa, justificando as baixas cargas
                                 1,000            ,611
Água                                                   dos demais fatores. Candidata a ficar fora.
I58-Índice de Consumo de                               Apresenta baixas cargas para os fatores em estudo.
Energia Elétrica em Sistemas     1,000            ,856 Candidata a ficar fora.
de Abastecimento de Água
                         Tabela 5: Análise das Comunalidades. (continuação)
                                 Inicia                                    Correlação
Indicadores                        l    Comunalidade
I15- Índice de Coleta de                               Com comunalidade alta, apresenta cargas bastante
Esgoto                                                 significativas para os fatores I24-Índice de
                                                       Atendimento Urbano de Esgoto Referido aos
                                                       Municípios Atendidos com Água e I47- Índice
                                                       de Atendimento Urbano de Esgoto Referido aos
                                 1,000            ,907
                                                       Municípios Atendidos com Esgoto. Apresenta
                                                       também uma carga bastante alta para o fator I56-
                                                       Índice de Atendimento Total de Esgoto
                                                       Referido aos Municípios Atendidos com Água.
                                                       Deve permanecer na amostra.
I28-Índice de Faturamento de                           Recomendada sair pela semelhança com I13-
                                 1,000            ,905
Água                                                   Índice de Perdas de Faturamento
I16-Índice de Tratamento de                            Apresenta uma carga razoável apenas no fator
Esgoto                           1,000            ,933 I46-Índice de Esgoto Tratado Referido a Água
                                                       Consumida. Candidata a ficar fora.
I21-Extensão da Rede de                                Com comunalidade alta, apresenta uma carga alta
Esgoto por Ligação                                     apenas no fator I59-Índice de Consumo de
                                 1,000            ,932
                                                       Energia Elétrica em Sistemas de Esgotamento
                                                       Sanitário. Candidata a sair.
I24- Índice de Atendimento                             Com comunalidade alta, observar como a
Urbano de Esgoto Referido                              composição de I24 e I47 são idênticas em termos
                                 1,000            ,957
aos Municípios Atendidos com                           das cargas fatoriais, sendo que uma explica
Água                                                   totalmente a outra.
I46-Índice de Esgoto Tratado                           Apresenta carga fatorial razoável apenas para a
Referido a Água Consumida        1,000            ,957 variável I16, que é candidata a ficar fora. Deve
                                                       sair.
I47-Índice de Atendimento                              Pela sua própria definição, deve sair em favor de
Urbano de Esgoto Referido                              I-24.
                                 1,000            ,957
aos Municípios Atendidos com
Esgoto
I56-Índice de Atendimento                              Apresenta elevadas cargas para os fatores I24 e
Total de Esgoto Referido aos                           I47, as quais, por sua vez, são intercambiáveis.
Municípios Atendidos com         1,000            ,946 Apresenta carga elevada também para o fator I15-
Água                                                   Índice de Coleta de Esgoto, que deve
                                                       permanecer na amostra.
I59-Índice de Consumo de                               Com comunalidade alta, apresenta uma carga alta
Energia Elétrica em Sistemas     1,000            ,929 apenas no fator I21-Extensão da Rede de Esgoto
de Esgotamento Sanitário                               por Ligação. Deve sair.
Método de Extração: Análise do Componente Principal




ABES – Associação Brasileira de Engenharia Sanitária e Ambiental                                   11
25º Congresso Brasileiro de Engenharia Sanitária e Ambiental


FASE III – ANÁLISE DA MATRIZ DE CORRELAÇÃO DO CONJUNTO REDUZIDO DOS
INDICADORES DO SNIS
Conforme as recomendações da FASE II, passamos a estudar um subconjunto dos indicadores operacionais
de água e esgoto que seja representativo dos demais, e que apresente uma consistência interna, antes de uma
nova tentativa de estabelecer as suas correlações com variáveis exógenas. Sendo assim, procedeu-se um novo
processamento dos dados, mantendo-se os mesmos 721 (municípios) respondentes para um conjunto de 8
(oito) indicadores selecionados da fase anterior para o ano de referência de 2005. Como poderá ser verificado
doravante, esse subconjunto já está muito próximo de ser o mais representativo do conjunto de indicadores
operacionais de água e esgoto analisado na Fase II.

Devemos sempre lembrar que um dos nossos objetivos, de fato, é a redução de dados. A primeira razão para a
busca de uma redução dos dados parece óbvia: a grande quantidade de informações que são coletadas,
consistidas e sistematizadas pelo SNIS. A segunda forte razão é mais sutil: conforme verificado nas análises
anteriores, muitos indicadores possuem estruturas semelhantes (como é o caso de grandezas
complementares), sendo recomendável a sua exclusão da análise; mas isso não invalida a sua presença na
série histórica do SNIS por uma questão conceitual. Sendo assim, devemos prosseguir com as análises tendo
em mente que algumas restrições aqui colocadas aos indicadores pré-existentes no SNIS, o são em função de
necessidades do tipo de análise que está sendo feita.

Não se pode afirmar, a partir dessa análise exploratória, que determinado indicador seja dispensável, quer
seja pela sua semelhança com outros indicadores, quer seja pela sua baixa correlação com o conjunto
explorado. O que, de fato, justifica a existência de um indicador é o próprio conceito que ele encerra. Isto
posto, como na fase anterior, passamos a analisar a matriz de correlação e as comunalidades do subconjunto
dos indicadores operacionais de água e de esgoto resultante das discussões da Fase II.

A Análise Fatorial e a Matriz de Correlação do Conjunto Reduzido
A Tabela 6 apresenta os resultados da Matriz de correlação e a Tabela 7 os resultados da análise de
comunalidades do conjunto reduzido de indicadores do SNIS.

                                    Tabela 6: Matriz de Correlação(a).
                           I10        I13      I25        I49      I53     I15        I24       I56
Correlação      I10        1,000       -,795    -,686      -,773    -,122    ,160       ,221      ,160
                I13         -,795     1,000      ,730       ,848     ,130   -,063      -,150     -,031
                I25         -,686       ,730    1,000       ,606     ,567   -,037      -,104      ,001
                I49         -,773       ,848     ,606     1,000     -,184   -,081      -,159     -,093
                I53         -,122       ,130     ,567      -,184    1,000    ,093       ,103      ,180
                I15          ,160      -,063    -,037      -,081     ,093  1,000        ,890      ,873
                I24          ,221      -,150    -,104      -,159     ,103    ,890     1,000       ,932
                I56          ,160      -,031     ,001      -,093     ,180    ,873       ,932     1,000
a Determinant = ,000
         Tabela 7: Análise das Comunalidades do Conjunto Reduzido de Indicadores do SNIS.
                                Inicia Comunalidad                     Correlação
Indicadores                        l        e
I10- Índice de Micromedição                          Com a comunalidade menor do que na fase
Relativo ao Volume                                   anterior, mas ainda alta, esta variável apresenta
Disponibilizado                                      as maiores cargas para os fatores I13-Índice de
                                                     Perdas de Faturamento, I49-Índice de Perdas na
                                                     Distribuição    e    I25-Volume       de    Água
                                 1,000         ,831
                                                     Disponibilizado por Economia (observar o sinal
                                                     trocado em todos os componentes, significando
                                                     que quando I10 aumenta, os fatores acima
                                                     diminuem). Isto, em hipótese, significa que a
                                                     micromedição reduz as perdas e inibe o


12                                    ABES – Associação Brasileira de Engenharia Sanitária e Ambiental
25º Congresso Brasileiro de Engenharia Sanitária e Ambiental



                                                    desperdício. Deve-se atentar para o fato de que
                                                    neste estudo, isto não é uma questão conceitual ou
                                                    um postulado, mas sim aquilo que a amostra do
                                                    SNIS está traduzindo através de um construto,
                                                    um ente estatístico. A compreensão disto é
                                                    fundamental para qualquer discussão posterior.
I13-Índice de Perdas de                             A variável I13-Índice de Perdas de Faturamento
Faturamento                                         apresenta a maior carga para o fator I49-Índice de
                                                    Perdas na Distribuição. Pelos mesmos motivos
                                                    acima, pode-se inferir que, ainda em hipótese, a
                                                    maior componente das perdas de faturamento
                               1,000           ,895 é a perda na distribuição. Também apresenta
                                                    cargas significativas para os fatores I10- Índice
                                                    de Micromedição Relativo ao Volume
                                                    Disponibilizado (agora com o sinal trocado) e
                                                    I25-Volume de Água Disponibilizado por
                                                    Economia.
  Tabela 7: Análise das Comunalidades do Conjunto Reduzido de Indicadores do SNIS (continuação).
                              Inicia Comunalidad                         Correlação
Indicadores                      l          e
I25-Volume de Água                                  O que essa variável I25-Volume de Água
Disponibilizado por Economia                        Disponibilizado por Economia apresenta de
                                                    diferente é uma carga significativa no fator I53-
                                                    Consumo Médio de Água por Economia. Como
                                                    essa carga tem sinal positivo, podemos inferir que
                                                    o aumento da disponibilização de água
                                                    aumenta o consumo. Embutido neste aumento
                               1,000           ,918
                                                    de consumo, devemos considerar, encontra-se
                                                    uma parcela devida à demanda reprimida;
                                                    mas também, uma parcela devida ao
                                                    desperdício. São hipóteses da mais alta
                                                    relevância para o nosso estudo, e que não
                                                    emergem da erudição, mas sim dos dados
                                                    contidos na amostra.
I49-Índice de Perdas na                             Como não poderia deixar de ser, a maior carga
Distribuição                   1,000           ,943 para essa variável está no fator I13-Índice de
                                                    Perdas de Faturamento.
I53-Consumo Médio de Água                           Por sua vez, a maior carga para essa variável está
por Economia                                        no fator I25-Volume de Água Disponibilizado por
                               1,000           ,979
                                                    Economia. Sobre isso, são importantes as
                                                    considerações anteriores em I25.
I15- Índice de Coleta de                            Da análise anterior do conjunto completo, o I15-
Esgoto                                              Índice de Coleta de Esgoto demonstra estar
                                                    fortemente correlacionado com o Atendimento
                                                    Referido aos Municípios Atendidos com Água
                                                    expresso pelos fatores I24 e I56. Esses
                                                    indicadores, por definição, surgem de uma
                                                    relação entre as populações atendidas por
                               1,000           ,911
                                                    esgotamento sanitário e as atendidas por
                                                    abastecimento de água. A amostra em estudo
                                                    demonstra não haver uma correlação
                                                    considerável entre os indicadores de esgoto e
                                                    aqueles da água. Isto é sintomático e revela
                                                    uma quadro preocupante para o saneamento
                                                    brasileiro.



ABES – Associação Brasileira de Engenharia Sanitária e Ambiental                                   13
25º Congresso Brasileiro de Engenharia Sanitária e Ambiental



I24- Índice de Atendimento                                 Possivelmente, essa        variável   estaria   bem
Urbano de Esgoto Referido                                  representada por I15.
                                1,000            ,952
aos Municípios Atendidos com
Água
I56-Índice de Atendimento                                  Possivelmente, essa        variável   estaria   bem
Total de Esgoto Referido aos                               representada por I15.
                                1,000            ,943
Municípios Atendidos com
Água
Método de Extração: Análise do Componente Principal

Partindo de um conjunto de 30 (trinta) indicadores operacionais de água e esgoto na FASE II, reduzimos
aquele conjunto para 8 (oito) indicadores nesta FASE III, cuja solução fatorial revela 3(três) componentes
capazes de explicar 92,14% da variância total do conjunto. Em vista das constatações da FASE I, esse
resultado se mostra bastante animador, uma vez que sugere termos encontrado um conjunto mínimo de
indicadores muito representativo da totalidade dos indicadores operacionais de água e esgoto do SNIS. Na
próxima fase, voltaremos a estudar a matriz de correlação com as variáveis exógenas, mas agora seguros de
termos um conjunto de indicadores consistentes entre si e representativos do conjunto maior.




                                  Tabela 8: Variância Total Explicada
Comp         Autovalores Iniciais              Extração das SSL                       Rotação das SSL
                 % da                             % da                                   % da
                Variânci Cumulativ               Variânci Cumulativ                    Variânci Cumulativ
       Total        a          o%        Total      a          o%             Total        a         o%
1       3,451     43,139        43,139 3,451       43,139       43,139        3,150      39,373       39,373
2       2,677     33,464        76,602 2,677       33,464       76,602        2,810      35,126       74,499
3       1,243     15,543        92,145 1,243       15,543       92,145        1,412      17,647       92,145
4        ,229      2,867        95,012
5        ,156      1,949        96,961
6        ,129      1,613        98,575
7        ,061        ,762       99,337
8        ,053        ,663      100,000
Método de Extração: Análise do Componente Principal


FASE IV – ANÁLISE DA MATRIZ DE CORRELAÇÃO ENTRE OS INDICADORES DO SNIS, DO
IDHM E DO MI
Antes de partir para um conjunto mais amplo de variáveis exógenas, uma vez que já temos um conjunto
reduzido de indicadores do SNIS, daremos um passo intermediário que é proceder a análise de correlação
com 2 (dois) dos mais importantes indicadores municipais utilizados no Brasil, a saber: IDHM – Índice de
Desenvolvimento Humano Municipal do PNUD, e o MI – Indicador de Mortalidade Infantil Estimada dos
Municípios Brasileiros – do Sistema de Monitoramento dos Indicadores de Mortalidade Infantil da Fiocruz.
Nesta fase, trabalhamos com uma amostra de 860 municípios, ou seja, todos aqueles municípios para os quais
há suficiência de dados primários para o cálculo dos indicadores selecionados para este estudo, e relativos ao
ano de referência de 2005. Como se trata de uma análise exploratória, o objetivo deste passo é estabelecer
referências para a comparação dos efeitos dos fatores nas variáveis em função de tamanho e adequação da
amostra. Não nos detemos na análise dos componentes desta fase em favor de um aprofundamento das
discussões a partir de uma amostra otimizada estudada na Fase V.

Com relação às variáveis exógenas introduzidas na análise, temos a considerar que:



14                                    ABES – Associação Brasileira de Engenharia Sanitária e Ambiental
25º Congresso Brasileiro de Engenharia Sanitária e Ambiental


O Índice de Desenvolvimento Humano foi criado originalmente para medir o nível de desenvolvimento
humano dos países a partir de indicadores de educação (alfabetização e taxa de matrícula), longevidade
(esperança de vida ao nascer) e renda (PIB per capita). O índice varia de 0 (nenhum desenvolvimento
humano) a 1 (desenvolvimento humano total). Países com IDH até 0,499 têm desenvolvimento humano
considerado baixo; os países com índices entre 0,500 e 0,799 são considerados de médio desenvolvimento
humano; países com IDH maior que 0,800 têm desenvolvimento humano considerado alto.

No caso da MI – Estimativa da Mortalidade Infantil dos Municípios Brasileiros, os indicadores foram
classificados em cinco grandes dimensões: I. Contextuais, que estabelece o contexto em que ocorrem os
óbitos infantis, sendo representada por características sócio-demográficas da população; II. Mortalidade
Proporcional, que é composta por indicadores relativos à estrutura de causas de morte e à distribuição etária
dos óbitos entre os menores de um ano; III. Relacionados ao Nascimento, para caracterizar as condições do
nascimento e da assistência à gestação e ao parto; IV. Indicadores de adequação das informações vitais, que
tem o propósito de estabelecer a adequação das informações vitais no nível municipal com vistas ao cálculo
direto da mortalidade infantil; V. Indicadores de completitude e consistência das variáveis constantes nas
declarações de óbito infantil e de nascimento, que visa monitorar a qualidade de preenchimento dos campos
das declarações de óbito infantil e de nascimento.

A Análise Fatorial e a Matriz de Correlação da Fase IV
A Tabela 9 apresenta a Matriz de Correlação referente à Fase IV e a Tabela 10 a variância total explicada.



                                            Tabela 9: Matriz de Correlação(a)
                                                                                           IDHM       IDHM      IDHM      MI
                            I10     I13        I25      I49       I15     I24     I56     RENDA      LONGE     EDUCA     1000
Corr.   I10                1,000    -,790      -,578    -,730      ,214    ,287    ,223     ,057        ,116     -,014   -,148
        I13                 -,790   1,000      ,599      ,824     -,117   -,212   -,106     ,127        ,048     ,191     ,015
        I25                 -,578    ,599     1,000      ,522     -,076   -,136   -,071     ,072        ,006     ,121     ,082
        I49                 -,730    ,824      ,522     1,000     -,135   -,220   -,161     ,060       -,002     ,123     ,027
        I15                 ,214    -,117      -,076    -,135     1,000    ,886    ,871     ,400        ,325     ,254    -,236
        I24                 ,287    -,212      -,136    -,220      ,886   1,000    ,939     ,352        ,333     ,197    -,262
        I56                 ,223    -,106      -,071    -,161      ,871    ,939   1,000     ,480        ,404     ,338    -,309
        IDHM_RENDA          ,057     ,127      ,072      ,060      ,400    ,352    ,480    1,000        ,626     ,843    -,530
        IDHM_LONGE          ,116     ,048      ,006     -,002      ,325    ,333    ,404     ,626       1,000     ,599    -,462
        IDHM_EDUCA          -,014    ,191      ,121      ,123      ,254    ,197    ,338     ,843        ,599    1,000    -,542
        MI_1000             -,148    ,015      ,082      ,027     -,236   -,262   -,309     -,530      -,462     -,542   1,000
a Determinant = 8,34E-005

                                          Tabela 10: Variância Total Explicada
Comp
.                   Autovalores Iniciais                      Extração das SSL                      Rotação das SSL
                        % da                                     % da                                  % da
                      Variânci Cumulativ                       Variânci Cumulativ                    Variânci Cumulativ
              Total       a           o%             Total         a          o%          Total         a          o%
1             4,082     37,107         37,107        4,082        37,107       37,107     3,075        27,955       27,955
2             3,107     28,249         65,356        3,107        28,249       65,356     2,862        26,019       53,974
3             1,550     14,089         79,445        1,550        14,089       79,445     2,802        25,470       79,445
4              ,584      5,310         84,755
5              ,501      4,554         89,309
6              ,446      4,052         93,362
7              ,255      2,317         95,679


ABES – Associação Brasileira de Engenharia Sanitária e Ambiental                                                          15
25º Congresso Brasileiro de Engenharia Sanitária e Ambiental



8         ,156      1,418       97,097
9         ,141      1,283       98,380
10        ,135      1,230       99,610
11        ,043       ,390      100,000
Extraction Method: Principal Component Analysis.


FASE V – REFINAMENTO DA AMOSTRA E ANÁLISE DOS COMPONENTES
O Tamanho e Dimensões da Amostra
Entre os pesquisadores há muita discussão sobre o tamanho ideal da amostra. Alguns defendem que a
amostra deve ter um número de respondentes no mínimo de 10(dez) vezes o número de variáveis em análise.
Outros defendem que esse número deverá ser de 20(vinte) vezes, ou até mais em alguns casos. De qualquer
forma, uma coisa é certa: amostras grandes em número de variáveis poderão produzir o que se chama de um
“super ajuste” que irá aparecer através da multicolinearidade. Quando isso ocorre, ou quando o número de
respondentes é muito grande, cargas fatoriais menores passam a ter significância, podendo ocorrer o
mascaramento de efeitos que desejamos medir.

A nossa amostra, usada na Fase IV, com 860 respondentes, mostra-se muito grande segundo as
recomendações. Esses 860 municípios são aqueles que apresentam suficiência de informações na base de
dados do SNIS para efeito do cálculo dos indicadores selecionados para este estudo, não representando,
todavia, a totalidade da base do SNIS. Sendo assim, ainda como uma medida exploratória, procuramos
reduzi-la utilizando vários critérios, e o que se mostrou mais adequado ao problema em estudo foi o “corte”
pela população. Ao filtrar os municípios com populações acima de 50.000 habitantes, reduzimos a amostra
para 316 respondentes, um tamanho bem mais adequado se consideradas as argumentações teóricas. Todavia,
devemos salientar que essa medida não pode implicar em perda do potencial de generalização dos resultados
para o conjunto dos municípios brasileiros. Na realidade, isto se coloca como uma condição indispensável
para o uso continuado desta metodologia na exploração dos dados da série histórica do SNIS.

                         Tabela 11: Matriz de Correlação Antes da Redução(a)
                                                                                   IDHM      IDHM      IDHM      MI
                        I10     I13      I25      I49     I15     I24     I56     RENDA     LONGE     EDUCA     1000
      I10              1,000    -,790   -,578     -,730    ,214    ,287    ,223     ,057      ,116      -,014   -,148
      I13               -,790   1,000    ,599     ,824    -,117   -,212   -,106     ,127      ,048      ,191     ,015
      I25               -,578    ,599   1,000     ,522    -,076   -,136   -,071     ,072      ,006      ,121     ,082
      I49               -,730    ,824    ,522    1,000    -,135   -,220   -,161     ,060      -,002     ,123     ,027
      I15               ,214    -,117   -,076     -,135   1,000    ,886    ,871     ,400      ,325      ,254    -,236
      I24               ,287    -,212   -,136     -,220    ,886   1,000    ,939     ,352      ,333      ,197    -,262
      I56               ,223    -,106   -,071     -,161    ,871    ,939   1,000     ,480      ,404      ,338    -,309
      IDHM_RENDA        ,057     ,127    ,072     ,060     ,400    ,352    ,480    1,000      ,626      ,843    -,530
      IDHM_LONGE        ,116     ,048    ,006     -,002    ,325    ,333    ,404     ,626     1,000      ,599    -,462
      IDHM_EDUCA        -,014    ,191    ,121     ,123     ,254    ,197    ,338     ,843      ,599     1,000    -,542
      MI_1000           -,148    ,015    ,082     ,027    -,236   -,262   -,309     -,530     -,462     -,542   1,000
a Determinant = 8,34E-005

                         Tabela 12: Matriz de Correlação Depois da Redução(a)
                                                                                   IDHM      IDHM      IDHM      MI
                        I13     I10      I25      I49     I15     I24     I56     RENDA     LONGE     EDUCA     1000
      I13              1,000    -,813    ,616     ,801    -,137   -,271   -,252     -,039     -,033     ,054     ,035
      I10               -,813   1,000   -,648     -,776    ,241    ,373    ,375     ,193      ,181      ,095    -,173
      I25               ,616    -,648   1,000     ,534    -,067   -,148   -,138     ,003      -,089     ,096     ,071
      I49               ,801    -,776    ,534    1,000    -,122   -,246   -,234     -,055     -,034     ,020     ,023



16                                      ABES – Associação Brasileira de Engenharia Sanitária e Ambiental
25º Congresso Brasileiro de Engenharia Sanitária e Ambiental


      I15               -,137   ,241    -,067   -,122   1,000    ,869    ,875      ,529     ,362    ,385   -,336
      I24               -,271   ,373    -,148   -,246    ,869   1,000    ,985      ,519     ,410    ,369   -,367
      I56               -,252   ,375    -,138   -,234    ,875    ,985   1,000      ,564     ,437    ,422   -,403
      IDHM_RENDA        -,039   ,193    ,003    -,055    ,529    ,519    ,564     1,000     ,601    ,843   -,631
      IDHM_LONGE        -,033   ,181    -,089   -,034    ,362    ,410    ,437      ,601    1,000    ,608   -,632
      IDHM_EDUCA         ,054   ,095    ,096    ,020     ,385    ,369    ,422      ,843     ,608   1,000   -,676
      MI_1000            ,035   -,173   ,071    ,023    -,336   -,367   -,403      -,631   -,632   -,676   1,000
a Determinant = 1,29E-005

A partir de uma análise visual, considerando apenas o padrão de cor, percebe-se que a redução da amostra
resultou num sensível aumento das cargas fatoriais dos componentes. Como havíamos afirmado antes, de
fato, um super ajuste provocado pelo tamanho da amostra pode mascarar os efeitos dos fatores sobre as
variáveis em estudo.

A Medida da Adequação da Amostra
Uma medida para quantificar o grau de inter-correlações entre as variáveis e da adequação da análise fatorial
é a medida de adequação da amostra (MSA). Esse índice varia de 0 a 1, alcançando 1 quando cada variável
é perfeitamente prevista sem erro pelas outras variáveis.

Nesse estudo, o valor para a MSA pode ser observado pela Tabela 13, antes da redução, e Tabela 14, após a
redução.



                        Tabela 13: Testes de KMO e Bartlett (antes da redução)
                        Medida da Adequação da Amostra de Kaiser-
                                                                        ,802
                                   Meyer-Olkin - KMO
                                              Approx. Chi-Square     8024,909
                                                      df                 55
                                                     Sig.               ,000

                         Tabela 14: Testes de KMO e Bartlett (após a redução)
                         Medida da Adequação da Amostra de Kaiser-
                                   Meyer-Olkin - KMO                    ,822

                                                    Approx. Chi-Square          3494,851
                                                            df                     55
                                                           Sig.                   ,000

Comparadas as medidas de adequação da amostra (MSA), vê-se que, após a redução da amostra deste estudo,
essa medida aumenta, acusando uma melhora do KMO de 0.802 para 0.822, o que vem reforçar a idéia de ser
bastante adequado o emprego da análise fatorial no caso em estudo. Já o teste de esfericidade de Bartlett
fornece um nível de significância (Sig.=0,000), que é inferior a 0,05, concluindo-se que as variáveis são
correlacionáveis (rejeitando-se a hipótese nula).

Com o MSA = 0.822, acreditamos que podemos prosseguir as análises dos resultados obtidos, com a
segurança de que estamos com uma boa medida de adequação da amostra (ver quadro abaixo). A medida
pode ser interpretada com as orientações apresentadas na Tabela 15.

                                         Tabela 15: Valores de MSA
                                        Valor            Adequação
                                        >= 0.80          admirável



ABES – Associação Brasileira de Engenharia Sanitária e Ambiental                                            17
25º Congresso Brasileiro de Engenharia Sanitária e Ambiental



                                       >= 0.70 < 0.80     mediano
                                       >= 0.60 < 0.70     medíocre
                                       >= 0.50 < 0.60     ruim
                                       < 0.50             inaceitável

Considerando as estreitas faixas da medida da adequação da amostra indicadas na tabela, mostra-se bastante
relevante o salto qualitativo da amostra reduzida; bem como, no sentido contrário, revela-se ser a amostra
abrangente (com maior número de municípios), um importante indicador da qualidade e consistência
da base de dados do SNIS utilizada neste estudo.

O Método da Análise dos Componentes Principais (ACP)
É importante observar que o principal objetivo da análise fatorial é reduzir o número de variáveis para
explicar o fenômeno de interesse, além de gerar hipóteses por meio da análise exploratória dos dados. A
análise fatorial não comprova, necessariamente, hipóteses. O que se busca é, em primeiro lugar, a
recomendação ou não da aplicação do método em si; e, em segundo lugar, se o mesmo corresponde às
predições possíveis a partir de um profundo conhecimento das questões em análise. Um trabalho inicial de
prospecção como este deve ser submetido ao exame de especialistas com diferentes inserções no campo de
conhecimento explorado aqui.


CONSIDERAÇÕES GERAIS
1. A técnica da Análise Fatorial produz coeficientes de regressão (cargas fatoriais) que indicam a relação
entre o fator e cada variável original. Adotamos as cores: verde para indicar as cargas mais significativas (>=
0.60); amarelo para aquelas importantes (>= 0.40 < 0.60); e ocre para aquelas ainda relevantes (>= 0.30 <
0.4), considerando o tamanho da amostra inicial de 860 municípios para os quais existem informações para
cálculo dos indicadores selecionados na base de dados do SNIS, ano de referência 2005; e 316 municípios
com mais de 50.000 habitantes na amostra reduzida. A partir disto, o primeiro passo da análise é um exame
visual da matriz de correlação, quando se pode observar a significância das cargas de cada fator nas variáveis
correspondentes.

2. Como já evidenciado na FASE III, a solução fatorial está indicando não haver uma correlação muito
significativa entre os indicadores operacionais da água e os demais envolvidos na análise, quais sejam os de
esgoto e as variáveis IDHM_RENDA, IDHM_LONGEVIDADE, IDHM_EDUCAÇÃO e MI_1000. Todavia,
esse grupo de indicadores da água demonstra existir uma dimensão latente bem definida, com ênfase para a
oposição que se revela nesta dimensão entre a micromedição (I10 – Índice de Micromedição Relativo ao
Volume Disponibilizado) e o complexo de perdas (I13 – Índice de Perdas de Faturamento, I25 – Volume
de Água Disponibilizado por Economia e I49 – Índice de Perdas na Distribuição).

3. Do exame visual da matriz de acima se pode ainda verificar que existe uma correlação significativa entre
o grupo de indicadores operacionais de esgoto e o grupo de variáveis estrangeiras. Mas não deixa de ser
notada uma curiosidade: o atendimento total de esgoto está relacionado com fatores representativos do
IDHM, com ênfase para a componente IDHM_RENDA, com carga = 0.56, seguida pela componente
IDHM_LONGE, com carga = 0.43, evidenciando a hipótese de carência de serviços pela população
mais pobre, relacionando-a com a longevidade/salubridade. Encontra-se, todavia, em oposição, ou
inversamente proporcional, à mortalidade infantil, como era de se esperar, com a significativa carga =
- 0.40.

4. Observar como o grupo de indicadores operacionais de esgoto encontra-se em oposição ao complexo de
perdas. Isto também é sintomático. Isto, em hipótese, poderia indicar a falta de capacidade de
investimento decorrente do mal desempenho operacional?

5. Dentre as componentes do IDHM, a variável IDHM_RENDA é a que apresenta as maiores cargas para
os fatores correspondentes aos indicadores de esgotamento sanitário do SNIS. Todavia, no conjunto das
variáveis estudadas, seu fator mais importante é o representado pela componente IDHM_EDUCA, como era
de se esperar.


18                                    ABES – Associação Brasileira de Engenharia Sanitária e Ambiental
25º Congresso Brasileiro de Engenharia Sanitária e Ambiental




6. A longevidade, que pode estar relacionada com as condições de salubridade também, apresenta como
principais fatores a renda, a educação, a mortalidade infantil (em oposição), e significativas cargas nos
fatores correspondentes aos indicadores de esgotamento sanitário do SNIS.

7. A mortalidade infantil, por sua vez, apresenta-se em oposição às dimensões do IDHM e dos fatores
correspondentes às condições de esgotamento sanitário do SNIS. Apresenta como seus principais fatores a
educação e a renda, respectivamente, com implicância na longevidade, e com relevantes cargas dos fatores
correspondentes aos indicadores de esgotamento sanitário do SNIS.

8. Mesmo no grupo de indicadores da água, que já apresentavam uma forte correlação, percebe-se um
sensível aumento das cargas fatoriais quando da redução da amostra.

9. O atendimento total de esgoto mostra-se mais fortemente relacionado com os fatores representativos do
IDHM e da MI – Mortalidade Infantil, para os municípios respondentes com mais de 50.000 habitantes. Para
a componente IDHM_RENDA, a carga fatorial passa de 0.48 para 0.56; seguida pela componente
IDHM_LONGE, que passa de 0.40 para 0.43; pela componente IDHM_EDUCA, que passa de 0.33 para
0.42; e pela componente MI_1000, que passa de -0.30 para -0.40. Observe-se que as maiores variações estão
nos fatores da mortalidade, educação e renda respectivamente.

Comunalidades da Amostra Reduzida
A soma em linha das cargas fatoriais ao quadrado resulta num número chamado comunalidade. A
comunalidade mostra a quantia da variância em uma variável que é explicada pelos fatores extraídos juntos;
isto é, o quanto da variância em uma dada variável é explicada pela solução fatorial. Quanto a isso, a variável
que apresenta o maior salto na sua comunalidade após a redução da amostra, de 0.577 para 0.740, é a MI -
mortalidade infantil; isto é, essa variável é melhor explicada pelos fatores em estudo nas cidades com mais de
50.000 habitantes, como pode ser observado na Tabela 16.


                                       Tabela 16: Comunalidades
                                                     Inicial   Extração
                                I13                     1,000       ,852
                                I10                     1,000       ,869
                                I25                     1,000       ,632
                                I49                     1,000       ,786
                                I15                     1,000       ,897
                                I24                     1,000       ,962
                                I56                     1,000       ,967
                                IDHM_RENDA              1,000       ,803
                                IDHM_LONGE              1,000       ,669
                                IDHM_EDUCA              1,000       ,829
                                MI_1000                 1,000       ,740
                           Método de Extração: Análise do Componente Principal.


Variância Total Explicada
Segundo o critério da raiz latente, somente autovalores > 1.0 são considerados na seleção de componentes
para análise posterior. Assim, na solução fatorial apresentada abaixo, somente três componentes devem ser
considerados. Na nossa matriz vemos que esses componentes explicam 82% da variância total do conjunto de
variáveis, o que torna um dos nossos principais objetivos, que é a redução de dados, bastante plausível graças
ao método escolhido. A Tabela 17 apresenta a variância total explicada e a Tabela 18 a matriz de
componentes.



ABES – Associação Brasileira de Engenharia Sanitária e Ambiental                                           19
25º Congresso Brasileiro de Engenharia Sanitária e Ambiental



                                 Tabela 17: Variância Total Explicada
Comp
.              Autovalores Iniciais            Extração das SSL                    Rotação das SSL
                   % da                           % da                                % da
                 Variânci Cumulativ              Variânci Cumulativ                 Variânci Cumulativ
         Total       a           o%      Total      a          o%          Total       a          o%
1        4,721     42,921         42,921 4,721     42,921       42,921     3,135      28,497       28,497
2        2,930     26,634         69,555 2,930     26,634       69,555     3,035      27,586       56,083
3        1,356     12,326         81,881 1,356     12,326       81,881     2,838      25,798       81,881
4         ,574      5,219         87,101
5         ,409      3,718         90,818
6         ,352      3,203         94,021
7         ,197      1,793         95,814
8         ,168      1,530         97,345
9         ,145      1,321         98,666
10        ,134      1,217         99,883
11        ,013        ,117       100,000
Extraction Method: Principal Component Analysis.

                               Tabela 18: Matriz de Componentes(a)
                                                       Componentes
                                               1            2           3
                        I13                     -,427         ,813        ,100
                        I10                      ,576        -,719       -,147
                        I25                     -,320         ,698        ,207
                        I49                     -,411         ,777        ,115
                        I15                      ,773         ,165        ,522
                        I24                      ,847         ,047        ,492
                        I56                      ,868         ,079        ,454
                        IDHM_RENDA               ,764         ,400       -,242
                        IDHM_LONGE               ,655         ,325       -,367
                        IDHM_EDUCA               ,658         ,489       -,395
                        MI_1000                 -,648        -,349        ,446
                        Traço                 42,921       26,634      12,326
                         Método de Extração: Análise do Componente Principal.
                                       3 componentes extraídos.

Como já visto anteriormente, a importância de um fator é avaliada pela proporção da variância representada
pelo fator após a rotação. A rotação favorece a análise dos componentes na medida em que revela as
dimensões subjacentes da solução fatorial apresentada. Se nos permitimos anteriormente identificar essas
dimensões, agora, com muito mais razão e propriedade, poderemos inclusive dar nomes aos fatores até aqui
identificados por números. Esses fatores, evidentemente, estarão associados àquelas dimensões latentes que
buscamos medir (3), como pode ser visto na Tabela 19.

                          Tabela 19: Matriz de Componentes Rotacionada (a)
                                                      Componentes
                                               1          2          3
                         I13                     ,914       ,038      -,124
                         I10                    -,902       ,129       ,197
                         I25                     ,795      -,014       ,015


20                                   ABES – Associação Brasileira de Engenharia Sanitária e Ambiental
25º Congresso Brasileiro de Engenharia Sanitária e Ambiental



                          I49                     ,880         ,021       -,106
                          I15                    -,043         ,239        ,916
                          I24                    -,185         ,251        ,930
                          I56                    -,173         ,303        ,919
                          IDHM_RENDA             -,011         ,818        ,366
                          IDHM_LONGE             -,063         ,792        ,192
                          IDHM_EDUCA              ,074         ,887        ,191
                          MI_1000                 ,058        -,848       -,131
                          SSLs                   3,135       3,035       2,838
                          % da
                                                28,497      27,586      25,798
                          Variância
                           Método de Extração: Análise do Componente Principal.
                         Método de Rotação: Varimax com Normalização de Kaiser.
                                    Rotação convergiu em 5 iterações.


A Análise dos Componentes
Da matriz de componentes rotacionada depreende-se um grande equilíbrio na proporção da variância
representada por cada um dos três fatores em análise. Isto significa que esses fatores adquirem praticamente a
mesma importância e juntos, parcimoniosamente, explicam aproximadamente 82% da variância total do
conjunto de variáveis originais Essa parcimônia é de fundamental importância em nosso estudo,
demonstrando equilíbrio dos fatores analisados.

O Componente 1
Como tem sido observado desde os estudos preliminares, o componente 1 revela uma dimensão relativa ao
abastecimento de água tratada, que poucas correlações tem demonstrado ter com as demais variáveis em
estudo. Todavia, nessa dimensão, aparece uma forte correlação (inversa) entre I13 – Índice de Perdas de
Faturamento e I10 – Índice de Micromedição Relativo ao Volume Disponibilizado. A hipótese que se levanta
é a de que o aumento do Índice de Micromedição pode reduzir o Índice de Perdas de Faturamento.

O Componente 2
O componente 2 revela-se claramente estar na dimensão social, alinhando, em oposição, o IDHM – Índice
de Desenvolvimento Humano Municipal e MI – Mortalidade Infantil Estimada para os municípios. Todavia,
diferente da dimensão da água, a dimensão social apresenta um entrelaçamento com a dimensão do esgoto,
aqui representada pelo componente 3, com ênfase para o I56 – Índice de Atendimento Total de Esgoto
Referido aos Municípios Atendidos com Água.

O Componente 3
Na dimensão das condições de esgotamento sanitário, o componente 3, reciprocamente apresenta
entrelaçamento com a dimensão social, com um evidente destaque para o fator renda. É importante observar
que a análise fatorial não testa hipóteses, mas, permite formulá-las.

Com isso, a Tabela 20 apresenta a matriz de transformação dos componentes.

                         Tabela 20: Matriz de Transformação dos Componentes
                           Componente           1           2          3
                                 1           -,404        ,634       ,660
                                 2            ,884        ,456       ,103
                                 3            ,235       -,625       ,744
                          Método de Extração: Análise do Componente Principal.
                         Método de Rotação: Varimax com Normalização de Kaiser.



ABES – Associação Brasileira de Engenharia Sanitária e Ambiental                                          21
25º Congresso Brasileiro de Engenharia Sanitária e Ambiental




FASE VI – ANÁLISE DOS ESCORES FATORIAIS PARA O ANO DE 2005
Procedemos a análise dos escores resultantes dos fatores principais. Para a obtenção dos estratos, utilizou-se a
técnica chamada análise hierárquica de agrupamento, a qual agrupa casos relativamente homogêneos de uma
determinada variável, no caso, os escores relativos aos fatores principais.

Essa amostra de 316 municípios com mais de 50.000 habitantes, inclui 24(vinte e quatro) capitais,
abrangendo uma população de 75.205.434 hab. A seguir uma análise sucinta do Fator 1.

FATOR 1 – Dimensão do Desempenho dos Sistemas de Abastecimento de Água
Deve-se lembrar que, neste estudo, esse desempenho é medido ponderando apenas os Indicadores de Perdas
de Faturamento, Perda na Distribuição, o Índice de Micromedição do Volume Disponibilizado e o Volume
Disponibilizado por Economia.

Péssimo: com relação às variáveis que compõem o Fator 1, e dentro da amostra reduzida para 316
municípios com mais de 50.000 hab, o Cluster 3 revela uma situação extrema: Índices de Perdas de
Faturamento e de Perdas na Distribuição altíssimos; Índice de Micromedição do Volume Disponibilizado
baixo; e um altíssimo Volume Disponibilizado por Economia. Realmente, sugere uma situação extrema de
mal desempenho para um serviço tão essencial como é o abastecimento de água tratada. Naquele
agrupamento a situação do baixo desempenho dos serviços de saneamento básico é agravada por índices
muito baixos de coleta de esgotos, atendimento urbano de esgoto e atendimento total de esgoto. Como
resultado, verificamos um alto índice de mortalidade infantil para cada 1.000 nascidos vivos.

Ruim: na seqüência, e sempre lembrando que estamos trabalhando com uma amostra de 316 municípios com
mais de 50.000 habitantes, aparece o Cluster 1. É bastante surpreendente que nesse agrupamento apareçam
3(três) capitais. Ali os indicadores de perdas de faturamento (I13) e na distribuição (I49) são altíssimos,
comparáveis ao do caso extremo. Mas, como pode ser verificado, não se trata mais de pequenos municípios,
mas de três capitais totalizando 870.130 hab. Observe-se os baixíssimos índices de micromedição sempre
associados com altos índices de volume disponibilizado. Essa associação, hipoteticamente, aponta para um
quadro de desperdício. Os indicadores de esgotamento sanitário neste grupo são muito baixos e assim, como
não poderia deixar de ser, os indicadores de mortalidade infantil estão muito acima do desejável.

Mediano: no caso do desempenho dos sistemas de abastecimento de água para a amostra em estudo, o
Cluster 2 mostra um quadro bastante preocupante do saneamento brasileiro. Numa amostra de 316
municípios, são 133 neste agrupamento, correspondendo a 42% dos municípios em número; mas contendo
14(quatorze) das 24(vinte e quatro) capitais da amostra (58%); e 38.944.847 de habitantes, correspondendo a
52% da amostra em população. Esse agrupamento é maior que a soma de todos os outros, recebendo uma
classificação apenas mediana. Os índices de perdas são muito elevados, os volumes micromedidos muito
baixos para altos volumes disponibilizados.

Bom: no Cluster 4 aparecem os municípios com desempenho de mediano para bom. É maior em termos do
número de municípios em relação à amostra: 174 municípios, correspondendo a 55% da amostra. O Cluster
4, juntamente com o Cluster 2, é bastante representativo da situação do saneamento brasileiro. Sete grandes
capitais estão ai incluídas. Neste agrupamento temos um total de 34.750.943 de habitantes, correspondendo a
46% da amostra. A passagem por esses agrupamentos mostra uma queda acentuada no indicador de
mortalidade infantil, e um avanço bastante significativo dos indicadores de esgotamento sanitário. Dos piores
desempenhos do Cluster 2 para os melhores do Cluster 4, deve-se notar, além da brutal melhora dos
indicadores de perdas, esse grande salto qualitativo e quantitativo dos indicadores de esgotamento sanitário e
da mortalidade infantil. Isto, inegavelmente, coloca a universalização do abastecimento de água tratada como
uma condição indispensável para a consecução dos objetivos do milênio.

Ótimo: de fato, neste Cluster 5 encontram-se situações bastante atípicas, infelizmente. Sabemos que índices
de perdas negativos não existem, salvo como um efeito contábil. Tampouco, em sistemas reais, podem esses
índices cair para números de 1(um) dígito, ou seja, menores que 10%. Mas, vale a pena observar neste grupo
o alto índice de micromedição e o baixo volume disponibilizado por economia. A despeito disso, todavia,


22                                     ABES – Associação Brasileira de Engenharia Sanitária e Ambiental
25º Congresso Brasileiro de Engenharia Sanitária e Ambiental


nota-se uma grande variância, ou mesmo disparidade, entre os indicadores de esgoto e de mortalidade
infantil dentro do grupo. Por essa razão, consideramo-lo atípico.

FATOR 2 - A Dimensão Social
Ao analisar o Fator 2, percebe-se uma clara associação entre pobreza (renda, longevidade e educação em
baixa), altas taxas de mortalidade infantil e mal desempenho dos serviços de saneamento básico na maioria
dos casos em análise. Devemos, todavia, lembrar que estamos trabalhando com uma amostra de 316
municípios.

Péssimo: extremo do extremo, para nesse Cluster só aparece um município. Essa cidade se caracteriza em
relação a extremos: extremo da pobreza, baixa expectativa de vida, pouca educação, mal desempenho dos
serviços de saneamento básico, alto índice de mortalidade infantil. Não sendo uma cidade tão pequena, com
seus 110.761 hab, torna-se uma má referência com relação aos indicadores analisados.

Ruim: ainda como um reflexo das condições precárias nas três dimensões em análise, o Cluster 3, com
7(sete) cidades, é pequeno deveras. Entretanto, vem evidenciar os profundos diferenciais existentes no Brasil.
Não podemos esquecer também que os municípios que fornecem informações para o SNIS – Sistema
Nacional de Informações sobre Saneamento, o fazem por já terem esclarecimento sobre a importância desse
diagnóstico. Inúmeros são os casos onde a falta desse esclarecimento acaba por ocultar situações ainda piores
do que os casos dessa amostra. Esse Cluster totaliza 630.335 hab, correspondendo a 0.8% da população da
amostra.

Mediano: com 50 cidades, o Cluster 2 é o primeiro agrupamento representativo da amostra, com 16% do
número de cidades e 6.579.271 hab, correspondendo a 8,7% da população da amostra. Neste grupo
aparecem duas capitais. As cidades desse agrupamento, no geral, estão ainda muito longe das metas do
milênio. Nessa dimensão social, mediano fica melhor traduzido como medíocre; pois, o diferencial a ser
superado no caso da mortalidade infantil, só como exemplo, requer muito investimento e tempo para a
consecução das metas. Deve-se observar que 47 dessas cidades, ou seja, 94% se encontram na região Norte-
Nordeste do país. As cidades do Cluster 3 e Cluster 4 estão todas naquela região também.

Bom: incomparavelmente maior que os outros, com 224 cidades, correspondendo a 71% da amostra em
número, e com 58.792.771 hab, correspondendo a 78% da população da amostra, o Cluster 1 pode ser
considerado como o perfil das cidades que fornecem informações para o SNIS. São cidades com um
considerável grau de desenvolvimento humano, cidades que apresentam condições de saneamento básico de
mediana para melhor, muitas das quais já se encontram próximas, ou até já atingiram, as metas do milênio
nos setores em estudo. Uns totais de 24 capitais da amostra encontram-se neste Cluster.
Ótimo: a dimensão social, das três dimensões em análise, é a única que apresenta um agrupamento
consistente de cidades na condição de excelência. De fato, ao examinar o quadro, verificamos que ali estão
cidades já muito conhecidas pela excelência de alguns indicadores. Mas, o que desejamos de fato enfatizar é
que essas cidades, em relação à amostra em estudo, no geral, apresentam melhores desempenhos nas
dimensões do saneamento básico e, consequentemente, baixos índices de mortalidade infantil, alta renda, alta
expectativa de vida e alto grau de educação. O Cluster 5 tem 34 cidades, ou 10,7% da amostra em número, e
9.092.296 hab, correspondendo a 12% da amostra em população.

FATOR 3 – Dimensão da Cobertura e Atendimento por Esgotamento Sanitário
Péssimo: a dimensão do esgotamento sanitário, neste estudo, exibe toda a sua complexidade. O Cluster 3,
que apresenta os maiores déficits de coleta e atendimento por esgoto sanitário, agrupa cidades que vão de um
extremo ao outro no que tange às outras dimensões em estudo, quais sejam as dimensões sociais e do
atendimento com água tratada. O grupo abrange ainda tanto cidades pequenas, com pouco mais de 50.000
habitantes, quanto grandes cidades e aglomerações urbanas, incluindo uma capital do Norte e outra do
Nordeste. Ao todo, são 73 cidades numa amostra de 316, 23% em número, e 13.433.254 hab,
correspondendo a 18% da amostra. Nada desprezível considerando os péssimos dados sobre cobertura e
atendimento.

Ruim: O Cluster 1, que agrupa cidades em condições consideradas ruins de atendimento de esgoto,


ABES – Associação Brasileira de Engenharia Sanitária e Ambiental                                          23
Análise de indicadores do SNIS
Análise de indicadores do SNIS

Más contenido relacionado

Similar a Análise de indicadores do SNIS

Teoria da mudança e o Ciência sem Fronteiras
Teoria da mudança e o Ciência sem FronteirasTeoria da mudança e o Ciência sem Fronteiras
Teoria da mudança e o Ciência sem FronteirasWalnerMamedeJnior
 
Classificação Internacional de Funcionalidade, Incapacidade e Saúde em inquér...
Classificação Internacional de Funcionalidade, Incapacidade e Saúde em inquér...Classificação Internacional de Funcionalidade, Incapacidade e Saúde em inquér...
Classificação Internacional de Funcionalidade, Incapacidade e Saúde em inquér...João Luís Santana
 
Apresentação 1º, 2º, 3º período objetivos, quadro teórico e metodologia
Apresentação 1º, 2º, 3º período objetivos, quadro teórico e metodologiaApresentação 1º, 2º, 3º período objetivos, quadro teórico e metodologia
Apresentação 1º, 2º, 3º período objetivos, quadro teórico e metodologiaCristina Trindade
 
Tcc Ricardo Chandulale-PowerPoint-1.pptx
Tcc Ricardo Chandulale-PowerPoint-1.pptxTcc Ricardo Chandulale-PowerPoint-1.pptx
Tcc Ricardo Chandulale-PowerPoint-1.pptxRicardoCarlos25
 
Ranking mundial de desenvolvimento da infraestrutura
Ranking mundial de desenvolvimento da infraestruturaRanking mundial de desenvolvimento da infraestrutura
Ranking mundial de desenvolvimento da infraestruturaAna Flavia Garcia Moraes
 
Seminário Artigos.pptx
Seminário Artigos.pptxSeminário Artigos.pptx
Seminário Artigos.pptxssuserd88009
 
TRABALHO_Aluizio Louzada Velloso Junior TCC REVISÃO DEPOIS DA BANCCA
TRABALHO_Aluizio Louzada Velloso Junior TCC REVISÃO DEPOIS DA BANCCATRABALHO_Aluizio Louzada Velloso Junior TCC REVISÃO DEPOIS DA BANCCA
TRABALHO_Aluizio Louzada Velloso Junior TCC REVISÃO DEPOIS DA BANCCAAluizio Louzada Velloso Junior
 
Isavc - Indicador das Condicionantes Sócio Ambientais para a Vida na Cidade
Isavc - Indicador das Condicionantes Sócio Ambientais para a Vida na CidadeIsavc - Indicador das Condicionantes Sócio Ambientais para a Vida na Cidade
Isavc - Indicador das Condicionantes Sócio Ambientais para a Vida na CidadeMarcos Camargo
 
18o. encontro de iniciação cientifica
18o. encontro de iniciação cientifica18o. encontro de iniciação cientifica
18o. encontro de iniciação cientificaDelza
 
Sistemática de Monitoramento e Avaliação em Programas e Projetos Governamentais
Sistemática de Monitoramento e Avaliação em Programas e Projetos GovernamentaisSistemática de Monitoramento e Avaliação em Programas e Projetos Governamentais
Sistemática de Monitoramento e Avaliação em Programas e Projetos GovernamentaisRosane Domingues
 
Gestão de custos_estudo sobre o uso e a implementação de sistemas de custos e...
Gestão de custos_estudo sobre o uso e a implementação de sistemas de custos e...Gestão de custos_estudo sobre o uso e a implementação de sistemas de custos e...
Gestão de custos_estudo sobre o uso e a implementação de sistemas de custos e...eparente
 
138_InterfacEHS_com_correcao (1)
138_InterfacEHS_com_correcao (1)138_InterfacEHS_com_correcao (1)
138_InterfacEHS_com_correcao (1)Graziani Gobatto
 
Aula 3 chagas 2000 - questionário na pesquisa científica
Aula 3   chagas 2000 - questionário na pesquisa científicaAula 3   chagas 2000 - questionário na pesquisa científica
Aula 3 chagas 2000 - questionário na pesquisa científicaAndréa Thees
 
Indicadores de eficiência operacional de uma empresa do setor
Indicadores de eficiência operacional de uma empresa do setorIndicadores de eficiência operacional de uma empresa do setor
Indicadores de eficiência operacional de uma empresa do setorJacyara Costa
 
O PATRIMÔNIO SOCIAL E SEUS IMPACTOS NOS INDICADORES DE QUALIDADE DAS UNIVERSI...
O PATRIMÔNIO SOCIAL E SEUS IMPACTOS NOS INDICADORES DE QUALIDADE DAS UNIVERSI...O PATRIMÔNIO SOCIAL E SEUS IMPACTOS NOS INDICADORES DE QUALIDADE DAS UNIVERSI...
O PATRIMÔNIO SOCIAL E SEUS IMPACTOS NOS INDICADORES DE QUALIDADE DAS UNIVERSI...AmerciBorgesDaRosa
 
Paulo Jannuzzi - Mesa 1 - Gestão municipal: perspectivas e desafios na implem...
Paulo Jannuzzi - Mesa 1 - Gestão municipal: perspectivas e desafios na implem...Paulo Jannuzzi - Mesa 1 - Gestão municipal: perspectivas e desafios na implem...
Paulo Jannuzzi - Mesa 1 - Gestão municipal: perspectivas e desafios na implem...Cepam
 

Similar a Análise de indicadores do SNIS (20)

Teoria da mudança e o Ciência sem Fronteiras
Teoria da mudança e o Ciência sem FronteirasTeoria da mudança e o Ciência sem Fronteiras
Teoria da mudança e o Ciência sem Fronteiras
 
Classificação Internacional de Funcionalidade, Incapacidade e Saúde em inquér...
Classificação Internacional de Funcionalidade, Incapacidade e Saúde em inquér...Classificação Internacional de Funcionalidade, Incapacidade e Saúde em inquér...
Classificação Internacional de Funcionalidade, Incapacidade e Saúde em inquér...
 
Apresentação 1º, 2º, 3º período objetivos, quadro teórico e metodologia
Apresentação 1º, 2º, 3º período objetivos, quadro teórico e metodologiaApresentação 1º, 2º, 3º período objetivos, quadro teórico e metodologia
Apresentação 1º, 2º, 3º período objetivos, quadro teórico e metodologia
 
Tcc Ricardo Chandulale-PowerPoint-1.pptx
Tcc Ricardo Chandulale-PowerPoint-1.pptxTcc Ricardo Chandulale-PowerPoint-1.pptx
Tcc Ricardo Chandulale-PowerPoint-1.pptx
 
Ranking mundial de desenvolvimento da infraestrutura
Ranking mundial de desenvolvimento da infraestruturaRanking mundial de desenvolvimento da infraestrutura
Ranking mundial de desenvolvimento da infraestrutura
 
Seminário Artigos.pptx
Seminário Artigos.pptxSeminário Artigos.pptx
Seminário Artigos.pptx
 
TRABALHO_Aluizio Louzada Velloso Junior TCC REVISÃO DEPOIS DA BANCCA
TRABALHO_Aluizio Louzada Velloso Junior TCC REVISÃO DEPOIS DA BANCCATRABALHO_Aluizio Louzada Velloso Junior TCC REVISÃO DEPOIS DA BANCCA
TRABALHO_Aluizio Louzada Velloso Junior TCC REVISÃO DEPOIS DA BANCCA
 
CIF e TabWin
CIF e TabWinCIF e TabWin
CIF e TabWin
 
Isavc - Indicador das Condicionantes Sócio Ambientais para a Vida na Cidade
Isavc - Indicador das Condicionantes Sócio Ambientais para a Vida na CidadeIsavc - Indicador das Condicionantes Sócio Ambientais para a Vida na Cidade
Isavc - Indicador das Condicionantes Sócio Ambientais para a Vida na Cidade
 
Edital 55
Edital 55Edital 55
Edital 55
 
18o. encontro de iniciação cientifica
18o. encontro de iniciação cientifica18o. encontro de iniciação cientifica
18o. encontro de iniciação cientifica
 
Sistemática de Monitoramento e Avaliação em Programas e Projetos Governamentais
Sistemática de Monitoramento e Avaliação em Programas e Projetos GovernamentaisSistemática de Monitoramento e Avaliação em Programas e Projetos Governamentais
Sistemática de Monitoramento e Avaliação em Programas e Projetos Governamentais
 
Gestão de custos_estudo sobre o uso e a implementação de sistemas de custos e...
Gestão de custos_estudo sobre o uso e a implementação de sistemas de custos e...Gestão de custos_estudo sobre o uso e a implementação de sistemas de custos e...
Gestão de custos_estudo sobre o uso e a implementação de sistemas de custos e...
 
138_InterfacEHS_com_correcao (1)
138_InterfacEHS_com_correcao (1)138_InterfacEHS_com_correcao (1)
138_InterfacEHS_com_correcao (1)
 
Aula 3 chagas 2000 - questionário na pesquisa científica
Aula 3   chagas 2000 - questionário na pesquisa científicaAula 3   chagas 2000 - questionário na pesquisa científica
Aula 3 chagas 2000 - questionário na pesquisa científica
 
Modelo de Aplicação de Indicadores de Sustentabilidade para o Setor Energético
Modelo de Aplicação de Indicadores de Sustentabilidade para o Setor EnergéticoModelo de Aplicação de Indicadores de Sustentabilidade para o Setor Energético
Modelo de Aplicação de Indicadores de Sustentabilidade para o Setor Energético
 
Indicadores de eficiência operacional de uma empresa do setor
Indicadores de eficiência operacional de uma empresa do setorIndicadores de eficiência operacional de uma empresa do setor
Indicadores de eficiência operacional de uma empresa do setor
 
Edital 114 2014 senarc
Edital 114 2014 senarcEdital 114 2014 senarc
Edital 114 2014 senarc
 
O PATRIMÔNIO SOCIAL E SEUS IMPACTOS NOS INDICADORES DE QUALIDADE DAS UNIVERSI...
O PATRIMÔNIO SOCIAL E SEUS IMPACTOS NOS INDICADORES DE QUALIDADE DAS UNIVERSI...O PATRIMÔNIO SOCIAL E SEUS IMPACTOS NOS INDICADORES DE QUALIDADE DAS UNIVERSI...
O PATRIMÔNIO SOCIAL E SEUS IMPACTOS NOS INDICADORES DE QUALIDADE DAS UNIVERSI...
 
Paulo Jannuzzi - Mesa 1 - Gestão municipal: perspectivas e desafios na implem...
Paulo Jannuzzi - Mesa 1 - Gestão municipal: perspectivas e desafios na implem...Paulo Jannuzzi - Mesa 1 - Gestão municipal: perspectivas e desafios na implem...
Paulo Jannuzzi - Mesa 1 - Gestão municipal: perspectivas e desafios na implem...
 

Más de Marcos Camargo

Metodologia para os indicadores do Orçamento Participativo de Belo Horizonte
Metodologia para os indicadores do Orçamento Participativo de Belo HorizonteMetodologia para os indicadores do Orçamento Participativo de Belo Horizonte
Metodologia para os indicadores do Orçamento Participativo de Belo HorizonteMarcos Camargo
 
Metodologia para os indicadores do Plano Municipal de Saneamento de Belo Hori...
Metodologia para os indicadores do Plano Municipal de Saneamento de Belo Hori...Metodologia para os indicadores do Plano Municipal de Saneamento de Belo Hori...
Metodologia para os indicadores do Plano Municipal de Saneamento de Belo Hori...Marcos Camargo
 
O geoprocessamento como instrumento de gestão
O geoprocessamento como instrumento de gestãoO geoprocessamento como instrumento de gestão
O geoprocessamento como instrumento de gestãoMarcos Camargo
 
Geoprocessamento na Gestão de Cidades
Geoprocessamento na Gestão de CidadesGeoprocessamento na Gestão de Cidades
Geoprocessamento na Gestão de CidadesMarcos Camargo
 
Indicadores de Gestão Urbana
Indicadores de Gestão UrbanaIndicadores de Gestão Urbana
Indicadores de Gestão UrbanaMarcos Camargo
 
O Geoprocessamento no Contexto do Saneamento Básico
O Geoprocessamento no Contexto do Saneamento BásicoO Geoprocessamento no Contexto do Saneamento Básico
O Geoprocessamento no Contexto do Saneamento BásicoMarcos Camargo
 

Más de Marcos Camargo (6)

Metodologia para os indicadores do Orçamento Participativo de Belo Horizonte
Metodologia para os indicadores do Orçamento Participativo de Belo HorizonteMetodologia para os indicadores do Orçamento Participativo de Belo Horizonte
Metodologia para os indicadores do Orçamento Participativo de Belo Horizonte
 
Metodologia para os indicadores do Plano Municipal de Saneamento de Belo Hori...
Metodologia para os indicadores do Plano Municipal de Saneamento de Belo Hori...Metodologia para os indicadores do Plano Municipal de Saneamento de Belo Hori...
Metodologia para os indicadores do Plano Municipal de Saneamento de Belo Hori...
 
O geoprocessamento como instrumento de gestão
O geoprocessamento como instrumento de gestãoO geoprocessamento como instrumento de gestão
O geoprocessamento como instrumento de gestão
 
Geoprocessamento na Gestão de Cidades
Geoprocessamento na Gestão de CidadesGeoprocessamento na Gestão de Cidades
Geoprocessamento na Gestão de Cidades
 
Indicadores de Gestão Urbana
Indicadores de Gestão UrbanaIndicadores de Gestão Urbana
Indicadores de Gestão Urbana
 
O Geoprocessamento no Contexto do Saneamento Básico
O Geoprocessamento no Contexto do Saneamento BásicoO Geoprocessamento no Contexto do Saneamento Básico
O Geoprocessamento no Contexto do Saneamento Básico
 

Análise de indicadores do SNIS

  • 1. 25º Congresso Brasileiro de Engenharia Sanitária e Ambiental V-069 – ANÁLISE EXPLORATÓRIA DOS INDICADORES DO SNIS – SISTEMA NACIONAL DE INFORMAÇÕES SOBRE SANEAMENTO Marcos Ubirajara(1) Mestre em Tecnologia Nuclear pelo IPEN/USP e Bacharel em Física pela PUC-SP. Consultor Especializado em Geoprocessamento e Tecnologias Correlatas Aplicadas ao Saneamento Básico e Ambiental. Jucélia Cabral Mendonça Engenheira Civil pela Escola de Engenharia da Universidade Federal de Goiânia (UFG-GO). Especialização em Educação Ambiental (CREA/SHS/EESC/USP). Mestre em Ciências da Engenharia Ambiental (EESC/USP). Engenheira do Ministério das Cidades. Cynthia Regina Araújo Melo Economista - Universidade Católica de Brasília - UCB - Especialização em Matemática para economia e administração - Universidade de Brasília - UnB - Economista do Ministério das Cidades. Endereço(1): Av. João Samaha, 702 - Apto 202 - São João Batista - Belo Horizonte - MG - CEP: 31520-100 - Brasil – Telefone: (31) 34357-3944 - e-mail: mucamargo@oi.com.br RESUMO O presente trabalho apresenta uma metodologia para a elaboração de um diagnóstico da abrangência e qualidade dos serviços de saneamento básico brasileiro a partir da análise exploratória multivariada dos indicadores do SNIS - Sistema Nacional de Informações sobre Saneamento. O método utilizado para a consecução do trabalho apresentado foi o da Análise Fatorial dos Componentes Principais tendo como principais objetivos a redução dos dados, a verificação da consistência interna dos indicadores do SNIS e a sua correlação com variáveis exógenas afetas ao saneamento básico e, por fim, traçar um quadro que expresse os profundos diferenciais existentes quanto à qualidade e abrangência dos serviços básicos de saneamento prestados no Brasil. PALAVRAS-CHAVE: Análise Fatorial e Exploratória, Indicadores do SNIS, Serviços de Saneamento Básico, Qualidade dos Serviços, Universalização. INTRODUÇÃO A análise fatorial é um dos métodos muito utilizado da análise exploratória multivariada, nos mais diversos campos do conhecimento, para a elaboração de estudos visando, principalmente, a redução de dados e a simplificação de casos envolvendo muitas variáveis e respondentes. No caso do Sistema Nacional de Informações sobre Saneamento, o SNIS, são mais de 4.000 (quatro mil) municípios respondentes, centenas de informações primárias e dezenas de indicadores calculados para formar a base de dados de informações. Com tantas informações, o desafio que se coloca é como utilizá-las na produção de um diagnóstico global que exiba os diferenciais que sabemos existir quanto à qualidade e abrangência dos serviços prestados pelo setor do saneamento, mas que também revele que outras dimensões latentes estariam associadas às dificuldades para a melhoria da qualidade e para a universalização dos serviços de saneamento no país. Com isso a proposta é traçar um quadro do saneamento brasileiro a partir de um conjunto mínimo de indicadores que, a priori, não sabemos quais são. O que se coloca como pré-condição para validação desse estudo, é que esse conjunto mínimo seja representativo do ponto de vista da grande quantidade de informações e indicadores disponíveis no SNIS; e que expresse os profundos diferenciais existentes quanto à qualidade e abrangência dos serviços básicos de saneamento prestados no Brasil. Isto quer dizer que um dos focos principais do trabalho a ser apresentado está na redução de dados e, por essa razão, apresenta-se a análise fatorial como um método eficaz para isso. ABES – Associação Brasileira de Engenharia Sanitária e Ambiental 1
  • 2. 25º Congresso Brasileiro de Engenharia Sanitária e Ambiental Como hipóteses iniciais, as quais estão respaldadas na vasta experiência adquirida para a construção da longa série histórica do SNIS, tem-se que fatores sociais e geopolíticos potencialmente estariam acoplados naquelas dimensões latentes que desejamos revelar. Todavia, tais informações sobre variáveis e indicadores sociais e da geopolítica não integram a base de dados do SNIS. Por essa razão, também colocou-se uma hipótese inicial a possível correlação entre as variáveis e indicadores do SNIS, e aquelas do IDHM – Índice de Desenvolvimento Humano Municipal e da MI – Mortalidade Infantil Estimada para os municípios brasileiros. O passo inicial para a comprovação dessas hipóteses, e que no futuro poderá ser feita através de modelagens matemáticas mais sofisticadas, é uma análise exploratória das informações disponíveis visando à depuração de conceitos e à redução de dados. Este trabalho está comprometido com a consecução desse passo inicial. Então, e antes de mais nada, procedeu-se uma análise exploratória das informações que hoje formam uma série histórica de mais de 10 (dez) anos, no sentido de encontrar um subconjunto de dados e indicadores que, em primeiro lugar, estejam correlacionados entre si e que, em segundo lugar, sejam passíveis de se correlacionarem com variáveis exógenas indispensáveis para a formação de um modelo de conhecimento que contemple as dimensões sociais e geopolíticas, tão fundamentais para a compreensão do quadro que está para emergir desse estudo. Tendo sido realizada em várias etapas, a análise exploratória, realizada primeiramente com dados do Diagnóstico dos Serviços de Água e Esgoto - Ano de Referência 2005 do SNIS, demonstrou ser a análise fatorial um método adequado para a redução dos dados e para o posterior cruzamento e estabelecimento de correlações entre os indicadores do saneamento básico e as variáveis exógenas em estudo. A partir da comprovação da adequação do método da análise fatorial, procedeu-se a Análise dos Componentes Principais (ACP) com o objetivo de revelar dimensões latentes emergentes das correlações entre variáveis ou grupos de variáveis e, a partir da análise dessas correlações, revelar as estruturas dessas grandezas latentes não evidentes através das variáveis manifestas em estudo. Com isso, o presente trabalho tem como objetivo principal promover uma análise exploratória envolvendo os indicadores da série histórica do SNIS – Sistema Nacional de Informações Sobre Saneamento, e outros indicadores amplamente aceitos e utilizados no Planejamento Integrado e no desenvolvimento de Políticas Setoriais afetas ao Saneamento Básico, como é o caso do IDHM - Índice de Desenvolvimento Humano Municipal do PNUD e o MI – Indicador da Mortalidade Infantil Estimada da FIOCRUZ para os municípios brasileiros. Enquanto desenvolvimento metodológico objetiva-se especificamente validar a metodologia da análise exploratória baseada na Análise Fatorial dos Componentes Principais na criação de um modelo respaldado nas técnicas apresentadas, e que reflita os aspectos multidisciplinares da complexa rede de inter- relações formada pelo saneamento básico e seus interferentes. Como conseqüência da validação da citada metodologia utilizada, apresenta-se como um subproduto a consistência dos dados do SNIS utilizados neste trabalho ante as variáveis exógenas pesquisadas e integradas ao modelo. DESENVOLVIMENTO A análise fatorial é um método muito utilizado e considerado eficaz na elaboração de estudos visando, principalmente, a redução de dados e a simplificação de casos envolvendo muitas variáveis e respondentes. Procedendo a Análise dos Componentes Principais (ACP), objetiva-se revelar correlações entre variáveis e grupos das variáveis em estudo e, a partir dessas correlações, identificar as estruturas das grandezas latentes não evidentes através das variáveis manifestas. Por que a análise fatorial? Determinados conceitos, como a exclusão social e urbana, não são bem definidos em razão até da diversidade de cenários apresentados pelas cidades. Não sendo diretamente observáveis, esses conceitos são freqüentemente chamados de variáveis latentes e espera-se que seus efeitos se revelem através das variáveis manifestas. O método mais conhecido para investigar a dependência de um conjunto de variáveis manifestas em relação a um número menor de variáveis latentes é a chamada análise fatorial. A análise fatorial pode identificar a estrutura subjacente de um conjunto de uma matriz de dados, bem como fornecer um processo para a redução dos dados. No nosso caso, o principal objetivo é, de fato, a redução dos dados e isso pressupõe que exista alguma ordem latente nos dados em análise. A redução aos fatores principais favorece muito a 2 ABES – Associação Brasileira de Engenharia Sanitária e Ambiental
  • 3. 25º Congresso Brasileiro de Engenharia Sanitária e Ambiental retroação aos períodos anteriores, reduzindo sobremaneira a necessidade de dados para as análises de evolução dos indicadores no tempo. Os tópicos que seguem têm como principal objetivo introduzir os conceitos e outros elementos teóricos da análise fatorial, visando à sua aplicação e posterior avaliação dos resultados como uma medida da adequação do método. Sabe-se que a estatística em si, qualquer que seja o método utilizado, não assegura bons resultados. Por essa razão, alguns cuidados devem ser tomados nos passos iniciais, sob pena de perda do potencial de generalização dos resultados obtidos ou mesmo da confiabilidade dos mesmos. Esse potencial de generalização coloca-se também como uma pré-condição para a validação do estudo que segue, à semelhança da necessidade de estarmos trabalhando com um conjunto mínimo de informações. FASE I – ELEMENTOS DA ANÁLISE FATORIAL O objetivo desta fase foi introduzir conceitos e outros elementos teóricos da Análise Fatorial, culminando com a recomendação do método para promover a análise exploratória apresentada neste trabalho. A principal recomendação resultante desta fase inicial foi à realização de um estudo mais detalhado envolvendo apenas as variáveis operacionais de água e de esgoto do SNIS, no sentido de apurar aquelas que, ao longo da série histórica, guardassem correlações entre si. Com isto, além da busca das possíveis correlações, visava-se também à redução dos dados, uma vez que muitos indicadores, embora indispensáveis para a compreensão do quadro do saneamento brasileiro, possuem uma estrutura de cálculo semelhante, o que acaba por se revelar através da Análise Fatorial. Então, somente após o estudo recomendado, partir para o estudo da possível e esperada correlação de um grupo já reduzido de variáveis com as variáveis exógenas. Sabendo-se também que um grande número de variáveis não iria assegurar a obtenção de resultados consistentes, partiu-se para segunda fase. Como objetivo secundário, buscou-se validar a metodologia da análise exploratória baseada na Análise Fatorial dos Componentes Principais, bem como envolver a equipe de especialistas do SNIS na criação de um modelo respaldado nas técnicas apresentadas, e que reflita os aspectos multidisciplinares da complexa rede de inter-relações formada pelo saneamento básico e seus interferentes. Como conseqüência da validação da metodologia utilizada, torna-se um importante objetivo a verificação da consistência dos dados do SNIS utilizados neste trabalho, o qual se pretende aferir a partir da medida da adequação da amostra utilizada (MSA), que decorre naturalmente da aplicação da Análise Fatorial. A Seleção de Variáveis Na fase de seleção das variáveis, sendo este um passo crucial, algumas recomendações para a adequação do método da análise fatorial aos objetivos do trabalho devem ser seguidas: O pesquisador deve saber como as variáveis estão inter-relacionadas para melhor interpretar os resultados. Sendo assim, esse pesquisador deverá estar em permanente contato com os especialistas para assegurar a qualidade e a confiabilidade dos resultados. Hoje a base de dados do SNIS corresponde a mais de 4.500 (quatro mil e quinhentos) municípios respondentes, centenas de informações primárias e dezenas de indicadores calculados para formar a base de dados de informações sobre saneamento. Dentre esses muitos respondentes, alguns respondem parcialmente aos questionários, significando que alguns critérios devam ser estabelecidos para inclusão na amostra em estudo. Sendo assim, procedeu-se uma análise exploratória dessas informações que hoje formam uma série histórica de mais de 10 (dez) anos, no sentido de encontrar um subconjunto de dados e indicadores que, em primeiro lugar, estejam correlacionados entre si e, em segundo lugar, sejam passíveis de se correlacionarem com variáveis exógenas indispensáveis para a formação de um modelo de conhecimento que contemple as dimensões sociais e geopolíticas; A qualidade e o significado dos fatores determinados refletem as estruturas conceituais das variáveis incluídas na análise. Isto deixa claro que a seleção de variáveis é uma tarefa para especialistas. Quando feita por um analista, deverá ser assistida pelos especialistas. No nosso caso, a seleção foi assistida pelos especialistas da equipe de técnicos e consultores da UGP/PMSS; ABES – Associação Brasileira de Engenharia Sanitária e Ambiental 3
  • 4. 25º Congresso Brasileiro de Engenharia Sanitária e Ambiental Deve-se desenvolver um modelo conceitual que evite a omissão de uma variável preditora crítica, bem como a inserção indiscriminada de variáveis esperando que a técnica “revele” as variáveis relevantes. Em primeiro lugar porque as variáveis irrelevantes podem aumentar o ajuste dos dados da amostra, mas torná-los menos generalizáveis. Em segundo lugar, as variáveis irrelevantes, embora não afetem as estimativas das variáveis relevantes, podem mascarar os verdadeiros efeitos em razão da multicolinearidade. Assim, incluir indiscriminadamente variáveis conceitualmente irrelevantes pode provocar vários efeitos indesejáveis, ainda que essas variáveis adicionais não influenciem diretamente os resultados do modelo. Após discussões preliminares com a equipe técnica, decidiu-se iniciar o estudo explorando apenas o sub-conjunto de indicadores e variáveis operacionais de água e de esgoto, que são os mais antigos e completos integrantes da base de dados do SNIS; Os resultados obtidos serão tão bons e confiáveis quanto os dados introduzidos na análise. Bons conjuntos de dados premiam o pesquisador com bons resultados. A qualidade e a confiabilidade dos indicadores e dados do SNIS, de fato, é uma das teses deste estudo, cujos resultados trazem uma confirmação da mesma. A Captura das Informações O Banco de Dados do SNIS – Sistema Nacional de Informações sobre Saneamento mantém em sua série histórica indicadores municipais calculados somente quando da suficiência de dados primários necessários para a sua consecução. Por essa razão, a captura das informações para o presente estudo obedece ao critério de seleção dos respondentes (municípios) com suficiência de dados. Após várias simulações foram selecionadas para o estudo as variáveis apresentadas na Tabela 01, tendo como referência a base de dados do SNIS do ano de 2005. Tabela 1: Variáveis Selecionadas. Ordem Variável Descrição Origem 1 I10 Índice de Micro-medição Relativo ao Volume SNIS Disponibilizado 2 I13 Índice de Perdas de Faturamento SNIS 3 I25 Volume de Água Disponibilizado por Economia SNIS 4 I49 Índice de Perdas na Distribuição SNIS 5 I15 Índice de Coleta de Esgotos SNIS 6 I24 Índice de Atendimento Urbano de Esgoto SNIS 7 I56 Índice de Atendimento Total de Esgoto SNIS 8 MI Mortalidade Infantil Estimada FIOCRUZ 9 IDHM_RENDA Componente de Renda do IDHM IDHM_2000 10 IDHM_LOGEVIDADE Componente de Longevidade do IDHM IDHM_2000 11 IDHM_EDUCACAO Componente de Educação do IDHM IDHM_2000 Fonte: SNIS, 2006; IBGE; FIOCRUZ. Ao analisar a Tabela 1, percebe-se o foco em três dimensões principais, a saber: desempenho dos serviços de abastecimento de água, cobertura e desempenho dos serviços de esgotamento sanitário e, como indicadores da dimensão social, o índice de desenvolvimento humano e da mortalidade infantil das populações atendidas. Conforme o critério apresentado, a coleção de dados foi feita a partir de uma consulta ao banco de dados do SNIS, a qual filtrou todos os municípios com valores não nulos para as variáveis em estudo. A tabela obtida foi exportada para o Excel, servindo então como dados de entrada para o software de estatística avançada. Neste estudo foi utilizado o programa SPSS. A Análise Fatorial Na análise fatorial as variáveis que não carregam significativamente em nenhum fator ou que apresentem comunalidades muito baixas devem ser ignoradas ou eliminadas. Ignorar uma variável pode ser apropriado se o objetivo for apenas a redução dos dados. Eliminar a variável pode ser apropriado quando esta é de menor importância para o objetivo do estudo ou quando apresenta valor de comunalidade muito baixo. Quando 4 ABES – Associação Brasileira de Engenharia Sanitária e Ambiental
  • 5. 25º Congresso Brasileiro de Engenharia Sanitária e Ambiental eliminada uma ou mais variáveis, o conjunto de dados deve ser processado novamente. Significância das Cargas Fatoriais Significância Prática: Considera-se que os valores das cargas fatoriais possuem as significâncias práticas apresentadas na Tabela 2. Tabela 2: Cargas Fatoriais e Significâncias Práticas. Valor da Carga Significância Prática > +- 0.30 Nível Mínimo > +- 0.40 Importantes > +- 0.50 Possuem Significância Prática O quadrado das cargas fatoriais representa a quantia da variância total da variável explicada pelo fator. Significância Estatística: Em termos da significância estatística, podemos trabalhar em duas dimensões: o tamanho da amostra e o número de variáveis. Assim, considera-se a seguinte tabela de significância das cargas em função do tamanho da amostra, conforme apresentado na Tabela 3. Tabela 3: Valor da Carga e Tamanho da Amostra Valor da Carga Tamanho da Amostra (respondentes) 0.30 350 0.35 250 0.40 200 0.45 150 0.50 120 0.55 100 0.60 85 0.65 70 0.70 60 0.75 50 No nosso estudo, estamos trabalhando com uma amostra maior que 350 respondentes, sugerindo que valores das cargas fatoriais < 0.30 têm significância estatística (1). O número de variáveis em análise também é importante na significância das cargas, guardando a seguinte relação: número de variáveis < o valor das cargas significantes Sobre as Comunalidades A comunalidade mostra a quantia da variância em uma variável que é explicada pelos fatores extraídos juntos. Em outras palavras, significa o quanto da variância de uma dada variável é explicada pela solução fatorial. Análise de Componentes A matriz geral de correlação é transformada por meio de estimação de um modelo fatorial para obtenção de uma matriz fatorial. As cargas fatoriais de cada variável nos fatores são interpretadas para identificar a estrutura latente das variáveis. De forma geral, quanto maior o número de fatores extraídos, melhor será o ajuste e maior será a porcentagem da variância do dado explicado pela solução fatorial. Todavia, quanto maior o número de fatores extraídos, menor a parcimônia da solução. Evidentemente, isto pressupõe a existência de critérios para a limitação do número ideal de fatores. No nosso estudo adotamos o critério da raiz latente. ABES – Associação Brasileira de Engenharia Sanitária e Ambiental 5
  • 6. 25º Congresso Brasileiro de Engenharia Sanitária e Ambiental Raiz Latente: Pelo critério da raiz latente, somente autovalores > 1.0 são considerados na seleção de componentes para análise posterior. Teste de Scree: Este teste poderá indicar outros fatores com valores próximos de 1.0 como sendo apropriados. A Interpretação dos Fatores Quando variáveis são muito diferentes, ou seja, não guardam correlações consideráveis entre si, o índice obtido pela soma dos traços será baixo. Do contrário, se as variáveis recaírem em um ou mais grupos altamente relacionados, esse índice se aproximará de 100%. Todavia, o aprofundamento dessa discussão impõe a necessidade de se proceder uma análise da importância e da consistência interna dos fatores. A importância de um fator (ou um conjunto de fatores) é avaliada pela proporção da variância representada pelo fator após a rotação. Se for uma rotação ortogonal, a importância do fator estará relacionada com o tamanho dos seus SSLs (Soma das Cargas Quadráticas da Matriz de Componentes Após a Rotação). Essa somas (SSLs) são convertidas para uma grandeza da proporção de variância para um fator, dividindo-as pelo número de variáveis (2). Sobre a Rotação da Matriz de Componentes A importância de um fator é avaliada pela proporção da variância representada pelo fator após a rotação. A rotação favorece a análise dos componentes na medida em que revela as dimensões subjacentes da solução fatorial apresentada. A partir da rotação, poderemos inclusive dar nomes aos fatores até então identificados por números. Esses fatores, evidentemente, estarão associados àquelas dimensões latentes que buscamos medir. FASE II – ANÁLISE DA MATRIZ DE CORRELAÇÃO DOS INDICADORES OPERACIONAIS DE ÁGUA E ESGOTO DO SNIS ANO 2005 Conforme ficou recomendado na FASE I, passamos a estudar o conjunto de indicadores do SNIS objetivando verificar a sua consistência interna e completude. Para esse efeito, escolhemos começar pelo conjunto de indicadores operacionais de água e esgoto, uma vez que acreditamos ser o desempenho operacional um dos fatores responsáveis pelo registro de grandes perdas nos sistemas e pela dificuldade de universalizar os serviços no país. Foram processados 30 (trinta) indicadores operacionais do SNIS, do ano de referência de 2005, para uma amostra de 721 (municípios) respondentes. Procedeu-se a análise obtendo-se a matriz de correlação apresentada na Tabela 4. A Análise das Comunalidades entre os Indicadores Operacionais de Água e Esgoto do SNIS O quadro que segue faz uma análise das comunalidades. Consideramos neste estudo que os níveis de explicação aceitáveis estariam acima de 50%. Sendo assim, todas as variáveis com comunalidades iguais ou menores a 0.50 são consideradas como tendo um nível de explicação insuficiente. Se há variáveis com comunalidades consideradas baixas, há duas opções possíveis: (1) interpretar a solução ignorando essas variáveis, ou (2) eliminar a variável, o que exigirá um novo processamento do conjunto reduzido [1]. Considerando sempre a contribuição de cada variável para os objetivos do estudo, optamos pela eliminação quando apropriada, pois, um dos nossos objetivos principais está na redução dos dados. A Tabela 5 apresenta a análise das comunalidades. 6 ABES – Associação Brasileira de Engenharia Sanitária e Ambiental
  • 7. 25º Congresso Brasileiro de Engenharia Sanitária e Ambiental ABES – Associação Brasileira de Engenharia Sanitária e Ambiental 7
  • 8. 25º Congresso Brasileiro de Engenharia Sanitária e Ambiental Tabela 5: Análise das Comunalidades Inicia Correlação Indicadores l Comunalidade I01-Densidade de Economias Esta variável apresenta baixa comunalidade, de Água por Ligação confirmando a pouca correlação que mantém com os demais fatores em estudo. Apresenta uma 1,000 ,601 correlação, ainda pouco significativa, com a variável I51-Índice de Perdas por Ligação. Tornou-se uma candidata a sair da amostra. I09-Índice de Hidrometração A alta comunalidade já recomenda. Essa variável apresenta cargas fatoriais bastante significativas para os fatores I44-Índice de Micromedição Relativo ao Consumo e I10-Índice de 1,000 ,840 Micromedição Relativo ao Volume Disponibilizado. Apresenta também uma carga considerável para o fator I57-Índice de Fluoretação da Água. I10- Índice de Micromedição A comunalidade está dizendo. Esta variável Relativo ao Volume apresenta as maiores cargas para os fatores I13- Disponibilizado Índice de Perdas de Faturamento (observar o sinal trocado, significando que quando um aumenta, o outro diminui) e com o I28-Índice de Faturamento de Água (notar que apresentam a mesma carga fatorial, significando que são grandezas da mesma natureza e muito 1,000 ,910 próximas na definição). Apresenta também forte correlação inversa com I51-Índice de Perdas por Ligação, e direta com I52-Índice de Consumo de Água. Apresenta ainda considerável relação inversa com I25-Volume de Água Disponibilizado por Economia, e direta com I09-Índice de Hidrometração e I44-Índice de Micromedição Relativo ao Consumo. É forte candidata a permanecer na análise. I11-Índice de Macromedição Notar como essa variável não mantém correlação 1,000 ,527 significativa com nenhuma das outras. É candidata a sair da análise. I13-Índice de Perdas de Essa variável também vem com uma forte Faturamento comunalidade. Apresenta as maiores cargas para os fatores I49-Índice de Perdas na Distribuição e I52-Índice de Consumo de Água (inversa). Apresenta também fortes correlações com I10- Índice de Micromedição Relativo ao Volume Disponibilizado (inversa) e com I51-Índice de Perdas por ligação. Uma curiosidade: a matriz de correlação está dizendo que essa grandeza é 1,000 ,905 perfeitamente explicada pelo inverso da grandeza em I28-Índice de Faturamento de Água. Em outras palavras, significa que são medidas complementares de uma mesma grandeza. É forte candidata a permanecer na análise, mas I28- Índice de Faturamento de Água pode sair. Embora algumas coisas pareçam óbvias, é bom lembrar que essas relações surgiram da análise estatística dos dados do SNIS, o que mostra a consistência desses dados. 8 ABES – Associação Brasileira de Engenharia Sanitária e Ambiental
  • 9. 25º Congresso Brasileiro de Engenharia Sanitária e Ambiental Tabela 5: Análise das Comunalidades. (continuação) Inicia Correlação Indicadores l Comunalidade I14-Consumo Micromedido Com uma comunalidade menor, essa variável por Economia apresenta a maior carga fatorial para o fator I53- Consumo Médio de Água por Economia, 1,000 ,753 seguida pelo fator I17-Consumo de Água Faturado por Economia e por I22-Consumo Médio per Capta de Água. I17-Consumo de Água Apresentando um perfil muito parecido com o do Faturado por Economia I14-Consumo Micromedido por Economia, essa variável tem a maior carga fatorial para o fator I53-Consumo Médio de Água por Economia, seguida pelo fator I14- Consumo Micromedido por Economia e por I22-Consumo Médio per 1,000 ,823 Capta de Água; deve-se observar que essa variável apresenta maior comunalidade do que I14, significando que ela pode ser melhor explicada pela solução fatorial. É candidata a sair em favor de I53. Se permanecer, será em detrimento de I14- Consumo Micromedido por Economia, evidentemente. I20-Extensão de Rede de Água Com comunalidade muito baixa, essa variável não por Ligação apresenta correlação significativa com nenhuma 1,000 ,505 das outras. É forte candidata a ficar fora da análise. I22-Consumo Médio per Comunalidade razoável. Em comparação com Capta de Água outras variáveis, apresenta cargas apenas razoáveis para os fatores I53-Consumo Médio de Água por Economia, I17-Consumo de Água Faturado por Economia e I14- Consumo 1,000 ,786 Micromedido por Economia, respectivamente. Como sugerimos ficar com I17 em detrimento de I14, o argumento para a manutenção dessa variável fica enfraquecido. Candidata a sair da análise. I23-Índice de Atendimento Comunalidade apenas razoável. Essa variável Urbano de Água apresenta correlação significativa apenas com o 1,000 ,767 fator I55-Índice de Atendimento Total de Água. É candidata a ficar fora da análise. I25-Volume de Água Com uma comunalidade alta, apresenta a maior Disponibilizado por Economia carga para o fator I51-Índice de Perdas por ligação. Essa forte correlação, em si, é uma tese dos nossos estudos. A seguir, apresenta altas cargas para I13-Índice de Perdas de Faturamento e para I28-Índice de Faturamento 1,000 ,913 de Água (inversa), as quais demonstraram ser redundantes nesta análise. Segue-se a correlação razoável com I49-Índice de Perdas na Distribuição e I52-Índice de Consumo de Água (inversa). Deve permanecer na análise em defesa da tese citada acima. I43-Partcipação das Comunalidade muito baixa. Não mantém 1,000 ,565 Economias Residenciais de correlação significativa com nenhuma das outras ABES – Associação Brasileira de Engenharia Sanitária e Ambiental 9
  • 10. 25º Congresso Brasileiro de Engenharia Sanitária e Ambiental Água no Total de Economias variáveis. É candidata a ficar fora da análise. de Água Tabela 5: Análise das Comunalidades. (continuação) Inicia Correlação Indicadores l Comunalidade I44-Índice de Micromedição Apresentando alta comunalidade, essa variável Relativo ao Consumo apresenta cargas fatoriais bastante significativas para os fatores I09- Índice de Hidrometração e I10-Índice de Micromedição Relativo ao 1,000 ,882 Volume Disponibilizado. Apresenta também uma carga considerável para o fator I57-Índice de Fluoretação da Água. Mas, observe-se que essa variável poderia estar bem representada por I09 ou I10. I49-Índice de Perdas na Com alta comunalidade, essa variável apresenta as Distribuição maiores cargas nos fatores I13 e I28 (em relação inversa), a qual se recomenda sair da amostra. Apresenta ainda forte correlação com I51-Índice de Perdas por ligação e uma relação inversa com 1,000 ,956 I10-Índice de Micromedição Relativo ao Volume Disponibilizado. A análise mostra uma redundância numa relação inversa com a variável I52-Índice de Consumo de Água. São, de fato, grandezas complementares. Pode permanecer na Amostra em detrimento de I52. I50-Índice Bruto de Perdas Apresenta a comunalidade mais baixa dessa Lineares amostra. Consequentemente, não mantém 1,000 ,269 correlação significativa com nenhuma das outras variáveis. Deve ficar fora da análise. I51-Índice de Perdas por Com a maior carga fatorial em I25-Volume de Ligação Água Disponibilizado por Economia, observar como ela reproduz as correlações daquela 1,000 ,860 variável, mas com uma comunalidade menor. Poderia estar representada por I25. Candidata a sair da análise. I52-Índice de Consumo de A matriz de correlação está dizendo que esses Água indicadores são “idênticos”. De fato, ao observar a composição de ambos, vemos que I49 = 1 – I52; 1,000 ,956 isto é, como eles são expressos em percentagem, então são complementares. Sugere-se excluí-lo da amostra. I53-Consumo Médio de Água Com alta comunalidade, essa variável apresenta a por Economia mesma composição de I17-Consumo de Água Faturado por Economia, mas com uma 1,000 ,922 comunalidade muito maior. Sugere-se mantê-la em detrimento de I17 e em detrimento de I14- Consumo Micromedido por Economia. I55-Índice de Atendimento Comunalidade razoável. Apresenta a maior carga Total de Água no fator I23-Índice de Atendimento Urbano de 1,000 ,790 Água, que é uma candidata a ficar fora. Apresenta uma carga razoável no fator I56-Índice 10 ABES – Associação Brasileira de Engenharia Sanitária e Ambiental
  • 11. 25º Congresso Brasileiro de Engenharia Sanitária e Ambiental de Atendimento Total de Esgoto Referido aos Municípios Atendidos com Água. Perde, porém, em comunalidade para I-56. Candidata a ficar fora, em favor de I-56. I57-Índice de Fluoretação da Comunalidade baixa, justificando as baixas cargas 1,000 ,611 Água dos demais fatores. Candidata a ficar fora. I58-Índice de Consumo de Apresenta baixas cargas para os fatores em estudo. Energia Elétrica em Sistemas 1,000 ,856 Candidata a ficar fora. de Abastecimento de Água Tabela 5: Análise das Comunalidades. (continuação) Inicia Correlação Indicadores l Comunalidade I15- Índice de Coleta de Com comunalidade alta, apresenta cargas bastante Esgoto significativas para os fatores I24-Índice de Atendimento Urbano de Esgoto Referido aos Municípios Atendidos com Água e I47- Índice de Atendimento Urbano de Esgoto Referido aos 1,000 ,907 Municípios Atendidos com Esgoto. Apresenta também uma carga bastante alta para o fator I56- Índice de Atendimento Total de Esgoto Referido aos Municípios Atendidos com Água. Deve permanecer na amostra. I28-Índice de Faturamento de Recomendada sair pela semelhança com I13- 1,000 ,905 Água Índice de Perdas de Faturamento I16-Índice de Tratamento de Apresenta uma carga razoável apenas no fator Esgoto 1,000 ,933 I46-Índice de Esgoto Tratado Referido a Água Consumida. Candidata a ficar fora. I21-Extensão da Rede de Com comunalidade alta, apresenta uma carga alta Esgoto por Ligação apenas no fator I59-Índice de Consumo de 1,000 ,932 Energia Elétrica em Sistemas de Esgotamento Sanitário. Candidata a sair. I24- Índice de Atendimento Com comunalidade alta, observar como a Urbano de Esgoto Referido composição de I24 e I47 são idênticas em termos 1,000 ,957 aos Municípios Atendidos com das cargas fatoriais, sendo que uma explica Água totalmente a outra. I46-Índice de Esgoto Tratado Apresenta carga fatorial razoável apenas para a Referido a Água Consumida 1,000 ,957 variável I16, que é candidata a ficar fora. Deve sair. I47-Índice de Atendimento Pela sua própria definição, deve sair em favor de Urbano de Esgoto Referido I-24. 1,000 ,957 aos Municípios Atendidos com Esgoto I56-Índice de Atendimento Apresenta elevadas cargas para os fatores I24 e Total de Esgoto Referido aos I47, as quais, por sua vez, são intercambiáveis. Municípios Atendidos com 1,000 ,946 Apresenta carga elevada também para o fator I15- Água Índice de Coleta de Esgoto, que deve permanecer na amostra. I59-Índice de Consumo de Com comunalidade alta, apresenta uma carga alta Energia Elétrica em Sistemas 1,000 ,929 apenas no fator I21-Extensão da Rede de Esgoto de Esgotamento Sanitário por Ligação. Deve sair. Método de Extração: Análise do Componente Principal ABES – Associação Brasileira de Engenharia Sanitária e Ambiental 11
  • 12. 25º Congresso Brasileiro de Engenharia Sanitária e Ambiental FASE III – ANÁLISE DA MATRIZ DE CORRELAÇÃO DO CONJUNTO REDUZIDO DOS INDICADORES DO SNIS Conforme as recomendações da FASE II, passamos a estudar um subconjunto dos indicadores operacionais de água e esgoto que seja representativo dos demais, e que apresente uma consistência interna, antes de uma nova tentativa de estabelecer as suas correlações com variáveis exógenas. Sendo assim, procedeu-se um novo processamento dos dados, mantendo-se os mesmos 721 (municípios) respondentes para um conjunto de 8 (oito) indicadores selecionados da fase anterior para o ano de referência de 2005. Como poderá ser verificado doravante, esse subconjunto já está muito próximo de ser o mais representativo do conjunto de indicadores operacionais de água e esgoto analisado na Fase II. Devemos sempre lembrar que um dos nossos objetivos, de fato, é a redução de dados. A primeira razão para a busca de uma redução dos dados parece óbvia: a grande quantidade de informações que são coletadas, consistidas e sistematizadas pelo SNIS. A segunda forte razão é mais sutil: conforme verificado nas análises anteriores, muitos indicadores possuem estruturas semelhantes (como é o caso de grandezas complementares), sendo recomendável a sua exclusão da análise; mas isso não invalida a sua presença na série histórica do SNIS por uma questão conceitual. Sendo assim, devemos prosseguir com as análises tendo em mente que algumas restrições aqui colocadas aos indicadores pré-existentes no SNIS, o são em função de necessidades do tipo de análise que está sendo feita. Não se pode afirmar, a partir dessa análise exploratória, que determinado indicador seja dispensável, quer seja pela sua semelhança com outros indicadores, quer seja pela sua baixa correlação com o conjunto explorado. O que, de fato, justifica a existência de um indicador é o próprio conceito que ele encerra. Isto posto, como na fase anterior, passamos a analisar a matriz de correlação e as comunalidades do subconjunto dos indicadores operacionais de água e de esgoto resultante das discussões da Fase II. A Análise Fatorial e a Matriz de Correlação do Conjunto Reduzido A Tabela 6 apresenta os resultados da Matriz de correlação e a Tabela 7 os resultados da análise de comunalidades do conjunto reduzido de indicadores do SNIS. Tabela 6: Matriz de Correlação(a). I10 I13 I25 I49 I53 I15 I24 I56 Correlação I10 1,000 -,795 -,686 -,773 -,122 ,160 ,221 ,160 I13 -,795 1,000 ,730 ,848 ,130 -,063 -,150 -,031 I25 -,686 ,730 1,000 ,606 ,567 -,037 -,104 ,001 I49 -,773 ,848 ,606 1,000 -,184 -,081 -,159 -,093 I53 -,122 ,130 ,567 -,184 1,000 ,093 ,103 ,180 I15 ,160 -,063 -,037 -,081 ,093 1,000 ,890 ,873 I24 ,221 -,150 -,104 -,159 ,103 ,890 1,000 ,932 I56 ,160 -,031 ,001 -,093 ,180 ,873 ,932 1,000 a Determinant = ,000 Tabela 7: Análise das Comunalidades do Conjunto Reduzido de Indicadores do SNIS. Inicia Comunalidad Correlação Indicadores l e I10- Índice de Micromedição Com a comunalidade menor do que na fase Relativo ao Volume anterior, mas ainda alta, esta variável apresenta Disponibilizado as maiores cargas para os fatores I13-Índice de Perdas de Faturamento, I49-Índice de Perdas na Distribuição e I25-Volume de Água 1,000 ,831 Disponibilizado por Economia (observar o sinal trocado em todos os componentes, significando que quando I10 aumenta, os fatores acima diminuem). Isto, em hipótese, significa que a micromedição reduz as perdas e inibe o 12 ABES – Associação Brasileira de Engenharia Sanitária e Ambiental
  • 13. 25º Congresso Brasileiro de Engenharia Sanitária e Ambiental desperdício. Deve-se atentar para o fato de que neste estudo, isto não é uma questão conceitual ou um postulado, mas sim aquilo que a amostra do SNIS está traduzindo através de um construto, um ente estatístico. A compreensão disto é fundamental para qualquer discussão posterior. I13-Índice de Perdas de A variável I13-Índice de Perdas de Faturamento Faturamento apresenta a maior carga para o fator I49-Índice de Perdas na Distribuição. Pelos mesmos motivos acima, pode-se inferir que, ainda em hipótese, a maior componente das perdas de faturamento 1,000 ,895 é a perda na distribuição. Também apresenta cargas significativas para os fatores I10- Índice de Micromedição Relativo ao Volume Disponibilizado (agora com o sinal trocado) e I25-Volume de Água Disponibilizado por Economia. Tabela 7: Análise das Comunalidades do Conjunto Reduzido de Indicadores do SNIS (continuação). Inicia Comunalidad Correlação Indicadores l e I25-Volume de Água O que essa variável I25-Volume de Água Disponibilizado por Economia Disponibilizado por Economia apresenta de diferente é uma carga significativa no fator I53- Consumo Médio de Água por Economia. Como essa carga tem sinal positivo, podemos inferir que o aumento da disponibilização de água aumenta o consumo. Embutido neste aumento 1,000 ,918 de consumo, devemos considerar, encontra-se uma parcela devida à demanda reprimida; mas também, uma parcela devida ao desperdício. São hipóteses da mais alta relevância para o nosso estudo, e que não emergem da erudição, mas sim dos dados contidos na amostra. I49-Índice de Perdas na Como não poderia deixar de ser, a maior carga Distribuição 1,000 ,943 para essa variável está no fator I13-Índice de Perdas de Faturamento. I53-Consumo Médio de Água Por sua vez, a maior carga para essa variável está por Economia no fator I25-Volume de Água Disponibilizado por 1,000 ,979 Economia. Sobre isso, são importantes as considerações anteriores em I25. I15- Índice de Coleta de Da análise anterior do conjunto completo, o I15- Esgoto Índice de Coleta de Esgoto demonstra estar fortemente correlacionado com o Atendimento Referido aos Municípios Atendidos com Água expresso pelos fatores I24 e I56. Esses indicadores, por definição, surgem de uma relação entre as populações atendidas por 1,000 ,911 esgotamento sanitário e as atendidas por abastecimento de água. A amostra em estudo demonstra não haver uma correlação considerável entre os indicadores de esgoto e aqueles da água. Isto é sintomático e revela uma quadro preocupante para o saneamento brasileiro. ABES – Associação Brasileira de Engenharia Sanitária e Ambiental 13
  • 14. 25º Congresso Brasileiro de Engenharia Sanitária e Ambiental I24- Índice de Atendimento Possivelmente, essa variável estaria bem Urbano de Esgoto Referido representada por I15. 1,000 ,952 aos Municípios Atendidos com Água I56-Índice de Atendimento Possivelmente, essa variável estaria bem Total de Esgoto Referido aos representada por I15. 1,000 ,943 Municípios Atendidos com Água Método de Extração: Análise do Componente Principal Partindo de um conjunto de 30 (trinta) indicadores operacionais de água e esgoto na FASE II, reduzimos aquele conjunto para 8 (oito) indicadores nesta FASE III, cuja solução fatorial revela 3(três) componentes capazes de explicar 92,14% da variância total do conjunto. Em vista das constatações da FASE I, esse resultado se mostra bastante animador, uma vez que sugere termos encontrado um conjunto mínimo de indicadores muito representativo da totalidade dos indicadores operacionais de água e esgoto do SNIS. Na próxima fase, voltaremos a estudar a matriz de correlação com as variáveis exógenas, mas agora seguros de termos um conjunto de indicadores consistentes entre si e representativos do conjunto maior. Tabela 8: Variância Total Explicada Comp Autovalores Iniciais Extração das SSL Rotação das SSL % da % da % da Variânci Cumulativ Variânci Cumulativ Variânci Cumulativ Total a o% Total a o% Total a o% 1 3,451 43,139 43,139 3,451 43,139 43,139 3,150 39,373 39,373 2 2,677 33,464 76,602 2,677 33,464 76,602 2,810 35,126 74,499 3 1,243 15,543 92,145 1,243 15,543 92,145 1,412 17,647 92,145 4 ,229 2,867 95,012 5 ,156 1,949 96,961 6 ,129 1,613 98,575 7 ,061 ,762 99,337 8 ,053 ,663 100,000 Método de Extração: Análise do Componente Principal FASE IV – ANÁLISE DA MATRIZ DE CORRELAÇÃO ENTRE OS INDICADORES DO SNIS, DO IDHM E DO MI Antes de partir para um conjunto mais amplo de variáveis exógenas, uma vez que já temos um conjunto reduzido de indicadores do SNIS, daremos um passo intermediário que é proceder a análise de correlação com 2 (dois) dos mais importantes indicadores municipais utilizados no Brasil, a saber: IDHM – Índice de Desenvolvimento Humano Municipal do PNUD, e o MI – Indicador de Mortalidade Infantil Estimada dos Municípios Brasileiros – do Sistema de Monitoramento dos Indicadores de Mortalidade Infantil da Fiocruz. Nesta fase, trabalhamos com uma amostra de 860 municípios, ou seja, todos aqueles municípios para os quais há suficiência de dados primários para o cálculo dos indicadores selecionados para este estudo, e relativos ao ano de referência de 2005. Como se trata de uma análise exploratória, o objetivo deste passo é estabelecer referências para a comparação dos efeitos dos fatores nas variáveis em função de tamanho e adequação da amostra. Não nos detemos na análise dos componentes desta fase em favor de um aprofundamento das discussões a partir de uma amostra otimizada estudada na Fase V. Com relação às variáveis exógenas introduzidas na análise, temos a considerar que: 14 ABES – Associação Brasileira de Engenharia Sanitária e Ambiental
  • 15. 25º Congresso Brasileiro de Engenharia Sanitária e Ambiental O Índice de Desenvolvimento Humano foi criado originalmente para medir o nível de desenvolvimento humano dos países a partir de indicadores de educação (alfabetização e taxa de matrícula), longevidade (esperança de vida ao nascer) e renda (PIB per capita). O índice varia de 0 (nenhum desenvolvimento humano) a 1 (desenvolvimento humano total). Países com IDH até 0,499 têm desenvolvimento humano considerado baixo; os países com índices entre 0,500 e 0,799 são considerados de médio desenvolvimento humano; países com IDH maior que 0,800 têm desenvolvimento humano considerado alto. No caso da MI – Estimativa da Mortalidade Infantil dos Municípios Brasileiros, os indicadores foram classificados em cinco grandes dimensões: I. Contextuais, que estabelece o contexto em que ocorrem os óbitos infantis, sendo representada por características sócio-demográficas da população; II. Mortalidade Proporcional, que é composta por indicadores relativos à estrutura de causas de morte e à distribuição etária dos óbitos entre os menores de um ano; III. Relacionados ao Nascimento, para caracterizar as condições do nascimento e da assistência à gestação e ao parto; IV. Indicadores de adequação das informações vitais, que tem o propósito de estabelecer a adequação das informações vitais no nível municipal com vistas ao cálculo direto da mortalidade infantil; V. Indicadores de completitude e consistência das variáveis constantes nas declarações de óbito infantil e de nascimento, que visa monitorar a qualidade de preenchimento dos campos das declarações de óbito infantil e de nascimento. A Análise Fatorial e a Matriz de Correlação da Fase IV A Tabela 9 apresenta a Matriz de Correlação referente à Fase IV e a Tabela 10 a variância total explicada. Tabela 9: Matriz de Correlação(a) IDHM IDHM IDHM MI I10 I13 I25 I49 I15 I24 I56 RENDA LONGE EDUCA 1000 Corr. I10 1,000 -,790 -,578 -,730 ,214 ,287 ,223 ,057 ,116 -,014 -,148 I13 -,790 1,000 ,599 ,824 -,117 -,212 -,106 ,127 ,048 ,191 ,015 I25 -,578 ,599 1,000 ,522 -,076 -,136 -,071 ,072 ,006 ,121 ,082 I49 -,730 ,824 ,522 1,000 -,135 -,220 -,161 ,060 -,002 ,123 ,027 I15 ,214 -,117 -,076 -,135 1,000 ,886 ,871 ,400 ,325 ,254 -,236 I24 ,287 -,212 -,136 -,220 ,886 1,000 ,939 ,352 ,333 ,197 -,262 I56 ,223 -,106 -,071 -,161 ,871 ,939 1,000 ,480 ,404 ,338 -,309 IDHM_RENDA ,057 ,127 ,072 ,060 ,400 ,352 ,480 1,000 ,626 ,843 -,530 IDHM_LONGE ,116 ,048 ,006 -,002 ,325 ,333 ,404 ,626 1,000 ,599 -,462 IDHM_EDUCA -,014 ,191 ,121 ,123 ,254 ,197 ,338 ,843 ,599 1,000 -,542 MI_1000 -,148 ,015 ,082 ,027 -,236 -,262 -,309 -,530 -,462 -,542 1,000 a Determinant = 8,34E-005 Tabela 10: Variância Total Explicada Comp . Autovalores Iniciais Extração das SSL Rotação das SSL % da % da % da Variânci Cumulativ Variânci Cumulativ Variânci Cumulativ Total a o% Total a o% Total a o% 1 4,082 37,107 37,107 4,082 37,107 37,107 3,075 27,955 27,955 2 3,107 28,249 65,356 3,107 28,249 65,356 2,862 26,019 53,974 3 1,550 14,089 79,445 1,550 14,089 79,445 2,802 25,470 79,445 4 ,584 5,310 84,755 5 ,501 4,554 89,309 6 ,446 4,052 93,362 7 ,255 2,317 95,679 ABES – Associação Brasileira de Engenharia Sanitária e Ambiental 15
  • 16. 25º Congresso Brasileiro de Engenharia Sanitária e Ambiental 8 ,156 1,418 97,097 9 ,141 1,283 98,380 10 ,135 1,230 99,610 11 ,043 ,390 100,000 Extraction Method: Principal Component Analysis. FASE V – REFINAMENTO DA AMOSTRA E ANÁLISE DOS COMPONENTES O Tamanho e Dimensões da Amostra Entre os pesquisadores há muita discussão sobre o tamanho ideal da amostra. Alguns defendem que a amostra deve ter um número de respondentes no mínimo de 10(dez) vezes o número de variáveis em análise. Outros defendem que esse número deverá ser de 20(vinte) vezes, ou até mais em alguns casos. De qualquer forma, uma coisa é certa: amostras grandes em número de variáveis poderão produzir o que se chama de um “super ajuste” que irá aparecer através da multicolinearidade. Quando isso ocorre, ou quando o número de respondentes é muito grande, cargas fatoriais menores passam a ter significância, podendo ocorrer o mascaramento de efeitos que desejamos medir. A nossa amostra, usada na Fase IV, com 860 respondentes, mostra-se muito grande segundo as recomendações. Esses 860 municípios são aqueles que apresentam suficiência de informações na base de dados do SNIS para efeito do cálculo dos indicadores selecionados para este estudo, não representando, todavia, a totalidade da base do SNIS. Sendo assim, ainda como uma medida exploratória, procuramos reduzi-la utilizando vários critérios, e o que se mostrou mais adequado ao problema em estudo foi o “corte” pela população. Ao filtrar os municípios com populações acima de 50.000 habitantes, reduzimos a amostra para 316 respondentes, um tamanho bem mais adequado se consideradas as argumentações teóricas. Todavia, devemos salientar que essa medida não pode implicar em perda do potencial de generalização dos resultados para o conjunto dos municípios brasileiros. Na realidade, isto se coloca como uma condição indispensável para o uso continuado desta metodologia na exploração dos dados da série histórica do SNIS. Tabela 11: Matriz de Correlação Antes da Redução(a) IDHM IDHM IDHM MI I10 I13 I25 I49 I15 I24 I56 RENDA LONGE EDUCA 1000 I10 1,000 -,790 -,578 -,730 ,214 ,287 ,223 ,057 ,116 -,014 -,148 I13 -,790 1,000 ,599 ,824 -,117 -,212 -,106 ,127 ,048 ,191 ,015 I25 -,578 ,599 1,000 ,522 -,076 -,136 -,071 ,072 ,006 ,121 ,082 I49 -,730 ,824 ,522 1,000 -,135 -,220 -,161 ,060 -,002 ,123 ,027 I15 ,214 -,117 -,076 -,135 1,000 ,886 ,871 ,400 ,325 ,254 -,236 I24 ,287 -,212 -,136 -,220 ,886 1,000 ,939 ,352 ,333 ,197 -,262 I56 ,223 -,106 -,071 -,161 ,871 ,939 1,000 ,480 ,404 ,338 -,309 IDHM_RENDA ,057 ,127 ,072 ,060 ,400 ,352 ,480 1,000 ,626 ,843 -,530 IDHM_LONGE ,116 ,048 ,006 -,002 ,325 ,333 ,404 ,626 1,000 ,599 -,462 IDHM_EDUCA -,014 ,191 ,121 ,123 ,254 ,197 ,338 ,843 ,599 1,000 -,542 MI_1000 -,148 ,015 ,082 ,027 -,236 -,262 -,309 -,530 -,462 -,542 1,000 a Determinant = 8,34E-005 Tabela 12: Matriz de Correlação Depois da Redução(a) IDHM IDHM IDHM MI I13 I10 I25 I49 I15 I24 I56 RENDA LONGE EDUCA 1000 I13 1,000 -,813 ,616 ,801 -,137 -,271 -,252 -,039 -,033 ,054 ,035 I10 -,813 1,000 -,648 -,776 ,241 ,373 ,375 ,193 ,181 ,095 -,173 I25 ,616 -,648 1,000 ,534 -,067 -,148 -,138 ,003 -,089 ,096 ,071 I49 ,801 -,776 ,534 1,000 -,122 -,246 -,234 -,055 -,034 ,020 ,023 16 ABES – Associação Brasileira de Engenharia Sanitária e Ambiental
  • 17. 25º Congresso Brasileiro de Engenharia Sanitária e Ambiental I15 -,137 ,241 -,067 -,122 1,000 ,869 ,875 ,529 ,362 ,385 -,336 I24 -,271 ,373 -,148 -,246 ,869 1,000 ,985 ,519 ,410 ,369 -,367 I56 -,252 ,375 -,138 -,234 ,875 ,985 1,000 ,564 ,437 ,422 -,403 IDHM_RENDA -,039 ,193 ,003 -,055 ,529 ,519 ,564 1,000 ,601 ,843 -,631 IDHM_LONGE -,033 ,181 -,089 -,034 ,362 ,410 ,437 ,601 1,000 ,608 -,632 IDHM_EDUCA ,054 ,095 ,096 ,020 ,385 ,369 ,422 ,843 ,608 1,000 -,676 MI_1000 ,035 -,173 ,071 ,023 -,336 -,367 -,403 -,631 -,632 -,676 1,000 a Determinant = 1,29E-005 A partir de uma análise visual, considerando apenas o padrão de cor, percebe-se que a redução da amostra resultou num sensível aumento das cargas fatoriais dos componentes. Como havíamos afirmado antes, de fato, um super ajuste provocado pelo tamanho da amostra pode mascarar os efeitos dos fatores sobre as variáveis em estudo. A Medida da Adequação da Amostra Uma medida para quantificar o grau de inter-correlações entre as variáveis e da adequação da análise fatorial é a medida de adequação da amostra (MSA). Esse índice varia de 0 a 1, alcançando 1 quando cada variável é perfeitamente prevista sem erro pelas outras variáveis. Nesse estudo, o valor para a MSA pode ser observado pela Tabela 13, antes da redução, e Tabela 14, após a redução. Tabela 13: Testes de KMO e Bartlett (antes da redução) Medida da Adequação da Amostra de Kaiser- ,802 Meyer-Olkin - KMO Approx. Chi-Square 8024,909 df 55 Sig. ,000 Tabela 14: Testes de KMO e Bartlett (após a redução) Medida da Adequação da Amostra de Kaiser- Meyer-Olkin - KMO ,822 Approx. Chi-Square 3494,851 df 55 Sig. ,000 Comparadas as medidas de adequação da amostra (MSA), vê-se que, após a redução da amostra deste estudo, essa medida aumenta, acusando uma melhora do KMO de 0.802 para 0.822, o que vem reforçar a idéia de ser bastante adequado o emprego da análise fatorial no caso em estudo. Já o teste de esfericidade de Bartlett fornece um nível de significância (Sig.=0,000), que é inferior a 0,05, concluindo-se que as variáveis são correlacionáveis (rejeitando-se a hipótese nula). Com o MSA = 0.822, acreditamos que podemos prosseguir as análises dos resultados obtidos, com a segurança de que estamos com uma boa medida de adequação da amostra (ver quadro abaixo). A medida pode ser interpretada com as orientações apresentadas na Tabela 15. Tabela 15: Valores de MSA Valor Adequação >= 0.80 admirável ABES – Associação Brasileira de Engenharia Sanitária e Ambiental 17
  • 18. 25º Congresso Brasileiro de Engenharia Sanitária e Ambiental >= 0.70 < 0.80 mediano >= 0.60 < 0.70 medíocre >= 0.50 < 0.60 ruim < 0.50 inaceitável Considerando as estreitas faixas da medida da adequação da amostra indicadas na tabela, mostra-se bastante relevante o salto qualitativo da amostra reduzida; bem como, no sentido contrário, revela-se ser a amostra abrangente (com maior número de municípios), um importante indicador da qualidade e consistência da base de dados do SNIS utilizada neste estudo. O Método da Análise dos Componentes Principais (ACP) É importante observar que o principal objetivo da análise fatorial é reduzir o número de variáveis para explicar o fenômeno de interesse, além de gerar hipóteses por meio da análise exploratória dos dados. A análise fatorial não comprova, necessariamente, hipóteses. O que se busca é, em primeiro lugar, a recomendação ou não da aplicação do método em si; e, em segundo lugar, se o mesmo corresponde às predições possíveis a partir de um profundo conhecimento das questões em análise. Um trabalho inicial de prospecção como este deve ser submetido ao exame de especialistas com diferentes inserções no campo de conhecimento explorado aqui. CONSIDERAÇÕES GERAIS 1. A técnica da Análise Fatorial produz coeficientes de regressão (cargas fatoriais) que indicam a relação entre o fator e cada variável original. Adotamos as cores: verde para indicar as cargas mais significativas (>= 0.60); amarelo para aquelas importantes (>= 0.40 < 0.60); e ocre para aquelas ainda relevantes (>= 0.30 < 0.4), considerando o tamanho da amostra inicial de 860 municípios para os quais existem informações para cálculo dos indicadores selecionados na base de dados do SNIS, ano de referência 2005; e 316 municípios com mais de 50.000 habitantes na amostra reduzida. A partir disto, o primeiro passo da análise é um exame visual da matriz de correlação, quando se pode observar a significância das cargas de cada fator nas variáveis correspondentes. 2. Como já evidenciado na FASE III, a solução fatorial está indicando não haver uma correlação muito significativa entre os indicadores operacionais da água e os demais envolvidos na análise, quais sejam os de esgoto e as variáveis IDHM_RENDA, IDHM_LONGEVIDADE, IDHM_EDUCAÇÃO e MI_1000. Todavia, esse grupo de indicadores da água demonstra existir uma dimensão latente bem definida, com ênfase para a oposição que se revela nesta dimensão entre a micromedição (I10 – Índice de Micromedição Relativo ao Volume Disponibilizado) e o complexo de perdas (I13 – Índice de Perdas de Faturamento, I25 – Volume de Água Disponibilizado por Economia e I49 – Índice de Perdas na Distribuição). 3. Do exame visual da matriz de acima se pode ainda verificar que existe uma correlação significativa entre o grupo de indicadores operacionais de esgoto e o grupo de variáveis estrangeiras. Mas não deixa de ser notada uma curiosidade: o atendimento total de esgoto está relacionado com fatores representativos do IDHM, com ênfase para a componente IDHM_RENDA, com carga = 0.56, seguida pela componente IDHM_LONGE, com carga = 0.43, evidenciando a hipótese de carência de serviços pela população mais pobre, relacionando-a com a longevidade/salubridade. Encontra-se, todavia, em oposição, ou inversamente proporcional, à mortalidade infantil, como era de se esperar, com a significativa carga = - 0.40. 4. Observar como o grupo de indicadores operacionais de esgoto encontra-se em oposição ao complexo de perdas. Isto também é sintomático. Isto, em hipótese, poderia indicar a falta de capacidade de investimento decorrente do mal desempenho operacional? 5. Dentre as componentes do IDHM, a variável IDHM_RENDA é a que apresenta as maiores cargas para os fatores correspondentes aos indicadores de esgotamento sanitário do SNIS. Todavia, no conjunto das variáveis estudadas, seu fator mais importante é o representado pela componente IDHM_EDUCA, como era de se esperar. 18 ABES – Associação Brasileira de Engenharia Sanitária e Ambiental
  • 19. 25º Congresso Brasileiro de Engenharia Sanitária e Ambiental 6. A longevidade, que pode estar relacionada com as condições de salubridade também, apresenta como principais fatores a renda, a educação, a mortalidade infantil (em oposição), e significativas cargas nos fatores correspondentes aos indicadores de esgotamento sanitário do SNIS. 7. A mortalidade infantil, por sua vez, apresenta-se em oposição às dimensões do IDHM e dos fatores correspondentes às condições de esgotamento sanitário do SNIS. Apresenta como seus principais fatores a educação e a renda, respectivamente, com implicância na longevidade, e com relevantes cargas dos fatores correspondentes aos indicadores de esgotamento sanitário do SNIS. 8. Mesmo no grupo de indicadores da água, que já apresentavam uma forte correlação, percebe-se um sensível aumento das cargas fatoriais quando da redução da amostra. 9. O atendimento total de esgoto mostra-se mais fortemente relacionado com os fatores representativos do IDHM e da MI – Mortalidade Infantil, para os municípios respondentes com mais de 50.000 habitantes. Para a componente IDHM_RENDA, a carga fatorial passa de 0.48 para 0.56; seguida pela componente IDHM_LONGE, que passa de 0.40 para 0.43; pela componente IDHM_EDUCA, que passa de 0.33 para 0.42; e pela componente MI_1000, que passa de -0.30 para -0.40. Observe-se que as maiores variações estão nos fatores da mortalidade, educação e renda respectivamente. Comunalidades da Amostra Reduzida A soma em linha das cargas fatoriais ao quadrado resulta num número chamado comunalidade. A comunalidade mostra a quantia da variância em uma variável que é explicada pelos fatores extraídos juntos; isto é, o quanto da variância em uma dada variável é explicada pela solução fatorial. Quanto a isso, a variável que apresenta o maior salto na sua comunalidade após a redução da amostra, de 0.577 para 0.740, é a MI - mortalidade infantil; isto é, essa variável é melhor explicada pelos fatores em estudo nas cidades com mais de 50.000 habitantes, como pode ser observado na Tabela 16. Tabela 16: Comunalidades Inicial Extração I13 1,000 ,852 I10 1,000 ,869 I25 1,000 ,632 I49 1,000 ,786 I15 1,000 ,897 I24 1,000 ,962 I56 1,000 ,967 IDHM_RENDA 1,000 ,803 IDHM_LONGE 1,000 ,669 IDHM_EDUCA 1,000 ,829 MI_1000 1,000 ,740 Método de Extração: Análise do Componente Principal. Variância Total Explicada Segundo o critério da raiz latente, somente autovalores > 1.0 são considerados na seleção de componentes para análise posterior. Assim, na solução fatorial apresentada abaixo, somente três componentes devem ser considerados. Na nossa matriz vemos que esses componentes explicam 82% da variância total do conjunto de variáveis, o que torna um dos nossos principais objetivos, que é a redução de dados, bastante plausível graças ao método escolhido. A Tabela 17 apresenta a variância total explicada e a Tabela 18 a matriz de componentes. ABES – Associação Brasileira de Engenharia Sanitária e Ambiental 19
  • 20. 25º Congresso Brasileiro de Engenharia Sanitária e Ambiental Tabela 17: Variância Total Explicada Comp . Autovalores Iniciais Extração das SSL Rotação das SSL % da % da % da Variânci Cumulativ Variânci Cumulativ Variânci Cumulativ Total a o% Total a o% Total a o% 1 4,721 42,921 42,921 4,721 42,921 42,921 3,135 28,497 28,497 2 2,930 26,634 69,555 2,930 26,634 69,555 3,035 27,586 56,083 3 1,356 12,326 81,881 1,356 12,326 81,881 2,838 25,798 81,881 4 ,574 5,219 87,101 5 ,409 3,718 90,818 6 ,352 3,203 94,021 7 ,197 1,793 95,814 8 ,168 1,530 97,345 9 ,145 1,321 98,666 10 ,134 1,217 99,883 11 ,013 ,117 100,000 Extraction Method: Principal Component Analysis. Tabela 18: Matriz de Componentes(a) Componentes 1 2 3 I13 -,427 ,813 ,100 I10 ,576 -,719 -,147 I25 -,320 ,698 ,207 I49 -,411 ,777 ,115 I15 ,773 ,165 ,522 I24 ,847 ,047 ,492 I56 ,868 ,079 ,454 IDHM_RENDA ,764 ,400 -,242 IDHM_LONGE ,655 ,325 -,367 IDHM_EDUCA ,658 ,489 -,395 MI_1000 -,648 -,349 ,446 Traço 42,921 26,634 12,326 Método de Extração: Análise do Componente Principal. 3 componentes extraídos. Como já visto anteriormente, a importância de um fator é avaliada pela proporção da variância representada pelo fator após a rotação. A rotação favorece a análise dos componentes na medida em que revela as dimensões subjacentes da solução fatorial apresentada. Se nos permitimos anteriormente identificar essas dimensões, agora, com muito mais razão e propriedade, poderemos inclusive dar nomes aos fatores até aqui identificados por números. Esses fatores, evidentemente, estarão associados àquelas dimensões latentes que buscamos medir (3), como pode ser visto na Tabela 19. Tabela 19: Matriz de Componentes Rotacionada (a) Componentes 1 2 3 I13 ,914 ,038 -,124 I10 -,902 ,129 ,197 I25 ,795 -,014 ,015 20 ABES – Associação Brasileira de Engenharia Sanitária e Ambiental
  • 21. 25º Congresso Brasileiro de Engenharia Sanitária e Ambiental I49 ,880 ,021 -,106 I15 -,043 ,239 ,916 I24 -,185 ,251 ,930 I56 -,173 ,303 ,919 IDHM_RENDA -,011 ,818 ,366 IDHM_LONGE -,063 ,792 ,192 IDHM_EDUCA ,074 ,887 ,191 MI_1000 ,058 -,848 -,131 SSLs 3,135 3,035 2,838 % da 28,497 27,586 25,798 Variância Método de Extração: Análise do Componente Principal. Método de Rotação: Varimax com Normalização de Kaiser. Rotação convergiu em 5 iterações. A Análise dos Componentes Da matriz de componentes rotacionada depreende-se um grande equilíbrio na proporção da variância representada por cada um dos três fatores em análise. Isto significa que esses fatores adquirem praticamente a mesma importância e juntos, parcimoniosamente, explicam aproximadamente 82% da variância total do conjunto de variáveis originais Essa parcimônia é de fundamental importância em nosso estudo, demonstrando equilíbrio dos fatores analisados. O Componente 1 Como tem sido observado desde os estudos preliminares, o componente 1 revela uma dimensão relativa ao abastecimento de água tratada, que poucas correlações tem demonstrado ter com as demais variáveis em estudo. Todavia, nessa dimensão, aparece uma forte correlação (inversa) entre I13 – Índice de Perdas de Faturamento e I10 – Índice de Micromedição Relativo ao Volume Disponibilizado. A hipótese que se levanta é a de que o aumento do Índice de Micromedição pode reduzir o Índice de Perdas de Faturamento. O Componente 2 O componente 2 revela-se claramente estar na dimensão social, alinhando, em oposição, o IDHM – Índice de Desenvolvimento Humano Municipal e MI – Mortalidade Infantil Estimada para os municípios. Todavia, diferente da dimensão da água, a dimensão social apresenta um entrelaçamento com a dimensão do esgoto, aqui representada pelo componente 3, com ênfase para o I56 – Índice de Atendimento Total de Esgoto Referido aos Municípios Atendidos com Água. O Componente 3 Na dimensão das condições de esgotamento sanitário, o componente 3, reciprocamente apresenta entrelaçamento com a dimensão social, com um evidente destaque para o fator renda. É importante observar que a análise fatorial não testa hipóteses, mas, permite formulá-las. Com isso, a Tabela 20 apresenta a matriz de transformação dos componentes. Tabela 20: Matriz de Transformação dos Componentes Componente 1 2 3 1 -,404 ,634 ,660 2 ,884 ,456 ,103 3 ,235 -,625 ,744 Método de Extração: Análise do Componente Principal. Método de Rotação: Varimax com Normalização de Kaiser. ABES – Associação Brasileira de Engenharia Sanitária e Ambiental 21
  • 22. 25º Congresso Brasileiro de Engenharia Sanitária e Ambiental FASE VI – ANÁLISE DOS ESCORES FATORIAIS PARA O ANO DE 2005 Procedemos a análise dos escores resultantes dos fatores principais. Para a obtenção dos estratos, utilizou-se a técnica chamada análise hierárquica de agrupamento, a qual agrupa casos relativamente homogêneos de uma determinada variável, no caso, os escores relativos aos fatores principais. Essa amostra de 316 municípios com mais de 50.000 habitantes, inclui 24(vinte e quatro) capitais, abrangendo uma população de 75.205.434 hab. A seguir uma análise sucinta do Fator 1. FATOR 1 – Dimensão do Desempenho dos Sistemas de Abastecimento de Água Deve-se lembrar que, neste estudo, esse desempenho é medido ponderando apenas os Indicadores de Perdas de Faturamento, Perda na Distribuição, o Índice de Micromedição do Volume Disponibilizado e o Volume Disponibilizado por Economia. Péssimo: com relação às variáveis que compõem o Fator 1, e dentro da amostra reduzida para 316 municípios com mais de 50.000 hab, o Cluster 3 revela uma situação extrema: Índices de Perdas de Faturamento e de Perdas na Distribuição altíssimos; Índice de Micromedição do Volume Disponibilizado baixo; e um altíssimo Volume Disponibilizado por Economia. Realmente, sugere uma situação extrema de mal desempenho para um serviço tão essencial como é o abastecimento de água tratada. Naquele agrupamento a situação do baixo desempenho dos serviços de saneamento básico é agravada por índices muito baixos de coleta de esgotos, atendimento urbano de esgoto e atendimento total de esgoto. Como resultado, verificamos um alto índice de mortalidade infantil para cada 1.000 nascidos vivos. Ruim: na seqüência, e sempre lembrando que estamos trabalhando com uma amostra de 316 municípios com mais de 50.000 habitantes, aparece o Cluster 1. É bastante surpreendente que nesse agrupamento apareçam 3(três) capitais. Ali os indicadores de perdas de faturamento (I13) e na distribuição (I49) são altíssimos, comparáveis ao do caso extremo. Mas, como pode ser verificado, não se trata mais de pequenos municípios, mas de três capitais totalizando 870.130 hab. Observe-se os baixíssimos índices de micromedição sempre associados com altos índices de volume disponibilizado. Essa associação, hipoteticamente, aponta para um quadro de desperdício. Os indicadores de esgotamento sanitário neste grupo são muito baixos e assim, como não poderia deixar de ser, os indicadores de mortalidade infantil estão muito acima do desejável. Mediano: no caso do desempenho dos sistemas de abastecimento de água para a amostra em estudo, o Cluster 2 mostra um quadro bastante preocupante do saneamento brasileiro. Numa amostra de 316 municípios, são 133 neste agrupamento, correspondendo a 42% dos municípios em número; mas contendo 14(quatorze) das 24(vinte e quatro) capitais da amostra (58%); e 38.944.847 de habitantes, correspondendo a 52% da amostra em população. Esse agrupamento é maior que a soma de todos os outros, recebendo uma classificação apenas mediana. Os índices de perdas são muito elevados, os volumes micromedidos muito baixos para altos volumes disponibilizados. Bom: no Cluster 4 aparecem os municípios com desempenho de mediano para bom. É maior em termos do número de municípios em relação à amostra: 174 municípios, correspondendo a 55% da amostra. O Cluster 4, juntamente com o Cluster 2, é bastante representativo da situação do saneamento brasileiro. Sete grandes capitais estão ai incluídas. Neste agrupamento temos um total de 34.750.943 de habitantes, correspondendo a 46% da amostra. A passagem por esses agrupamentos mostra uma queda acentuada no indicador de mortalidade infantil, e um avanço bastante significativo dos indicadores de esgotamento sanitário. Dos piores desempenhos do Cluster 2 para os melhores do Cluster 4, deve-se notar, além da brutal melhora dos indicadores de perdas, esse grande salto qualitativo e quantitativo dos indicadores de esgotamento sanitário e da mortalidade infantil. Isto, inegavelmente, coloca a universalização do abastecimento de água tratada como uma condição indispensável para a consecução dos objetivos do milênio. Ótimo: de fato, neste Cluster 5 encontram-se situações bastante atípicas, infelizmente. Sabemos que índices de perdas negativos não existem, salvo como um efeito contábil. Tampouco, em sistemas reais, podem esses índices cair para números de 1(um) dígito, ou seja, menores que 10%. Mas, vale a pena observar neste grupo o alto índice de micromedição e o baixo volume disponibilizado por economia. A despeito disso, todavia, 22 ABES – Associação Brasileira de Engenharia Sanitária e Ambiental
  • 23. 25º Congresso Brasileiro de Engenharia Sanitária e Ambiental nota-se uma grande variância, ou mesmo disparidade, entre os indicadores de esgoto e de mortalidade infantil dentro do grupo. Por essa razão, consideramo-lo atípico. FATOR 2 - A Dimensão Social Ao analisar o Fator 2, percebe-se uma clara associação entre pobreza (renda, longevidade e educação em baixa), altas taxas de mortalidade infantil e mal desempenho dos serviços de saneamento básico na maioria dos casos em análise. Devemos, todavia, lembrar que estamos trabalhando com uma amostra de 316 municípios. Péssimo: extremo do extremo, para nesse Cluster só aparece um município. Essa cidade se caracteriza em relação a extremos: extremo da pobreza, baixa expectativa de vida, pouca educação, mal desempenho dos serviços de saneamento básico, alto índice de mortalidade infantil. Não sendo uma cidade tão pequena, com seus 110.761 hab, torna-se uma má referência com relação aos indicadores analisados. Ruim: ainda como um reflexo das condições precárias nas três dimensões em análise, o Cluster 3, com 7(sete) cidades, é pequeno deveras. Entretanto, vem evidenciar os profundos diferenciais existentes no Brasil. Não podemos esquecer também que os municípios que fornecem informações para o SNIS – Sistema Nacional de Informações sobre Saneamento, o fazem por já terem esclarecimento sobre a importância desse diagnóstico. Inúmeros são os casos onde a falta desse esclarecimento acaba por ocultar situações ainda piores do que os casos dessa amostra. Esse Cluster totaliza 630.335 hab, correspondendo a 0.8% da população da amostra. Mediano: com 50 cidades, o Cluster 2 é o primeiro agrupamento representativo da amostra, com 16% do número de cidades e 6.579.271 hab, correspondendo a 8,7% da população da amostra. Neste grupo aparecem duas capitais. As cidades desse agrupamento, no geral, estão ainda muito longe das metas do milênio. Nessa dimensão social, mediano fica melhor traduzido como medíocre; pois, o diferencial a ser superado no caso da mortalidade infantil, só como exemplo, requer muito investimento e tempo para a consecução das metas. Deve-se observar que 47 dessas cidades, ou seja, 94% se encontram na região Norte- Nordeste do país. As cidades do Cluster 3 e Cluster 4 estão todas naquela região também. Bom: incomparavelmente maior que os outros, com 224 cidades, correspondendo a 71% da amostra em número, e com 58.792.771 hab, correspondendo a 78% da população da amostra, o Cluster 1 pode ser considerado como o perfil das cidades que fornecem informações para o SNIS. São cidades com um considerável grau de desenvolvimento humano, cidades que apresentam condições de saneamento básico de mediana para melhor, muitas das quais já se encontram próximas, ou até já atingiram, as metas do milênio nos setores em estudo. Uns totais de 24 capitais da amostra encontram-se neste Cluster. Ótimo: a dimensão social, das três dimensões em análise, é a única que apresenta um agrupamento consistente de cidades na condição de excelência. De fato, ao examinar o quadro, verificamos que ali estão cidades já muito conhecidas pela excelência de alguns indicadores. Mas, o que desejamos de fato enfatizar é que essas cidades, em relação à amostra em estudo, no geral, apresentam melhores desempenhos nas dimensões do saneamento básico e, consequentemente, baixos índices de mortalidade infantil, alta renda, alta expectativa de vida e alto grau de educação. O Cluster 5 tem 34 cidades, ou 10,7% da amostra em número, e 9.092.296 hab, correspondendo a 12% da amostra em população. FATOR 3 – Dimensão da Cobertura e Atendimento por Esgotamento Sanitário Péssimo: a dimensão do esgotamento sanitário, neste estudo, exibe toda a sua complexidade. O Cluster 3, que apresenta os maiores déficits de coleta e atendimento por esgoto sanitário, agrupa cidades que vão de um extremo ao outro no que tange às outras dimensões em estudo, quais sejam as dimensões sociais e do atendimento com água tratada. O grupo abrange ainda tanto cidades pequenas, com pouco mais de 50.000 habitantes, quanto grandes cidades e aglomerações urbanas, incluindo uma capital do Norte e outra do Nordeste. Ao todo, são 73 cidades numa amostra de 316, 23% em número, e 13.433.254 hab, correspondendo a 18% da amostra. Nada desprezível considerando os péssimos dados sobre cobertura e atendimento. Ruim: O Cluster 1, que agrupa cidades em condições consideradas ruins de atendimento de esgoto, ABES – Associação Brasileira de Engenharia Sanitária e Ambiental 23