La presentazione delinea i risultati delle analisi svolte nel tempo sui dati anagrafici acquisiti con le Rilevazioni delle LAC. Sono illustrati, inoltre, gli esiti del processo di controllo e correzione delle variabili demografiche per la pubblicazione della popolazione legale per sesso, età e cittadinanza, oltre alle valutazioni legate alla corrispondenza individuale fra LAC e questionario.
A. Pezone - La qualità delle Liste Anagrafiche Comunali
1. La qualità delle
Liste Anagrafiche Comunali
A cura di
Anna Pezone
pezone@istat.it
33° Convegno Nazionale ANUSCA 2013
I servizi demografici: il futuro è già iniziato
Abano Terme 25-29 novembre 2013
2. Le Rilevazioni LAC
Le Rilevazioni LAC effettuate dall’Istat
Nome
Data di
riferimento
Comuni
interessati
Comuni
rispondenti
N. individui
acquisiti
Sperimentale 2010
31.12.2009
1.850
1.746
31 milioni
1° Rilevazione CP 2011
31.12.2010
8.093
8.092
61 milioni
2° Rilevazione CP 2011
08.10.2011
2.510
2.437
49 milioni
01.01.2013
8.092
8.001
61 milioni
(comuni con almeno 5.000 ab. e quelli della provincia di BZ)
Rilevazione 2013
In occasione del 15° Censimento Generale della
Popolazione, con la Rilevazione delle LAC si è dato
l’avvio all’impiego su scala nazionale dei dati anagrafici
comunali.
3. Le Rilevazioni LAC
I dati delle LAC sono stati utilizzati per:
L’invio dei questionari
alle famiglie;
La tracciatura delle attività dei
rispondenti e degli operatori
censuari
Il
confronto
censimento/anagrafe
contestuale all’attività censuaria
la determinazione dell’ammontare e
della struttura della popolazione legale
in tempi molto più rapidi rispetto ai
censimenti passati
4. Aspetti della qualità LAC
Confrontabilità
Regolarità
Completezza
Garantita dall’assenza di modifiche nel tempo delle
informazioni richieste, nelle definizioni delle variabili e nelle
caratteristiche operative adottate dal processo di trasmissione
e acquisizione
Garantita dalla frequenza annuale della rilevazione e della data
di riferimento
Garantita dal quadro informativo soddisfacente che i dati
anagrafici LAC hanno fornito per censimento passato e che
forniranno per il futuro censimento permanente
Archivio anagrafico
Problemi di
copertura
Iscritti in
anagrafe
e residenti
Non iscritti in anagrafe
e residenti
Iscritti in anagrafe
non residenti
5. Aspetti della qualità LAC
Tempestività
Cronogramma dell’acquisizione delle LAC al 08.10.2011
30 giorni
30 giorni
Cronogramma dell’acquisizione delle LAC al 31.12.2010
120 giorni
30 giorni
Cronogramma dell’acquisizione delle LAC al 01.01.2013
La tempistica della rilevazione LAC2013 è stata influenzata da:
Elezioni politiche - febbraio 2013
Elezioni amministrative - maggio 2013
6. Aspetti della qualità LAC
Validità delle variabili
Molte considerazioni sulla qualità delle variabili LAC devono essere
legate all’applicazione web STARLAC con particolare riferimento:
Al processo di trasmissione/acquisizione dei file Comunali
per i quali sono fissati numerosi vincoli di qualità
Ai risultati delle analisi eseguite sui file acquisiti e riportati
nei Report sulla qualità resi disponibili ai Comuni
7. Aspetti della qualità LAC - STARLAC
Supporta i Comuni durante
l’operazione di invio dei dati
Monitora
le attività
Gestisce
l’acquisizione
controllata dei dati
Fornisce i Report
sulla qualità dei dati
8. Qualità delle variabili
Qualità richiesta
Starlac gestisce i controlli di validità dei file inviati (nome e formato dei file,
nome e formato delle variabili) ed esegue i controlli di soglia rispetto alle
variabili per l’accettazione/rifiuto della LAC inviata
9. Qualità delle variabili
Qualità risultante
Informazioni di sintesi
Navigabilità
Report sulla qualità
Starlac restituisce al Responsabile/Referente Tecnico dei comuni, che
hanno correttamente inviato la LAC, i dettagli sui risultati delle analisi
della qualità dei dati
Per ciascuna regola di controllo implementata
è reso disponibile: il valore assoluto e % di
individui che violano la regola.
Informazioni di dettaglio
Per ciascuna regola di controllo implementata
sono visualizzabili i dati identificativi dei singoli individui che la violano
Gli elementi identificativi disponibili al massimo livello di dettaglio sono utili ai
Responsabili delle Anagrafi per intervenire direttamente sulle schede
individuali per massimizzare la qualità dei dati anagrafici.
12. Qualità delle variabili LAC
Sperim. LAC 2010
Lac Gen. 2011
Lac Ott. 2011
% individui errati
I comuni hanno potuto usufruire dei Report sulla qualità nel corso della
Rilevazione sperimentale del 2010 e per la Rilevazione LAC2013. Per il 2014 è
atteso un ulteriore miglioramento.
Lac 2013
13. Le LAC per i dati di censimento
Un ulteriore utilizzo delle LAC
Validazione delle variabili demografiche per la pubblicazione, per la prima
volta in Italia e ad un anno di distanza dalla data di riferimento del
Censimento, della Popolazione LEGALE per SESSO, ETA’ e
CITTADINANZA
Per la determinazione della struttura demografica della
popolazione, dopo le dovute analisi esplorative, si è
proceduto a scelte di imputazione sulla base di:
Concordanze/discordanze tra valori delle variabili nelle
fonti disponibili
Apporto informativo delle variabili ausiliarie
Studi ad hoc, utilizzando dati familiari, dei casi residuali
Focus speciali su particolari sottopopolazioni di particolare
interesse anche con il supporto di altri archivi.
14. Il processo di controllo e correzione attraverso le LAC
Variabili
Fonti
presenti in LAC
censiti
Censiti
CF
Variabili ausiliarie
SESSO
SGR
CITTADINANZA
SGR
ANNO DI
NASCITA
SGR
SESSO
Nuovi
Popolazione censita
Unità
WEB
SGR
codice famiglia, nome
CITTADINANZA
SGR
codice famiglia, età, nome e cognome
ANNO DI
NASCITA
SGR
codice famiglia, relazione di parentela,
cittadinanza
WEB
CF
WEB
codice famiglia, nome
CF, codice famiglia, età, nome e
cognome
codice famiglia, relazione di parentela,
cittadinanza + dati demografici di sintesi
I buoni livelli di qualità delle variabili delle LAC hanno permesso
la
determinazione
della
struttura
demografica
della
popolazione legale con largo anticipo rispetto ai censimenti
passati
15. Il processo di controllo e correzione attraverso le LAC
La variabile SESSO
È la variabile risultata più robusta. Le correzioni complessive sono state 2.000,
prossime allo 0%.
La variabile CITTADINANZA (italiana/straniera)
Su 335.115 codici mancanti, errati o anomali è stata attribuita nel 87,29% dei casi
cittadinanza italiana e nel 12,71% cittadinanza straniera.
La variabile ANNO DI NASCITA (1)
Nel 35,43% degli individui - tre fonti concordanti e non sono stati quindi effettuati
ulteriori controlli. Nel 63,01% degli individui - due fonti concordanti solo se 1920
e il 1999.
La variabile ANNO DI NASCITA (2)
Per i nati tra il 2000 e il 2011 e per la popolazione ultracentenaria le procedure di
verifica hanno fatto uso delle variabili ausiliarie e per ridurre il rischio di errata
attribuzione si è fatto ricorso al confronto con i dati della «Rilevazione degli iscritti
in anagrafe per nascita».
La variabile ANNO DI NASCITA (3)
Per tutti i casi in cui le procedure deterministiche di correzione si sono rivelate
insufficiente si è fatto ricorso all’analisi della struttura del nucleo familiare.
16. Confronto con i dati del questionario
Un ulteriore riscontro a conferma dell’importanza dei dati di fonte anagrafica
rappresentato dai risultati dell’analisi eseguita sulle principali variabili
demografiche presenti in LAC (sesso, cittadinanza, data di nascita e relazione
di parentela). Queste variabili sono state messe a confronto con le stesse
informazioni riportate nei questionari di rilevazione dai rispondenti censiti
come residenti e presenti in LAC.
Variabile
Sesso
Cittadinanza
Anno di nascita
Relazione di parentela(a)
Stato civile
Concordanza
Discordanza
96,26
95,96
95,39
95,38
88,99
0,14
0,20
1,19
3,65
6,35
Dato non confrontabile
perché mancante o
fuori range su LAC o
questionario
3,60
3,84
3,41
0,97
4,66
Totale
100,00
100,00
100,00
100,00
100,00
Nota: (a) La relazione di parentela è stata valutata per i soli individui residenti in famiglia
La tabella mostra che i dati della LAC sono confermati ampiamente da ciò
che hanno compilato i rispondenti sul questionario.
17. Confronto con i dati del questionario – i cartogrammi
CONCORDANZA
PIENA delle 5
variabili
SESSO
CITTADINANZA
ANNO DI
NASCITA
RELAZ. DI
PARENTELA
18. In sintesi …..
Analizzando tutti gli aspetti della qualità dei dati anagrafici comunali è
emerso che esse possono essere influenzate da numerosi aspetti quali:
la dimensione demografica dei comuni
la localizzazione territoriale delle anagrafi
i controlli e i vincoli di qualità imposti dai software utilizzati per
l’acquisizione e la gestione delle pratiche anagrafiche rese dai cittadini.
Per
il
censimento
permanente
i
dati
delle
anagrafi
comunali
rappresenteranno, comunque, una irrinunciabile fonte informativa sulla quale
eseguire il conteggio di popolazione in termini di individui, famiglie e
convivenze. Pertanto, i controlli da eseguire su questi dati devono sempre
assicurare i più elevati standard di qualità.
19. Uso futuro degli archivi anagrafici
A partire dal 2014 il sistema anagrafico nazionale dovrà essere riordinato
in un’unica anagrafe denominata Anagrafe Nazionale della Popolazione
Residente -
ANPR. Essa sarà istituita presso il Ministero dell'interno e
determinerà un’accelerazione del processo di automazione amministrativa
rendendo più efficiente ed efficace la gestione dei dati anagrafi della
popolazione, riducendone i costi.
I dati dei registri anagrafici rappresenteranno, comunque, una
irrinunciabile fonte informativa sulla quale eseguire il conteggio
delle unità di rilevazione per il censimento permanente.
20. Uso futuro degli archivi anagrafici
LAC
ANPR
Inizio
Censimento
permanente
Sperimentazioni C-sample e D-sample
per il Censimento permanente
Entro il 2015 tutti i
comuni dovrebbero
popolare l’archivio con i
propri dati
LAC
o
ANPR