Presentazione fatta a ForumPA 2009 che tratta due sperimentazione sul tema dell'Information retrieval nel contesto giuridico, condotte presso il Laboratorio di sperimentazione di tecnologie e applicazioni dell'Ufficio divisionale Tecnologie innovative del CNIPA.
2. Agenda
• Cosa si intende per Information retrieval
• Casi di studio:
– Il prototipo NavigaNorme
– Partecipazione alla competizione internazionale
TREC
3. Cos'è l'Information retrieval?
• Information retrieval
– Area di ricerca interdisciplinare che studia
tecniche utilizzate per il recupero mirato
dell’informazione in formato elettronico.
– Esempi applicativi:
• Motori di ricerca
4. Genesi del prototipo NavigaNorme
20/02/2008
Il collegio del CNIPA costituisce un GdL per la
realizzazione di un prototipo operante su un
insieme limitato ma significativo di norme
concernenti l'ambito di competenza del CNIPA, ai
fini della creazione di un testo coordinato della
normativa in materia.
Riferimento: ADUNANZA DEL 20 FE88RAIO 2008 - DELlBERAZIONE N. 15/2008
5. “Definizione” delle specifiche
Legge 7 agosto 1990, n. 241 IPOTESI D I Decreto legislativo 7 marzo 2005, n. 82
“Nuove norme in materia di RELAZIONE “Codice dell'amministrazione digitale.”
procedimento amministrativo e pubblicato nella Gazzetta Ufficiale n. 112 del 16
di diritto di accesso ai maggio 2005 Supplemento Ordinario n. 93 1
documenti amministrativi”.
Pubblicata nella Gazzetta Ufficiale
18 agosto 1990, n. 192.
Capo I Princìpi
1. Principi generali dell'attività Art. 3 Diritto all'uso delle tecnologie
amministrativa (3). (1.1 > 12.1) 1.I cittadini e le imprese hanno diritto a richiedere ed
1. L'attività amministrativa ottenere l'uso delle tecnologie telematiche nelle
persegue i fini determinati dalla Specializzazione comunicazioni con le pubbliche amministrazioni e
legge ed è retta da criteri di strumentale – uso con i gestori di pubblici servizi statali nei limiti di
economicità, di efficacia, di dell’ICT per il quanto previsto nel presente codice.
pubblicità e di trasparenza raggiungimento di scopi Omissis
secondo le modalità previste dalla più generali Art. 12 Norme generali per l'uso delle tecnologie
presente legge e dalle altre dell'informazione e delle comunicazioni nell'azione
disposizioni che disciplinano (1.1 > 15.1) amministrativa
singoli procedimenti, nonché dai Specializzazione 1.Le pubbliche amministrazioni nell'organizzare
princìpi dell'ordinamento strumentale – uso autonomamente la propria attività utilizzano le
comunitario (4). dell’ICT per il tecnologie dell'informazione e della comunicazione
1bis. La pubblica raggiungimento di scopi per la realizzazione degli obiettivi di efficienza,
amministrazione, nell'adozione di più generali efficacia, economicità, imparzialità, trasparenza,
atti di natura non autoritativa, semplificazione e partecipazione.
agisce secondo le norme di diritto Omissis
privato salvo che la legge Art. 15 Digitalizzazione e riorganizzazione
disponga diversamente (5). 1. La riorganizzazione strutturale e gestionale delle
1ter. I soggetti privati preposti pubbliche amministrazioni volta al perseguimento
all'esercizio di attività degli obiettivi di cui all'articolo 12, comma 1,
amministrative assicurano il avviene anche attraverso il migliore e più esteso
rispetto dei princìpi di cui al utilizzo delle tecnologie dell'informazione e della
comma 1 (6). comunicazione nell'ambito di una coordinata strategia
2. La pubblica amministrazione (1.2 > 15.2) che garantisca il coerente sviluppo del processo di
non può aggravare il procedimento Specializzazione digitalizzazione.
se non per straordinarie e motivate strumentale – uso 2. In attuazione del comma 1, le pubbliche
esigenze imposte dallo dell’ICT per il amministrazioni provvedono in particolare a
svolgimento dell'istruttoria. raggiungimento di scopi razionalizzare e semplificare i procedimenti
(3) Rubrica aggiunta dall'art. 21, L. 11 più generali amministrativi, le attività gestionali, i documenti, la Area Studi
febbraio 2005, n. 15. legislativi
6. Individuazione dei partner scientifici
• Contributi del Laboratorio di sperimentazione
– In collaborazione con:
• Fondazione Ugo Bordoni
• Univ. Tor Vergata: Laboratorio Art Research Group
• Univ. Tor Vergata: Laboratorio Nestor
• Univ. Glasgow (collab. indiretta)
– In raccordo con la dott.ssa Lupo per le
collaborazioni in corso con il CNR
– In raccordo con il GdL classificazione dei
documenti – CNR e Università della Calabria
Ufficio Gestione e condivisione della conoscenza
7. Funzionalità di “NavigaNorme”
Comma X
Elenco di commi correlati
a X ordinati per rilevanza
• Rilevanza calcolata in base a:
– Grado di “somiglianza” statistica
– Riferimenti espliciti tra norme (attivi e passivi)
– Presenza di termini del dizionario “amministrativo”
– Presenza di termini del dizionario “ICT”
– ... estendibile
8. Prestazioni di “NavigaNorme”
Configurazione:
Riferimenti Attivi: +100
Riferimenti Passivi: + 50
Numero commi recuperati: 800
Numero commi rilevanti recuperati dal sistema: 450 (+ 11 commi)
% di commi rilevanti nei primi 5: 91% (+20%)
% di commi rilevanti nei primi 10: 81% (+17%)
% di commi rilevanti nei primi 20: 68% (+6%)
% di commi rilevanti nei primi 40: 56% (+2%)
Il prototipo è stato reputato
estremamente soddisfacente
dagli esperti di dominio che lo hanno provato
10. “NavigaNorme” oggi... (2/2)
• Oltre al tool di annotazione semantica, sono
in fase di studio tecniche per sfruttare al
meglio:
– La struttura XML dei testi normativi
– Il feedback da parte dell'utente.
12. Text REtrieval Conference (TREC)
• Workshop internazionale che ospita una
competizione nella risoluzione di problemi
complessi di IR
• Gruppi di partecipanti: tra 200 e 250.
• Obiettivo principale: incoraggiare lo sviluppo della
ricerca in questo settore
– Collezioni di test realistiche
– Procedure di valutazione uniformi e “oggettive”
14. Partecipazione CNIPA a TREC'08
• Squadra italiana composta da:
– CNIPA
– Fondazione Ugo Bordoni
– Università di Roma “Tor Vergata” Laboratorio Nestor
• Risultati:
– seconda posizione nella competizione “Legal Track”
– verificata efficacia delle tecnologie usate per
NavigaNorme
– acquisite conoscenze utili alla realizzazione e valutazione
di NavigaNorme
– rafforzati rapporti di collaborazione e gettate le basi per
nuove attività di ricerca e nuove collaborazioni.
15. Conclusioni
• Le esperienze di NavigaNorme e TREC testimoniano:
– Potenzialità delle collaborazioni tra PA e S.P.R.
– Efficacia degli approcci multidisciplinari:
• il confronto continuo e faticoso tra gli esperti delle diverse
discipline (giuristi, informatici, avvocati)
– Capacità di valorizzare risorse esistenti:
• archivi XML, glossari, ...
– Capacità, da parte della PA, di identificare problemi
sfidanti presenti nella PA interessanti per il mondo
della ricerca.
– Capacità, da parte del S.P.R., di proporre
tematiche di ricerca di interesse per la PA.
16. Bibliografia
• M.Bianchi, M.Draoli, G.Gambosi, G.Stilo, A support system for the
analysis and the management of complex ruling documents, in the
Proceedings of the 2nd Workshop on Legal Informatics and Legal
Information Technology, Poznan (Poland), 2009.
• M.Bianchi, M.Draoli, G.Gambosi, A.L.Petrucci, G.Stilo, ICT tools for the
simplification of legislative frameworks, in the Proceedings of the 1st
International Conference on eGovernment and eGovernance, Ankara
(Turkey), 2009.
• G. Amati, M. Bianchi, A. Celi, M. Draoli, G. Gambosi, G. Stilo, CNIPA,
FUB and University of Rome "Tor Vergata" at TREC 2008 Legal Track, in
the Proceedings of the 17th Text REtrieval Conference (TREC 2008),
Gaithersburg (Mariland – USA), 2008