Presentazione alla Tavola rotonda su e-science e OA: quale futuro? quale impatto per l'OA e la produzione, lo scambio, la conservazione dei dati della ricerca?
Roma, Tor Vergata, 27 ottobre 2011
Una breve introduzione ad Elsa Morante, vita e opere
Il futuro della comunicazione scientifica tra e-science e open access
1. OpenData?
<Antonella De Robbio>
Università degli Studi di Padova
Centro di Ateneo per le Biblioteche
Il futuro della comunicazione scientifica
tra e-science e open access
Roma, Tor Vergata, 27 ottobre 2011
Tavola rotonda su
e-science e OA: quale futuro?
quale impatto per l'OA e la produzione, lo scambio,
la conservazione dei dati della ricerca?
2. Open <…>
•
•
•
•
•
•
•
•
•
Open Source: riguarda le licenze di distribuzione di programmi e applicazioni.
Open Content: facilmente confondibile con l'Open Data, ma mentre l'Open Data concentra
l'attenzione alla ricerca scientifica e ai dati che le competono, l'Open Content si rivolge alla
creatività delle opere.
Open Knowledge: si ispira all'Open Content e mira alla "diffusione della conoscenza con le
seguenti caratteristiche: libera (di proprietà di ogni essere umano), accessibile
(raggiungibile da ogni essere umano), comprensibile (presentata nel modo più semplice
possibile, e attraverso la definizione esaustiva di ogni significato coinvolto), universale
(accessibile in ogni lingua)"
Open Access: riguarda la comunicazione scientifica e si concretizza nella disponibilità dei
contenuti digitali online, articoli di riviste, ricerche svolte in campo accademico,
consentendone la pubblicazione e l'accesso/utilizzo gratuito.
Open Learning: nuovo movimento per una didattica a distanza Open (a vari livelli):
piattaforme (Moodle), contenuti … Khan Academy… modalità collaborative …Open
Educational Resources (OED)
Open Library: consistente in progetti che mirano a creare pagine web per ogni libro
pubblicato, permettendo l'accesso libero all'opera, la condivisione, la diffusione della
stessa. Nello specifico l'Open Library Project nasce da Internet Archive, in collaborazione
con la California State Library e la Kahle Austin Foundation.
OpenBibliographic Data: sotto-insieme di OpenData
Open Bibliography in science, technology and medicine (STM) è una combinazione di
strumenti Open Source, specifiche tecniche Open e Open bibliographic data. Usa
BibJSON, un formato di dati a struttura testuale semplice (BibTex, Dublin Core, PRISM e
JSON)
Open Linked Data (LOD): affinchè i dati siano realmente <open> devono essere anche
tecnicamente <connettibili>
3. Open Data?
• A differenza di quanto accade per altri movimenti <open>,
per i quali sono state formulate definizioni incluse in
dichiarazioni internazionali, per l'Open Data non vi è
ancora un accordo generale nella definizione del termine.
• Open Data Commons è il più giovane tra i movimenti, e
gli stessi strumenti legali che vi ruotano attorno hanno
appena iniziato il confronto tra differenti legislazioni e
differenti assetti normativi
• Al pari di altre filosofie "open", si propone l'obiettivo di
rendere immediatamente "accessibili a chiunque i dati
primari della ricerca, senza limitazione di copyright,
brevetti o altri meccanismi di controllo".
• Una buona definizione di partenza di cosa siano l'Open
Data, l'Open Content, e l'Open Information è stata
formulata dall'Open Knowledge Foundation
4.
5. Il movimento Open Data
• I dati appartengono al genere umano. Esempi tipici sono
i genomi, i dati sugli organismi per la scienza medica,
dati ambientali e meteorologici, ecc.
• I dati prodotti dalla pubblica amministrazione, in quanto
finanziati da denaro pubblico, devono ritornare ai
contribuenti, e alla comunità in generale, sotto forma di
dati aperti e universalmente disponibili
• Restrizioni sui dati e sul loro riutilizzo limitano lo sviluppo
della comunità
• I dati sono necessari per agevolare l'esecuzione di
comuni attività umane (ad esempio i dati cartografici, i
dati delle istituzioni pubbliche, ecc.)
• In campo scientifico il tasso di scoperta è accelerato da
un migliore accesso ai dati, in particolare in biomedicina
6. I tre settori dell’Open Data
Raw data = dati grezzi
Riuso… dati aggregati,
comparazione, modelli predittivi
nano-pubblicazioni
Dati aperti nel settore
dell’informazione pubblica
OpenGovernment
OpenScience
Grafici, tabelle,
strutture molecolari,
foto di proteine,
Immagini scientifiche,
informazioni fattuali,
dati e info supplementari
che si annidano
dentro gli articoli scientifici
annotazioni
OpenBiblio
Geografici, ambientali,
Demografici, elettorali,
Finanziari, enti locali,
Leggi, norme, sociali,
Dati sicurezza…
Open Bibliographic Data
Open bibliography
Dati e Metadati
Cataloghi e MetaOPAC Open
Schemi di classificazione
Database Open
OpenRepository (IR e disciplinari)
Bibliografie aperte (BibJSON)
7.
8. Nel 2007 l’European Science Foundation e la Deutsche
Forschungsgemeinschaft nell’ambito del Berlin5 tenutosi a
Padova, organizzarono il workshop ''Shared Responsibilities
in Sharing Research Data'', con lo scopo di aumentare la
consapevolezza riguardo all'accesso aperto ai dati della
ricerca e ad aprire un forum di discussione per le potenziali
aree di cooperazione.
9. « Numerosi scienziati hanno sottolineato con ironia
che proprio nel momento storico in cui disponiamo
delle tecnologie per consentire la disponibilità dei
dati scientifici a livello globale e dei sistemi di
distribuzione che ci consentirebbero di ampliare
la collaborazione e accelerare il ritmo e la profondità
della scoperte... siamo occupati e bloccare i dati e a
prevenire l'uso di tecnologie avanzate che
avrebbero un forte impatto sulla diffusione della
conoscenza. »
[dichiarazione di John Wilbanks]
Protocollo
metodologia per
creare degli
E’ fortemente raccomandato l’impiego delle licenze PDDL
strumenti legali
e CCZero quando si impiegano dati che sono di pubblico
che consentano la
dominio e che sono alla base della scienza pubblica.
riutilizzazione dei
Assicurarsi inoltre la compatibilità con il
dati primari
Protocollo per l’implementazione dell’accesso aperto ai dati ricerca e per
della
di Science Commons e la Open Knowledge/Data
garantirne
Definition.
l'interoperabilità.
10. • Il Digital Curation Centre (http://www.dcc.ac.uk/) ha
pubblicato Cite Datasets and Link to Publications, guida
che illustra come creare collegamenti tra le pubblicazioni
di ricerca e i dati su cui si basano, così da rendere
possibile la localizzazione dei dataset per chi legge un
articolo, e viceversa.
• La guida fornisce inoltre esempi pratici sull’argomento,
sulle problematiche che si possono presentare e sulle
modalità per superare eventuali ostacoli. la guida sarà di
sicuro interesse per i ricercatori, per chi si occupa di
linked data e per i gestori di archivi di dati.
11. Esempi di dati aperti nel settore
dell’informazione pubblica
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
Dati geografici (mappe geografiche, stradali, geologiche, dati sui movimenti
sismici, utilizzo del territorio, …)
Dati ambientali (atmosferici, climatici, inquinamento,…)
Dati sul trasporto locale
Dati demografici (dati sui censimenti, popolazione, dati migratori…)
Dati elettorali
Dati sulla produzione e sul consumo energetici
Dati finanziari (di bilancio) e tributari (redditi e tasse)
Dati economici e delle attività degli enti locali (primo Comune italiano:
Firenze - ottobre 2011 - ha rilasciato numerosi set di dati)
Dati sui beni immobili (catastali)
Dati utili per la salute pubblica (dati aggregati)
Dati sullo stato dell’educazione
Dati per la gestione e smaltimento
Dati sulla gestione delle acque
Dati sulla sicurezza pubblica
Dati di fonte e documentazione pubblica (legislazione, giurisprudenza)
…
12. Dati aperti per società aperte
• Perché i dati sono importanti e perché è importante che siano
aperti:
– i dati pubblici sono realmente utili laddove essi sono grezzi, davvero
aperti e connessi
– i dati grezzi (raw data) sono un terreno fertile che crea ricchezza
• La natura dei dati:
– definizione di open/linked data raw
• Education to Open Data, or Open Data for Education?
– il valore di avere dati aperti per la ricerca da una parte e nel sistema
pubblico crea un valore educativo a tutto campo
• Open data per ristrutturare i sistemi di governo
– Il valore economico (esterno e interno) risiede nell’apertura dei dati
– Uno studio McKinsey sui paesi UE ha calcolato che gli Open Data
potrebbero abbattere i costi della PA del 20% creando valore fino a 300
miliardi € in 10 anni tra riduzione di inefficienze, maggiori introiti fiscali e
maggiore produttività
– Forme di cittadinanza attiva (Open Government Data Poster)
13. Open data come misura per il rilancio dell’economia
Una ricerca realizzata dalla Scuola sant’Anna di Pisa propone sette linee di
azione per impostare correttamente un “governo” dei dati aperti
1.
2.
3.
4.
5.
6.
7.
definire chiaramente e
spiegare sia il concetto di
open data che di public data
mantenere separate le
questioni politiche da quelle
economiche
distinguere tra dati esistenti e
dati futuri
imporre licenze appropriate
educare la cittadinanza alla
comprensione ed all’uso dei
dati
focalizzarsi su questioni locali
e specifiche al fine di suscitare
l’interesse per l’Open Data
coinvolgendo ONG, enti di
beneficenza ed associazioni
imprenditoriali
Ma perché molti dati pubblici non sono ancora aperti???
14.
15. Il Kenya è la prima nazione tra i paesi in via di sviluppo nel
sud del mondo ad aprire una piattaforma di open data dove
condivide informazioni su 6 temi: istruzione, energia, salute,
popolazione, povertà, risorse idriche e servizi igienici.
Le tabelle più scaricate riguardano la povertà per provincia e
la spesa pubblica. Nella home page ha una mappa che
mostra le 47 contee della nazione.
Nell’area community segnala già le prime
applicazioni sviluppate a partire dagli open
data. Per esempio, Huduma è uno spazio
dove i cittadini possono dare voce alle loro
richieste per avere accesso alle
infrastrutture di base, aiutati da una
visualizzazione delle risorse disponibili nelle
aree vicine. Msema Kweli sarà
un’applicazione per cellulari che permetterà
di vedere i piccoli progetti in fase di
realizzazione sul campo che
altrimenti è difficile raggiungere da una
singola finestra di accesso.
16.
17. Due le condizioni per dati davvero aperti:
Licenze open
[questione copyright]
LOD: LinkedOpenData
[questione interoperabilità]
19. Il valore della rinuncia ai diritti
risiede nei dati
• Poiché determinare quale porzione dei nostri dati è
fattuale e quale porzione è reinterpretata, una risposta
alla domanda se sia opportuna la protezione tramite il
copyright è perciò ardua
• Una scuola di pensiero crede che sia probabilmente
meglio rinunciare a tutti i diritti di proprietà sui dati.
Significa offrire il proprio lavoro nel pubblico dominio.
• Questo modello presuppone l’uso di una licenza
• CC0 1.0 Universal (CC0 1.0) Public Domain
Dedication
• Public Domain Dedication and License (PDDL) —
“Public Domain for data/databases”
20. Le quattro licenze di Open Data Commons
catalogo CERN
OCLC catalogo WorldCat
Progetto OpenStreetMap
Immagine tratta dalle slide di Maurizio Napolitano
http://www.slideshare.net/napo/licenze-opendata
21.
22. OCLC ha preferito orientarsi su questa licenza ODC-BY, una via di mezzo tra la licenza
Open Database License (ODC-ODbL) - Attribution Share-Alike for data/databases,
più restrittiva anche in termini di interoperabilità, e le licenze di pubblico dominio
come la PDDL o la CC0 sulle quali OCLC nutre parecchie riserve.
23. Nel caso di OpenStreetMap gli autori concedono
i dati con licenza Open Database License (ODbL)
(pubblico dominio).
24.
25. Il W3C Incubator Group, attivo da maggio 2010 ad agosto 2011, ha rilasciato il Library
Linked Data Incubator Group Final Report.
Obiettivo del gruppo è stato aumentare l’interoperabilità dei dati delle biblioteche sul
web, mettendo assieme persone interessate alle attività sul web semantico nella
comunità bibliotecaria e oltre, basandosi su iniziative esistenti e identificando possibilità
future di collaborazione.
Le raccomandazioni contenute nel report sono le seguenti:
•I direttori di biblioteca devono identificare i seti di dati idonei ad essere esposti come
Linked Data e promuovere la discussione su open data e diritti connessi;
•Chi si occupa di standard per le biblioteche deve promuovere la partecipazione delle
biblioteche alle discussioni sul web semantico e la sua standardizzazione, sviluppare
standard compatibili con i linked data, e diffondere buone pratiche per incentivare le
biblioteche a muoversi in direzione dei LD.
•Bibliotecari e archivisti conservano i set di elementi LD e applicano l’esperienza delle
biblioteche nella cura e nella conservazione a lungo termine dei set di dati LD.
26.
27. "Data is the new oil?
No. Data is the new soil"
[David McCandless @ #TED]
http://richard.cyganiak.de/2007/10/lod/lod-datasets_2010-09-22_colored.html
Notas del editor
Open data come misura per il rilancio dell’economia. Una ricerca realizzata dalla Scuola sant’Anna di Pisa propone sette linee di azione per impostare correttamente un “governo” dei dati aperti.