SlideShare a Scribd company logo
1 of 21
Download to read offline
NEXA
                        Center for Internet & Society

L'enorme archivio di dati: il Web

Giuseppe Rizzo
Dottorando di Ricerca
Dipartimento di Automatica ed Informatica
Politecnico di Torino
Email: giuseppe.rizzo@polito.it



29° Mercoledì di Nexa
Centro NEXA su Internet & Società
Politecnico di Torino



Torino, 9 Marzo 2011
Agenda   NEXA
                                Center for Internet & Society




 ♦ Idea
 ♦ Il Web dei documenti
 ♦ Il Web dei dati
 ♦ Linked Data
 ♦ Come condividere i dati
 ♦ Conclusioni




Torino, 9 Marzo 2011                                        2
Idea                            NEXA
                                                                      Center for Internet & Society




                       Il Web è uno spazio di informazione globale,
                           un enorme archivio distribuito di dati




Torino, 9 Marzo 2011                                                                              3
Il Web dei documenti NEXA
                                    Center for Internet & Society




Torino, 9 Marzo 2011                                            4
Documento                    NEXA
                                                    Center for Internet & Society




 ♦ E' l'elemento atomico di scambio dell'informazione

 ♦ E' il contenitore di differenti tipi di informazione:
    ■ codice, usato dalle applicazioni per creare le viste o
       interfacce di presentazione
    ■ testo, immagini e video, comprensibili all'uomo




Torino, 9 Marzo 2011                                                            5
Esempio: Wikipedia         NEXA
                                                  Center for Internet & Society




                                            I dati e le
                                            informazioni di
                                            formattazione
                                            sono aggregati e
                                            presentati
                                            all'utilizzatore




                                        I riferimenti
                                        ipertestuali sono
                                        annegati nel
                                        documento




Torino, 9 Marzo 2011                                                          6
Web dei dati   NEXA
                                      Center for Internet & Society




Torino, 9 Marzo 2011                                              7
NEXA
                                                Center for Internet & Society




 ♦ L'elemento atomico di informazione è il dato

 ♦ Al dato non è associata la formattazione: il dato è
    grezzo, “raw”

 ♦ La vista viene creata dal fruitore dell'informazione




Torino, 9 Marzo 2011                                                        8
Esempio: DBpedia    NEXA
                                           Center for Internet & Society




              Wikipedia               DBpedia




Torino, 9 Marzo 2011                                                   9
Dati vs Documenti NEXA   Center for Internet & Society




 ♦ Le informazioni sono strutturate


 ♦ Una macchina può attingere all'informazione grezza
    senza doverla filtrare per rimuovere il rumore




Torino, 9 Marzo 2011                                                     10
Il Web                    NEXA
                                                   Center for Internet & Society




 ♦ Spazio di informazione globale

 ♦ Archivi di dati sparsi per la rete

 ♦ Dati tra loro “linked”, collegati : Linked Data

 ♦ Il fruitore può aggregare e collezionare dati
    provenienti da archivi distribuiti




Torino, 9 Marzo 2011                                                        11
Linked Data                                 NEXA
                                                                                   Center for Internet & Society




Rif. Tim Berners-Lee, "The Great Unveiling" in Long Beach, CA. USA, 4, Feb 2009.

Torino, 9 Marzo 2011                                                                                        12
Esempio di Linked Data                 NEXA
                                                              Center for Internet & Society




 Archivio sui livelli                                Archivio sui livelli
 di ozono nell'aria                                  di traffico della
 della città di Torino          +                    citta di Torino



         Quartiere        Ora   Livello   Numero             ...
                                ozono     macchine




Torino, 9 Marzo 2011                                                                   13
App da data.gov       NEXA
                                                    Center for Internet & Society




http://www.data.gov/semantic/Castnet/html/exhibit
- http://www.data.gov/raw/8
- http://www.data.gov/raw/9

Torino, 9 Marzo 2011                                                         14
Interoperabilità                                  NEXA
                                                                                   Center for Internet & Society




Rif. Tim Berners-Lee, "The Great Unveiling" in Long Beach, CA. USA, 4, Feb 2009.

Torino, 9 Marzo 2011                                                                                        15
Condivisione dei dati NEXA                                       Center for Internet & Society




 ♦ Utilizzo di URI1 per l'identificazione delle risorse

 ♦ Utilizzo del protocollo HTTP per permettere di
       navigare le relazioni e consultare le risorse

 ♦ Uso di standard RDF2 per la rappresentazione delle
       relazioni tra risorse ed un punto di accesso dove
       esplorare le inferenze

 ♦ Creare i collegamenti tra le varie URI al fine di
       scoprire nuovi dati
   1
       URI : Uniform Resource Identifier, è l'indirizzo Web con il quale si identificano le risorse
   2
       RDF: Resource Description Framework, definisce come rappresentare le risorse

Torino, 9 Marzo 2011                                                                                           16
URI                   NEXA
                                                    Center for Internet & Society




http://example.com/over/there?name=ferret#nose

                   autorità   percorso   domanda*

 schema della                                             frammento*
comunicazione




 *: campi opzionali.


 Torino, 9 Marzo 2011                                                        17
RDF                  NEXA
                                                   Center for Internet & Society




 ♦ E' un formalismo con il quale si definiscono le risorse
    e le relazioni tra esse

 ♦ Si basa sul concetto di dichiarazione

 ♦ La dichiarazione è composta da tre elementi,
    tripla: il soggetto, il predicato, l'oggetto

 ♦ Ogni elemento è descritto mediante una URI.
    L'oggetto inoltre può essere descritto da un “literal”
    ossia da una sequenza di caratteri



Torino, 9 Marzo 2011                                                        18
Conclusioni                NEXA
                                                  Center for Internet & Society




 ♦ Il Web dei dati permette di collegare informazioni tra
    archivi di dati non strettamente collegati

 ♦ Dati aperti permettono il libero consumo e la libera
    navigazione da parte del fruitore

 ♦ Dati aperti creano l'infrastruttura su cui il Linked
    Data si basa

 ♦ Il Web ha bisogno di “Raw data now” ma anche di
    dati facili da usare, riusare e distribuire


Torino, 9 Marzo 2011                                                       19
Questioni aperte          NEXA
                                                 Center for Internet & Society




 ♦ Affidabilità dei dati: il Web è uno spazio aperto in cui
    tutti possono aggiungere informazioni. Si demanda
    al fornitore la responsabilità su quello che viene
    pubblicato

 ♦ Dati con riferimenti temporali e spaziali

 ♦ Freschezza dei dati: aggiornati in tempo reale




Torino, 9 Marzo 2011                                                      20
NEXA
                                                    Center for Internet & Society




              Grazie per il vostro tempo e per la vostra
                              attenzione!




Torino, 9 Marzo 2011                                                         21

More Related Content

Viewers also liked

Edisi Nas 23 Jan
Edisi Nas 23 JanEdisi Nas 23 Jan
Edisi Nas 23 Janepaper
 
Edisi5novaceh
Edisi5novacehEdisi5novaceh
Edisi5novacehepaper
 
19 J An N As
19 J An N As19 J An N As
19 J An N Asepaper
 
25desaceh
25desaceh25desaceh
25desacehepaper
 
Waspada Aceh 110909
Waspada  Aceh 110909Waspada  Aceh 110909
Waspada Aceh 110909epaper
 
Double Vision1
Double Vision1Double Vision1
Double Vision1galivebig
 
CrossLanguageSpotter: A Library for Detecting Relations in Polyglot Frameworks
CrossLanguageSpotter: A Library for Detecting Relations in Polyglot FrameworksCrossLanguageSpotter: A Library for Detecting Relations in Polyglot Frameworks
CrossLanguageSpotter: A Library for Detecting Relations in Polyglot FrameworksGiuseppe Rizzo
 
Edisi 17 Feb Medan
Edisi 17 Feb MedanEdisi 17 Feb Medan
Edisi 17 Feb Medanepaper
 
Edisi23oktnas
Edisi23oktnasEdisi23oktnas
Edisi23oktnasepaper
 
Edisi 3 Feb Aceh
Edisi 3 Feb AcehEdisi 3 Feb Aceh
Edisi 3 Feb Acehepaper
 
Edisi19aceh
Edisi19acehEdisi19aceh
Edisi19acehepaper
 
Edisi25sepaceh
Edisi25sepacehEdisi25sepaceh
Edisi25sepacehepaper
 
Edisi12oktnasional
Edisi12oktnasionalEdisi12oktnasional
Edisi12oktnasionalepaper
 
TD presentation ENG 2015_vAC2
TD presentation ENG 2015_vAC2TD presentation ENG 2015_vAC2
TD presentation ENG 2015_vAC2Antonio Carretta
 
Chapter 12 Public Relations
Chapter 12   Public RelationsChapter 12   Public Relations
Chapter 12 Public RelationsJill Falk
 
Edisi 26 Nov Aceh
Edisi 26 Nov AcehEdisi 26 Nov Aceh
Edisi 26 Nov Acehepaper
 
Edisi29oktaceh
Edisi29oktacehEdisi29oktaceh
Edisi29oktacehepaper
 
Joe\'s porfolio of images 2006-2009
Joe\'s porfolio of images 2006-2009Joe\'s porfolio of images 2006-2009
Joe\'s porfolio of images 2006-2009jdtrevino
 

Viewers also liked (20)

Edisi Nas 23 Jan
Edisi Nas 23 JanEdisi Nas 23 Jan
Edisi Nas 23 Jan
 
Edisi5novaceh
Edisi5novacehEdisi5novaceh
Edisi5novaceh
 
19 J An N As
19 J An N As19 J An N As
19 J An N As
 
25desaceh
25desaceh25desaceh
25desaceh
 
Waspada Aceh 110909
Waspada  Aceh 110909Waspada  Aceh 110909
Waspada Aceh 110909
 
Double Vision1
Double Vision1Double Vision1
Double Vision1
 
CrossLanguageSpotter: A Library for Detecting Relations in Polyglot Frameworks
CrossLanguageSpotter: A Library for Detecting Relations in Polyglot FrameworksCrossLanguageSpotter: A Library for Detecting Relations in Polyglot Frameworks
CrossLanguageSpotter: A Library for Detecting Relations in Polyglot Frameworks
 
Edisi 17 Feb Medan
Edisi 17 Feb MedanEdisi 17 Feb Medan
Edisi 17 Feb Medan
 
Edisi23oktnas
Edisi23oktnasEdisi23oktnas
Edisi23oktnas
 
Edisi 3 Feb Aceh
Edisi 3 Feb AcehEdisi 3 Feb Aceh
Edisi 3 Feb Aceh
 
Edisi19aceh
Edisi19acehEdisi19aceh
Edisi19aceh
 
Edisi25sepaceh
Edisi25sepacehEdisi25sepaceh
Edisi25sepaceh
 
Letter Writers
Letter WritersLetter Writers
Letter Writers
 
Nys Arts 2 Toys
Nys Arts 2 ToysNys Arts 2 Toys
Nys Arts 2 Toys
 
Edisi12oktnasional
Edisi12oktnasionalEdisi12oktnasional
Edisi12oktnasional
 
TD presentation ENG 2015_vAC2
TD presentation ENG 2015_vAC2TD presentation ENG 2015_vAC2
TD presentation ENG 2015_vAC2
 
Chapter 12 Public Relations
Chapter 12   Public RelationsChapter 12   Public Relations
Chapter 12 Public Relations
 
Edisi 26 Nov Aceh
Edisi 26 Nov AcehEdisi 26 Nov Aceh
Edisi 26 Nov Aceh
 
Edisi29oktaceh
Edisi29oktacehEdisi29oktaceh
Edisi29oktaceh
 
Joe\'s porfolio of images 2006-2009
Joe\'s porfolio of images 2006-2009Joe\'s porfolio of images 2006-2009
Joe\'s porfolio of images 2006-2009
 

Similar to L'enorme archivio di dati: il Web

Ict days2014 - Open & Big Data un anno dopo #opendata #bigdata #trentino #ict...
Ict days2014 - Open & Big Data un anno dopo #opendata #bigdata #trentino #ict...Ict days2014 - Open & Big Data un anno dopo #opendata #bigdata #trentino #ict...
Ict days2014 - Open & Big Data un anno dopo #opendata #bigdata #trentino #ict...European Commission, Joint Research Centre
 
Open Data in Piemonte Portale web e best practices
Open Data in Piemonte Portale web e best practicesOpen Data in Piemonte Portale web e best practices
Open Data in Piemonte Portale web e best practicesE-R
 
dati.Trentino.it - un anno dopo
dati.Trentino.it - un anno dopodati.Trentino.it - un anno dopo
dati.Trentino.it - un anno dopodatitrentinoit
 
Il Web Semantico applicato agli edifici intelligenti
Il Web Semantico applicato agli edifici intelligentiIl Web Semantico applicato agli edifici intelligenti
Il Web Semantico applicato agli edifici intelligentiFulvio Corno
 
INPS Open Data a ITN 2012
INPS Open Data a ITN 2012INPS Open Data a ITN 2012
INPS Open Data a ITN 2012gattopardi
 
Opendata day Marche 2013
Opendata day Marche 2013Opendata day Marche 2013
Opendata day Marche 2013Carlo Vaccari
 
Lorenzo Benussi - Intelligenza e complessità delle Comunità Intelligenti - Di...
Lorenzo Benussi - Intelligenza e complessità delle Comunità Intelligenti - Di...Lorenzo Benussi - Intelligenza e complessità delle Comunità Intelligenti - Di...
Lorenzo Benussi - Intelligenza e complessità delle Comunità Intelligenti - Di...Cultura Digitale
 
Presentazione opendataforumpa ver 1.1 2012
Presentazione opendataforumpa ver 1.1 2012Presentazione opendataforumpa ver 1.1 2012
Presentazione opendataforumpa ver 1.1 2012gattopardi
 
La Semantica e il Web dei Dati
La Semantica e il Web dei DatiLa Semantica e il Web dei Dati
La Semantica e il Web dei DatiIrene Celino
 
OntoPiA e il knowledge graph della pubblica amministrazione italiana
OntoPiA e il knowledge graph della pubblica amministrazione italianaOntoPiA e il knowledge graph della pubblica amministrazione italiana
OntoPiA e il knowledge graph della pubblica amministrazione italianaGiorgia Lodi
 
Alessandro Nicotra, Seminario Internet Governance
Alessandro Nicotra, Seminario Internet GovernanceAlessandro Nicotra, Seminario Internet Governance
Alessandro Nicotra, Seminario Internet GovernanceAndrea Rossetti
 
Linked Open Data. Definizioni, esempi, esperienze pisane
Linked Open Data. Definizioni, esempi, esperienze pisaneLinked Open Data. Definizioni, esempi, esperienze pisane
Linked Open Data. Definizioni, esempi, esperienze pisaneFrancesca Di Donato
 
Open data per inail presentazione Forum PA - maggio 2012
Open data per inail    presentazione Forum PA - maggio 2012Open data per inail    presentazione Forum PA - maggio 2012
Open data per inail presentazione Forum PA - maggio 2012Pietro Monti
 
P2P systems, torrent, P2P solutions, Course for University of Florence
P2P systems, torrent, P2P solutions, Course for University of FlorenceP2P systems, torrent, P2P solutions, Course for University of Florence
P2P systems, torrent, P2P solutions, Course for University of FlorencePaolo Nesi
 
Laboratorio di Informatica - Lezione 9 (Classi V)
Laboratorio di Informatica - Lezione 9 (Classi V)Laboratorio di Informatica - Lezione 9 (Classi V)
Laboratorio di Informatica - Lezione 9 (Classi V)informaticaOriani
 
ITN Torino settembre 2012 - OpenData Inps - un modello di sviluppo per l'Open...
ITN Torino settembre 2012 - OpenData Inps - un modello di sviluppo per l'Open...ITN Torino settembre 2012 - OpenData Inps - un modello di sviluppo per l'Open...
ITN Torino settembre 2012 - OpenData Inps - un modello di sviluppo per l'Open...INPSDG
 
L’evoluzione di Internet of things
L’evoluzione di Internet of thingsL’evoluzione di Internet of things
L’evoluzione di Internet of thingsCasaleggio Associati
 
Opendata inps
Opendata inps Opendata inps
Opendata inps gattopardi
 

Similar to L'enorme archivio di dati: il Web (20)

Ict days2014 - Open & Big Data un anno dopo #opendata #bigdata #trentino #ict...
Ict days2014 - Open & Big Data un anno dopo #opendata #bigdata #trentino #ict...Ict days2014 - Open & Big Data un anno dopo #opendata #bigdata #trentino #ict...
Ict days2014 - Open & Big Data un anno dopo #opendata #bigdata #trentino #ict...
 
Open Data in Piemonte Portale web e best practices
Open Data in Piemonte Portale web e best practicesOpen Data in Piemonte Portale web e best practices
Open Data in Piemonte Portale web e best practices
 
dati.Trentino.it - un anno dopo
dati.Trentino.it - un anno dopodati.Trentino.it - un anno dopo
dati.Trentino.it - un anno dopo
 
Il Web Semantico applicato agli edifici intelligenti
Il Web Semantico applicato agli edifici intelligentiIl Web Semantico applicato agli edifici intelligenti
Il Web Semantico applicato agli edifici intelligenti
 
INPS Open Data a ITN 2012
INPS Open Data a ITN 2012INPS Open Data a ITN 2012
INPS Open Data a ITN 2012
 
Storia di internet
Storia di internetStoria di internet
Storia di internet
 
Opendata day Marche 2013
Opendata day Marche 2013Opendata day Marche 2013
Opendata day Marche 2013
 
Lorenzo Benussi - Intelligenza e complessità delle Comunità Intelligenti - Di...
Lorenzo Benussi - Intelligenza e complessità delle Comunità Intelligenti - Di...Lorenzo Benussi - Intelligenza e complessità delle Comunità Intelligenti - Di...
Lorenzo Benussi - Intelligenza e complessità delle Comunità Intelligenti - Di...
 
Presentazione opendataforumpa ver 1.1 2012
Presentazione opendataforumpa ver 1.1 2012Presentazione opendataforumpa ver 1.1 2012
Presentazione opendataforumpa ver 1.1 2012
 
La Semantica e il Web dei Dati
La Semantica e il Web dei DatiLa Semantica e il Web dei Dati
La Semantica e il Web dei Dati
 
OntoPiA e il knowledge graph della pubblica amministrazione italiana
OntoPiA e il knowledge graph della pubblica amministrazione italianaOntoPiA e il knowledge graph della pubblica amministrazione italiana
OntoPiA e il knowledge graph della pubblica amministrazione italiana
 
Alessandro Nicotra, Seminario Internet Governance
Alessandro Nicotra, Seminario Internet GovernanceAlessandro Nicotra, Seminario Internet Governance
Alessandro Nicotra, Seminario Internet Governance
 
Presentazione sce
Presentazione scePresentazione sce
Presentazione sce
 
Linked Open Data. Definizioni, esempi, esperienze pisane
Linked Open Data. Definizioni, esempi, esperienze pisaneLinked Open Data. Definizioni, esempi, esperienze pisane
Linked Open Data. Definizioni, esempi, esperienze pisane
 
Open data per inail presentazione Forum PA - maggio 2012
Open data per inail    presentazione Forum PA - maggio 2012Open data per inail    presentazione Forum PA - maggio 2012
Open data per inail presentazione Forum PA - maggio 2012
 
P2P systems, torrent, P2P solutions, Course for University of Florence
P2P systems, torrent, P2P solutions, Course for University of FlorenceP2P systems, torrent, P2P solutions, Course for University of Florence
P2P systems, torrent, P2P solutions, Course for University of Florence
 
Laboratorio di Informatica - Lezione 9 (Classi V)
Laboratorio di Informatica - Lezione 9 (Classi V)Laboratorio di Informatica - Lezione 9 (Classi V)
Laboratorio di Informatica - Lezione 9 (Classi V)
 
ITN Torino settembre 2012 - OpenData Inps - un modello di sviluppo per l'Open...
ITN Torino settembre 2012 - OpenData Inps - un modello di sviluppo per l'Open...ITN Torino settembre 2012 - OpenData Inps - un modello di sviluppo per l'Open...
ITN Torino settembre 2012 - OpenData Inps - un modello di sviluppo per l'Open...
 
L’evoluzione di Internet of things
L’evoluzione di Internet of thingsL’evoluzione di Internet of things
L’evoluzione di Internet of things
 
Opendata inps
Opendata inps Opendata inps
Opendata inps
 

More from Giuseppe Rizzo

Artificial intelligence for social good
Artificial intelligence for social goodArtificial intelligence for social good
Artificial intelligence for social goodGiuseppe Rizzo
 
COMPRENDE, PERSONALIZZA, INTERAGISCE E IMPARA: L’AI COGNITIVA PER L’HR
COMPRENDE, PERSONALIZZA, INTERAGISCE E  IMPARA: L’AI COGNITIVA PER L’HRCOMPRENDE, PERSONALIZZA, INTERAGISCE E  IMPARA: L’AI COGNITIVA PER L’HR
COMPRENDE, PERSONALIZZA, INTERAGISCE E IMPARA: L’AI COGNITIVA PER L’HRGiuseppe Rizzo
 
Understand, Answer and Argument: Conversational Agents
Understand, Answer and Argument: Conversational AgentsUnderstand, Answer and Argument: Conversational Agents
Understand, Answer and Argument: Conversational AgentsGiuseppe Rizzo
 
AI For Profiling Your Customers
AI For Profiling Your CustomersAI For Profiling Your Customers
AI For Profiling Your CustomersGiuseppe Rizzo
 
AI for Personalized Chatbot
AI for Personalized ChatbotAI for Personalized Chatbot
AI for Personalized ChatbotGiuseppe Rizzo
 
Tourist Knowledge Graph Creation to Automating Travel Bookings
Tourist Knowledge Graph Creation to Automating Travel BookingsTourist Knowledge Graph Creation to Automating Travel Bookings
Tourist Knowledge Graph Creation to Automating Travel BookingsGiuseppe Rizzo
 
The SentiME System at the SSA Challenge Task 1
The SentiME System at the SSA Challenge Task 1The SentiME System at the SSA Challenge Task 1
The SentiME System at the SSA Challenge Task 1Giuseppe Rizzo
 
Context-Enhanced Adaptive Entity Linking
Context-Enhanced Adaptive Entity LinkingContext-Enhanced Adaptive Entity Linking
Context-Enhanced Adaptive Entity LinkingGiuseppe Rizzo
 
From Data to Knowledge for Tourists
From Data to Knowledge for TouristsFrom Data to Knowledge for Tourists
From Data to Knowledge for TouristsGiuseppe Rizzo
 
Enabling Visitors to Explore a Smart City
Enabling Visitors to Explore a Smart CityEnabling Visitors to Explore a Smart City
Enabling Visitors to Explore a Smart CityGiuseppe Rizzo
 
NEEL2015 challenge summary
NEEL2015 challenge summaryNEEL2015 challenge summary
NEEL2015 challenge summaryGiuseppe Rizzo
 
Inductive Entity Typing Alignment
Inductive Entity Typing AlignmentInductive Entity Typing Alignment
Inductive Entity Typing AlignmentGiuseppe Rizzo
 
Benchmarking the Extraction and Disambiguation of Named Entities on the Seman...
Benchmarking the Extraction and Disambiguation of Named Entities on the Seman...Benchmarking the Extraction and Disambiguation of Named Entities on the Seman...
Benchmarking the Extraction and Disambiguation of Named Entities on the Seman...Giuseppe Rizzo
 
Learning with the Web. Structuring data to ease machine understanding
Learning with the Web. Structuring data to ease  machine understandingLearning with the Web. Structuring data to ease  machine understanding
Learning with the Web. Structuring data to ease machine understandingGiuseppe Rizzo
 
Learning with the Web: Spotting Named Entities on the intersection of NERD an...
Learning with the Web: Spotting Named Entities on the intersection of NERD an...Learning with the Web: Spotting Named Entities on the intersection of NERD an...
Learning with the Web: Spotting Named Entities on the intersection of NERD an...Giuseppe Rizzo
 
NERD meets NIF: Lifting NLP Extraction Results to the Linked Data Cloud
NERD meets NIF:  Lifting NLP Extraction Results to the Linked Data CloudNERD meets NIF:  Lifting NLP Extraction Results to the Linked Data Cloud
NERD meets NIF: Lifting NLP Extraction Results to the Linked Data CloudGiuseppe Rizzo
 
NERD: Evaluating Named Entity Recognition Tools in the Web of Data
NERD: Evaluating Named Entity Recognition Tools in the Web of DataNERD: Evaluating Named Entity Recognition Tools in the Web of Data
NERD: Evaluating Named Entity Recognition Tools in the Web of DataGiuseppe Rizzo
 
Zenaminer: driving the SCORM tandard towards the Web of Data
Zenaminer: driving the SCORM tandard towards the Web of DataZenaminer: driving the SCORM tandard towards the Web of Data
Zenaminer: driving the SCORM tandard towards the Web of DataGiuseppe Rizzo
 

More from Giuseppe Rizzo (20)

Artificial intelligence for social good
Artificial intelligence for social goodArtificial intelligence for social good
Artificial intelligence for social good
 
AI in 60 minutes
AI in 60 minutesAI in 60 minutes
AI in 60 minutes
 
COMPRENDE, PERSONALIZZA, INTERAGISCE E IMPARA: L’AI COGNITIVA PER L’HR
COMPRENDE, PERSONALIZZA, INTERAGISCE E  IMPARA: L’AI COGNITIVA PER L’HRCOMPRENDE, PERSONALIZZA, INTERAGISCE E  IMPARA: L’AI COGNITIVA PER L’HR
COMPRENDE, PERSONALIZZA, INTERAGISCE E IMPARA: L’AI COGNITIVA PER L’HR
 
Understand, Answer and Argument: Conversational Agents
Understand, Answer and Argument: Conversational AgentsUnderstand, Answer and Argument: Conversational Agents
Understand, Answer and Argument: Conversational Agents
 
AI For Profiling Your Customers
AI For Profiling Your CustomersAI For Profiling Your Customers
AI For Profiling Your Customers
 
AI for Personalized Chatbot
AI for Personalized ChatbotAI for Personalized Chatbot
AI for Personalized Chatbot
 
Tourist Knowledge Graph Creation to Automating Travel Bookings
Tourist Knowledge Graph Creation to Automating Travel BookingsTourist Knowledge Graph Creation to Automating Travel Bookings
Tourist Knowledge Graph Creation to Automating Travel Bookings
 
The SentiME System at the SSA Challenge Task 1
The SentiME System at the SSA Challenge Task 1The SentiME System at the SSA Challenge Task 1
The SentiME System at the SSA Challenge Task 1
 
Context-Enhanced Adaptive Entity Linking
Context-Enhanced Adaptive Entity LinkingContext-Enhanced Adaptive Entity Linking
Context-Enhanced Adaptive Entity Linking
 
From Data to Knowledge for Tourists
From Data to Knowledge for TouristsFrom Data to Knowledge for Tourists
From Data to Knowledge for Tourists
 
Enabling Visitors to Explore a Smart City
Enabling Visitors to Explore a Smart CityEnabling Visitors to Explore a Smart City
Enabling Visitors to Explore a Smart City
 
NEEL2015 challenge summary
NEEL2015 challenge summaryNEEL2015 challenge summary
NEEL2015 challenge summary
 
Inductive Entity Typing Alignment
Inductive Entity Typing AlignmentInductive Entity Typing Alignment
Inductive Entity Typing Alignment
 
Benchmarking the Extraction and Disambiguation of Named Entities on the Seman...
Benchmarking the Extraction and Disambiguation of Named Entities on the Seman...Benchmarking the Extraction and Disambiguation of Named Entities on the Seman...
Benchmarking the Extraction and Disambiguation of Named Entities on the Seman...
 
Learning with the Web. Structuring data to ease machine understanding
Learning with the Web. Structuring data to ease  machine understandingLearning with the Web. Structuring data to ease  machine understanding
Learning with the Web. Structuring data to ease machine understanding
 
Learning with the Web: Spotting Named Entities on the intersection of NERD an...
Learning with the Web: Spotting Named Entities on the intersection of NERD an...Learning with the Web: Spotting Named Entities on the intersection of NERD an...
Learning with the Web: Spotting Named Entities on the intersection of NERD an...
 
NERD meets NIF: Lifting NLP Extraction Results to the Linked Data Cloud
NERD meets NIF:  Lifting NLP Extraction Results to the Linked Data CloudNERD meets NIF:  Lifting NLP Extraction Results to the Linked Data Cloud
NERD meets NIF: Lifting NLP Extraction Results to the Linked Data Cloud
 
The NERD project
The NERD projectThe NERD project
The NERD project
 
NERD: Evaluating Named Entity Recognition Tools in the Web of Data
NERD: Evaluating Named Entity Recognition Tools in the Web of DataNERD: Evaluating Named Entity Recognition Tools in the Web of Data
NERD: Evaluating Named Entity Recognition Tools in the Web of Data
 
Zenaminer: driving the SCORM tandard towards the Web of Data
Zenaminer: driving the SCORM tandard towards the Web of DataZenaminer: driving the SCORM tandard towards the Web of Data
Zenaminer: driving the SCORM tandard towards the Web of Data
 

L'enorme archivio di dati: il Web

  • 1. NEXA Center for Internet & Society L'enorme archivio di dati: il Web Giuseppe Rizzo Dottorando di Ricerca Dipartimento di Automatica ed Informatica Politecnico di Torino Email: giuseppe.rizzo@polito.it 29° Mercoledì di Nexa Centro NEXA su Internet & Società Politecnico di Torino Torino, 9 Marzo 2011
  • 2. Agenda NEXA Center for Internet & Society ♦ Idea ♦ Il Web dei documenti ♦ Il Web dei dati ♦ Linked Data ♦ Come condividere i dati ♦ Conclusioni Torino, 9 Marzo 2011 2
  • 3. Idea NEXA Center for Internet & Society Il Web è uno spazio di informazione globale, un enorme archivio distribuito di dati Torino, 9 Marzo 2011 3
  • 4. Il Web dei documenti NEXA Center for Internet & Society Torino, 9 Marzo 2011 4
  • 5. Documento NEXA Center for Internet & Society ♦ E' l'elemento atomico di scambio dell'informazione ♦ E' il contenitore di differenti tipi di informazione: ■ codice, usato dalle applicazioni per creare le viste o interfacce di presentazione ■ testo, immagini e video, comprensibili all'uomo Torino, 9 Marzo 2011 5
  • 6. Esempio: Wikipedia NEXA Center for Internet & Society I dati e le informazioni di formattazione sono aggregati e presentati all'utilizzatore I riferimenti ipertestuali sono annegati nel documento Torino, 9 Marzo 2011 6
  • 7. Web dei dati NEXA Center for Internet & Society Torino, 9 Marzo 2011 7
  • 8. NEXA Center for Internet & Society ♦ L'elemento atomico di informazione è il dato ♦ Al dato non è associata la formattazione: il dato è grezzo, “raw” ♦ La vista viene creata dal fruitore dell'informazione Torino, 9 Marzo 2011 8
  • 9. Esempio: DBpedia NEXA Center for Internet & Society Wikipedia DBpedia Torino, 9 Marzo 2011 9
  • 10. Dati vs Documenti NEXA Center for Internet & Society ♦ Le informazioni sono strutturate ♦ Una macchina può attingere all'informazione grezza senza doverla filtrare per rimuovere il rumore Torino, 9 Marzo 2011 10
  • 11. Il Web NEXA Center for Internet & Society ♦ Spazio di informazione globale ♦ Archivi di dati sparsi per la rete ♦ Dati tra loro “linked”, collegati : Linked Data ♦ Il fruitore può aggregare e collezionare dati provenienti da archivi distribuiti Torino, 9 Marzo 2011 11
  • 12. Linked Data NEXA Center for Internet & Society Rif. Tim Berners-Lee, "The Great Unveiling" in Long Beach, CA. USA, 4, Feb 2009. Torino, 9 Marzo 2011 12
  • 13. Esempio di Linked Data NEXA Center for Internet & Society Archivio sui livelli Archivio sui livelli di ozono nell'aria di traffico della della città di Torino + citta di Torino Quartiere Ora Livello Numero ... ozono macchine Torino, 9 Marzo 2011 13
  • 14. App da data.gov NEXA Center for Internet & Society http://www.data.gov/semantic/Castnet/html/exhibit - http://www.data.gov/raw/8 - http://www.data.gov/raw/9 Torino, 9 Marzo 2011 14
  • 15. Interoperabilità NEXA Center for Internet & Society Rif. Tim Berners-Lee, "The Great Unveiling" in Long Beach, CA. USA, 4, Feb 2009. Torino, 9 Marzo 2011 15
  • 16. Condivisione dei dati NEXA Center for Internet & Society ♦ Utilizzo di URI1 per l'identificazione delle risorse ♦ Utilizzo del protocollo HTTP per permettere di navigare le relazioni e consultare le risorse ♦ Uso di standard RDF2 per la rappresentazione delle relazioni tra risorse ed un punto di accesso dove esplorare le inferenze ♦ Creare i collegamenti tra le varie URI al fine di scoprire nuovi dati 1 URI : Uniform Resource Identifier, è l'indirizzo Web con il quale si identificano le risorse 2 RDF: Resource Description Framework, definisce come rappresentare le risorse Torino, 9 Marzo 2011 16
  • 17. URI NEXA Center for Internet & Society http://example.com/over/there?name=ferret#nose autorità percorso domanda* schema della frammento* comunicazione *: campi opzionali. Torino, 9 Marzo 2011 17
  • 18. RDF NEXA Center for Internet & Society ♦ E' un formalismo con il quale si definiscono le risorse e le relazioni tra esse ♦ Si basa sul concetto di dichiarazione ♦ La dichiarazione è composta da tre elementi, tripla: il soggetto, il predicato, l'oggetto ♦ Ogni elemento è descritto mediante una URI. L'oggetto inoltre può essere descritto da un “literal” ossia da una sequenza di caratteri Torino, 9 Marzo 2011 18
  • 19. Conclusioni NEXA Center for Internet & Society ♦ Il Web dei dati permette di collegare informazioni tra archivi di dati non strettamente collegati ♦ Dati aperti permettono il libero consumo e la libera navigazione da parte del fruitore ♦ Dati aperti creano l'infrastruttura su cui il Linked Data si basa ♦ Il Web ha bisogno di “Raw data now” ma anche di dati facili da usare, riusare e distribuire Torino, 9 Marzo 2011 19
  • 20. Questioni aperte NEXA Center for Internet & Society ♦ Affidabilità dei dati: il Web è uno spazio aperto in cui tutti possono aggiungere informazioni. Si demanda al fornitore la responsabilità su quello che viene pubblicato ♦ Dati con riferimenti temporali e spaziali ♦ Freschezza dei dati: aggiornati in tempo reale Torino, 9 Marzo 2011 20
  • 21. NEXA Center for Internet & Society Grazie per il vostro tempo e per la vostra attenzione! Torino, 9 Marzo 2011 21