HCI 2018 (3/10) Design Models, Methodologies and Guidelines
Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data
1. Linked Open Data
Dr. Sabin Buragawww.purl.org/net/busaco
Dezvoltarea aplicațiilor Web
2. Mariano José de Larra
Dr. Sabin Buragawww.purl.org/net/busaco
“E mai ușor să negi lucrurile,
decât să te informezi despre ele.”
3. anyone can say anything about anything
no one knows everything about anything
my system is most valuable
because of its interconnection to its peers
Dr. Sabin Buragawww.purl.org/net/busaco
Web attitude (Tim Berners-Lee)
4. Centrate pe documente
expoziţii virtuale, ştiri, e-travel
Tranzacționale
e-banking, soluţii B2B, workflow-uri
Colaborative
chat, e-learning, servicii peer-to-peer, wiki,…
Orientate spre portaluri
comunități, pentru afaceri, Web cetățenesc etc.
De tip ubicuu
servicii bazate pe locație, multi-platformă, în timp-real
cloud computing
Web social
spații virtuale, activități colaborative, tagging de resurse,
volum mare de date (big data)
Web semantic (Web of data)
date structurate, recomandare & mediatizare,
servicii contextuale, aplicații smart
management de cunoștințe + raționament automat
evoluția în timp a complexității
Interactive
Dr. Sabin Buragawww.purl.org/net/busaco
pagini statice, situri de companii
5. A fi stocat pe Web
(“on the Web”)
ca document “opac”
– disponibil într-un format proprietar sau nu –
fără a referi, pe baza standardelor Web,
alte resurse de interes
Dr. Sabin Buragawww.purl.org/net/busaco
disponibilitatea datelor la nivel de Web
6. A fi descoperibil pe baza standardelor Web
(“in the Web”)
folosind modele/formate de date deschise
(e.g., HTML, XML, JSON, RDF etc.)
aliniate principiilor hipertextului/hipermedia,
procesabile independent de platformă
Dr. Sabin Buragawww.purl.org/net/busaco
disponibilitatea datelor la nivel de Web
11. Achiziția (acquiring)
aplicațiile Web trebuie să preia
informații și/sau cunoștințe,
nu date brute – lipsite de semnificație
Dr. Sabin Buragawww.purl.org/net/busaco
managementul cunoștințelor
12. Achiziția (acquiring)
aplicațiile Web trebuie să preia
informații și/sau cunoștințe,
nu date brute – lipsite de semnificație
e.g., texte (formatate) preluate din formulare
Dr. Sabin Buragawww.purl.org/net/busaco
managementul cunoștințelor
13. Achiziția (acquiring)
aplicațiile Web trebuie să preia
informații și/sau cunoștințe,
nu date brute – lipsite de semnificație
utilizatorii obișnuiți nu vor marca datele
în formate precum HTML sau JSON, XML, RDF etc.
Dr. Sabin Buragawww.purl.org/net/busaco
managementul cunoștințelor
14. Dr. Sabin Buragawww.purl.org/net/busaco
de la limbaj natural la modele conceptuale modelate
via RDF – proiectul FRED (F. Draicchio et al., 2012)
http://wit.istc.cnr.it/stlab-tools/fred
16. Modelarea (modelling)
conceptele trebuie stocate ca date structurate
ideal, fiecare fragment de informație trebuie modelat
riguros la nivel semantic
conform
expresivității dorite
Dr. Sabin Buragawww.purl.org/net/busaco
managementul cunoștințelor
17. Modelarea (modelling)
conceptele trebuie stocate ca date structurate
ideal, fiecare fragment de informație trebuie modelat
riguros la nivel semantic
Dr. Sabin Buragawww.purl.org/net/busaco
managementul cunoștințelor
în practică, acest aspect este aproape imposibil
(vezi dificultățile de dezambiguizare a limbajului natural)
19. Modelarea (modelling)
Dr. Sabin Buragawww.purl.org/net/busaco
managementul cunoștințelor
pași de urmat:
identificarea categoriilor (claselor) de resurse,
definirea proprietăților + restricțiilor,
completarea – (semi)automată a – datelor despre indivizi:
input explicit, data mining, tagging,
microdate HTML5, RDFa etc.
detalii în
cursurile viitoare
20. Obținerea (retrieving)
mecanisme de interogare și filtrare a cunoștințelor
Dr. Sabin Buragawww.purl.org/net/busaco
managementul cunoștințelor
21. Obținerea (retrieving)
oferirea de suport pentru efectuarea de agregări,
procesări și extrageri de date/informații/cunoștințe,
în manieră (semi)automată,
pe baza meta-datelor și relațiilor dintre entități
Dr. Sabin Buragawww.purl.org/net/busaco
managementul cunoștințelor
22. Reutilizarea (reusing)
fiecare entitate trebuie definită doar o singură dată
identificată printr-un URI
Dr. Sabin Buragawww.purl.org/net/busaco
managementul cunoștințelor
23. De ce este mai „bun” un URL precum
http://business.data.gov.uk/id/company/04285910
decât înregistrarea
SHA PCT PRACTICE BNF CODE BNF NAME ITEMS NIC ACT COST
Q30 5D7 A86003 0101010G0AAABAB Co-Magaldrox_Susp 195mg/220mg/5ml S/F
Phil Archer (2013) – www.w3.org/2013/Talks/1016_phila_ldpoint/
Dr. Sabin Buragawww.purl.org/net/busaco
managementul cunoștințelor
24. De ce este mai „bun” un URL precum
http://business.data.gov.uk/id/company/04285910
decât înregistrarea
SHA PCT PRACTICE BNF CODE BNF NAME ITEMS NIC ACT COST
Q30 5D7 A86003 0101010G0AAABAB Co-Magaldrox_Susp 195mg/220mg/5ml S/F
“because you can look it up; because you can refer to a URI
in any context, unlike 'Q30' which only means something
in a specific context”
Phil Archer (2013) – www.w3.org/2013/Talks/1016_phila_ldpoint/
Dr. Sabin Buragawww.purl.org/net/busaco
managementul cunoștințelor
25. Reutilizarea (reusing)
datele trebuie să poată fi accesate la nivel global
oferirea seturilor de date (data sets) deschise
Dr. Sabin Buragawww.purl.org/net/busaco
managementul cunoștințelor
26. Reutilizarea (reusing)
datele trebuie să poată fi accesate la nivel global
oferirea seturilor de date (data sets) deschise
aspecte importante:
disponibilitate în formate standardizate
politici de acces – copyright, proveniență, licențiere
confidențialitate (privacy)
Dr. Sabin Buragawww.purl.org/net/busaco
managementul cunoștințelor
27. Reutilizarea (reusing)
depinde și de utilizabilitatea sistemului
Dr. Sabin Buragawww.purl.org/net/busaco
managementul cunoștințelor
formate alternative oferind o sintaxă simplă, standardizată
query by example
interacțiune naturală
flexibilitate – e.g., oferirea de sugestii
etc.
29. Publicarea (publishing)
datele/informațiile/cunoștintele trebuie să poată fi
publicate în formate standardizate deschise,
care să încurajeze refolosirea în alte contexte
de considerat atât utilizatorii umani, cât și aplicațiile
Dr. Sabin Buragawww.purl.org/net/busaco
managementul cunoștințelor
30. Mentenanță (maintaining)
necesitatea existenței unor servicii care să asigure
consistența datelor/cunoștințelor
serviciile automate se pot baza pe instrumente
de efectuare a raționamentelor (reasoners)
Dr. Sabin Buragawww.purl.org/net/busaco
managementul cunoștințelor
38. Dr. Sabin Buragawww.purl.org/net/busaco
aplicații rdf: SWAML
Extragerea datelor din mesaje de e-mail, în vederea
interogării, reutilizării & publicării ulterioare
(Sergio Fernández et al., 2009)
procesează datele în format mailbox (RFC 4155) și
oferă descrieri RDF ale mesajelor, listelor de distribuție
și persoanelor, bazându-se pe SIOC
interogări via SPARQL, publicare folosind RDFa
40. Management colaborativ al conținutului
modelat semantic (semantic wikis)
Semantic MediaWiki
extensie a sistemului MediaWiki:
permite adnotarea semantică a conținutului unui wiki
http://semantic-mediawiki.org/
Dr. Sabin Buragawww.purl.org/net/busaco
aplicații rdf: semantic mediawiki
41. Idee:
asocierea de perechi proprietate—valoare
fiecărui fragment de informație dintr-un wiki
The title of this book is '''[[Has Title::Cloud Atlas]]'''
Dr. Sabin Buragawww.purl.org/net/busaco
aplicații rdf: semantic mediawiki
42. Utilizări în special în e-science
(arheologie, biologie, biomedicină,…)
și în domeniul guvernamental, inclusiv în e-learning
http://semantic-mediawiki.org/wiki/Semantic_MediaWiki_publications
Dr. Sabin Buragawww.purl.org/net/busaco
aplicații rdf: semantic mediawiki
43. De la conținut colaborativ la adnotare semantică
(Christian Bizer et al.)
constituie o bază de cunoștințe
versiunea în limba engleză:
descrieri a peste 4 milioane de „lucruri” (things) via RDF
conținut disponibil în 119 limbi – 25 milioane de „things”
Dr. Sabin Buragawww.purl.org/net/busaco
aplicații rdf: dbpedia
44. De la conținut colaborativ la adnotare semantică
(Christian Bizer et al.)
recurge la diverse modele conceptuale
vizând mai multe domenii
acces via SPARQL:
http://wiki.dbpedia.org/OnlineAccess?v=d8c
Dr. Sabin Buragawww.purl.org/net/busaco
aplicații rdf: dbpedia
45. surse de date care referă alte entități DBpedia
conform Bizer et al., 2009
Dr. Sabin Buragawww.purl.org/net/busaco
aplicatii rdf: exemplificari
46. Extractori pentru procesarea tipurilor de conținuturi
oferite de Wikipedia
labelsrdfs:label, interlanguage links, redirects,
imagesfoaf:depiction, geo-coordinates,
disambiguationdbpedia:disambiguates,
external linksdbpedia:reference,
pagelinksdbpedia:wikilink etc.
DBpedia Information Extraction Framework
implementat inițial în PHP, actualmente în Scala
Dr. Sabin Buragawww.purl.org/net/busaco
aplicații rdf: dbpedia
49. Freebase (preluat de Google în 2011)
model de date specificat semantic, în mod colaborativ
expune seturi de triple RDF
Dr. Sabin Buragawww.purl.org/net/busaco
aplicații rdf: freebase
oferă un API deschis + limbaj de interogare propriu: MQL
utilizatorii finali nu trebuie să aibă cunoștințe
privitoare la Web-ul semantic
50. restaurantele din
preajma Bucureștiului
detalii pentru dezvoltatorii de aplicații la
https://developers.google.com/freebase/
Dr. Sabin Buragawww.purl.org/net/busaco
linked data: aplicatii reale
53. Paradigmă de publicare a datelor pe Web
care recurge la tehnologiile Web existente
Dr. Sabin Buragawww.purl.org/net/busaco
linked data
Tom Heath & Christian Bizer, Linked Data: Evolving
the Web into a Global Data Space, Morgan & Claypool, 2011
http://linkeddatabook.com/book
54. Paradigmă de publicare a datelor pe Web
care recurge la tehnologiile Web existente
reducerea redundanței
facilitarea reutilizării
permiterea descoperirii
maximizarea inter-conectivității între “lucruri” înrudite
adoptarea unei viziuni pragmatice
Dr. Sabin Buragawww.purl.org/net/busaco
linked data
55. Viziune:
Use the Web of Data as a Content Management System
Use the community at large as content editors
Ivan Herman (2013) – http://www.w3.org/2013/Talks/0902-Lisbon-IH/
Dr. Sabin Buragawww.purl.org/net/busaco
linked data
56. Ingrediente de bază:
identificare – URI
acces – HTTP
modelare – RDF
structurare – schema.org, RDFa, RDF Schema, OWL
Dr. Sabin Buragawww.purl.org/net/busaco
linked data
57. un „nor” al datelor interconectate extrase din DBpedia
exemplu furnizat de R. Meymandpour & J. Davis (2013)
Dr. Sabin Buragawww.purl.org/net/busaco
linked data
58. Utilizarea URI-urilor pentru numirea “lucrurilor”
specificarea via URI a oricăror resurse
– informaționale sau non-informaționale –,
nu doar a documentelor
identitate unică la nivel global
http://www.w3.org/DesignIssues/LinkedData.html
Dr. Sabin Buragawww.purl.org/net/busaco
linked data: principii (Berners-Lee)
59. Folosirea de URI-uri ce pot fi vehiculate via HTTP
orice URI are un proprietar:
persoană, organizație, specificație,…
utilizatorii/aplicațiile pot localiza resursele
(oricine posedă un browser/client Web)
http://www.w3.org/DesignIssues/LinkedData.html
Dr. Sabin Buragawww.purl.org/net/busaco
linked data: principii (Berners-Lee)
60. Oferirea de informații utile în format RDF
atunci când o agent (entitate) accesează un URI,
poate “afla” (meta-)date de interes
http://www.w3.org/DesignIssues/LinkedData.html
Dr. Sabin Buragawww.purl.org/net/busaco
linked data: principii (Berners-Lee)
61. Includerea în reprezentarea RDF
a unor legături spre alte URI-uri
facilitarea descoperirii de informații înrudite
(network effect)
http://www.w3.org/DesignIssues/LinkedData.html
Dr. Sabin Buragawww.purl.org/net/busaco
linked data: principii (Berners-Lee)
62. S. Buraga, „De câte stele sunt datele d-voastră?” (2012)
www.slideshare.net/busaco/de-cte-stele-sunt-datele-dvoastra
Dr. Sabin Buragawww.purl.org/net/busaco
date de 5 stele (5 ★ Open Data)
63. conținutul e disponibil pe Web – indiferent de
format – conform unei licențe deschise
Dr. Sabin Buragawww.purl.org/net/busaco
date de 1 stea
64. documentul în sine poate fi partajat via Internet
Dr. Sabin Buragawww.purl.org/net/busaco
utilizatorii pot vizualiza, lista,
stoca local și, eventual, modifica documentul
65. pentru a refolosi datele incluse în document
sunt necesare uneori procesări suplimentare
Dr. Sabin Buragawww.purl.org/net/busaco
documentul poate fi publicat rapid & facil pe Web
66. suplimentar, conținutul este disponibil pe Web
într-un format structurat
Dr. Sabin Buragawww.purl.org/net/busaco
date de 2 stele
67. documentul poate fi exportat în alt format
(structurat sau nu)
Dr. Sabin Buragawww.purl.org/net/busaco
utilizatorii pot procesa documentul
– folosind, uzual, software proprietar
68. datele sunt în continuare “încuiate” în document,
procesarea depinzând de un anumit program
Dr. Sabin Buragawww.purl.org/net/busaco
documentul poate fi încă publicat facil pe Web
69. recurgerea la un format deschis
pentru a pune la dispoziție pe Web date
Dr. Sabin Buragawww.purl.org/net/busaco
date deschise de 3 stele
70. asigurarea independenței de platforma software
Dr. Sabin Buragawww.purl.org/net/busaco
datele pot fi gestionate (vizualizate, filtrate, procesate,
convertite, refolosite etc.) în orice manieră
71. exportarea datelor într-un format proprietar
ar putea fi problematică
Dr. Sabin Buragawww.purl.org/net/busaco
în continuare, documentul poate fi publicat facil pe Web
72. adoptarea identificatorilor de resurse (URI-uri)
pentru a desemna “lucruri” de interes
Dr. Sabin Buragawww.purl.org/net/busaco
date deschise de 4 stele
74. “data in the Web”implicații pe termen lung
Dr. Sabin Buragawww.purl.org/net/busaco
publicarea poate fi relativ mai dificilă,
necesitând de obicei adoptarea de instrumente și
metodologii specifice tehnologiilor Web-ului semantic
75. în plus, datele sunt inter-relaționate
conform principiilor inițiativei linked data
Dr. Sabin Buragawww.purl.org/net/busaco
date deschise de 5 stele
76. se oferă premisele efectuării de raționamente automate
direct la nivel de Web pe baza modelelor conceptuale
exprimate standardizat via SKOS, OWL,…
Dr. Sabin Buragawww.purl.org/net/busaco
posibilitatea descoperirii altor date de interes (înrudite)
direct la momentul procesării
77. probleme legate de adopția lentă de către industrie
Dr. Sabin Buragawww.purl.org/net/busaco
dificultăți:
consistența & reconcilierea datelor și cunoștințelor
79. Dr. Sabin Buragawww.purl.org/net/busaco
linked data: studiu de caz
Publicarea pe Web a datelor interconectate
referitoare la whisky – conform (Tom Heath, 2009)
existența unui magazin virtual destinat connoisseur-ului
afacere online – wiskii.com – fondată de Jeff
informații furnizate de experți ai domeniului
contribuții realizate și de către utilizatori obișnuiți
implementare bazată pe un server de aplicații Web
date stocate relațional
acces simultan la date în HTML și RDF
80. 1. înțelegerea principiilor linked data
2. înțelegerea (conceptualizarea) datelor
3. alegerea URI-urilor pentru “lucrurile” de interes
4. stabilirea infrastructurii
5. relaționarea cu alte seturi de date existente
6. descrierea & publicarea datelor
Dr. Sabin Buragawww.purl.org/net/busaco
linked data: studiu de caz
81. Care sunt aspectele principale care trebuie
surprinse privind datele aplicației Web?
Dr. Sabin Buragawww.purl.org/net/busaco
linked data: studiu de caz
82. Care sunt aspectele principale care trebuie
surprinse privind datele aplicației Web?
persoane?
locații geografice?
artefacte culturale?
comentarii? evaluări?
etc.
Dr. Sabin Buragawww.purl.org/net/busaco
linked data: studiu de caz
83. Aspecte – concepte – de interes privind
baza de cunoștințe utilizată de aplicația wiskii.com
distilerii, regiuni & locații geografice, fondatori,
proprietari, brand-uri, produse, fotografii,
evaluări (review-uri), comentarii, prețuri & oferte
Dr. Sabin Buragawww.purl.org/net/busaco
linked data: studiu de caz
84. Descrierea datelor pe baza vocabularelor
principii:
reutilizarea, nu inventarea unui alt vocabular
combinarea vocabularelor existente
Dr. Sabin Buragawww.purl.org/net/busaco
linked data: studiu de caz
85. Descrierea datelor pe baza vocabularelor
în contextul studiului de caz,
potențiale modele conceptuale ce pot fi folosite:
Geonames – http://www.geonames.org/ontology
GoodRelations
FOAF (Friend Of A Friend)
Review – http://vocab.org/review/
SIOC (Semantically-Interconnected Online Communities)
Whisky – http://vocab.org/whisky/
Dr. Sabin Buragawww.purl.org/net/busaco
linked data: studiu de caz
86. URI
http://purl.org/stuff/rev#Comment
http://purl.org/stuff/rev#Feedback
http://purl.org/stuff/rev#Review
http://purl.org/stuff/rev#commenter
http://purl.org/stuff/rev#hasReview
Description
A comment on a review.
Feedback on the review.
A review of an work.
The commenter on the review.
Associates a work with a a review.
Used to associate a review with a
hasComment http://purl.org/stuff/rev#hasComment
comment on the review.
Associates a review with a feedback on
hasFeedback http://purl.org/stuff/rev#hasFeedback
the review.
maxRating
A numeric value.
http://purl.org/stuff/rev#maxRating
minRating
A numeric value.
http://purl.org/stuff/rev#minRating
Number of positive usefulness votes
positiveVotes http://purl.org/stuff/rev#positiveVotes
(integer).
rating
A numeric value.
http://purl.org/stuff/rev#rating
reviewer
The person that has written the review.
http://purl.org/stuff/rev#reviewer
text
The text of the review.
http://purl.org/stuff/rev#text
title
The title of the review.
http://purl.org/stuff/rev#title
totalVotes
Number of usefulness votes (integer).
http://purl.org/stuff/rev#totalVotes
type
The type of media of a work under review.
http://purl.org/stuff/rev#type
concepte & proprietăți definite de vocabularul Review
Dr. Sabin Buragawww.purl.org/net/busaco
Term
Comment
Feedback
Review
commenter
hasReview
87. Descrierea datelor pe baza vocabularelor
vocabularele (tipurile de date) definite pot avea ulterior
atașate specificații formale
Dr. Sabin Buragawww.purl.org/net/busaco
linked data: studiu de caz
88. Alegerea URI-urilor corespunzătoare
principii:
recurgerea la schema HTTP pentru facilitarea accesului
http://vocab.org/whisky/terms/Brand
versus
urn:whisky-vocab:brand
Dr. Sabin Buragawww.purl.org/net/busaco
linked data: studiu de caz
90. Alegerea URI-urilor corespunzătoare
principii:
abstractizare – evitarea detaliilor de implementare
http://dbpedia.org/resource/Romania
versus
http://www4.wiwiss.fu-berlin.de:2020/demos/dbpedia/cgi-bin/
resources.php?id=Romania
Dr. Sabin Buragawww.purl.org/net/busaco
linked data: studiu de caz
91. Alegerea URI-urilor corespunzătoare
principii:
folosirii unei singure convenții de referire
# (hash) sau / (slash)
http://undeva.info/foaf.rdf#me
versus
http://undeva.info/id/me
Dr. Sabin Buragawww.purl.org/net/busaco
linked data: studiu de caz
93. Exemplificări (clasă + instanță):
regiuni
distilerii
brand-uri
produse
persoane
fotografii
review-uri
http://wiskii.com/regions/speyside
http://wiskii.com/distilleries/talisker
http://wiskii.com/brands/talisker
http://wiskii.com/products/talisker-10-yo
http://wiskii.com/people/william-matheson
http://wiskii.com/photos/58
http://wiskii.com/reviews/271
Dr. Sabin Buragawww.purl.org/net/busaco
linked data: studiu de caz
94. Accesul la o anumită reprezentare – exemple:
concept
date RDF
pagină HTML
http://wiskii.com/brands/talisker
http://wiskii.com/brands/talisker/rdf
http://wiskii.com/brands/talisker/html
Dr. Sabin Buragawww.purl.org/net/busaco
linked data: studiu de caz
99. HTTP GET
HTTP 303 See Other
Dr. Sabin Buragawww.purl.org/net/busaco
linked data: studiu de caz
HTTP 303 See Other
http://wiskii.com/brands/talisker
HTML
http://wiskii.com/brands/talisker/html
RDF
aplicație
Web
date
http://wiskii.com/brands/talisker/rdf
content
negotiation
100. Instrumente utile la http://linkeddata.org/tools
a se parcurge și http://www.w3.org/wiki/LinkedData
Dr. Sabin Buragawww.purl.org/net/busaco
linked data: studiu de caz
101. Relaționarea cu alte seturi de date
de revăzut “norul” linked data – http://lod-cloud.net/
Dr. Sabin Buragawww.purl.org/net/busaco
linked data: studiu de caz
102. Relaționarea cu alte seturi de date
informațiile privitoare la fiecare set de date RDF
pot fi explorate via CKAN
(Comprehensive Knowledge Archive Network)
http://ckan.org/
http://thedatahub.org/
Dr. Sabin Buragawww.purl.org/net/busaco
linked data: studiu de caz
103. Relaționarea cu alte seturi de date
aspecte de interes privind vocabularele publice:
gradul de utilizare
mentenanța
aplicabilitatea
expresivitatea
Dr. Sabin Buragawww.purl.org/net/busaco
linked data: studiu de caz
104. Relaționarea cu alte seturi de date
predicate generice folosite uzual:
owl:sameAs
foaf:homepage, foaf:topic, foaf:based_near, foaf:maker,
foaf:depiction, foaf:primaryTopic,…
rdfs:seeAlso
Dr. Sabin Buragawww.purl.org/net/busaco
linked data: studiu de caz
105. Relaționarea cu alte seturi de date – exemplificare:
Dr. Sabin Buragawww.purl.org/net/busaco
linked data: studiu de caz
106. <http://dbpedia.org/resource/Kolkata>
owl:sameAs freebase:Kolkata ;
owl:sameAs <http://sws.geonames.org/1275004> ;
owl:sameAs <http://ru.dbpedia.org/resources/Калькутта> ;
...
<http://sws.geonames.org/1275004>
rdfs:seeAlso <http://dbpedia.org/resource/Kolkata>
wgs84_pos:lat "22.56263" ;
wgs84_pos:long "88.36304" ;
gn:parentCountry <http://sws.geonames.org/1269750> ;
...
după Ivan Herman (2013)
Dr. Sabin Buragawww.purl.org/net/busaco
Relații între diverse resurse din seturi de date diferite:
107. Descrierea & publicarea datelor interconectate
voiD (Vocabulary of Interlinked Datasets)
K. Alexander, R. Cyganiak, M. Hausenblas & J. Zhao, 2010
http://www.w3.org/2001/sw/interest/void/
Dr. Sabin Buragawww.purl.org/net/busaco
linked data
108. Calitatea datelor
Disponibilitatea și stabilitatea setului de date
Publicarea direct pe situl public
don’t repeat
yourself
Claritate privind termenii de utilizare (licențiere)
Existența aplicațiilor
Dr. Sabin Buragawww.purl.org/net/busaco
linked data: cerințe (Health & Bizer)
110. 639 vs. 2289 seturi de date
1,7 miliarde vs. 62 miliarde de triple RDF
49,8% vs. 61,9% date având erori
statistici vizând linked open data (12 noiembrie 2013)
http://stats.lod2.eu/
Dr. Sabin Buragawww.purl.org/net/busaco
linked data: studiu de caz
111. Aspecte privind cele mai bune practici:
identificarea resurselor – identifier patterns
modelare – modelling patterns
publicare a datelor – publishing patterns
management al datelor – data management patterns
dezvoltare de aplicații – application patterns
Dr. Sabin Buragawww.purl.org/net/busaco
linked data
112. Mai multe detalii:
Leigh Dodds & Ian Davis, Linked Data Patterns. A pattern
catalogue for modelling, publishing, and consuming
Linked Data, 2012:
http://patterns.dataincubator.org/
a se studia și http://schoolofdata.org/handbook/
Dr. Sabin Buragawww.purl.org/net/busaco
linked data
115. Depanarea (inspectarea triplelor) RDF
manuală
eventual, preluând datele – în stilul REST –
via cURL sau un instrument similar
Dr. Sabin Buragawww.purl.org/net/busaco
linked data: testare & depanare
116. Depanarea (inspectarea triplelor) RDF
recurgerea la un hyperdata (semantic) browser
e.g., instrumentul OpenLink Data Explorer ca extensie
a unui navigator Web actual – http://ode.openlinksw.com/
Dr. Sabin Buragawww.purl.org/net/busaco
linked data: testare & depanare
122. Revyu.com
Semantic Web reviewing and rating site
(T. Health & E. Motta, 2008)
permite integrarea datelor evaluate de utilizatori
review-urile sunt stocate + publicate transparent în RDF
(utilizatorii finali introduc datele în mod tradițional)
Dr. Sabin Buragawww.purl.org/net/busaco
linked data: aplicații
123. Revyu.com
recurge la vocabulare ca Review, FOAF (Friend Of A
Friend), SKOS (Simple Knowledge Organizational System)
interogări pe baza unui punct terminal SPARQL
interconectare cu alte seturi de date:
DBpedia, OpenGuides, RDF Book Mashup etc.
Dr. Sabin Buragawww.purl.org/net/busaco
linked data: aplicații
124. Proiectul Europeana
inițiativă de prezervare a conținutul cultural
reprezentativ din statele europene
acces deschis la date interconectate
via data.europeana.eu
Dr. Sabin Buragawww.purl.org/net/busaco
linked data: aplicații
126. myExperiment (David De Roure et al.)
aplicație Web colaborativă – bazată pe Ruby on Rails –
pentru managementul workflow-urilor științifice
și a altor obiecte vizând cercetarea
modelarea datelor se bazează pe RDF:
http://rdf.myexperiment.org/
acces la date publice via SPARQL
Dr. Sabin Buragawww.purl.org/net/busaco
linked data: aplicații
128. Inițiativele semantic (open) e-government
linked data în contextul informațiilor publice ale UK:
http://data.gov.uk/linked-data
un proiect similar:
USA – http://www.data.gov/developers/page/semantic-web
de studiat și prezentările lui Richard Wallis:
www.slideshare.net/rjw
Dr. Sabin Buragawww.purl.org/net/busaco
linked data: aplicații
129. acces la date publice oficiale după gradul de deschidere
(openness score)
http://data.gov.uk/data/search?openness_score=5
Dr. Sabin Buragawww.purl.org/net/busaco
linked data: aplicații
130. Dr. Sabin Buragawww.purl.org/net/busaco
linked data: aplicații
SIGMA (SemantIc Government Mashup Application)
Claudia Gheorghiu, Radu Nicolescu, Andrei Vasile Bogdan,
Cristian Ochișor, Sabin Buraga, Lenuța Alboaie (2011)
platformă Web extensibilă capabilă să creeze mashup-uri
oferind acces la date guvernamentale deschise
includerea unei soluții proprii de acces via un end-point
SPARQL la date guvernamentale preluate de la gov.ro
132. Alte utilizări – conform Stefan Decker et al., 2012:
mass-media
BBC, Guardian, New York Times
publicații academice
CrossRef, Nature
biblioteci (digitale)
Library of Congress, SUDOC (Franța), Vatican,…
Dr. Sabin Buragawww.purl.org/net/busaco
linked data: aplicații
133. Pentru diverse exemplificări, a se consulta și lucrările
atelierelor de lucru LDOW (Linked Data on the Web)
http://events.linkeddata.org/ldow2013/
http://events.linkeddata.org/ldow2012/
http://events.linkeddata.org/ldow2011/
Dr. Sabin Buragawww.purl.org/net/busaco
linked data: aplicații
134. “Software – as a service or not – is just a container.
What makes software valuable has always been what
it does to data. Now, in the same spirit of SOA and SaaS,
a new concept is emerging, Data-as-a-Service – DaaS.”
Pete Soderling, august 2010
http://goo.gl/S4dYy
Dr. Sabin Buragawww.purl.org/net/busaco
“concluzii”
135. aplicații bazate pe Web of data
arhitectură, linked data, studii de caz
Dr. Sabin Buragawww.purl.org/net/busaco
rezumat