4. 1. Data?
• Råmaterial för digitala tjänster
• Strukturerad information i form av t.ex.
bilder, text, siffror mm.
5.
6. 2. PSI?
• Public Sector Information – ”data från offentlig
sektor”
• PSI-direktivet
• PSI-lagen – Lag (2010:566) om
vidareutnyttjande av handlingar från den
offentliga förvaltningen
7. 3. Öppna data?
“Data kan kallas öppna data om vem som helst
fritt får använda, återanvända och distribuera
dessa med som största motprestation att ange
källa eller krav på att dela data på samma sätt.”
opendefinition.org
8. Kan man ta betalt och
kalla det öppna data?
NEJ
9. 4. Öppna offentliga data
Öppna data Offentliga data
“PSI”
Öppna offentliga data
10. Utgångsläge i Sverige
• Tillgång till handlingar för vidareutnyttjande
sedan 1766-ish
• Omfattande insamling och behandling av
information i förvaltningen
• Elektroniskt tillgängliga informationssamlingar
av hög kvalitet
• Som huvudregel får offentlig information
(upprättade handlingar) fritt vidareutnyttjas
11. Före PSI-lagen
• Tryckfrihetsförordningen (1766, 1949)
• Upphovsrättslagen (1960)
• Arkivlagen (1990)
• Kommunallagen (1991)
• Avgiftsförordningen (1992)
• Personuppgiftslagen (1998)
• Konkurrenslagen (2008)
• Offentlighets- och sekretesslag (2009)
• + ett antal registerförfattningar
12. Efter PSI-lagen
• Tryckfrihetsförordningen (1766, 1949)
• Upphovsrättslagen (1960)
• Arkivlagen (1990)
• Kommunallagen (1991)
• Avgiftsförordningen (1992)
• Personuppgiftslagen (1998)
• Konkurrenslagen (2008)
• Offentlighets- och sekretesslag (2009)
• + ett antal registerförfattningar
• PSI-lagen (2010)
16. Tre huvudargument
1. Insyn i offentlig sektor
2. Kommersiella möjligheter med
vidareförädling
3. Flera alternativa tjänster – samarbete med
civilsamhället
17. Insyn i offentlig sektor
• Genom tillgång till data blir det möjligt att
förstå hur myndigheter spenderar pengar och
presterar.
• Förtroende för offentlig sektor.
18. Kommersiella möjligheter med
vidareförädling
1. Värdet av ökad tillgång till offentliga data är
stort. För öppna data är den potentiella
nyttan ca 10 miljarder kr/år.
2. Flera företag som livnär sig på det redan idag.
EU/Graham Vickery: PSI reuse
21. Pricing of Public Sector Information
Study
• När priset blev 0 ökade användningen av data
med mellan 1 000% och 10 000%.
• Utan avgifter försvann transaktionskostnader
och administration.
• Intäkter utgör ofta en mycket liten del av
budgeten.
• Drastiska prissänkningar ger ibland samma
intäktsnivå.
22. För väderdata…
I USA finns det ca 400 företag och 4000
anställda som lever på att förädla offentlig
väderdata till nya tjänster. Motsvarande siffra i
EU är ca 30 företag och 300 anställda.
Källa: Borders in Cyberspace - Deriving Maximum Benefitfrom Public Investment in Scientific Data Retention:
http://www.authorstream.com/Presentation/Davide-45234-Weiss-presentation-Borders-Cyberspace-Deriving-Maximum-Benefitfrom-Public-Investment-
presentat-Education-ppt-powerpoint/
32. The Semantic Web
”the idea of having data on the
web defined and linked in a way
that it can be used by machines
not just for display purposes, but
for automation, integration and
reuse of data across various
applications”
35. Varför länkade data?
• Underlag för att svara på komplexa frågor
finns redan
• Men informationen är spridd över flera källor
• Det tar lång tid att samla in och bearbeta den
• Länkade data är ett sätt att underlätta
användning av data för att besvara komplexa
frågor
36. Idag har vi ofta silos med data som
handlar om samma ting
Organisation A Organisation B
37. …och olika sätt att identifiera de ting
som finns
•VIAF:54154627
•498403
•August_Strindberg
•”ヨハン・アウグスト・ストリン
ドベリ”
•…
38. För den som vill återanvända data är
det ofta olika sätt för åtkomst
VIAF:54154627 498403
A B
XML
SOAP
MS WORD
42. Dokument tilldelas en globalt unik
adress – en URL
http://riksarkivet.se/nyheter/sbl
PROTOKOLL
43. Med länkade data använder man
länkar som identifierare för olika ting
Länk = URI (Uniform Resource Identifier)
44. Fyra principer för länkade data
1. Användning av URI:er för identifierare för olika
ting.
2. Användning av HTTP URI:er för dessa ting så att
man kan skapa referenser och slå upp
information.
3. Tillhandahållande av maskinläsbar information
om ett ting när dess URI anropas. Informationen
ska tillhandahållas i ett standardiserat format
som t.ex. RDF.
4. Inkludera länkar till relaterade ting i den
information som lämnas.
45. Identifierare för olika ting?
• ”August Strindberg”
• ”Röda rummet”
• ”Uppsala universitet”
RÖDA
RUMMET
56. Kontext
"Designa alltid saker genom att beakta dem i
nästa större kontext - en stol i ett rum, ett rum i
ett hus, ett hus i en miljö, en miljö i en
stadsplan"
Eliel Saarinen
http://thinkexist.com/quotes/eliel_saarinen/
60. Femstjärnig modell för öppna data
★ Publicera vad du har på webben med en
öppen licens
★★ Publicera som strukturerad data
★★★ Använd ett öppet format (t.ex. CSV istället
för Excel)
★★★★ Använd URI:er för att identifiera saker så
att andra kan peka på dem
★★★★★ Länka dina data till andras för att ge
kontext
http://5stardata.info/
Tim Berners Lee. Källa Wikimedia commons: http://en.wikipedia.org/wiki/File:Timbernerslee.jpg
Länkar mellan dokument. Man tilldelar ett dokument en globalt unik indentifierare.
Tänk om vi kunde återanvända detta sätt som identifierare för olika ting i världen?
Foto från boken Gunnar Brandell: Ett författarliv III Paris - till och från 1894-1898 via http://commons.wikimedia.org/wiki/File:Strindberg_1896.jpg Genom att ha samma identifierare blir det enklare att relatera information.
Foto från boken Gunnar Brandell: Ett författarliv III Paris - till och från 1894-1898 via http://commons.wikimedia.org/wiki/File:Strindberg_1896.jpg
Foto från boken Gunnar Brandell: Ett författarliv III Paris - till och från 1894-1898 via http://commons.wikimedia.org/wiki/File:Strindberg_1896.jpg
http://richard.cyganiak.de/2007/10/lod/
http://5stardata.info/
Bild från Wikipedia http://commons.wikimedia.org/wiki/File:God2-Sistine_Chapel.png