SlideShare una empresa de Scribd logo
1 de 10
Descargar para leer sin conexión
Tillvägagångssätt för omvandling och
publicering av data som LOD




 Hannes Ebner      <hannes@metasolutions.se>
 Matthias Palmér   <matthias@metasolutions.se>


 MetaSolutions AB
 http://metasolutions.se
Översikt

●   Förarbete - avgränsningar
●   Olika angreppsätt för olika källor
    ○   Webbdokument
    ○   Tabulär data
    ○   Relationell data
    ○   Data tillhandahållen via API:er
●   EntryStore
Förarbete - avgränsningar


E-delegationens arbete kring öppna data har lett till en
vägledning som är en bra grund även för länkade data.

           "vägledning för vidarutnyttjande
               av offentlig information"

          http://www.edelegationen.se/Stod-
             och-verktyg/Oppna-data-psi/
Datakälla - Webbdokument


(X)HTML/RDFa genererat på serversidan
 ● Genomförbarhet beror på ramverket



Fördelar
 ● Oftast direkt tillgång till databasen
 ● Automatiskt stöd i populära CMS (t.ex. Drupal)
 ● Inget behov för specifik RDF-infrastruktur



Nackdelar
 ● RDF måste extraheras ur (X)HTML
 ● Ingen SPARQL-endpoint
 ● Manuell editering av mallar (templates)
Datakälla - Tabulär data


RDF Refine
 ● Baserat på Open Refine
 ● Kan identifiera och länka till externa resurser
 ● RDF konstruktion via mallar



Fördelar
 ● Klarar stora datamängder
 ● Automatisk identifiering och länkning
   (reconciliation)
 ● Föreslår relaterade datakällor med Sindice



Nackdelar
 ● Manuell hantering via GUI
 ● Ingen komplett lösning, kombinera med triplestore
RDF Refine
Datakälla - Relationella data


D2RQ
 ● Relationella databaser som virtuella grafer



Fördelar
 ● Inbyggt gränssnitt för LD
 ● SPARQL endpoint med GUI
 ● Stödjer många databaser
 ● Stöd för RDF dumpar för import i nativa triple
   stores

Nackdelar
 ● Fungerar bäst med väldesignade databaser
 ● D2Rs query översättning inte lämplig för
   produktivmiljöer
Datakälla - data tillgänglig via APIer


Virtuoso Sponger
 ● agerar RDF middleware mot bl. a. APIer



Fördelar
 ● Färdiga lösningar för många APIer
 ● Skalbart med cachning
 ● Kompetent lösning med mycket dokumentation



Nackdelar
 ● Del av större lösning - tämligen komplicerat
 ● Delar av lösningen är inte open source
Molntjänst för enkel publicering av LOD


●   Baserad på EntryStore
    ○   Open Source plattform
    ○   Kan driftsättas internt eller som molntjänst
    ○   Mål är att bidra till en ökad publicering av LOD


●   Initialt fokus på
    ○   Beskrivning av resurser med metadata,
        t.ex. dokument
    ○   Statistikdata från SCB
    ○   Energidata från Knivsta kommun
WebbApp
          Arkitekturskiss                                                   entrystore.js




                                                                                     LOD
                                EntryStore - molntjänst
               Resurser         Sökindex    Rättigheter      Triple store




Config     Tabular importer                  Config       Webbdokument importer


          Relational importer    Config                     API based importer       Config




Kalkylb
                       RDB
                                             Doku                       API
lad                                          ment

Más contenido relacionado

Más de Hannes Ebner

Introduction to Dublin Core Metadata
Introduction to Dublin Core MetadataIntroduction to Dublin Core Metadata
Introduction to Dublin Core MetadataHannes Ebner
 
Organic.Edunet Repository Tools
Organic.Edunet Repository ToolsOrganic.Edunet Repository Tools
Organic.Edunet Repository ToolsHannes Ebner
 
Learning Object Annotation in Agricultural Learning Repositories
Learning Object Annotation in Agricultural Learning RepositoriesLearning Object Annotation in Agricultural Learning Repositories
Learning Object Annotation in Agricultural Learning RepositoriesHannes Ebner
 
A Mashup-friendly Resource and Metadata Management Framework
A Mashup-friendly Resource and Metadata Management FrameworkA Mashup-friendly Resource and Metadata Management Framework
A Mashup-friendly Resource and Metadata Management FrameworkHannes Ebner
 
Short introduction to Conzilla
Short introduction to ConzillaShort introduction to Conzilla
Short introduction to ConzillaHannes Ebner
 
Collaborilla - An enhancement to the Conzilla concept browser for enabling co...
Collaborilla - An enhancement to the Conzilla concept browser for enabling co...Collaborilla - An enhancement to the Conzilla concept browser for enabling co...
Collaborilla - An enhancement to the Conzilla concept browser for enabling co...Hannes Ebner
 

Más de Hannes Ebner (6)

Introduction to Dublin Core Metadata
Introduction to Dublin Core MetadataIntroduction to Dublin Core Metadata
Introduction to Dublin Core Metadata
 
Organic.Edunet Repository Tools
Organic.Edunet Repository ToolsOrganic.Edunet Repository Tools
Organic.Edunet Repository Tools
 
Learning Object Annotation in Agricultural Learning Repositories
Learning Object Annotation in Agricultural Learning RepositoriesLearning Object Annotation in Agricultural Learning Repositories
Learning Object Annotation in Agricultural Learning Repositories
 
A Mashup-friendly Resource and Metadata Management Framework
A Mashup-friendly Resource and Metadata Management FrameworkA Mashup-friendly Resource and Metadata Management Framework
A Mashup-friendly Resource and Metadata Management Framework
 
Short introduction to Conzilla
Short introduction to ConzillaShort introduction to Conzilla
Short introduction to Conzilla
 
Collaborilla - An enhancement to the Conzilla concept browser for enabling co...
Collaborilla - An enhancement to the Conzilla concept browser for enabling co...Collaborilla - An enhancement to the Conzilla concept browser for enabling co...
Collaborilla - An enhancement to the Conzilla concept browser for enabling co...
 

Tillvägagångssätt för omvandling och publicering av data som LOD

  • 1. Tillvägagångssätt för omvandling och publicering av data som LOD Hannes Ebner <hannes@metasolutions.se> Matthias Palmér <matthias@metasolutions.se> MetaSolutions AB http://metasolutions.se
  • 2. Översikt ● Förarbete - avgränsningar ● Olika angreppsätt för olika källor ○ Webbdokument ○ Tabulär data ○ Relationell data ○ Data tillhandahållen via API:er ● EntryStore
  • 3. Förarbete - avgränsningar E-delegationens arbete kring öppna data har lett till en vägledning som är en bra grund även för länkade data. "vägledning för vidarutnyttjande av offentlig information" http://www.edelegationen.se/Stod- och-verktyg/Oppna-data-psi/
  • 4. Datakälla - Webbdokument (X)HTML/RDFa genererat på serversidan ● Genomförbarhet beror på ramverket Fördelar ● Oftast direkt tillgång till databasen ● Automatiskt stöd i populära CMS (t.ex. Drupal) ● Inget behov för specifik RDF-infrastruktur Nackdelar ● RDF måste extraheras ur (X)HTML ● Ingen SPARQL-endpoint ● Manuell editering av mallar (templates)
  • 5. Datakälla - Tabulär data RDF Refine ● Baserat på Open Refine ● Kan identifiera och länka till externa resurser ● RDF konstruktion via mallar Fördelar ● Klarar stora datamängder ● Automatisk identifiering och länkning (reconciliation) ● Föreslår relaterade datakällor med Sindice Nackdelar ● Manuell hantering via GUI ● Ingen komplett lösning, kombinera med triplestore
  • 7. Datakälla - Relationella data D2RQ ● Relationella databaser som virtuella grafer Fördelar ● Inbyggt gränssnitt för LD ● SPARQL endpoint med GUI ● Stödjer många databaser ● Stöd för RDF dumpar för import i nativa triple stores Nackdelar ● Fungerar bäst med väldesignade databaser ● D2Rs query översättning inte lämplig för produktivmiljöer
  • 8. Datakälla - data tillgänglig via APIer Virtuoso Sponger ● agerar RDF middleware mot bl. a. APIer Fördelar ● Färdiga lösningar för många APIer ● Skalbart med cachning ● Kompetent lösning med mycket dokumentation Nackdelar ● Del av större lösning - tämligen komplicerat ● Delar av lösningen är inte open source
  • 9. Molntjänst för enkel publicering av LOD ● Baserad på EntryStore ○ Open Source plattform ○ Kan driftsättas internt eller som molntjänst ○ Mål är att bidra till en ökad publicering av LOD ● Initialt fokus på ○ Beskrivning av resurser med metadata, t.ex. dokument ○ Statistikdata från SCB ○ Energidata från Knivsta kommun
  • 10. WebbApp Arkitekturskiss entrystore.js LOD EntryStore - molntjänst Resurser Sökindex Rättigheter Triple store Config Tabular importer Config Webbdokument importer Relational importer Config API based importer Config Kalkylb RDB Doku API lad ment