SlideShare una empresa de Scribd logo
1 de 48
Descargar para leer sin conexión
Workshop: DSpace und das Semantic Web
Pascal-Nicolas Becker | Technische Universität Berlin | 104. Bibliothekartag | Nürnberg, 28.05.2015
Agenda
• Ziel & Motivation
• Kurze Linked Data Einführung
• Repositorien und das Semantic Web
• dspace-rdf: Aufbau und Konfiguration
• Questions & Answers
• Evtl. Live-Demonstration
Workshop-Charakter: Fragen, Ideen, Anmerkungen bitte jederzeit!
Konkrete Konfiguration am Ende.
Folie 2
DSpace und das Semantic Web | Pascal-Nicolas Becker | 104.Bibliothekartag | Nürnberg, 28.05.2014
Kurze Vorstellung der
Teilnehmer: Wer? Woher?
Welche Version von DSpace?
Folie 3
DSpace und das Semantic Web | Pascal-Nicolas Becker | 104.Bibliothekartag | Nürnberg, 28.05.2014
Ziel & Motivation
Folie 4
DSpace und das Semantic Web | Pascal-Nicolas Becker | 104.Bibliothekartag | Nürnberg, 28.05.2014
Digitale Repositorien
Source: The Directory of Open Access Repositories,
http://www.opendoar.org, abgerufen am 06.06.2014.
Ein Repositorium ist ein System zur
sicheren Speicherung digitaler Objekte und
der die Objekte beschreibenden
strukturierten Metadaten.
Beispiele:
• Digitale Archive
• Institutionelle Repositorien (Preprints,
Postprints, OA-Publikationen, …)
• Digitale Bilddatenbanken
• Forschungsdaten-Repositorien
• …
Mehr als 2500 OA-Repositorien weltweit
DSpace und das Semantic Web | Pascal-Nicolas Becker | 104.Bibliothekartag | Nürnberg, 28.05.2014
Folie 5
Verbreitung von Repositoriensoftware
OpenDOAR ROAR
DSpace 1127 41,2% 1464 39,2%
EPrints 375 13,7% 532 14,2%
OPUS 71 2,6% 54 1,4%
Fedora 41 1,5% 55 1,5%
MyCore 8 0,3% 7 0,2%
Andere 835 30,5% 516 13,8%
Unbekannt 282 10,3% 1111 29,7%
2739 3739
Quelle: http://www.opendoar.org und http://roar.eprints.org,
abgerufen am 06. Juni 2014.
DSpace und das Semantic Web | Pascal-Nicolas Becker | 104.Bibliothekartag | Nürnberg, 28.05.2014
Folie 6
xxx.lanl.org / ArXiv.org
Quelle: Paul Ginsparg, First Steps Towards Electronic Research Communication. In: Computer in Physics, Vol. 8, No. 4, 1994, pp. 390-396.
Foto: Paul Ginsparg
“Although the WorldWideWeb still
represents only a small fraction of the
overall usage, this access mode is expected
to become dominant in the near future.”
Paul Ginsparg 1994
DSpace und das Semantic Web | Pascal-Nicolas Becker | 104.Bibliothekartag | Nürnberg, 28.05.2014
Folie 7
Folie 8
DSpace und das Semantic Web | Pascal-Nicolas Becker | 104.Bibliothekartag | Nürnberg, 28.05.2014
The Semantic Web
„Information varies along many axes. One of
these is the difference between information
produced primarily for human consumption
and that produced mainly for machines. […]
To date, the Web has developed most
rapidly as a medium of documents for
people rather than for data and information
that can be processed automatically.“
Berners-Lee, Handler, Lasilla 2001
Repositorieninhalte und das Semantic Web
• Informationen im Internet sind auf den menschlichen Konsum ausgerichtet
• Viele Informationen werden nur implizit über den Kontext zur Verfügung gestellt
• Grundidee des Semantic Web: Implizite Informationen explizit
machen, um sie automatisiert verarbeiten zu können
• Ein Repositorium „kennt“ den Titel eines Artikels
• Titel werden Fett und in größerer Schrift ausgegeben,
Autorennamen kursiv
• Wieso stellen wir diese Daten nicht auch maschinell
nutzbar bereit?
DSpace und das Semantic Web | Pascal-Nicolas Becker | 104.Bibliothekartag | Nürnberg, 28.05.2014
Folie 9
Research Data Lifecycle
DSpace und das Semantic Web | Pascal-Nicolas Becker | 104.Bibliothekartag | Nürnberg, 28.05.2014
Folie 10
Bisheriger Datenaustausch mit Repositorien
• OAI-PMH (Open Archive Initiative – Protocol for Metadata Harvesting):
de-facto-Standard im Repositorienumfeld
• Aber auf das Repositorienumfeld begrenzt!
• Google unterstützt OAI-PMH seit 2008 nicht mehr
(zuvor als Alternative zum Sitemap Protocol genutzt)
• „Nur“ eine Schnittstelle, kein Format
 Linked Data ist ein generischer nativer Weg Daten auszutauschen
 Linked Data ist nicht auf das Umfeld von Repositorien beschränkt
 Linked Data ist selbst beschreibend
 Linked Data vereinfacht den Datenaustausch mit Repositorien
DSpace und das Semantic Web | Pascal-Nicolas Becker | 104.Bibliothekartag | Nürnberg, 28.05.2014
Folie 11
Linked Data – Kurze Einführung
Folie 12
DSpace und das Semantic Web | Pascal-Nicolas Becker | 104.Bibliothekartag | Nürnberg, 28.05.2014
Folie 13
DSpace und das Semantic Web | Pascal-Nicolas Becker | 104.Bibliothekartag | Nürnberg, 28.05.2014
The Linked Data Principles
1. Use URIs as names for things
2. Use HTTP URIs so that people can look up those things
3. When someone looks up a URI, provide useful information, using the standards
(RDF*, SPARQL)
4. Include links to other URIs, so they can discover more things
Tim Berners-Lee
http://www.w3.org/DesignIssues/LinkedData.html
 “This creates what I call a Semantic Web – a web of data that can be processed
directly or indirectly by machines.”
Tim Berners-Lee und Marc Fischetti:
“Weaving the Web. The Past, Present and Future of the World Wide Web by its Initiator”
London 1999, ISBN: 0-7528-2090-7
URI = URN + URL
http://digital-repositories.org/ontologies/dspace#Repository
mailto:p.becker@tu-berlin.de
• Uniformed Resource Identifier ist ein Identifikator für eine abstrakte oder physische
Ressource
• Ein URI kann ein Uniformed Resource Name, Uniformed Resource Locator oder
beides sein
• Ein URN ist ein Name, ein URL ist eine Adresse
• Ein URI ist eindeutig!
RFC 3986
Folie 14
DSpace und das Semantic Web | Pascal-Nicolas Becker | 104.Bibliothekartag | Nürnberg, 28.05.2014
URL URN
URI
Resource Description Framework – RDF
• Datenmodell
• Formulierung logischer Aussagen über beliebige Ressourcen
• Struktur von Trippeln: Subject – Predicate – Object
• Subject und Predicate sind immer URIs, Objects sind URIs oder Literale
Folie 15
DSpace und das Semantic Web | Pascal-Nicolas Becker | 104.Bibliothekartag | Nürnberg, 28.05.2014
Reposi-
torien-
software
DSpace
ist eine
DSpace
Committer
Group
Claudia
Jürgen
Pascal-
Nicolas
Becker
…
gepflegt
von
hat Mitglied
hat Mitglied
hat Mitglied
programmiert / entwickelt
programmiert / entwickelt
dokumentiert / pflegt / unterstützt
heißt
Anzahl bekannter
Installationen
1200
„DSpace“
Vokabulare und Ontologien
• Zur Formulierung von Aussagen in RDF brauchen wir URIs
• URIs sollen eine „Bedeutung“ (=> Semantik) haben
• Vokabulare dienen dazu URIs eine Semantik zuzuweisen
• Aus logischen Aussagen kann man Schlussfolgerungen ziehen
• Zum Teil ist Wissen erforderlich, dass über die reinen Vokabulare hinausgeht
• Hintergrund- oder Domänenwissen wird in Ontologien abgelegt
• Ontologien und Vokabulare werden als Linked Data und somit in RDF veröffentlicht
• RDF-Schema (RDFS) dient der Beschreibung von Vokabularen
• Klassenmodell, bei dem Klassen und Eigenschaften getrennt modelliert werden
• Die Web Ontology Language (OWL) geht über die Möglichkeiten von RDFS hinaus
• für Ontologien genutzt
Folie 16
DSpace und das Semantic Web | Pascal-Nicolas Becker | 104.Bibliothekartag | Nürnberg, 28.05.2014
Beispiel: DSpace Metadata RDF Mapping Vocabulary
@prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#> .
@prefix dc: <http://purl.org/dc/elements/1.1/> .
@prefix : <http://digital-repositories.org/ontologies/dspace-metadata-mapping/0.2.0#> .
...
<http://digital-repositories.org/ontologies/dspace-metadata-mapping/0.2.0>
rdfs:comment "Vocabulary for describing mappings of DSpace metadata to rdf." ;
dc:contributor "Pascal-Nicolas Becker" ;
dc:title "DSpace Metadata RDF Mapping Spec" ;
dc:description "Vocabulary for describing mappings of DSpace metadata to RDF. This
vocabulary is used to configure DSpace how to convert stored metadata
into RDF." ;
dc:date "2014-04-18".
:DSpaceMetadataRDFMapping
a rdfs:Class ;
rdfs:label "DSpace Metadata RDF Mapping" ;
rdfs:comment "Represents the mapping of a DSpace metadata value to an RDF equivalent.".
:Result
a rdfs:Class ;
rdfs:subClassOf rdf:Statement ;
rdfs:label "DSpace Metadata RDF Mapping Result" ;
rdfs:comment "A reified statement that describes the result of the
DSpaceMetadataRDFMapping.".
...
Folie 17
DSpace und das Semantic Web | Pascal-Nicolas Becker | 104.Bibliothekartag | Nürnberg, 28.05.2014
Beispiel: DSpace Repository Ontology
@prefix : <http://digital-repositories.org/ontologies/dspace/#> .
...
<http://digital-repositories.org/ontologies/dspace/> rdf:type owl:Ontology ;
rdfs:label "DSpace Repository Ontology"@en ;
dc:creator "Pascal-Nicolas Becker" ;
dc:date "2014-09-11" ;
dc:description "DSpace Repository Ontology"@en ;
dc:description "Ontology to describe a repository using DSpace. You can find further
information about dspace at http://www.dspace.org."@en .
...
:hasBitstream rdf:type owl:ObjectProperty ;
rdfs:comment "Links from an item to a bitstream of the item. Bitstreams can be a
representation of an item or a part of a representation composed of several bitstreams.
Bitstreams are arbitrary files, e.g. documents, archives, images, ..."@en ;
rdfs:domain :Item ;
rdfs:subPropertyOf :hasPart .
...
### http://digital-repositories.org/ontologies/dspace/#hasPart
:hasPart rdf:type owl:ObjectProperty ,
owl:TransitiveProperty ;
rdfs:comment "Links top down between the structure of a DSpace repository."@en ;
owl:inverseOf :isPartOf .
...
Folie 18
DSpace und das Semantic Web | Pascal-Nicolas Becker | 104.Bibliothekartag | Nürnberg, 28.05.2014
Zusammenfassung
• RDF ist ein Datenmodell zur Formulierung logischer Aussagen
• Subject und Predicate sind immer URIs Objects sind URIs oder Literale
• URIs sind eindeutig („Johann Jakob Freudenreich ist Bräutigam und braut zu gleich“)
• Vokabulare und Ontologien sollen die Semantik einer URI beschreiben und Wissen
„hinterlegen“
• Aus logischen Aussagen lassen sich Schlüsse ziehen
• DSpace wird von der DSpace Committer Group gepflegt
• Pascal-Nicolas Becker ist Mitglieder der DSpace Committer Group
 Pascal-Nicolas Becker ist für die Pflege von DSpace (mit-)verantwortlich
• Ein Computer „versteht“ die Semantik nicht
• Ein Computer kann Logik anwenden
• Logische Schlussfolgerungen wirken wie Verständnis
Folie 19
DSpace und das Semantic Web | Pascal-Nicolas Becker | 104.Bibliothekartag | Nürnberg, 28.05.2014
RDF-Repräsentationen
• RDF ist ein Modell
• RDF ist unabhängig von einer speziellen Repräsentation
• Für RDF gibt es unterschiedliche Repräsentationen (Graphisch, RDF/XML, Turtle,
N3, …)
• Turtle gilt als benutzerfreundliche Alternative zu RDF/XML und ist eine
Teilmenge von N3
• Die Default-Konfiguration von DSpace-RDF verwendet Turtle, die Konfiguration
kann aber auch in anderen Repräsentationen angegeben werden
• Die Beispiele in dieser Präsentation verwenden Turtle
Folie 20
DSpace und das Semantic Web | Pascal-Nicolas Becker | 104.Bibliothekartag | Nürnberg, 28.05.2014
SPARQL
• SPARQL Protocol And RDF Query Language ist eine Abfragesprache für RDF
• „Was SQL für relationale Datenbanken ist SPARQL für RDF“
• „SPARQL-Endpoint“: Schnittstelle, die über SPARQL abgefragt werden kann
• Seit SPARQL 1.1 ist auch die Manipulation von Daten via SPARQL möglich
SELECT * WHERE { ?s ?p ?o . }
PREFIX dc: <http://purl.org/dc/elements/1.1/>
SELECT ?s WHERE { ?s dc:contributor "Becker, Pascal-Nicolas" . }
SPARQL by example:
http://www.cambridgesemantics.com/semantic-university/sparql-by-example
Folie 21
DSpace und das Semantic Web | Pascal-Nicolas Becker | 104.Bibliothekartag | Nürnberg, 28.05.2014
Von RDF zu Linked Data
• RDF ist ein Datenmodell
• Linked Data ist ein Begriff für bestimmte Konventionen Daten zu bereitzustellen
Linked Data Principles:
1. Use URIs as names for things
2. Use HTTP URIs so that people can look up those things
3. When someone looks up a URI, provide useful information, using the standards
(RDF*, SPARQL)
4. Include links to other URIs, so they can discover more things
Tim Berners-Lee
http://www.w3.org/DesignIssues/LinkedData.html
Folie 22
DSpace und das Semantic Web | Pascal-Nicolas Becker | 104.Bibliothekartag | Nürnberg, 28.05.2014
HTTP
• Linked Data setzt auf HTTP auf
• Die in RDF verwandten URIs sollen via HTTP aufrufbar sein und weitere
Informationen liefern => Linked Data
• HTTP verfügt über Mechanismen um URLs weiterzuleiten
• Linked Data unterscheidet zwischen URNs und URLs: URNs sollen auf URLs
weitergeleitet werden, die die Daten (RDF/XML, Turtle, …) enthalten, die die durch
den URN identifizierte Resource beschreiben
(http://example.org/rdf/dog => http://example.org/dog.ttl)
• doi:10.0123/4567 ist kein HTTP-URI! (dazu gleich mehr)
Folie 23
DSpace und das Semantic Web | Pascal-Nicolas Becker | 104.Bibliothekartag | Nürnberg, 28.05.2014
Vermeidbare Fehler und Hindernisse
• URIs nachnutzen, wo immer möglich! Keine eigenen URIs erzeugen, wenn es bereits
adäquate gibt
• Beispiele: Für Klassifikationen, wie die Library of Congress Subject Headings
(LCSH) oder die Dewey Decimal Classification (DDC), existieren bereits URIs
• Erzeugung von URIs nur für „eigene“ Entitäten, Erzeugung von URIs nur wenn
ausreichend Informationen vorhanden sind
• Beispiel: Autoren
• Können verschiedene Autoren gleichen Namens differenziert werden?
• Sollten Autoren nicht eigene URIs erzeugen und hinterlegen können, anstatt von
„fremden“ Institutionen URIs zugewiesen zubekommen?
• Aber: Erzeugung von URIs für Objekte des Repositoriums (da autoritativ)
• Erzeugung von Links so oft wie möglich
DSpace und das Semantic Web | Pascal-Nicolas Becker | 104.Bibliothekartag | Nürnberg, 28.05.2014
Folie 24
Repositorien
und das Semantic Web
Folie 25
DSpace und das Semantic Web | Pascal-Nicolas Becker | 104.Bibliothekartag | Nürnberg, 28.05.2014
Repositorieninhalte sind besonders gut geeignet
Inhalte von Repositorien sind zur
Bereitstellung im Semantik Web besonders
gut geeignet:
• Metadaten existieren bereits in einer
strukturierten Form
• Sie müssen nicht erst generiert oder
aufwändig manuell zur Publikation als
Linked Data erzeugt werden
• Es geht “lediglich” um die Konvertierung
vorhandener Daten in RDF, um das
hinzufügen von Links und das
Publizieren unter Berücksichtigung der
Linked Data Principles
DSpace und das Semantic Web | Pascal-Nicolas Becker | 104.Bibliothekartag | Nürnberg, 28.05.2014
Folie 26
Was speichern Repositorien?
 Unmöglich die Dateien zu konvertieren (technische Probleme, manuell nicht leistbar)
 Aber wir können die Metadaten konvertieren und die Dateien verlinken!
• Digitale Objekte
 Eine oder mehrere Dateien:
Dokumente (PDF, Text, …), Bilder (PNG,
Tiff, …), Tabellen (CSV, …), Audio (Wave,
OGG/VORBIS, …), Video, …
• Beschreibende Metadaten
 Strukturierte Metadaten in Key-Value-Form:
dc.title, dc.contributor.author, dc.description,
dc.date.available, dc.subject.lcsh,
dc.subject.ddc, …
“Ein Repositorium ist ein System zur sicheren Speicherung und Weitergabe
digitaler Objekte und der die Objekte beschreibenden Metadaten.“
DSpace und das Semantic Web | Pascal-Nicolas Becker | 104.Bibliothekartag | Nürnberg, 28.05.2014
Folie 27
Charakteristika von Repositorien
• Verschiedene Repositorien nutzen unterschiedliche Metadatenschemata
 Die Konvertierung muss stark konfigurierbar und erweiterbar sein
• Für Metadatenschemata können bereits Vokabulare existieren (z.B. DC, DDC,
LCSH, …)
 Werte von Metadaten müssen in URIs/Links konvertiert werden können
• Repositorieninhalte ändern sich so gut wie nie (Zitierfähigkeit, Zuverlässigkeit),
die Konvertierung kann aber zeitaufwändig sein
 Daten konvertieren und in einem Cache speichern
• Repositorien erzeugen URIs zur Adressierung ihrer Inhalte
 Bestehende URIs nachnutzen und um Content Negotiation erweitern
• Persistent Identifier (handle, DOI, …) verstoßen gegen die Linked Data Principles
 Persistent Identifier sind in der Form als HTTP(S) URIs zu nutzen
(z.B. http://hdl.handle.net/..., http://dx.doi.org/... )
DSpace und das Semantic Web | Pascal-Nicolas Becker | 104.Bibliothekartag | Nürnberg, 28.05.2014
Folie 28
Repositoriensoftware erweitern
• Hinzufügen eines Triple Stores (Triple Store = Datenbank für RDF)
• Nutzung als Cache für die konvertierten Daten
• Zur Bereitstellung eines SPARQL-Endpoints
• Methoden entwickeln zur Konvertierung in RDF und zur Ergänzung von Links
• Ein Modul zur Bereitstellung der konvertierten Daten als RDF-Serialisierung erstellen
• Content Negotiation unterstützen
File SystemFile System
Relational
Database
Relational
Database
Triple StoreTriple Store
RDF ConversionRDF Conversion
Authorization
System
Authorization
System
Browse and
Search
Browse and
Search
Persistent
Identifier Mgt.
Persistent
Identifier Mgt.
Event SystemEvent System
User
Administration
User
Administration
......
Web UIWeb UI
OAI-PMH
Interface
OAI-PMH
Interface
RESTREST
SWORDSWORD ......
RDF
Serialization
RDF
Serialization
InterfacesInterfaces
Business LogicBusiness Logic
Storage LayerStorage Layer
DSpace und das Semantic Web | Pascal-Nicolas Becker | 104.Bibliothekartag | Nürnberg, 28.05.2014
Folie 29
Konvertierung vorhandener Metadaten in RDF
• Repositoriensoftware kann um weitere Metadatenfelder erweitert werden
• Dublin Core wird oft genutzt, auch andere Metadatenschemata müssen unterstützt
werden
 Die Konvertierung muss stark konfigurierbar sein!
 Die Konfiguration sollte in RDF vorgenommen werden, da so die volle Funktionalität
von RDF genutzt werden kann
 „Reification“ kann zur Beschreibung der gewünschten Ergebnisse genutzt werden
 Platzhalter können z.B. für URIs des Repositoriums verwendet werden
 Reguläre Ausdrücke können Literale und/oder URIs aus Metadatenwerten generieren
 Es braucht ein Vokabular um solche Konfigurationen zu erstellen
DSpace und das Semantic Web | Pascal-Nicolas Becker | 104.Bibliothekartag | Nürnberg, 28.05.2014
Folie 30
Repositorien beschreiben
• Neben der Konvertierung der Metadaten sollten die Repositorien selbst beschrieben
werden
• Wer betreibt das Repositorium? Gibt es eine SWORD-Schnittstelle? Wo ist der
SPARQL-Endpoint zu finden? Wie ist das Repositorium strukturiert? …
• Auch braucht es ein Vokabular, um die Digitalen Objekte (Dateien) zu verlinken
• Für DSpace habe ich die DSpace Repository Ontology erstellt:
http://digital-repositories.org/ontologies/dspace
• Es wäre wichtig eine Digital Repositories Ontology zu erstellen, unabhängig von der
genutzten Repositoriensoftware
• Ein Mapping zwischen einer solchen Ontologie und der DSpace Repository Ontology,
der Eprints Ontology, … wäre hilfreich! (Mitstreiter gesucht)
DSpace und das Semantic Web | Pascal-Nicolas Becker | 104.Bibliothekartag | Nürnberg, 28.05.2014
Folie 31
DSpace-RDF
Folie 32
DSpace und das Semantic Web | Pascal-Nicolas Becker | 104.Bibliothekartag | Nürnberg, 28.05.2014
DSpace 5
• DSpace ist die weltweit am häufigsten eingesetzte Software für OA-Repositorien
• DSpace 5.0 wurde im Januar 2015 veröffentlicht, 5.2 ist im Mai erschienen
• Die TU Berlin hat DSpace 5 um Linked Data Support erweitert:
• Konvertierung der Metadaten in Linked Data
• Ausgabe als RDF/XML, Turtle, N-Triples, SPARQL, Content Negotation
• Stark konfigurierbar, anpass- und erweiterbar
• Standardkonfiguration mit ausgeliefert
• Test it yourself:
http://demo.dspace.org/data/handle/10673/5/ttl
http://demo.dspace.org/data/handle/10673/5/ttl?text
wget -O - --header=‘Accept: text/turtle’ http://demo.dspace.org/jspui/handle/10673/5
or download and install a release candidate
Wenn Sie DSpace 5.0 einsetzen, bitte schalten Sie den Linked Data Support ein!
DSpace und das Semantic Web | Pascal-Nicolas Becker | 104.Bibliothekartag | Nürnberg, 28.05.2014
Folie 33
Komponenten
• Daten werden bei Erzeugung und Änderungen automatisch in LD konvertiert
• Konvertierung erweiter- und stark konfigurierbar
• Verschiedene Module zur Erzeugung von URIs nutzbar
(z.B. basierend auf DOIs, Handles oder den von DSpace erzeugten URIs).
• Triple Store als Cache ergänzend zu Datenbank
• [dspace-install]/bin/dspace rdfizer zur manuellen Steuerung
• Neue Webapp: dspace-rdf stellt Daten als RDF-Serialisate bereit
• Filter für Content Negotiation hinzugefügt (XMLUI und JSPUI)
• Noch fehlend: Link in HTML-Version (JSPUI/XMLUI) auf LD
Folie 34
DSpace und das Semantic Web | Pascal-Nicolas Becker | 104.Bibliothekartag | Nürnberg, 28.05.2014
Interner Aufbau (Klassenstruktur)
DSpace und das Semantic Web | Pascal-Nicolas Becker | 104.Bibliothekartag | Nürnberg, 28.05.2014
Folie 35
DSpace-RDF: Konfiguration (config/modules/rdf.cfg)
Konfiguration teilt sich auf:
• Verbindungsdaten zum Triple Store
• Wie verbindet sich DSpace?
• Wo befindet sich der öffentliche SPARQL Endpoint?
• Ein- und Ausschalten der Content Negotiation
• Wie sollen URIs zur Identifikation der Resourcen in RDF generiert werden?
• Welche „Plugins“ sollen zur Konvertierung verwandt werden?
• Gegebenenfalls Konfiguration der Plugins
Folie 36
DSpace und das Semantic Web | Pascal-Nicolas Becker | 104.Bibliothekartag | Nürnberg, 28.05.2014
Verbindungsdaten
• DSpace nutzt für Abfragen an den Triple Store die SPARQL 1.1 Query Language und
das SPARQL 1.1 Graph Store HTTP Protocol
• Dspace nutzt zur Manipulation des Triple Stores das SPARQL 1.1 Graph Store HTTP
Protocol
• In der Datei rdf.cfg sind die Adressen für die entsprechende Endpunkte und ggf.
Daten zur Authentifikation anzugeben
• Die Adresse des SPARQL Endpoints, wie er in RDF (z.B. mittels void:sparqlEndpoint)
angegeben werden soll, sind im Rahmen der Konfiguration der Konvertierung
anzugeben
Folie 37
DSpace und das Semantic Web | Pascal-Nicolas Becker | 104.Bibliothekartag | Nürnberg, 28.05.2014
Generierung von URIs
• Es können URIs des Repositoriums oder Persistent Identifier in Form von HTTP-URIs
verwendet werden
• Dazu ist die Java-Klasse zur Generierung der URIs anzugeben:
• LocalURIGenerator: Nutzung der „lokalen“ URIs des Repositoriums
z.B. https://depositonce.tu-berlin.de/handle/11303/157
• DOIHandleURIGenerator / DOIURIGenerator:
Nutzung von DOIs (Wahlweise mit Fallback auf URIs oder Handles)
z.B. http://dx.doi.org/10.14279/depositonce-1
• HandleURIGenerator: Nutzung von Handles (mit Fallback auf URIs)
z.B. http://hdl.handle.net/11303/15
Folie 38
DSpace und das Semantic Web | Pascal-Nicolas Becker | 104.Bibliothekartag | Nürnberg, 28.05.2014
Konfiguration der Konvertierung
• Konvertierung nutzt Plugins
• Alle zu nutzenden Plugins sind anzugeben, z.B.:
converter.plugins = org.dspace.rdf.conversion.StaticDSOConverterPlugin, 
org.dspace.rdf.conversion.MetadataConverterPlugin, 
org.dspace.rdf.conversion.SimpleDSORelationsConverterPlugin
Folie 39
DSpace und das Semantic Web | Pascal-Nicolas Becker | 104.Bibliothekartag | Nürnberg, 28.05.2014
StaticDSOConverterPlugin
Das StaticDSOConverterPlugin: ergänzt statische Daten (z.B. Angabe wo der SPARQL-
Endpoint zu finden ist oder die Homepage des Repositoriums)
• Es können Daten angegeben werden, die zu allen Resourcen hinzugefügt
werden sollen
• Es können Daten abhängig vom Typ (Item, Collection, Community, Site)
angegeben werden
• rdf.cfg enthält den Pfad zu Dateien mit den jeweiligen statischen Inhalten
• Dateien können in einer der gängigen RDF-Serialisierungen angegeben werden
(per default Turtle)
Folie 40
DSpace und das Semantic Web | Pascal-Nicolas Becker | 104.Bibliothekartag | Nürnberg, 28.05.2014
SimpleDSORelationsConverterPlugin
Das SimpleDSORelationsConverterPlugin bildet Beziehungen zwischen DSpace-
Objekten ab:
• Welche Top-Level-Communities hat das Repositorium?
• Welche Subcommunities und Collections gehören zu einer Community?
• Welche Items gehören zu einer Collection und welche Bitstreams zu welchen Items?
• Auch die andere Richtung wird abgebildet: zu welchen Collections gehört ein Item?
Zu welchen Communities eine Subcommunity oder Collection?
• ...
Das Plugin ermöglicht es die Linked-Data-Daten des Repositoriums durch das Verfolgen
von Links zu erfassen, sich also in den konvertierten Daten von Resource zu Resource
zu hangeln.
Folie 41
DSpace und das Semantic Web | Pascal-Nicolas Becker | 104.Bibliothekartag | Nürnberg, 28.05.2014
MetadataConverterPlugin
• Konvertiert die Metadaten von Items
• Kann zur Konvertierung von Bitstreams/Dateien erweitert werden
• Konfiguration wird in RDF angegeben, so dass der volle Umfang von RDF genutzt
werden kann
• Konfiguration nutzt das DSpace Metadata RDF Mapping Vocabulary
Folie 42
DSpace und das Semantic Web | Pascal-Nicolas Becker | 104.Bibliothekartag | Nürnberg, 28.05.2014
DSpace Metadata RDF Mapping Vocabulary
http://digital-repositories.org/ontologies/dspace-metadata-mapping/
• Ein “Mapping” beschreibt die Konvertierung eines Metadatenfeldes in RDF
• Metadatenfelder können anhand Ihres Namens (key) und eines Regulären Ausdrucks
erkannt werden, der auf den Wert des Feldes angewandt wird
• Erzeugt ein oder mehrere Triple
• Platzhalter für die URI des zu konfigurierenden Objekts
• Sowohl Literale als auch Ressourcen erzeugbar
• Literale können typisiert und Language Tags verwendet werden
• Die Sprachangabe zu Metadatenfeldern aus DSpace kann genutzt werden
• Der Wert eines Metadatenfeldes kann übernommen werden
• Reguläre Ausdrücke können zur Manipulation von Metadatenwerten bei der
Erzeugung von Literalen und Resource URIs verwandt werden
DSpace und das Semantic Web | Pascal-Nicolas Becker | 104.Bibliothekartag | Nürnberg, 28.05.2014
Folie 43
Folie 44
DSpace und das Semantic Web | Pascal-Nicolas Becker | 104.Bibliothekartag | Nürnberg, 28.05.2014
@prefix dc: <http://purl.org/dc/elements/1.1/> .
@prefix dm: <http://digital-repositories.org/ontologies/dspace-metadata-
mapping/0.2.0#> .
@prefix : <#> .
:title
dm:metadataName "dc.title" ;
dm:creates [
dm:subject dm:DSpaceObjectIRI ;
dm:predicate dcterms:title ;
dm:object dm:DSpaceValue ;
] ;
.
Beispiel: DSpace Metadata RDF Mapping Vocabulary
Folie 45
DSpace und das Semantic Web | Pascal-Nicolas Becker | 104.Bibliothekartag | Nürnberg, 28.05.2014
:doi
dm:metadataName „dc.identifier.doi" ;
dm:condition „^doi:“ ;
dm:creates [
dm:subject dm:DSpaceObjectIRI ;
dm:predicate dc:identifier;
dm:object [
a dm:ResourceGenerator ;
dm:modifier [
dm:matcher „^doi:(.*)$“ ;
dm:replacement „http://dx.doi.org/$1“ ;
] ;
dm:pattern „$DSpaceValue“ ;
] ;
] ;
.
Beispiel: DSpace Metadata RDF Mapping Vocabulary
Questions & Answers
Folie 46
DSpace und das Semantic Web | Pascal-Nicolas Becker | 104.Bibliothekartag | Nürnberg, 28.05.2014
Live-Demonstration
Folie 47
DSpace und das Semantic Web | Pascal-Nicolas Becker | 104.Bibliothekartag | Nürnberg, 28.05.2014
Technische Universität Berlin
Universitätsbibliothek
Pascal-Nicolas Becker
p.becker@tu-berlin.de
Servicezentrum Forschungsdaten und –publikationen
http://www.szf.tu-berlin.de
Repositorium DepositOnce
http://depositonce.tu-berlin.de
Diplomarbeit „Repositorien und das Semantic Web“
http://www.pnjb.de/uni/diplomarbeit/
DSpace und das Semantic Web | Pascal-Nicolas Becker | 104.Bibliothekartag | Nürnberg, 28.05.2014
Folie 48

Más contenido relacionado

La actualidad más candente

SCAPE Skalierbare Langzeitarchivierung
SCAPE Skalierbare LangzeitarchivierungSCAPE Skalierbare Langzeitarchivierung
SCAPE Skalierbare LangzeitarchivierungSven Schlarb
 
Campus Community / Institutionelle Virtuelle Forschungsumgebung. Eine Aufgabe...
Campus Community / Institutionelle Virtuelle Forschungsumgebung. Eine Aufgabe...Campus Community / Institutionelle Virtuelle Forschungsumgebung. Eine Aufgabe...
Campus Community / Institutionelle Virtuelle Forschungsumgebung. Eine Aufgabe...Felix Lohmeier
 
SCAPE - Skalierbare Langzeitarchivierung (SCAPE - scalable longterm digital p...
SCAPE - Skalierbare Langzeitarchivierung (SCAPE - scalable longterm digital p...SCAPE - Skalierbare Langzeitarchivierung (SCAPE - scalable longterm digital p...
SCAPE - Skalierbare Langzeitarchivierung (SCAPE - scalable longterm digital p...SCAPE Project
 
Schlanke Discovery-Lösung auf Basis von TYPO3. Der neue Bibliothekskatalog de...
Schlanke Discovery-Lösung auf Basis von TYPO3. Der neue Bibliothekskatalog de...Schlanke Discovery-Lösung auf Basis von TYPO3. Der neue Bibliothekskatalog de...
Schlanke Discovery-Lösung auf Basis von TYPO3. Der neue Bibliothekskatalog de...Felix Lohmeier
 
Laudatio Workshop Entwicklersession zu Gemeinsamkeiten in Forschungsdatenrepo...
Laudatio Workshop Entwicklersession zu Gemeinsamkeiten in Forschungsdatenrepo...Laudatio Workshop Entwicklersession zu Gemeinsamkeiten in Forschungsdatenrepo...
Laudatio Workshop Entwicklersession zu Gemeinsamkeiten in Forschungsdatenrepo...Dennis Zielke
 

La actualidad más candente (13)

IANUS als fachspezifisches Forschungsdatenzentrum für die Altertumswissenscha...
IANUS als fachspezifisches Forschungsdatenzentrum für die Altertumswissenscha...IANUS als fachspezifisches Forschungsdatenzentrum für die Altertumswissenscha...
IANUS als fachspezifisches Forschungsdatenzentrum für die Altertumswissenscha...
 
Forschungsdaten – Nach der Publikation ist vor der Archivierung!
Forschungsdaten – Nach der Publikation ist vor der Archivierung!Forschungsdaten – Nach der Publikation ist vor der Archivierung!
Forschungsdaten – Nach der Publikation ist vor der Archivierung!
 
Digitale Daten in den Altertumswissenschaften
Digitale Daten in den AltertumswissenschaftenDigitale Daten in den Altertumswissenschaften
Digitale Daten in den Altertumswissenschaften
 
Ich kann die Datei nicht öffnen!
Ich kann die Datei nicht öffnen!Ich kann die Datei nicht öffnen!
Ich kann die Datei nicht öffnen!
 
DSpace 5 und Linked (Open) Data
DSpace 5 und Linked (Open) DataDSpace 5 und Linked (Open) Data
DSpace 5 und Linked (Open) Data
 
SCAPE Skalierbare Langzeitarchivierung
SCAPE Skalierbare LangzeitarchivierungSCAPE Skalierbare Langzeitarchivierung
SCAPE Skalierbare Langzeitarchivierung
 
Aus dem Alltag einer Datenkuratorin
Aus dem Alltag einer DatenkuratorinAus dem Alltag einer Datenkuratorin
Aus dem Alltag einer Datenkuratorin
 
Wieso, Weshalb, Warum - Zur digitalen Langzeitarchivierung in der Archäologie...
Wieso, Weshalb, Warum - Zur digitalen Langzeitarchivierung in der Archäologie...Wieso, Weshalb, Warum - Zur digitalen Langzeitarchivierung in der Archäologie...
Wieso, Weshalb, Warum - Zur digitalen Langzeitarchivierung in der Archäologie...
 
Über den Lebenszyklus von Forschungsdaten - Angebote und Empfehlungen von IANUS
Über den Lebenszyklus von Forschungsdaten - Angebote und Empfehlungen von IANUSÜber den Lebenszyklus von Forschungsdaten - Angebote und Empfehlungen von IANUS
Über den Lebenszyklus von Forschungsdaten - Angebote und Empfehlungen von IANUS
 
Campus Community / Institutionelle Virtuelle Forschungsumgebung. Eine Aufgabe...
Campus Community / Institutionelle Virtuelle Forschungsumgebung. Eine Aufgabe...Campus Community / Institutionelle Virtuelle Forschungsumgebung. Eine Aufgabe...
Campus Community / Institutionelle Virtuelle Forschungsumgebung. Eine Aufgabe...
 
SCAPE - Skalierbare Langzeitarchivierung (SCAPE - scalable longterm digital p...
SCAPE - Skalierbare Langzeitarchivierung (SCAPE - scalable longterm digital p...SCAPE - Skalierbare Langzeitarchivierung (SCAPE - scalable longterm digital p...
SCAPE - Skalierbare Langzeitarchivierung (SCAPE - scalable longterm digital p...
 
Schlanke Discovery-Lösung auf Basis von TYPO3. Der neue Bibliothekskatalog de...
Schlanke Discovery-Lösung auf Basis von TYPO3. Der neue Bibliothekskatalog de...Schlanke Discovery-Lösung auf Basis von TYPO3. Der neue Bibliothekskatalog de...
Schlanke Discovery-Lösung auf Basis von TYPO3. Der neue Bibliothekskatalog de...
 
Laudatio Workshop Entwicklersession zu Gemeinsamkeiten in Forschungsdatenrepo...
Laudatio Workshop Entwicklersession zu Gemeinsamkeiten in Forschungsdatenrepo...Laudatio Workshop Entwicklersession zu Gemeinsamkeiten in Forschungsdatenrepo...
Laudatio Workshop Entwicklersession zu Gemeinsamkeiten in Forschungsdatenrepo...
 

Destacado

Repositorieninhalte als Linked Data bereitstellen
Repositorieninhalte als Linked Data bereitstellenRepositorieninhalte als Linked Data bereitstellen
Repositorieninhalte als Linked Data bereitstellenPascal-Nicolas Becker
 
DepositOnce - Das Repositorium für Forschungsergebnisse der TU Berlin
DepositOnce - Das Repositorium für Forschungsergebnisse der TU BerlinDepositOnce - Das Repositorium für Forschungsergebnisse der TU Berlin
DepositOnce - Das Repositorium für Forschungsergebnisse der TU BerlinPascal-Nicolas Becker
 
Strategic Development - Future Plans for DSpace
Strategic Development - Future Plans for DSpaceStrategic Development - Future Plans for DSpace
Strategic Development - Future Plans for DSpacePascal-Nicolas Becker
 
Open Science Days 2014 - Becker - Repositories and Linked Data
Open Science Days 2014 - Becker - Repositories and Linked DataOpen Science Days 2014 - Becker - Repositories and Linked Data
Open Science Days 2014 - Becker - Repositories and Linked DataPascal-Nicolas Becker
 
Alfresco im Einsatz bei SWM – Stadtwerke München, Simon Rittsteiger, Projekt ...
Alfresco im Einsatz bei SWM – Stadtwerke München, Simon Rittsteiger, Projekt ...Alfresco im Einsatz bei SWM – Stadtwerke München, Simon Rittsteiger, Projekt ...
Alfresco im Einsatz bei SWM – Stadtwerke München, Simon Rittsteiger, Projekt ...Nicole Szigeti
 
SWIB14 Weaving repository contents into the Semantic Web
SWIB14 Weaving repository contents into the Semantic WebSWIB14 Weaving repository contents into the Semantic Web
SWIB14 Weaving repository contents into the Semantic WebPascal-Nicolas Becker
 
Fred frankfurt alfresco user day de 2015
Fred frankfurt alfresco user day de 2015Fred frankfurt alfresco user day de 2015
Fred frankfurt alfresco user day de 2015XeniT Solutions nv
 
Illuminating DSpace's Linked Data Support
Illuminating DSpace's Linked Data SupportIlluminating DSpace's Linked Data Support
Illuminating DSpace's Linked Data SupportPascal-Nicolas Becker
 
Alfresco Day Milano 2016 - Pernexas
Alfresco Day Milano 2016 - PernexasAlfresco Day Milano 2016 - Pernexas
Alfresco Day Milano 2016 - PernexasAlfresco Software
 
Anwendungsbeispiele verschiedener SAP-Alfresco Umgebungen - Volker Bläsig, CE...
Anwendungsbeispiele verschiedener SAP-Alfresco Umgebungen - Volker Bläsig, CE...Anwendungsbeispiele verschiedener SAP-Alfresco Umgebungen - Volker Bläsig, CE...
Anwendungsbeispiele verschiedener SAP-Alfresco Umgebungen - Volker Bläsig, CE...Nicole Szigeti
 
Alfresco Day Vienna 2016: Activiti – ein Katalysator für die DMS-Strategie be...
Alfresco Day Vienna 2016: Activiti – ein Katalysator für die DMS-Strategie be...Alfresco Day Vienna 2016: Activiti – ein Katalysator für die DMS-Strategie be...
Alfresco Day Vienna 2016: Activiti – ein Katalysator für die DMS-Strategie be...Alfresco Software
 
Alfresco im Einsatz bei SIGNA, Franz Hillebrand, Managing Director, SIGNA Inf...
Alfresco im Einsatz bei SIGNA, Franz Hillebrand, Managing Director, SIGNA Inf...Alfresco im Einsatz bei SIGNA, Franz Hillebrand, Managing Director, SIGNA Inf...
Alfresco im Einsatz bei SIGNA, Franz Hillebrand, Managing Director, SIGNA Inf...Nicole Szigeti
 
Digital Asset Management
Digital Asset ManagementDigital Asset Management
Digital Asset Managementprivate
 
Alfresco Day Vienna 2016: How to Achieve Digital Flow in the Enterprise - Joh...
Alfresco Day Vienna 2016: How to Achieve Digital Flow in the Enterprise - Joh...Alfresco Day Vienna 2016: How to Achieve Digital Flow in the Enterprise - Joh...
Alfresco Day Vienna 2016: How to Achieve Digital Flow in the Enterprise - Joh...Alfresco Software
 
Parcial final info1
Parcial final info1Parcial final info1
Parcial final info1patita02
 
Libertad razones para el amor
Libertad  razones para el amorLibertad  razones para el amor
Libertad razones para el amoragustinaka
 

Destacado (20)

Repositorieninhalte als Linked Data bereitstellen
Repositorieninhalte als Linked Data bereitstellenRepositorieninhalte als Linked Data bereitstellen
Repositorieninhalte als Linked Data bereitstellen
 
DepositOnce - Das Repositorium für Forschungsergebnisse der TU Berlin
DepositOnce - Das Repositorium für Forschungsergebnisse der TU BerlinDepositOnce - Das Repositorium für Forschungsergebnisse der TU Berlin
DepositOnce - Das Repositorium für Forschungsergebnisse der TU Berlin
 
Strategic Development - Future Plans for DSpace
Strategic Development - Future Plans for DSpaceStrategic Development - Future Plans for DSpace
Strategic Development - Future Plans for DSpace
 
Zustand und Entwicklung von DSpace
Zustand und Entwicklung von DSpaceZustand und Entwicklung von DSpace
Zustand und Entwicklung von DSpace
 
Open Science Days 2014 - Becker - Repositories and Linked Data
Open Science Days 2014 - Becker - Repositories and Linked DataOpen Science Days 2014 - Becker - Repositories and Linked Data
Open Science Days 2014 - Becker - Repositories and Linked Data
 
Alfresco im Einsatz bei SWM – Stadtwerke München, Simon Rittsteiger, Projekt ...
Alfresco im Einsatz bei SWM – Stadtwerke München, Simon Rittsteiger, Projekt ...Alfresco im Einsatz bei SWM – Stadtwerke München, Simon Rittsteiger, Projekt ...
Alfresco im Einsatz bei SWM – Stadtwerke München, Simon Rittsteiger, Projekt ...
 
SWIB14 Weaving repository contents into the Semantic Web
SWIB14 Weaving repository contents into the Semantic WebSWIB14 Weaving repository contents into the Semantic Web
SWIB14 Weaving repository contents into the Semantic Web
 
Fred frankfurt alfresco user day de 2015
Fred frankfurt alfresco user day de 2015Fred frankfurt alfresco user day de 2015
Fred frankfurt alfresco user day de 2015
 
Illuminating DSpace's Linked Data Support
Illuminating DSpace's Linked Data SupportIlluminating DSpace's Linked Data Support
Illuminating DSpace's Linked Data Support
 
Alfresco Day Milano 2016 - Pernexas
Alfresco Day Milano 2016 - PernexasAlfresco Day Milano 2016 - Pernexas
Alfresco Day Milano 2016 - Pernexas
 
Anwendungsbeispiele verschiedener SAP-Alfresco Umgebungen - Volker Bläsig, CE...
Anwendungsbeispiele verschiedener SAP-Alfresco Umgebungen - Volker Bläsig, CE...Anwendungsbeispiele verschiedener SAP-Alfresco Umgebungen - Volker Bläsig, CE...
Anwendungsbeispiele verschiedener SAP-Alfresco Umgebungen - Volker Bläsig, CE...
 
Alfresco Day Vienna 2016: Activiti – ein Katalysator für die DMS-Strategie be...
Alfresco Day Vienna 2016: Activiti – ein Katalysator für die DMS-Strategie be...Alfresco Day Vienna 2016: Activiti – ein Katalysator für die DMS-Strategie be...
Alfresco Day Vienna 2016: Activiti – ein Katalysator für die DMS-Strategie be...
 
Alfresco im Einsatz bei SIGNA, Franz Hillebrand, Managing Director, SIGNA Inf...
Alfresco im Einsatz bei SIGNA, Franz Hillebrand, Managing Director, SIGNA Inf...Alfresco im Einsatz bei SIGNA, Franz Hillebrand, Managing Director, SIGNA Inf...
Alfresco im Einsatz bei SIGNA, Franz Hillebrand, Managing Director, SIGNA Inf...
 
Alfresco CMIS
Alfresco CMISAlfresco CMIS
Alfresco CMIS
 
Digital Asset Management
Digital Asset ManagementDigital Asset Management
Digital Asset Management
 
Alfresco Day Vienna 2016: How to Achieve Digital Flow in the Enterprise - Joh...
Alfresco Day Vienna 2016: How to Achieve Digital Flow in the Enterprise - Joh...Alfresco Day Vienna 2016: How to Achieve Digital Flow in the Enterprise - Joh...
Alfresco Day Vienna 2016: How to Achieve Digital Flow in the Enterprise - Joh...
 
Basic aspects of Open Access
Basic aspects of Open AccessBasic aspects of Open Access
Basic aspects of Open Access
 
Dokumentenmanagement mit Alfresco
Dokumentenmanagement mit AlfrescoDokumentenmanagement mit Alfresco
Dokumentenmanagement mit Alfresco
 
Parcial final info1
Parcial final info1Parcial final info1
Parcial final info1
 
Libertad razones para el amor
Libertad  razones para el amorLibertad  razones para el amor
Libertad razones para el amor
 

Similar a DSpace und das Semantic Web

AMSL Kick-off-Meeting sächsischer Hochschulbibliotheken
AMSL Kick-off-Meeting sächsischer HochschulbibliothekenAMSL Kick-off-Meeting sächsischer Hochschulbibliotheken
AMSL Kick-off-Meeting sächsischer HochschulbibliothekenBjörn Muschall
 
Kickoff Workshop zum Projekt amsl mit den sächsischen Hochschulbibliotheken
Kickoff Workshop zum Projekt amsl mit den sächsischen HochschulbibliothekenKickoff Workshop zum Projekt amsl mit den sächsischen Hochschulbibliotheken
Kickoff Workshop zum Projekt amsl mit den sächsischen HochschulbibliothekenLydiaU
 
Einbindung von Linked Data in existierende Bibliotheksanswendungen
Einbindung von Linked Data in existierende BibliotheksanswendungenEinbindung von Linked Data in existierende Bibliotheksanswendungen
Einbindung von Linked Data in existierende Bibliotheksanswendungenredsys
 
Anforderungen an Thesauri im Semantic Web
Anforderungen an Thesauri im Semantic WebAnforderungen an Thesauri im Semantic Web
Anforderungen an Thesauri im Semantic WebJoachim Neubert
 
1114 sasaki-metadata
1114 sasaki-metadata1114 sasaki-metadata
1114 sasaki-metadataFelix Sasaki
 
Linked Open Data - Eine Perspektive für die Bibliothekswelt?
Linked Open Data - Eine Perspektive für die Bibliothekswelt?Linked Open Data - Eine Perspektive für die Bibliothekswelt?
Linked Open Data - Eine Perspektive für die Bibliothekswelt?Felix Ostrowski
 
Präsentation amsl Deutscher Bibliothekartag 2014 ERM
Präsentation amsl Deutscher Bibliothekartag 2014 ERMPräsentation amsl Deutscher Bibliothekartag 2014 ERM
Präsentation amsl Deutscher Bibliothekartag 2014 ERMLydiaU
 
Projekt AMSL: Entwicklung eines Electronic Resource Management Systems für Bi...
Projekt AMSL: Entwicklung eines Electronic Resource Management Systems für Bi...Projekt AMSL: Entwicklung eines Electronic Resource Management Systems für Bi...
Projekt AMSL: Entwicklung eines Electronic Resource Management Systems für Bi...Björn Muschall
 
Integration von Normdaten in Bibliotheksanwendungen auf der Basis von Semanti...
Integration von Normdaten in Bibliotheksanwendungen auf der Basis von Semanti...Integration von Normdaten in Bibliotheksanwendungen auf der Basis von Semanti...
Integration von Normdaten in Bibliotheksanwendungen auf der Basis von Semanti...redsys
 
Linked Open (Library) Data
Linked Open (Library) DataLinked Open (Library) Data
Linked Open (Library) DataFab Fuerste
 
OpenNebula - CeBIT 2013
OpenNebula - CeBIT 2013OpenNebula - CeBIT 2013
OpenNebula - CeBIT 2013NETWAYS
 
Präsentation social semantic web
Präsentation social semantic webPräsentation social semantic web
Präsentation social semantic web_veronika_
 
A NoSQL Summer - The Year After
A NoSQL Summer - The Year AfterA NoSQL Summer - The Year After
A NoSQL Summer - The Year AfterMeMo News AG
 
RDF Application Profiles
RDF Application ProfilesRDF Application Profiles
RDF Application ProfilesKai Eckert
 
Sitzung 10
Sitzung 10Sitzung 10
Sitzung 10scuy
 
DSpace as publication platform
DSpace as publication platformDSpace as publication platform
DSpace as publication platformredsys
 
Oracle no sql-doag-datenbank_konferenz_juni_2014
Oracle no sql-doag-datenbank_konferenz_juni_2014Oracle no sql-doag-datenbank_konferenz_juni_2014
Oracle no sql-doag-datenbank_konferenz_juni_2014Gunther Pippèrr
 

Similar a DSpace und das Semantic Web (20)

Repositorieninhalte als LinkedData bereitstellen
Repositorieninhalte als LinkedData bereitstellenRepositorieninhalte als LinkedData bereitstellen
Repositorieninhalte als LinkedData bereitstellen
 
AMSL Kick-off-Meeting sächsischer Hochschulbibliotheken
AMSL Kick-off-Meeting sächsischer HochschulbibliothekenAMSL Kick-off-Meeting sächsischer Hochschulbibliotheken
AMSL Kick-off-Meeting sächsischer Hochschulbibliotheken
 
Kickoff Workshop zum Projekt amsl mit den sächsischen Hochschulbibliotheken
Kickoff Workshop zum Projekt amsl mit den sächsischen HochschulbibliothekenKickoff Workshop zum Projekt amsl mit den sächsischen Hochschulbibliotheken
Kickoff Workshop zum Projekt amsl mit den sächsischen Hochschulbibliotheken
 
Einbindung von Linked Data in existierende Bibliotheksanswendungen
Einbindung von Linked Data in existierende BibliotheksanswendungenEinbindung von Linked Data in existierende Bibliotheksanswendungen
Einbindung von Linked Data in existierende Bibliotheksanswendungen
 
Anforderungen an Thesauri im Semantic Web
Anforderungen an Thesauri im Semantic WebAnforderungen an Thesauri im Semantic Web
Anforderungen an Thesauri im Semantic Web
 
Nah am Nutzer (Steinberg) - Konzept und Umsetzung eines Discovery-Services mi...
Nah am Nutzer (Steinberg) - Konzept und Umsetzung eines Discovery-Services mi...Nah am Nutzer (Steinberg) - Konzept und Umsetzung eines Discovery-Services mi...
Nah am Nutzer (Steinberg) - Konzept und Umsetzung eines Discovery-Services mi...
 
1114 sasaki-metadata
1114 sasaki-metadata1114 sasaki-metadata
1114 sasaki-metadata
 
Linked Open Data - Eine Perspektive für die Bibliothekswelt?
Linked Open Data - Eine Perspektive für die Bibliothekswelt?Linked Open Data - Eine Perspektive für die Bibliothekswelt?
Linked Open Data - Eine Perspektive für die Bibliothekswelt?
 
Präsentation amsl Deutscher Bibliothekartag 2014 ERM
Präsentation amsl Deutscher Bibliothekartag 2014 ERMPräsentation amsl Deutscher Bibliothekartag 2014 ERM
Präsentation amsl Deutscher Bibliothekartag 2014 ERM
 
Projekt AMSL: Entwicklung eines Electronic Resource Management Systems für Bi...
Projekt AMSL: Entwicklung eines Electronic Resource Management Systems für Bi...Projekt AMSL: Entwicklung eines Electronic Resource Management Systems für Bi...
Projekt AMSL: Entwicklung eines Electronic Resource Management Systems für Bi...
 
Integration von Normdaten in Bibliotheksanwendungen auf der Basis von Semanti...
Integration von Normdaten in Bibliotheksanwendungen auf der Basis von Semanti...Integration von Normdaten in Bibliotheksanwendungen auf der Basis von Semanti...
Integration von Normdaten in Bibliotheksanwendungen auf der Basis von Semanti...
 
Linked Open (Library) Data
Linked Open (Library) DataLinked Open (Library) Data
Linked Open (Library) Data
 
OpenNebula - CeBIT 2013
OpenNebula - CeBIT 2013OpenNebula - CeBIT 2013
OpenNebula - CeBIT 2013
 
Präsentation social semantic web
Präsentation social semantic webPräsentation social semantic web
Präsentation social semantic web
 
A NoSQL Summer - The Year After
A NoSQL Summer - The Year AfterA NoSQL Summer - The Year After
A NoSQL Summer - The Year After
 
RDF Application Profiles
RDF Application ProfilesRDF Application Profiles
RDF Application Profiles
 
What’s new in Apache Solr 4.7 und Elasticsearch 1.1
What’s new in Apache Solr 4.7 und Elasticsearch 1.1What’s new in Apache Solr 4.7 und Elasticsearch 1.1
What’s new in Apache Solr 4.7 und Elasticsearch 1.1
 
Sitzung 10
Sitzung 10Sitzung 10
Sitzung 10
 
DSpace as publication platform
DSpace as publication platformDSpace as publication platform
DSpace as publication platform
 
Oracle no sql-doag-datenbank_konferenz_juni_2014
Oracle no sql-doag-datenbank_konferenz_juni_2014Oracle no sql-doag-datenbank_konferenz_juni_2014
Oracle no sql-doag-datenbank_konferenz_juni_2014
 

DSpace und das Semantic Web

  • 1. Workshop: DSpace und das Semantic Web Pascal-Nicolas Becker | Technische Universität Berlin | 104. Bibliothekartag | Nürnberg, 28.05.2015
  • 2. Agenda • Ziel & Motivation • Kurze Linked Data Einführung • Repositorien und das Semantic Web • dspace-rdf: Aufbau und Konfiguration • Questions & Answers • Evtl. Live-Demonstration Workshop-Charakter: Fragen, Ideen, Anmerkungen bitte jederzeit! Konkrete Konfiguration am Ende. Folie 2 DSpace und das Semantic Web | Pascal-Nicolas Becker | 104.Bibliothekartag | Nürnberg, 28.05.2014
  • 3. Kurze Vorstellung der Teilnehmer: Wer? Woher? Welche Version von DSpace? Folie 3 DSpace und das Semantic Web | Pascal-Nicolas Becker | 104.Bibliothekartag | Nürnberg, 28.05.2014
  • 4. Ziel & Motivation Folie 4 DSpace und das Semantic Web | Pascal-Nicolas Becker | 104.Bibliothekartag | Nürnberg, 28.05.2014
  • 5. Digitale Repositorien Source: The Directory of Open Access Repositories, http://www.opendoar.org, abgerufen am 06.06.2014. Ein Repositorium ist ein System zur sicheren Speicherung digitaler Objekte und der die Objekte beschreibenden strukturierten Metadaten. Beispiele: • Digitale Archive • Institutionelle Repositorien (Preprints, Postprints, OA-Publikationen, …) • Digitale Bilddatenbanken • Forschungsdaten-Repositorien • … Mehr als 2500 OA-Repositorien weltweit DSpace und das Semantic Web | Pascal-Nicolas Becker | 104.Bibliothekartag | Nürnberg, 28.05.2014 Folie 5
  • 6. Verbreitung von Repositoriensoftware OpenDOAR ROAR DSpace 1127 41,2% 1464 39,2% EPrints 375 13,7% 532 14,2% OPUS 71 2,6% 54 1,4% Fedora 41 1,5% 55 1,5% MyCore 8 0,3% 7 0,2% Andere 835 30,5% 516 13,8% Unbekannt 282 10,3% 1111 29,7% 2739 3739 Quelle: http://www.opendoar.org und http://roar.eprints.org, abgerufen am 06. Juni 2014. DSpace und das Semantic Web | Pascal-Nicolas Becker | 104.Bibliothekartag | Nürnberg, 28.05.2014 Folie 6
  • 7. xxx.lanl.org / ArXiv.org Quelle: Paul Ginsparg, First Steps Towards Electronic Research Communication. In: Computer in Physics, Vol. 8, No. 4, 1994, pp. 390-396. Foto: Paul Ginsparg “Although the WorldWideWeb still represents only a small fraction of the overall usage, this access mode is expected to become dominant in the near future.” Paul Ginsparg 1994 DSpace und das Semantic Web | Pascal-Nicolas Becker | 104.Bibliothekartag | Nürnberg, 28.05.2014 Folie 7
  • 8. Folie 8 DSpace und das Semantic Web | Pascal-Nicolas Becker | 104.Bibliothekartag | Nürnberg, 28.05.2014 The Semantic Web „Information varies along many axes. One of these is the difference between information produced primarily for human consumption and that produced mainly for machines. […] To date, the Web has developed most rapidly as a medium of documents for people rather than for data and information that can be processed automatically.“ Berners-Lee, Handler, Lasilla 2001
  • 9. Repositorieninhalte und das Semantic Web • Informationen im Internet sind auf den menschlichen Konsum ausgerichtet • Viele Informationen werden nur implizit über den Kontext zur Verfügung gestellt • Grundidee des Semantic Web: Implizite Informationen explizit machen, um sie automatisiert verarbeiten zu können • Ein Repositorium „kennt“ den Titel eines Artikels • Titel werden Fett und in größerer Schrift ausgegeben, Autorennamen kursiv • Wieso stellen wir diese Daten nicht auch maschinell nutzbar bereit? DSpace und das Semantic Web | Pascal-Nicolas Becker | 104.Bibliothekartag | Nürnberg, 28.05.2014 Folie 9
  • 10. Research Data Lifecycle DSpace und das Semantic Web | Pascal-Nicolas Becker | 104.Bibliothekartag | Nürnberg, 28.05.2014 Folie 10
  • 11. Bisheriger Datenaustausch mit Repositorien • OAI-PMH (Open Archive Initiative – Protocol for Metadata Harvesting): de-facto-Standard im Repositorienumfeld • Aber auf das Repositorienumfeld begrenzt! • Google unterstützt OAI-PMH seit 2008 nicht mehr (zuvor als Alternative zum Sitemap Protocol genutzt) • „Nur“ eine Schnittstelle, kein Format  Linked Data ist ein generischer nativer Weg Daten auszutauschen  Linked Data ist nicht auf das Umfeld von Repositorien beschränkt  Linked Data ist selbst beschreibend  Linked Data vereinfacht den Datenaustausch mit Repositorien DSpace und das Semantic Web | Pascal-Nicolas Becker | 104.Bibliothekartag | Nürnberg, 28.05.2014 Folie 11
  • 12. Linked Data – Kurze Einführung Folie 12 DSpace und das Semantic Web | Pascal-Nicolas Becker | 104.Bibliothekartag | Nürnberg, 28.05.2014
  • 13. Folie 13 DSpace und das Semantic Web | Pascal-Nicolas Becker | 104.Bibliothekartag | Nürnberg, 28.05.2014 The Linked Data Principles 1. Use URIs as names for things 2. Use HTTP URIs so that people can look up those things 3. When someone looks up a URI, provide useful information, using the standards (RDF*, SPARQL) 4. Include links to other URIs, so they can discover more things Tim Berners-Lee http://www.w3.org/DesignIssues/LinkedData.html  “This creates what I call a Semantic Web – a web of data that can be processed directly or indirectly by machines.” Tim Berners-Lee und Marc Fischetti: “Weaving the Web. The Past, Present and Future of the World Wide Web by its Initiator” London 1999, ISBN: 0-7528-2090-7
  • 14. URI = URN + URL http://digital-repositories.org/ontologies/dspace#Repository mailto:p.becker@tu-berlin.de • Uniformed Resource Identifier ist ein Identifikator für eine abstrakte oder physische Ressource • Ein URI kann ein Uniformed Resource Name, Uniformed Resource Locator oder beides sein • Ein URN ist ein Name, ein URL ist eine Adresse • Ein URI ist eindeutig! RFC 3986 Folie 14 DSpace und das Semantic Web | Pascal-Nicolas Becker | 104.Bibliothekartag | Nürnberg, 28.05.2014 URL URN URI
  • 15. Resource Description Framework – RDF • Datenmodell • Formulierung logischer Aussagen über beliebige Ressourcen • Struktur von Trippeln: Subject – Predicate – Object • Subject und Predicate sind immer URIs, Objects sind URIs oder Literale Folie 15 DSpace und das Semantic Web | Pascal-Nicolas Becker | 104.Bibliothekartag | Nürnberg, 28.05.2014 Reposi- torien- software DSpace ist eine DSpace Committer Group Claudia Jürgen Pascal- Nicolas Becker … gepflegt von hat Mitglied hat Mitglied hat Mitglied programmiert / entwickelt programmiert / entwickelt dokumentiert / pflegt / unterstützt heißt Anzahl bekannter Installationen 1200 „DSpace“
  • 16. Vokabulare und Ontologien • Zur Formulierung von Aussagen in RDF brauchen wir URIs • URIs sollen eine „Bedeutung“ (=> Semantik) haben • Vokabulare dienen dazu URIs eine Semantik zuzuweisen • Aus logischen Aussagen kann man Schlussfolgerungen ziehen • Zum Teil ist Wissen erforderlich, dass über die reinen Vokabulare hinausgeht • Hintergrund- oder Domänenwissen wird in Ontologien abgelegt • Ontologien und Vokabulare werden als Linked Data und somit in RDF veröffentlicht • RDF-Schema (RDFS) dient der Beschreibung von Vokabularen • Klassenmodell, bei dem Klassen und Eigenschaften getrennt modelliert werden • Die Web Ontology Language (OWL) geht über die Möglichkeiten von RDFS hinaus • für Ontologien genutzt Folie 16 DSpace und das Semantic Web | Pascal-Nicolas Becker | 104.Bibliothekartag | Nürnberg, 28.05.2014
  • 17. Beispiel: DSpace Metadata RDF Mapping Vocabulary @prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#> . @prefix dc: <http://purl.org/dc/elements/1.1/> . @prefix : <http://digital-repositories.org/ontologies/dspace-metadata-mapping/0.2.0#> . ... <http://digital-repositories.org/ontologies/dspace-metadata-mapping/0.2.0> rdfs:comment "Vocabulary for describing mappings of DSpace metadata to rdf." ; dc:contributor "Pascal-Nicolas Becker" ; dc:title "DSpace Metadata RDF Mapping Spec" ; dc:description "Vocabulary for describing mappings of DSpace metadata to RDF. This vocabulary is used to configure DSpace how to convert stored metadata into RDF." ; dc:date "2014-04-18". :DSpaceMetadataRDFMapping a rdfs:Class ; rdfs:label "DSpace Metadata RDF Mapping" ; rdfs:comment "Represents the mapping of a DSpace metadata value to an RDF equivalent.". :Result a rdfs:Class ; rdfs:subClassOf rdf:Statement ; rdfs:label "DSpace Metadata RDF Mapping Result" ; rdfs:comment "A reified statement that describes the result of the DSpaceMetadataRDFMapping.". ... Folie 17 DSpace und das Semantic Web | Pascal-Nicolas Becker | 104.Bibliothekartag | Nürnberg, 28.05.2014
  • 18. Beispiel: DSpace Repository Ontology @prefix : <http://digital-repositories.org/ontologies/dspace/#> . ... <http://digital-repositories.org/ontologies/dspace/> rdf:type owl:Ontology ; rdfs:label "DSpace Repository Ontology"@en ; dc:creator "Pascal-Nicolas Becker" ; dc:date "2014-09-11" ; dc:description "DSpace Repository Ontology"@en ; dc:description "Ontology to describe a repository using DSpace. You can find further information about dspace at http://www.dspace.org."@en . ... :hasBitstream rdf:type owl:ObjectProperty ; rdfs:comment "Links from an item to a bitstream of the item. Bitstreams can be a representation of an item or a part of a representation composed of several bitstreams. Bitstreams are arbitrary files, e.g. documents, archives, images, ..."@en ; rdfs:domain :Item ; rdfs:subPropertyOf :hasPart . ... ### http://digital-repositories.org/ontologies/dspace/#hasPart :hasPart rdf:type owl:ObjectProperty , owl:TransitiveProperty ; rdfs:comment "Links top down between the structure of a DSpace repository."@en ; owl:inverseOf :isPartOf . ... Folie 18 DSpace und das Semantic Web | Pascal-Nicolas Becker | 104.Bibliothekartag | Nürnberg, 28.05.2014
  • 19. Zusammenfassung • RDF ist ein Datenmodell zur Formulierung logischer Aussagen • Subject und Predicate sind immer URIs Objects sind URIs oder Literale • URIs sind eindeutig („Johann Jakob Freudenreich ist Bräutigam und braut zu gleich“) • Vokabulare und Ontologien sollen die Semantik einer URI beschreiben und Wissen „hinterlegen“ • Aus logischen Aussagen lassen sich Schlüsse ziehen • DSpace wird von der DSpace Committer Group gepflegt • Pascal-Nicolas Becker ist Mitglieder der DSpace Committer Group  Pascal-Nicolas Becker ist für die Pflege von DSpace (mit-)verantwortlich • Ein Computer „versteht“ die Semantik nicht • Ein Computer kann Logik anwenden • Logische Schlussfolgerungen wirken wie Verständnis Folie 19 DSpace und das Semantic Web | Pascal-Nicolas Becker | 104.Bibliothekartag | Nürnberg, 28.05.2014
  • 20. RDF-Repräsentationen • RDF ist ein Modell • RDF ist unabhängig von einer speziellen Repräsentation • Für RDF gibt es unterschiedliche Repräsentationen (Graphisch, RDF/XML, Turtle, N3, …) • Turtle gilt als benutzerfreundliche Alternative zu RDF/XML und ist eine Teilmenge von N3 • Die Default-Konfiguration von DSpace-RDF verwendet Turtle, die Konfiguration kann aber auch in anderen Repräsentationen angegeben werden • Die Beispiele in dieser Präsentation verwenden Turtle Folie 20 DSpace und das Semantic Web | Pascal-Nicolas Becker | 104.Bibliothekartag | Nürnberg, 28.05.2014
  • 21. SPARQL • SPARQL Protocol And RDF Query Language ist eine Abfragesprache für RDF • „Was SQL für relationale Datenbanken ist SPARQL für RDF“ • „SPARQL-Endpoint“: Schnittstelle, die über SPARQL abgefragt werden kann • Seit SPARQL 1.1 ist auch die Manipulation von Daten via SPARQL möglich SELECT * WHERE { ?s ?p ?o . } PREFIX dc: <http://purl.org/dc/elements/1.1/> SELECT ?s WHERE { ?s dc:contributor "Becker, Pascal-Nicolas" . } SPARQL by example: http://www.cambridgesemantics.com/semantic-university/sparql-by-example Folie 21 DSpace und das Semantic Web | Pascal-Nicolas Becker | 104.Bibliothekartag | Nürnberg, 28.05.2014
  • 22. Von RDF zu Linked Data • RDF ist ein Datenmodell • Linked Data ist ein Begriff für bestimmte Konventionen Daten zu bereitzustellen Linked Data Principles: 1. Use URIs as names for things 2. Use HTTP URIs so that people can look up those things 3. When someone looks up a URI, provide useful information, using the standards (RDF*, SPARQL) 4. Include links to other URIs, so they can discover more things Tim Berners-Lee http://www.w3.org/DesignIssues/LinkedData.html Folie 22 DSpace und das Semantic Web | Pascal-Nicolas Becker | 104.Bibliothekartag | Nürnberg, 28.05.2014
  • 23. HTTP • Linked Data setzt auf HTTP auf • Die in RDF verwandten URIs sollen via HTTP aufrufbar sein und weitere Informationen liefern => Linked Data • HTTP verfügt über Mechanismen um URLs weiterzuleiten • Linked Data unterscheidet zwischen URNs und URLs: URNs sollen auf URLs weitergeleitet werden, die die Daten (RDF/XML, Turtle, …) enthalten, die die durch den URN identifizierte Resource beschreiben (http://example.org/rdf/dog => http://example.org/dog.ttl) • doi:10.0123/4567 ist kein HTTP-URI! (dazu gleich mehr) Folie 23 DSpace und das Semantic Web | Pascal-Nicolas Becker | 104.Bibliothekartag | Nürnberg, 28.05.2014
  • 24. Vermeidbare Fehler und Hindernisse • URIs nachnutzen, wo immer möglich! Keine eigenen URIs erzeugen, wenn es bereits adäquate gibt • Beispiele: Für Klassifikationen, wie die Library of Congress Subject Headings (LCSH) oder die Dewey Decimal Classification (DDC), existieren bereits URIs • Erzeugung von URIs nur für „eigene“ Entitäten, Erzeugung von URIs nur wenn ausreichend Informationen vorhanden sind • Beispiel: Autoren • Können verschiedene Autoren gleichen Namens differenziert werden? • Sollten Autoren nicht eigene URIs erzeugen und hinterlegen können, anstatt von „fremden“ Institutionen URIs zugewiesen zubekommen? • Aber: Erzeugung von URIs für Objekte des Repositoriums (da autoritativ) • Erzeugung von Links so oft wie möglich DSpace und das Semantic Web | Pascal-Nicolas Becker | 104.Bibliothekartag | Nürnberg, 28.05.2014 Folie 24
  • 25. Repositorien und das Semantic Web Folie 25 DSpace und das Semantic Web | Pascal-Nicolas Becker | 104.Bibliothekartag | Nürnberg, 28.05.2014
  • 26. Repositorieninhalte sind besonders gut geeignet Inhalte von Repositorien sind zur Bereitstellung im Semantik Web besonders gut geeignet: • Metadaten existieren bereits in einer strukturierten Form • Sie müssen nicht erst generiert oder aufwändig manuell zur Publikation als Linked Data erzeugt werden • Es geht “lediglich” um die Konvertierung vorhandener Daten in RDF, um das hinzufügen von Links und das Publizieren unter Berücksichtigung der Linked Data Principles DSpace und das Semantic Web | Pascal-Nicolas Becker | 104.Bibliothekartag | Nürnberg, 28.05.2014 Folie 26
  • 27. Was speichern Repositorien?  Unmöglich die Dateien zu konvertieren (technische Probleme, manuell nicht leistbar)  Aber wir können die Metadaten konvertieren und die Dateien verlinken! • Digitale Objekte  Eine oder mehrere Dateien: Dokumente (PDF, Text, …), Bilder (PNG, Tiff, …), Tabellen (CSV, …), Audio (Wave, OGG/VORBIS, …), Video, … • Beschreibende Metadaten  Strukturierte Metadaten in Key-Value-Form: dc.title, dc.contributor.author, dc.description, dc.date.available, dc.subject.lcsh, dc.subject.ddc, … “Ein Repositorium ist ein System zur sicheren Speicherung und Weitergabe digitaler Objekte und der die Objekte beschreibenden Metadaten.“ DSpace und das Semantic Web | Pascal-Nicolas Becker | 104.Bibliothekartag | Nürnberg, 28.05.2014 Folie 27
  • 28. Charakteristika von Repositorien • Verschiedene Repositorien nutzen unterschiedliche Metadatenschemata  Die Konvertierung muss stark konfigurierbar und erweiterbar sein • Für Metadatenschemata können bereits Vokabulare existieren (z.B. DC, DDC, LCSH, …)  Werte von Metadaten müssen in URIs/Links konvertiert werden können • Repositorieninhalte ändern sich so gut wie nie (Zitierfähigkeit, Zuverlässigkeit), die Konvertierung kann aber zeitaufwändig sein  Daten konvertieren und in einem Cache speichern • Repositorien erzeugen URIs zur Adressierung ihrer Inhalte  Bestehende URIs nachnutzen und um Content Negotiation erweitern • Persistent Identifier (handle, DOI, …) verstoßen gegen die Linked Data Principles  Persistent Identifier sind in der Form als HTTP(S) URIs zu nutzen (z.B. http://hdl.handle.net/..., http://dx.doi.org/... ) DSpace und das Semantic Web | Pascal-Nicolas Becker | 104.Bibliothekartag | Nürnberg, 28.05.2014 Folie 28
  • 29. Repositoriensoftware erweitern • Hinzufügen eines Triple Stores (Triple Store = Datenbank für RDF) • Nutzung als Cache für die konvertierten Daten • Zur Bereitstellung eines SPARQL-Endpoints • Methoden entwickeln zur Konvertierung in RDF und zur Ergänzung von Links • Ein Modul zur Bereitstellung der konvertierten Daten als RDF-Serialisierung erstellen • Content Negotiation unterstützen File SystemFile System Relational Database Relational Database Triple StoreTriple Store RDF ConversionRDF Conversion Authorization System Authorization System Browse and Search Browse and Search Persistent Identifier Mgt. Persistent Identifier Mgt. Event SystemEvent System User Administration User Administration ...... Web UIWeb UI OAI-PMH Interface OAI-PMH Interface RESTREST SWORDSWORD ...... RDF Serialization RDF Serialization InterfacesInterfaces Business LogicBusiness Logic Storage LayerStorage Layer DSpace und das Semantic Web | Pascal-Nicolas Becker | 104.Bibliothekartag | Nürnberg, 28.05.2014 Folie 29
  • 30. Konvertierung vorhandener Metadaten in RDF • Repositoriensoftware kann um weitere Metadatenfelder erweitert werden • Dublin Core wird oft genutzt, auch andere Metadatenschemata müssen unterstützt werden  Die Konvertierung muss stark konfigurierbar sein!  Die Konfiguration sollte in RDF vorgenommen werden, da so die volle Funktionalität von RDF genutzt werden kann  „Reification“ kann zur Beschreibung der gewünschten Ergebnisse genutzt werden  Platzhalter können z.B. für URIs des Repositoriums verwendet werden  Reguläre Ausdrücke können Literale und/oder URIs aus Metadatenwerten generieren  Es braucht ein Vokabular um solche Konfigurationen zu erstellen DSpace und das Semantic Web | Pascal-Nicolas Becker | 104.Bibliothekartag | Nürnberg, 28.05.2014 Folie 30
  • 31. Repositorien beschreiben • Neben der Konvertierung der Metadaten sollten die Repositorien selbst beschrieben werden • Wer betreibt das Repositorium? Gibt es eine SWORD-Schnittstelle? Wo ist der SPARQL-Endpoint zu finden? Wie ist das Repositorium strukturiert? … • Auch braucht es ein Vokabular, um die Digitalen Objekte (Dateien) zu verlinken • Für DSpace habe ich die DSpace Repository Ontology erstellt: http://digital-repositories.org/ontologies/dspace • Es wäre wichtig eine Digital Repositories Ontology zu erstellen, unabhängig von der genutzten Repositoriensoftware • Ein Mapping zwischen einer solchen Ontologie und der DSpace Repository Ontology, der Eprints Ontology, … wäre hilfreich! (Mitstreiter gesucht) DSpace und das Semantic Web | Pascal-Nicolas Becker | 104.Bibliothekartag | Nürnberg, 28.05.2014 Folie 31
  • 32. DSpace-RDF Folie 32 DSpace und das Semantic Web | Pascal-Nicolas Becker | 104.Bibliothekartag | Nürnberg, 28.05.2014
  • 33. DSpace 5 • DSpace ist die weltweit am häufigsten eingesetzte Software für OA-Repositorien • DSpace 5.0 wurde im Januar 2015 veröffentlicht, 5.2 ist im Mai erschienen • Die TU Berlin hat DSpace 5 um Linked Data Support erweitert: • Konvertierung der Metadaten in Linked Data • Ausgabe als RDF/XML, Turtle, N-Triples, SPARQL, Content Negotation • Stark konfigurierbar, anpass- und erweiterbar • Standardkonfiguration mit ausgeliefert • Test it yourself: http://demo.dspace.org/data/handle/10673/5/ttl http://demo.dspace.org/data/handle/10673/5/ttl?text wget -O - --header=‘Accept: text/turtle’ http://demo.dspace.org/jspui/handle/10673/5 or download and install a release candidate Wenn Sie DSpace 5.0 einsetzen, bitte schalten Sie den Linked Data Support ein! DSpace und das Semantic Web | Pascal-Nicolas Becker | 104.Bibliothekartag | Nürnberg, 28.05.2014 Folie 33
  • 34. Komponenten • Daten werden bei Erzeugung und Änderungen automatisch in LD konvertiert • Konvertierung erweiter- und stark konfigurierbar • Verschiedene Module zur Erzeugung von URIs nutzbar (z.B. basierend auf DOIs, Handles oder den von DSpace erzeugten URIs). • Triple Store als Cache ergänzend zu Datenbank • [dspace-install]/bin/dspace rdfizer zur manuellen Steuerung • Neue Webapp: dspace-rdf stellt Daten als RDF-Serialisate bereit • Filter für Content Negotiation hinzugefügt (XMLUI und JSPUI) • Noch fehlend: Link in HTML-Version (JSPUI/XMLUI) auf LD Folie 34 DSpace und das Semantic Web | Pascal-Nicolas Becker | 104.Bibliothekartag | Nürnberg, 28.05.2014
  • 35. Interner Aufbau (Klassenstruktur) DSpace und das Semantic Web | Pascal-Nicolas Becker | 104.Bibliothekartag | Nürnberg, 28.05.2014 Folie 35
  • 36. DSpace-RDF: Konfiguration (config/modules/rdf.cfg) Konfiguration teilt sich auf: • Verbindungsdaten zum Triple Store • Wie verbindet sich DSpace? • Wo befindet sich der öffentliche SPARQL Endpoint? • Ein- und Ausschalten der Content Negotiation • Wie sollen URIs zur Identifikation der Resourcen in RDF generiert werden? • Welche „Plugins“ sollen zur Konvertierung verwandt werden? • Gegebenenfalls Konfiguration der Plugins Folie 36 DSpace und das Semantic Web | Pascal-Nicolas Becker | 104.Bibliothekartag | Nürnberg, 28.05.2014
  • 37. Verbindungsdaten • DSpace nutzt für Abfragen an den Triple Store die SPARQL 1.1 Query Language und das SPARQL 1.1 Graph Store HTTP Protocol • Dspace nutzt zur Manipulation des Triple Stores das SPARQL 1.1 Graph Store HTTP Protocol • In der Datei rdf.cfg sind die Adressen für die entsprechende Endpunkte und ggf. Daten zur Authentifikation anzugeben • Die Adresse des SPARQL Endpoints, wie er in RDF (z.B. mittels void:sparqlEndpoint) angegeben werden soll, sind im Rahmen der Konfiguration der Konvertierung anzugeben Folie 37 DSpace und das Semantic Web | Pascal-Nicolas Becker | 104.Bibliothekartag | Nürnberg, 28.05.2014
  • 38. Generierung von URIs • Es können URIs des Repositoriums oder Persistent Identifier in Form von HTTP-URIs verwendet werden • Dazu ist die Java-Klasse zur Generierung der URIs anzugeben: • LocalURIGenerator: Nutzung der „lokalen“ URIs des Repositoriums z.B. https://depositonce.tu-berlin.de/handle/11303/157 • DOIHandleURIGenerator / DOIURIGenerator: Nutzung von DOIs (Wahlweise mit Fallback auf URIs oder Handles) z.B. http://dx.doi.org/10.14279/depositonce-1 • HandleURIGenerator: Nutzung von Handles (mit Fallback auf URIs) z.B. http://hdl.handle.net/11303/15 Folie 38 DSpace und das Semantic Web | Pascal-Nicolas Becker | 104.Bibliothekartag | Nürnberg, 28.05.2014
  • 39. Konfiguration der Konvertierung • Konvertierung nutzt Plugins • Alle zu nutzenden Plugins sind anzugeben, z.B.: converter.plugins = org.dspace.rdf.conversion.StaticDSOConverterPlugin, org.dspace.rdf.conversion.MetadataConverterPlugin, org.dspace.rdf.conversion.SimpleDSORelationsConverterPlugin Folie 39 DSpace und das Semantic Web | Pascal-Nicolas Becker | 104.Bibliothekartag | Nürnberg, 28.05.2014
  • 40. StaticDSOConverterPlugin Das StaticDSOConverterPlugin: ergänzt statische Daten (z.B. Angabe wo der SPARQL- Endpoint zu finden ist oder die Homepage des Repositoriums) • Es können Daten angegeben werden, die zu allen Resourcen hinzugefügt werden sollen • Es können Daten abhängig vom Typ (Item, Collection, Community, Site) angegeben werden • rdf.cfg enthält den Pfad zu Dateien mit den jeweiligen statischen Inhalten • Dateien können in einer der gängigen RDF-Serialisierungen angegeben werden (per default Turtle) Folie 40 DSpace und das Semantic Web | Pascal-Nicolas Becker | 104.Bibliothekartag | Nürnberg, 28.05.2014
  • 41. SimpleDSORelationsConverterPlugin Das SimpleDSORelationsConverterPlugin bildet Beziehungen zwischen DSpace- Objekten ab: • Welche Top-Level-Communities hat das Repositorium? • Welche Subcommunities und Collections gehören zu einer Community? • Welche Items gehören zu einer Collection und welche Bitstreams zu welchen Items? • Auch die andere Richtung wird abgebildet: zu welchen Collections gehört ein Item? Zu welchen Communities eine Subcommunity oder Collection? • ... Das Plugin ermöglicht es die Linked-Data-Daten des Repositoriums durch das Verfolgen von Links zu erfassen, sich also in den konvertierten Daten von Resource zu Resource zu hangeln. Folie 41 DSpace und das Semantic Web | Pascal-Nicolas Becker | 104.Bibliothekartag | Nürnberg, 28.05.2014
  • 42. MetadataConverterPlugin • Konvertiert die Metadaten von Items • Kann zur Konvertierung von Bitstreams/Dateien erweitert werden • Konfiguration wird in RDF angegeben, so dass der volle Umfang von RDF genutzt werden kann • Konfiguration nutzt das DSpace Metadata RDF Mapping Vocabulary Folie 42 DSpace und das Semantic Web | Pascal-Nicolas Becker | 104.Bibliothekartag | Nürnberg, 28.05.2014
  • 43. DSpace Metadata RDF Mapping Vocabulary http://digital-repositories.org/ontologies/dspace-metadata-mapping/ • Ein “Mapping” beschreibt die Konvertierung eines Metadatenfeldes in RDF • Metadatenfelder können anhand Ihres Namens (key) und eines Regulären Ausdrucks erkannt werden, der auf den Wert des Feldes angewandt wird • Erzeugt ein oder mehrere Triple • Platzhalter für die URI des zu konfigurierenden Objekts • Sowohl Literale als auch Ressourcen erzeugbar • Literale können typisiert und Language Tags verwendet werden • Die Sprachangabe zu Metadatenfeldern aus DSpace kann genutzt werden • Der Wert eines Metadatenfeldes kann übernommen werden • Reguläre Ausdrücke können zur Manipulation von Metadatenwerten bei der Erzeugung von Literalen und Resource URIs verwandt werden DSpace und das Semantic Web | Pascal-Nicolas Becker | 104.Bibliothekartag | Nürnberg, 28.05.2014 Folie 43
  • 44. Folie 44 DSpace und das Semantic Web | Pascal-Nicolas Becker | 104.Bibliothekartag | Nürnberg, 28.05.2014 @prefix dc: <http://purl.org/dc/elements/1.1/> . @prefix dm: <http://digital-repositories.org/ontologies/dspace-metadata- mapping/0.2.0#> . @prefix : <#> . :title dm:metadataName "dc.title" ; dm:creates [ dm:subject dm:DSpaceObjectIRI ; dm:predicate dcterms:title ; dm:object dm:DSpaceValue ; ] ; . Beispiel: DSpace Metadata RDF Mapping Vocabulary
  • 45. Folie 45 DSpace und das Semantic Web | Pascal-Nicolas Becker | 104.Bibliothekartag | Nürnberg, 28.05.2014 :doi dm:metadataName „dc.identifier.doi" ; dm:condition „^doi:“ ; dm:creates [ dm:subject dm:DSpaceObjectIRI ; dm:predicate dc:identifier; dm:object [ a dm:ResourceGenerator ; dm:modifier [ dm:matcher „^doi:(.*)$“ ; dm:replacement „http://dx.doi.org/$1“ ; ] ; dm:pattern „$DSpaceValue“ ; ] ; ] ; . Beispiel: DSpace Metadata RDF Mapping Vocabulary
  • 46. Questions & Answers Folie 46 DSpace und das Semantic Web | Pascal-Nicolas Becker | 104.Bibliothekartag | Nürnberg, 28.05.2014
  • 47. Live-Demonstration Folie 47 DSpace und das Semantic Web | Pascal-Nicolas Becker | 104.Bibliothekartag | Nürnberg, 28.05.2014
  • 48. Technische Universität Berlin Universitätsbibliothek Pascal-Nicolas Becker p.becker@tu-berlin.de Servicezentrum Forschungsdaten und –publikationen http://www.szf.tu-berlin.de Repositorium DepositOnce http://depositonce.tu-berlin.de Diplomarbeit „Repositorien und das Semantic Web“ http://www.pnjb.de/uni/diplomarbeit/ DSpace und das Semantic Web | Pascal-Nicolas Becker | 104.Bibliothekartag | Nürnberg, 28.05.2014 Folie 48