6. Memoirs of Sr Isaac
1752
Newtons Life
dc:issued
dc:title
http://data.dm2e/
manuscript1
dc:subject
dc:creator
William Stukeley Isaac Newton
7. Memoirs of Sr Isaac http://data.dm2e/ dc:issued
dc:title 1752
Newtons Life manuscript1
dc:creator dc:subject
http://data.dm2e/ http://data.dm2e/
author1 subject1
foaf:name rdfs:label
William Stukeley Isaac Newton
8. Memoirs of Sr Isaac http://data.dm2e/ dc:issued
dc:title manuscript1 1752
Newtons Life
dc:creator dc:subject
William Stukeley Isaac Newton
foaf:name foaf:name
http://viaf.org/ http://viaf.org/
WilliamStukeley IsaacNewton
foaf:depiction
foaf:depiction
rel:friendOf
foaf:dateOfBirth foaf:dateOfBirth
1687 1642
9. Memoirs of Sr Isaac http://data.dm2e/ dc:issued
dc:title manuscript1 1752
Newtons Life
dc:creator dc:subject
William Stukeley Isaac Newton
foaf:name foaf:name
http://viaf.org/ http://viaf.org/
WilliamStukeley IsaacNewton
foaf:depiction
foaf:depiction
rel:friendOf
foaf:dateOfBirth foaf:dateOfBirth
1687 1642
21. http://dm2e.eu @DM2Europeana
Linked
Open
Manuscript
data
now!
Editor's Notes
Mein Name ist Konstantin Baierer und ich möchte Ihnen heute das Projekt DM2E – Digitised Manuscripts to Europeaana- vorstellen. DM2E ist ein EC-gefördertes Projekt, dass sich um die Transformaiton von digitalisierten Handschriften nach Linked Data bemüht. Da die Zeit begrenzt ist möchte ich mich auf zwei Aspekte konzentrieren: Wie wir Handschriften-Metadaten nach LD bringen und wie Geisteswissenschaftler auf neue Weise damit arbeiten können.
Es geht um andschriften, die zu Zeitpunkt X geschrieben wurden, in Bibliotheken oder Archiven die Jahrhunderte überdauert haben, in einem der zahlreichen Digitalisierungsprojekte der letzten Jahre digitalisiert wurden und jetzt im Web zu betrachten sind.
DM2E arbeitet mit rund einem Dutzend Datenprovider zusammen, die ihre Daten teilweise enorm gut erschlossen haben und qualitativ hervorragende Metadaten bieten. Das sind natürlich wahre Schätze, die es lohnen, gehoben und nach LOD gebracht zu werden.
http://www.e-codices.unifr.ch/en/csg/0912/3/small Aber sie sind doch schon im Web verfügbar? Für das einfache browsing der Handschriften gibt es hervorragende Interfaces, für Programmierer allerdings nicht, da muss man hoffen, dass es eine Schnittstelle gibt, aber auch dann sind die Daten sind sehr providerspezifisch.
Nehmen wir ein Beispiel, wie wir RDF aus einer handschrift erzeugen können. Das ist die Titelseite der "Memoiren von Sr Isaac Newton", geschrieben 1752 von William Stukeley.
Zunächst erzeugen wir eine URI für die Handschrift und verknüpfen die Felder als zeichenketten: Titel, Errscheinungsjahr, Autor und ein Schlagwort, das wir aus dem Titel generiert haben.
Im nächsten Schritt lösen wir uns von der Zentriertheit auf das Manuskript und machen den autor und das Schlagwort zu eigenständigen Resourcen, die auch unabhängig vom Manuskript existieren und damit nachnutzbar werden.
Jetzt können wir diese Resourcen mit Resourcen, die bereits im linked Data Web sind, abgleichen und erkennen, dass "unser" William Stukeley der gleiche William Stukeley ist, der bereits im VIAF Datenset verfügbar ist. Ausserdem wissen wir jetzt, dass unser Schlagwort eine Person repräsentiert, nämlich Isaac Newton, den wir ebenfalls in VIAF gefunden haben.
Durch einen automatisierbaren Abgleich über standardisierte Schnittstellen mit dem Linked Open Data Web haben wir somit auf einen Schlag eine enorme Anreicherung unserer Daten: Aus den simplen Zeichenketten sind Personen geworden, mit Geburtsjahren und Portraits. Wir wissen jetzt sogar, dass Wiliam Stukeley und Isaac Newton Zeitgenossen waren, ja sogar, dass sie Freunde waren!
Diesen Abgleich von lokalen Resourcen und entfernten Resourcen im WWW, nennt man Linking. Durch das Verlinken der Daten entsteht ein Netzwerk von Daten, der "Giant Global Graph" wie Tim Berners-Lee es nannte. Das hier ist eine Visualisierung des GGG, in dem man sieht, wie Datensets verschiedener Anbieter miteinander verbunden sind.
Hier sieht man die Bubbles, die aus Bibliotheksdaten generiert wurden. Das sind schon recht viele, aber wir hoffen, dass im weiteren Verlauf von DM2E für jeden unserer Daten-Provider eine neue, gut mit dem Rest der Wolke verknüpfte, Bubble hinzukommen wird.
Nun dazu, wie wir Digital Humanists neue Werkzeuge an die Hand geben wollen.
Der klassische analoge Geisteswissenschaftler arbeitet noch heute in ähnlicher Weise wie es hier dargestellt ist: Er ist örtlich gebunden, sein primärer Forschungsgegenstand sind Bücher, seine Tools (z.B. der Globus) sind ebenfalls lokal vorhanden und er schreibt viel mit Federkiel und Tinte. Er kommuniziert über Briefe oder E-Mails.
Mit den Tools, für die wir die Grundlage schaffen, sollten Geisteswissenschaftler ortsunabhängig arbeiten können, wie der junge Mann hier. Der digitale Geisteswissenschaftler arbeitet primär im Netz, kommuniziert online in sozialen Netzwerke. Sein Forschungsgegenstand ist nicht das gedruckte Buch, sondern das Wesen des Buches.
Klassische wissenschaftliche Kommunikation findet über Briefe statt. Wie wir an dieser Visualisierung der Republic of Letters über einen zeitraum von vier Jahren sehen, war die Kommunikation seit jeher rege.
Betrachten wir allerdings die Geschwindigkeit mit der heute kommuniziert wird! Das hier ist eine Visualisierung des Diskurses, der per Twitter zu einer einzigen Konferenz in den USA geführt wurde. Um dieser Geschwindigkeitszunahme Rechnung zu tragen, brauchen wir unkomplizierte und semantisch reiche Methoden, Information zu transportieren.
Die klassische geisteswissenschaftliche Recherche beginnt und endet in einer Bibliothek. Ein Bibliothekskatalog verzeichnet gedruckte Werke, andere Sucheinstiege sind nur geeignet, Werke zu finden. Wir denken, dass es an der zeit ist, sich von der Fixierung auf das Werk als Anfang und Ende der Suche zu lösen.
Stattdessen wollen wir dem digitalen Geisteswissenschaftler navigationsmöglichkeiten im LOD Web bieten. Er soll Resourcen jedweder Art unkompliziert speichern, wiederfinden und annotieren können. Über das Europeana Portal sollte er einen guten Sucheinstieg haben
Annotation von Handschriften funktionierte lange Zeit über Marginalien. Seitdem es nicht mehr gerne gesehen wird, in kostbare Handschriften zu kritzel, verwendet man Notizzettel oder, modernerweise, Post-Its. Querverweise zu anderen Resourcen (z.B. anderen Werken) war nur durch bestimmte Ansetzungsformen möglich und nicht immer zielführend.
(Pundit) Mit Linked Data-basierten Tools ist es erstmals möglich, wirklich intertextuell zu arbeiten, einzelne Textabschnitte auf andere Textabschnitte qualifiziert zu beziehen. Schlagworte sind nicht mehr so subjektiv wie früher, da Schlagwörter eindeutig sind, weil sie eine URI haben.
Lassen sie mich mit einer kleinen Remineszenz an TBLs berühmte "Raw Data Now!" Slide enden. Das Projekt ist noch in der Frühphase, wenn Sie Interesse haben, schauen sie auf dm2e.eu vorbei, folgen sie uns auf Twitter oder unterhalten Sie sich heute mit mir oder meinen Kolleginnen. Vielen Dank!