Die in Rechnungen enthaltenen Informationen werden von Historikern gerne nicht nur als Text sondern auch als strukturierte Daten ausgewertete. Im Internet sind die Technologien des sog. „Semantic Web“ eine sich zunehmend verbreitende Strategie der Publikation solcher Daten. Eine Rechnungsedition, die sich nicht nur am Standard der digitalen Edition TEI orientiert sondern zusätzlich auch eine Datenrepräsentation nach dem vom W3C festgelegten Standard RDF (Resource Description Framework) veröffentlicht, ermöglicht damit komplexe Abfragen mit Hilfe der Abfragesprache SPARQL (SPARQL Protocol and RDF Query Language), welche das W3C für das Semantic Web standardisiert hat. Eine solche Publikation ist aber nicht nur eine Form, eine Rechnungsedition besser nachnutzbar zu machen, sondern bietet auch die Möglichkeit, die in ihr enthaltenen Informationen mit den Mitteln von Linked Open Data – einem weiteren Konzept des Semantic Web – auszuwerten. Dabei geht es darum, online verfügbare Ressourcen zur Normalisierung von Maßangaben, Geldbeträgen, Gütern und Berufsbezeichnungen, in die Auswertung der Daten einzubinden. Der Beitrag wird solche Möglichkeiten des Semantic Web am Beispiel der digitalen Edition der Basler Jahrrechnungen des 16. Jahrhunderts vorstellen.
Semantic Technologies in the Scholarly Edition of Medieval and Early Modern Accounts
1. Über die Rolle von Technologien des
Semantic Web bei der Edition von
Rechnungen und Amtsbüchern
Georg Vogeler
<georg.vogeler@uni-graz.at>
Institut für Dokumentologie und Editorik e.V.
Konzeptionelle Überlegungen zur Edition von Rechnungen und Amtsbüchern des späten Mittelalters, Hamburg 2.-3.2.2015
2. Edition
Text als Sprache
Text als InhaltText als Bild
Dokument
Handelt von
Gelesen als
Gelesen als
Handelt von
Sieht aus Handelt von
3. Edition
Text als Sprache
Text als InhaltText als Bild
Dokument
Diplomatische
Transkription Tabellarische
Darstellung
Textkritische Edition
mit Variantenapparat
Traditionelle
Editionskonzepte
für Rechnungen
4. Digitale Edition: Technologien
• Text als Bild
– Digitalphotographie
– archivfähige Bilddatenformate wie z.B. TIFF, JPG2000
– Bildbetrachter, wie z.B. DFG Viewer, jQuery-Plugins,
IIIF
• Text als Sprache
– XML/TEI, mit Modifizierung (ODD)
– XMLEditoren wie xmlcopy, Oxygen-XML Editor z.B.
mit Ediarium-Plugin, handgeschriebene Online-
Editoren z.B. EditMOM
5. Technologien für Inhalte?
• „Datenbanken“
• Tabellenkalkulation (OO Calc, MS Excel ...)
• Buchführungssoftware
• Datenformate?
– CSV (Zeichen-/Kommaseparierte Werte)
– DDI (Data Documentation Initiative) für
Metadaten incl. Datenkategorien
6. Technologien für Inhalte:
Das Semantic Web des W3C
• RDF (Resource Description Framework)
– Generelles Konzept zur Abbildung von „Aussagen“
über die Welt in Computercode
• SPARQL (SPARQL Protocol and RDF Query
Language)
– Abfragesprache für in RDF kodierten Aussagen
• OWL (Web Ontology Language) / RDFs (RDF
Schema)
– Definitionen der in RDF verwendeten Codes und
Regelwerk zur Beschreibung ihrer Beziehungen
7. RDF für Rechnungen, z.B.
Digitale Edition der Basler Jahrrechnungen 1535-1611, unter der Leitung von Susanna
Burghartz, im Erscheinen, hier Vorabansicht zur Jahrrechnung 1547
<http://gams.uni-graz.at/archive/objects/o:srbas.1547/datastreams/RDF/content>
8. oder auch ...
@prefix gams.srbas.1547:
<http://gams.uni-graz.at/archive/get/o:srbas.1547/sdef:TEI/get#> .
@prefix bk:<http://gams.uni-graz.at/rem/bookkeeping/> .
@prefix xsd:<http://www.w3.org/2001/XMLSchema#> .
gams.srbas.1547:d2e13392_calc
a bk:#bk_total_calc ;
a bk:#bk_balance
<http://gams.uni-graz.at/onto/#partOf>
<http://gams.uni-graz.at/o:srbas.1547> ;
bk:amount gams.srbas.1547:toplevel_calc .
gams.srbas.1547:toplevel_calc bk:num "-3233262"^^xsd:decimal ;
bk:unit bk:#d ;
bk:as bk:#bk_d ;
N3/turtle-Syntax
9. Semantic Web bei der Digitalen Edition
der Jahrrechnungen der Stadt Basel
• Als Format für die Veröffentlichung der Texte
als „Daten“
• Als internes Datenbankformat für
Darstellungen wie die Kontenübersicht
11. Semantic Web bei der Digitalen Edition
der Jahrrechnungen der Stadt Basel
• Als Format für die Veröffentlichung der Texte
als „Daten“
• Als internes Datenbankformat für
Darstellungen wie die Kontenübersicht
• Als interne Datenbank für die Suche
12. Ist das „Semantic Web“?
• Nein, denn die Anwendung verwendet
Datenbankoperationen, die auch mit
relationalen Datenbanken möglich sind
• Jein, denn es sind Datenbankoperationen mit
erhöhtem Komplexitätsgrad (z.B.
Kontenhierarchien)
• Ja, denn die Anwendung verwendet RDF,
SPARQL und einen SPARQL-Endpoint
13. „SPARQL-Endpoints“
= Öffentliche Schnittstellen, um SPARQL-Anfragen an RDF-Ressourcen
auf unterschiedlichen Servern zu machen:
SELECT DISTINCT ?jahr ?von ?entry ?betrag ?text ?o ?signofamount
?konto
WHERE {
SERVICE <http://rem.gams.uni-graz.at/sesame/sparqlendpoint> {
?entry bk:inhalt ?text; g2o:partOf ?o ; bk:amount ?a .
?a bk:num ?betrag ; bk:as ?signofamount .
?o dc:date ?jahr ; srbas:from ?von ; g2o:sameAs ?mo .
{ ?text bds:search „umb" ; bds:matchAllTerms "true" . }
}
SERVICE <http://gams.uni-graz.at/mulgara/sparqlendpoint> {
?mo <fedora-rels-ext:isMemberOf> <fedora:context:srbas> .
}
}
ORDER BY ?jahr ?von ?o ?pfad ?entry
14. Welche Informationen könnte man aus
verteilten Resourcen ziehen?
Vergleichbarkeit von Angaben:
• Umrechnungslisten für Maße
• Taxonomien für Güter, Dienstleistungen,
Berufe etc.
• Preise/Löhne für
Waren/Dienstleistungsgruppen
17. Suche z.B. nach Weinpreisen
in den
Basler
Jahres-
rechnun-
gen
mit Hilfe
eines
SPAQRL-
Inferface
für jeder-
mann
möglich: http://linkeddata.uriburner.com/sparql
18. ein paar Ergebnisse aus Basel
date menge preis in lb text
1535 24 0.95
"Für xxiiij soum win, von armen luten an ir schuld empangen, uff
den schuld thät xix ß ist aller her in in keller komen xxij lb xvj ß "
1535 24 0.95
"Item uszgeben umb xxiiij soum win, so die armen lüt an ir schuld
der reben herin in keller gewert haben xxij lb xvj ß "
1535 2 1.35
"Item geben umb ij soum win, dem schaffner desz capittels
gütern zu Siszach, der den werklüten am wiger zu Artistorff
worden ist ij lb xiiij ß
1536 13.5 1.8
"Fur xiiij̶ soum win von armen lüten an den kouff der reben
empfangen, thut nach dem schlag in gelt xxiiij lbvj ß"
1539 8 0.91875
"An die schuld der alten extanzen empfangen viij soum win, sind
mit gellt verrechnet vij lb vij ß "
1543 1 4 "Item iiij lb dem predicanten zallt fur ein soum win"
1543 2 4 "Item viij lb dem predicanten fur zwen soum win geben"
19. Suche z.B. nach Weinpreisen
• in den Basler Jahresrechnungen
– mit Hilfe eines SPAQRL-Inferface wie z.B.
http://linkeddata.uriburner.com/sparql für
jedermann möglich
• ... und in den Rechnungen des Deutschen
Ordens?
• auch, wenn die Daten als RDF veröffentlicht
werden.
20. Umrechungen, Taxonomien und Preise
• ... sind Inhalte von Rechnungsdokumenten.
• ... können in anderen Kontexten weiterverwendet
werden.
• ... sollten also digital mit Methoden ediert
werden, welche ihre direkte Nutzung als
Datenquelle in anderen Anwendungen erleichtert:
• nämlich:
Technologien des Semantic Web
21. Welche Rolle könnten die Technologien
des Semantic Web haben?
1. Beschreibung des Datenmodells
2. Speicherung und Abfrage der Inhalte von
Rechnungen und wirtschaftlichen
Amtsbüchern
3. Speicherung von gemeinsamen Ressourcen,
die in die Verarbeitung der Daten
eingebunden werden sollten.
22. Digitale Editionen von Rechnungen
unter Verwendung von Technologien
des Semantic Web schaffen eine
solide Basis für Ökonometrie ...
hofft
Georg Vogeler
<georg.vogeler@uni-graz.at>
Institut für Dokumentologie und Editorik e.V.
Notas del editor
Ich benutze das für die Basler Rechnungen
Was tun die nun?
=> 1. Datenaustausch; 2. Datenverknüpfung: geleicher Identifikator
http://lod.b3kat.de/sparql?query=PREFIX++rdf%3A%3Chttp%3A%2F%2Fwww.w3.org%2F1999%2F02%2F22-rdf-syntax-ns%23%3E+PREFIX++rdfs%3A%3Chttp%3A%2F%2Fwww.w3.org%2F2000%2F01%2Frdf-schema%23%3E+PREFIX++owl%3A%3Chttp%3A%2F%2Fwww.w3.org%2F2002%2F07%2Fowl%23%3E+PREFIX++dc%3A%3Chttp%3A%2F%2Fpurl.org%2Fdc%2Felements%2F1.1%2F%3E+PREFIX++dct%3A%3Chttp%3A%2F%2Fpurl.org%2Fdc%2Fterms%2F%3E+PREFIX++dcmitype%3A%3Chttp%3A%2F%2Fpurl.org%2Fdc%2Fdcmitype%2F%3E+PREFIX++bibo%3A%3Chttp%3A%2F%2Fpurl.org%2Fontology%2Fbibo%2F%3E+PREFIX++frbr%3A%3Chttp%3A%2F%2Fpurl.org%2Fvocab%2Ffrbr%2Fcore%23%3E+PREFIX++event%3A%3Chttp%3A%2F%2Fpurl.org%2FNET%2Fc4dm%2Fevent.owl%23%3E+PREFIX++foaf%3A%3Chttp%3A%2F%2Fxmlns.com%2Ffoaf%2F0.1%2F%3E+PREFIX++skos%3A%3Chttp%3A%2F%2Fw3.org%2F2004%2F02%2Fskos%2Fcore%23%3E+PREFIX++geonames%3A%3Chttp%3A%2F%2Fwww.geonames.org%2Fontology%23%3E+PREFIX++marcrel%3A%3Chttp%3A%2F%2Fid.loc.gov%2Fvocabulary%2Frelators%2F%3E+PREFIX++rdagr1%3A%3Chttp%3A%2F%2Frdvocab.info%2FElements%2F%3E++SELECT+*+WHERE+{+++++%3Fs+%3Fp+%3Fo+%3B++++++++marcrel%3Aaut+%3Chttp%3A%2F%2Fd-nb.info%2Fgnd%2F118658085%3E+.+++++}++LIMIT+500+++++&xhtml=true
Namensvarianten
2. Datenverknüpfung: gleicher Identifikator:
B3kat = Bayerischer Verbundkatalog : in dem man mit dem gleichen Identifkator nach Georg von Below suchen kann, wie in der DNB, der deutschen Biographie etc.
http://lod.b3kat.de/sparql?query=PREFIX++rdf%3A%3Chttp%3A%2F%2Fwww.w3.org%2F1999%2F02%2F22-rdf-syntax-ns%23%3E+PREFIX++rdfs%3A%3Chttp%3A%2F%2Fwww.w3.org%2F2000%2F01%2Frdf-schema%23%3E+PREFIX++owl%3A%3Chttp%3A%2F%2Fwww.w3.org%2F2002%2F07%2Fowl%23%3E+PREFIX++dc%3A%3Chttp%3A%2F%2Fpurl.org%2Fdc%2Felements%2F1.1%2F%3E+PREFIX++dct%3A%3Chttp%3A%2F%2Fpurl.org%2Fdc%2Fterms%2F%3E+PREFIX++dcmitype%3A%3Chttp%3A%2F%2Fpurl.org%2Fdc%2Fdcmitype%2F%3E+PREFIX++bibo%3A%3Chttp%3A%2F%2Fpurl.org%2Fontology%2Fbibo%2F%3E+PREFIX++frbr%3A%3Chttp%3A%2F%2Fpurl.org%2Fvocab%2Ffrbr%2Fcore%23%3E+PREFIX++event%3A%3Chttp%3A%2F%2Fpurl.org%2FNET%2Fc4dm%2Fevent.owl%23%3E+PREFIX++foaf%3A%3Chttp%3A%2F%2Fxmlns.com%2Ffoaf%2F0.1%2F%3E+PREFIX++skos%3A%3Chttp%3A%2F%2Fw3.org%2F2004%2F02%2Fskos%2Fcore%23%3E+PREFIX++geonames%3A%3Chttp%3A%2F%2Fwww.geonames.org%2Fontology%23%3E+PREFIX++marcrel%3A%3Chttp%3A%2F%2Fid.loc.gov%2Fvocabulary%2Frelators%2F%3E+PREFIX++rdagr1%3A%3Chttp%3A%2F%2Frdvocab.info%2FElements%2F%3E++SELECT+*+WHERE+{+++++%3Fs+%3Fp+%3Fo+%3B++++++++marcrel%3Aaut+%3Chttp%3A%2F%2Fd-nb.info%2Fgnd%2F118658085%3E+.+++++}++LIMIT+500+++++&xhtml=true
Die Edition der Basler
Erläutern ...
Am Anfang stehen ein paar Abkürzungen, die das Lesen weiter unten erleichtern
Das vom Programm berechnete Ergebnis der Baserl Jahrrechnung von 1547 hat den Fehlbetrag 3.233.262 Pfennige
1. haben Sie gesehen
Beruht auf SPARQL-Abfragen
z.B. Suche nach umb (als Hinweis auf Preisangaben)
http://gams.uni-graz.at/archive/objects/query:srbas.fulltext/methods/sdef:Query/get?params=%241|umb
3874 Buchungen mit Jahr, Konto, Text und numerischer Repräsentation in ca. 2 Sekunden
##Suche einschränken mit Jahreszahlen, RegEx
Kategoriale Suche (mit Hierarchie: Berechnungen) oder Anfrage auf Preisindices
... und letzteres hat Konsequenzen:
Zwei verschiedene Server werden hier gleichzeitig abgefragt
Verwendete Einheiten und Währungen
Die folgende Auflistung soll als Anhaltspunkt dienen zu den verschiedenen, in den Jahrbüchern verwendeten Einheiten und Währungen.
Einheiten
Wein: Saum – Omen – (Viertel) – Masz
Getreide: Malter – Sack – Viertzel – (Viertel) – Sester – Kupfli – Becher
Salpeter, Schiesspulver: Centner (ce.) - Pfund (h)
Tuch: Stuck – Ellen – Fuss
Holz: Klaffter
Gold, Silber: Marck - Lot – Glin[?]
Währungen:
Basler Pfund: Pfund (lb) – Schilling (ß) – Pfennig (d)
Sonnen Cronen – Sosz
(Rheinische) Gulden (fl.) - Batzen (bz.)
Marck
Franken
Münzen
Dicke Pfennige
Es sollte klar sein, daß das eigentlich Quellenaussagen sind: z.B. 1 Saum = 3 Ohm = 96 Mass (1838 = 150 l)
Ich muß gestehen, daß es natürlich nur geht, wenn Weinpreise kodiert sind...
http://linkeddata.uriburner.com/sparql?default-graph-uri=&query=PREFIX+gl-bus%3A+%3Chttp%3A%2F%2Fwww.xbrl.org%2Fint%2Fgl%2Fbus%2F2010-04-12%3E+PREFIX+bk%3A+%3Chttp%3A%2F%2Fgams.uni-graz.at%2Frem%2Fbookkeeping%2F%3E+PREFIX+srbas%3A+%3Chttp%3A%2F%2Fgams.uni-graz.at%2Fsrbas%2F%3E+PREFIX+g2o%3A%3Chttp%3A%2F%2Fgams.uni-graz.at%2Fonto%2F%23%3E+SELECT+%3Fdate+%3Fmenge+%3Fpreis+%3Finhalt+FROM+%3Chttp%3A%2F%2Fgams.uni-graz.at%2Farchive%2Fobjects%2Fo%3Asrbas.1535%2Fdatastreams%2FRDF%2Fcontent%3E+FROM+%3Chttp%3A%2F%2Fgams.uni-graz.at%2Farchive%2Fobjects%2Fo%3Asrbas.1536%2Fdatastreams%2FRDF%2Fcontent%3E+FROM+%3Chttp%3A%2F%2Fgams.uni-graz.at%2Farchive%2Fobjects%2Fo%3Asrbas.1537%2Fdatastreams%2FRDF%2Fcontent%3E+FROM+%3Chttp%3A%2F%2Fgams.uni-graz.at%2Farchive%2Fobjects%2Fo%3Asrbas.1539%2Fdatastreams%2FRDF%2Fcontent%3E+FROM+%3Chttp%3A%2F%2Fgams.uni-graz.at%2Farchive%2Fobjects%2Fo%3Asrbas.1540%2Fdatastreams%2FRDF%2Fcontent%3E+FROM+%3Chttp%3A%2F%2Fgams.uni-graz.at%2Farchive%2Fobjects%2Fo%3Asrbas.1541%2Fdatastreams%2FRDF%2Fcontent%3E+FROM+%3Chttp%3A%2F%2Fgams.uni-graz.at%2Farchive%2Fobjects%2Fo%3Asrbas.1542%2Fdatastreams%2FRDF%2Fcontent%3E+FROM+%3Chttp%3A%2F%2Fgams.uni-graz.at%2Farchive%2Fobjects%2Fo%3Asrbas.1543%2Fdatastreams%2FRDF%2Fcontent%3E+FROM+%3Chttp%3A%2F%2Fgams.uni-graz.at%2Farchive%2Fobjects%2Fo%3Asrbas.1544%2Fdatastreams%2FRDF%2Fcontent%3E+FROM+%3Chttp%3A%2F%2Fgams.uni-graz.at%2Farchive%2Fobjects%2Fo%3Asrbas.1545%2Fdatastreams%2FRDF%2Fcontent%3E+FROM+%3Chttp%3A%2F%2Fgams.uni-graz.at%2Farchive%2Fobjects%2Fo%3Asrbas.1548%2Fdatastreams%2FRDF%2Fcontent%3E+FROM+%3Chttp%3A%2F%2Fgams.uni-graz.at%2Farchive%2Fobjects%2Fo%3Asrbas.3155%2Fdatastreams%2FONTOLOGY%2Fcontent%3E+WHERE+{+%3Fp+bk%3AmentionedAt+%3Fsource+%3B++++gl-bus%3AmeasurableQuantity+%3Fmenge+%3B++++gl-bus%3AmeasurableCostPerUnit+%3Fpreis+.+%3Fsource+bk%3Ainhalt+%3Finhalt+.+%3Fsource+g2o%3ApartOf+%3Fo+.+%3Fo+srbas%3Afrom+%3Fdate+.+}+ORDER+BY+%3Fdate&should-sponge=soft&format=text%2Fhtml&CXML_redir_for_subjs=121&CXML_redir_for_hrefs=&timeout=30000000
Praktisch heißt das:
1. Bitten Sie Ihren technischen Partner, daß er eine RDF-Repräsentation Ihrer Daten ermöglicht – das kann auch mit Hilfe von Konvertierungssoftware passieren: http://www.w3.org/wiki/ConverterToRdf
Lassen Sie sich dabei von Ihrem technischen Partner nicht einreden, daß kompliziertere Zusammenhänge in Tabellen nicht ausdrückbar seien.
2. Verwenden Sie kontrollierte Vokabularien für Ihre Maße, Güter etc. – und wenn es sie nicht gibt, erstellen sie selber welche aus ihren Quellen.