SlideShare una empresa de Scribd logo
1 de 39
Universität zu Köln. Historisch-Kulturwissenschaftliche Informationsverarbeitung
Dr. Jan G. Wieners // jan.wieners@uni-koeln.de
Tools & Methods in Digital Humanities
Sommersemester 2015
09. Juni 2015 – Digitale Bibliotheken, Metadatenstandards: MARC, Dublin Core, TEI & Co.
 „BAM“-Sektor: Bibliotheken, Archive, Museen
 Digitale Bibliotheken, Digitale Archive, Digitale Museen
 Bibliographische Metadaten
 MARC
 MAB
 MARCXML
 Dublin Core (DC)
 Metadata Object Description Schema (MODS)
 Digitale Objekte
 Metadata Encoding and Transmission Standard (METS)
 Ein (DER) Standard zur Codierung von Texten: TEI
Überblick / ToDo
Digitale Bibliothek
Vannevar Bush(1890-1974)
Sammlung digitaler Objekte
 Text
 Video
 Audio
 3D Objekte
 Simulationen, VR, etc.
Bereitstellung von Zugriffsmöglichkeiten:
 Benutzerseite:
 Zugriff (access)
 Abfrage (retrieval) von digitalen Objekten
 Bibliothekarinnen-/Bibliothekarseite:
 Selection
 Organization
 Maintenance
Metadaten  Kritisch für alle Formen organisierter digitaler Inhalte
Digitale Bibliothek
Arten von Metadaten:
 Administrative metadata for managing resources, such as
rights information
 Descriptive metadata for describing resources (Beispiel:
Zettel des Zettelkataloges)
 Preservation metadata for describing resources, such as
recording preservation actions
 Technical metadata related to low-level system information,
such as data formats and any data compression used
 Usage metadata related to system use, such as tracking
user behavior
 “End user’s view is only the tip of the iceberg:
Much of the metadata is not intended for public display”
Metadaten
“End user’s view is only the tip of the
iceberg: Much of the metadata is not
intended for public display”
Arten von Metadaten:
 Administrative metadata for managing resources, such as
rights information
 Descriptive metadata for describing resources (Beispiel:
Zettel des Zettelkataloges)
 Preservation metadata for describing resources, such as
recording preservation actions
 Technical metadata related to low-level system information,
such as data formats and any data compression used
 Usage metadata related to system use, such as tracking
user behavior
 “End user’s view is only the tip of the iceberg:
Much of the metadata is not intended for public display”
Metadaten
 MARC
 MAB
 MARCXML
 Dublin Core (DC)
 Metadata Object Description Schema: MODS
 METS/MODS
Bibliographische Metadaten: Standards, eine Auswahl
MARC
MARC: MAchine Readable Cataloging
 Vorgestellt in den späten 1960er Jahren von Henriette Avram
(Library of Congress)
 !Grundproblem/-intention: Migration von Zettelkatalogen zu
computerbasierter Repräsentation von Datensätzen (Records)
 MARC-Datensätze gespeichert als Sammlung von Feldern in
einem „ziemlich komplexen Format“
[Witten, Bainbridge, Nichols (2010): How to Build a Digital Library]
 “Producing a MARC record for a particular publication is an
onerous undertaking that is governed by a detailed set of (highly
detailed) rules and guidelines called the Anglo-American
Cataloging Rules (AACR2R, 2R  final revised 2nd edition).”
[Witten, Bainbridge, Nichols (2010): How to Build a Digital Library]
MARC
Beispiel: http://catalog2.loc.gov
MARC
 Variable Control Fields (00x)
 Variable Data Fields
 Numbers and Codes (0xx)
 Main Entries (1xx)
 Titles (2xx)
 Edition, Imprint, etc. (2xx)
 Physical Description, etc. (3xx)
 Series Statements (4xx)
 Notes (5xx)
 […]
 Vgl. die Referenz unter
http://www.loc.gov/marc/bibliographic/ecbdhome.html
MARC Tags (die Spitze des Eisbergs)
MARCXML-Darstellung
MARCXML
Vorteile?
MARCXML  Dublin Core
http://lccn.loc.gov/79459272/dc
Satz von 15 Elementen zur Beschreibung von Ressourcen:
 Title
 Creator
 Subject
 Description
 Publisher
 Contributor
 Date
 Type
 Format
 Identifier
 Source
 Language
 Relation
 Coverage
 Rights
 Alle Elemente sind optional und wiederholbar, die Reihenfolge ist
beliebig
Dublin Core
Maschinelles Austauschformat für Bibliotheken
(MAB),
 MAB  1970er, Deutsche Nationalbibliothek
 MAB2  1990er
 Verwendung mit RAK (Regeln zur Alphabetischen Katalogisierung)
Kleiner Exkurs: MAB und VD18
Intention: Digitalisierung und Erschließung der im
deutschen Sprachraum veröffentlichten Drucke des
18. Jahrhunderts
Kontext
VD18
VD 16 VD 17 VD 18
~100 000 erfasste
Titel
~255 000
Titel
Ziel: Mehr als
600 000 Titel
Förderzeitraum: 1969-
1999
Förderzeitraum:
Seit Juli 1996
Förderzeitraum:
Ab 2009
VD18 – Arbeitsaufteilung / Workflow
SWB
KoordinierungsDB
VD18: Daten
Digitale Objekte:
METS / MODS
Problemstellung
 Zwei sich ergänzende internationale Formate zur
Kodierung von Metadaten und digitalen Objekten, die
aus mehreren Teilen (Seiten, Dateien, Kapitel, etc.)
bestehen (vgl. http://www.gbv.de/wikis/cls/METS/MODS):
 Metadata Encoding and Transmission Standard (METS)
 Metadata Object Description Schema (MODS)
 Heimat von METS: http://www.loc.gov/standards/mets/
 METS: „Designed to permit the representation,
maintenance, and exchange of the increasingly
complex digital objects that make up digital libraries.
Library catalogs have for years used MARC records to
fulfill these functions for their materials. The METS
initiative aims to do the same for digital collections.”
METS / MODS
Sieben Hauptabschnitte:
 Kopfteil (METS Header)
 Erschließungsangaben (Descriptive Metadata)
 Verwaltungsangaben (Administrative Metadata)
 Dateienabschnitt (File Section)
 Strukturbeschreibung (Structural Map)
 Strukturverknüpfungen (Structural Links)
 Verhalten (Behavior)
Ein Beispiel:
 http://vd18-proto.bibliothek.uni-halle.de/de-slub-
vd18/oai/?verb=GetRecord&metadataPrefix=mets&mode
=view&identifier=5270690
METS / MODS
Einheitliches Strukturieren: Standards
Hugo von Hofmannsthal – Die Beiden
Sie trug den Becher in der Hand
– Ihr Kinn und Mund glich seinem Rand –,
So leicht und sicher war ihr Gang,
Kein Tropfen aus dem Becher sprang.
So leicht und fest war seine Hand:
Er ritt auf einem jungen Pferde,
Und mit nachlässiger Gebärde
Erzwang er, daß es zitternd stand.
Jedoch, wenn er aus ihrer Hand
Den leichten Becher nehmen sollte,
So war es beiden allzu schwer:
Denn beide bebten sie so sehr,
Daß keine Hand die andre fand
Und dunkler Wein am Boden rollte.
Hugo von Hofmannsthal – Die Beiden
Sie trug den Becher in der Hand
– Ihr Kinn und Mund glich seinem Rand –,
So leicht und sicher war ihr Gang,
Kein Tropfen aus dem Becher sprang.
So leicht und fest war seine Hand:
Er ritt auf einem jungen Pferde,
Und mit nachlässiger Gebärde
Erzwang er, daß es zitternd stand.
Jedoch, wenn er aus ihrer Hand
Den leichten Becher nehmen sollte,
So war es beiden allzu schwer:
Denn beide bebten sie so sehr,
Daß keine Hand die andre fand
Und dunkler Wein am Boden rollte.
Vers
Strophe
Ein Standard von dem man unbedingt ‘mal gehört haben muss:
Die Text Encoding Initiative (TEI)
Eine Lösung: TEI (Text Encoding Initiative)
 Fokus: Text
TEI bezeichnet sowohl
 das Konsortium (TEI-C),
 als auch einen Standard zur Kodierung und zum Austausch von
Textdokumenten
„TEI hat ein unabhängiges, portables und offenes Format [für die]
Speicherung, Austausch und Analyse von Texten in den
Geisteswissenschaften entwickelt. Das konkrete Resultat dieser
Arbeit sind sowohl Richtlinien für die Kodierung unterschiedlicher
Textsorten als auch das Textkodierungsformat selber.“
(http://www.onb.ac.at/sichtungen/print/bruvik-tm-1a-print.html)
 Richtlinien und Format sind frei zugänglich und kostenlos
Text Encoding Initiative (TEI)
Geschichte:
 1987 entstanden als internationale Initiative von
Philologinnen und Philologen
 Dokumentenformat zur Repräsentation von Texten in
digitaler Form
 Vielseitigkeit & Praxisnähe
Differenzierung: TEI bezeichnet sowohl
 das Konsortium (TEI-C), 2000 gegründet
 als auch Richtlinien und Empfehlungen zur Kodierung
und zum Austausch von Textdokumenten.
Intention: Geisteswissenschaftlerinnen und
Geisteswissenschaftler sollen über größtmögliche Freiheit
verfügen, textuell vorliegende Information nach eigenem
Textbegriff in XML zu codieren.
Text Encoding Initiative (TEI)
Versionsgeschichte
 1990: TEI P1 (P => Proposal, Entwurf / Plan)
Basiert auf SGML (Standard Generalized Markup
Language)
 1992 / 1993: TEI P2
 1994: TEI P3 ("Green Books")
 2002: TEI P4 (XML-basiert)
 2002: TEI Lite
 2007 TEI P5
Die Text Encoding Initiative
http://www.tei-c.org/release/doc/tei-p5-doc/en/Guidelines.pdf (1646 Seiten)
Modularisierung
 Flexible Auswahl von TEI-Elementen aufgrund des
modularen Charakters der TEI. So muss ein eigenes
Schema nicht alle Elemente und Attribute der TEI
enthalten.
 Module, u.a.:
 core für Basiselemente
 header für Metadaten
 textstructure für grundlegende Textstrukturen
 drama für Dramen
 prose, poetry, etc.
Die Text Encoding Initiative
Verortung:
EAD: Encoded Archival Description
METS: Metadata Encoding and Transmission Standard
Datenhaltungsschicht: XML vs. JSON?
/

Más contenido relacionado

Destacado

Ausdauersport Mineralstoffmangel
Ausdauersport MineralstoffmangelAusdauersport Mineralstoffmangel
Ausdauersport MineralstoffmangelMike-49
 
Austauschschüler aus Taiwan suchen Gastfamilie, ab Sommer 2014
Austauschschüler aus Taiwan suchen Gastfamilie, ab Sommer 2014Austauschschüler aus Taiwan suchen Gastfamilie, ab Sommer 2014
Austauschschüler aus Taiwan suchen Gastfamilie, ab Sommer 2014Klaus Bardenhagen
 
Cap7
Cap7Cap7
Cap7CJAO
 
Listen-IT
Listen-ITListen-IT
Listen-ITotolab
 
Planificadordeproyectosactualtodosemideparamodificar plantilla.docx (1)
Planificadordeproyectosactualtodosemideparamodificar plantilla.docx (1)Planificadordeproyectosactualtodosemideparamodificar plantilla.docx (1)
Planificadordeproyectosactualtodosemideparamodificar plantilla.docx (1)Nidia Cardenas
 
Sicheres Arbeiten mit Nanomaterialien
Sicheres Arbeiten mit NanomaterialienSicheres Arbeiten mit Nanomaterialien
Sicheres Arbeiten mit NanomaterialienSwissNanoCube
 
Venise Carnaval Demw
Venise Carnaval DemwVenise Carnaval Demw
Venise Carnaval Demwed
 
Astra erleben – Was dagegen?
Astra erleben – Was dagegen?Astra erleben – Was dagegen?
Astra erleben – Was dagegen?C H
 

Destacado (15)

Ausdauersport Mineralstoffmangel
Ausdauersport MineralstoffmangelAusdauersport Mineralstoffmangel
Ausdauersport Mineralstoffmangel
 
Sistema nervioso
Sistema nerviosoSistema nervioso
Sistema nervioso
 
Austauschschüler aus Taiwan suchen Gastfamilie, ab Sommer 2014
Austauschschüler aus Taiwan suchen Gastfamilie, ab Sommer 2014Austauschschüler aus Taiwan suchen Gastfamilie, ab Sommer 2014
Austauschschüler aus Taiwan suchen Gastfamilie, ab Sommer 2014
 
Befugnisse
BefugnisseBefugnisse
Befugnisse
 
Descripcion celia
Descripcion celiaDescripcion celia
Descripcion celia
 
Cap7
Cap7Cap7
Cap7
 
Wandmalereien na
Wandmalereien naWandmalereien na
Wandmalereien na
 
Listen-IT
Listen-ITListen-IT
Listen-IT
 
Ecuador gs
Ecuador gsEcuador gs
Ecuador gs
 
Planificadordeproyectosactualtodosemideparamodificar plantilla.docx (1)
Planificadordeproyectosactualtodosemideparamodificar plantilla.docx (1)Planificadordeproyectosactualtodosemideparamodificar plantilla.docx (1)
Planificadordeproyectosactualtodosemideparamodificar plantilla.docx (1)
 
Ilusionl
IlusionlIlusionl
Ilusionl
 
Sicheres Arbeiten mit Nanomaterialien
Sicheres Arbeiten mit NanomaterialienSicheres Arbeiten mit Nanomaterialien
Sicheres Arbeiten mit Nanomaterialien
 
Venise Carnaval Demw
Venise Carnaval DemwVenise Carnaval Demw
Venise Carnaval Demw
 
Astra erleben – Was dagegen?
Astra erleben – Was dagegen?Astra erleben – Was dagegen?
Astra erleben – Was dagegen?
 
SoSe 2013 | IT-Zertifikat: AMM - Klausurvorbereitung
 SoSe 2013 | IT-Zertifikat: AMM - Klausurvorbereitung SoSe 2013 | IT-Zertifikat: AMM - Klausurvorbereitung
SoSe 2013 | IT-Zertifikat: AMM - Klausurvorbereitung
 

Similar a SoSem 2015 | IT-Zertifikat: Tools & Methods in Digital Humanities - 01_Digitale Bibliotheken, Metadatenstandards: MARC, Dublin Core, TEI & Co.

Semantic Web und Linked Open Data. Eine Bibliothekarische Geschichte
Semantic Web und Linked Open Data. Eine Bibliothekarische GeschichteSemantic Web und Linked Open Data. Eine Bibliothekarische Geschichte
Semantic Web und Linked Open Data. Eine Bibliothekarische GeschichteJakob .
 
20120608_Thematische Vernetzung heterogener Informationsbestände
20120608_Thematische Vernetzung heterogener Informationsbestände20120608_Thematische Vernetzung heterogener Informationsbestände
20120608_Thematische Vernetzung heterogener Informationsbeständedatentaste
 
Einführung in die Literaturverwaltung
Einführung in die LiteraturverwaltungEinführung in die Literaturverwaltung
Einführung in die LiteraturverwaltungTIB Hannover
 
Anforderungen an die Wissensrepräsentation im Social Semantic Web
Anforderungen an die Wissensrepräsentation im Social Semantic WebAnforderungen an die Wissensrepräsentation im Social Semantic Web
Anforderungen an die Wissensrepräsentation im Social Semantic WebKatrin Weller
 
EAD – Facts & Figures. Grundlagen, Werkzeuge und die Zukunft mit EAD3
EAD – Facts & Figures. Grundlagen, Werkzeuge und die Zukunft mit EAD3EAD – Facts & Figures. Grundlagen, Werkzeuge und die Zukunft mit EAD3
EAD – Facts & Figures. Grundlagen, Werkzeuge und die Zukunft mit EAD3Tobias Wildi
 
Goobi für alle(s).
Goobi für alle(s).Goobi für alle(s).
Goobi für alle(s).goobi_org
 
2022_46.OpenDataMeetup_MA13.pdf
2022_46.OpenDataMeetup_MA13.pdf2022_46.OpenDataMeetup_MA13.pdf
2022_46.OpenDataMeetup_MA13.pdfStadt Wien
 
Semantic MediaWiki im Projektmanagement
Semantic MediaWiki im Projektmanagement Semantic MediaWiki im Projektmanagement
Semantic MediaWiki im Projektmanagement Bernhard Krabina
 
Literaturverwaltungssysteme im Überblick
Literaturverwaltungssysteme im ÜberblickLiteraturverwaltungssysteme im Überblick
Literaturverwaltungssysteme im ÜberblickPeter Mayr
 
"Literaturverwaltungssysteme im Überblick" 2010er Version
"Literaturverwaltungssysteme im Überblick" 2010er Version"Literaturverwaltungssysteme im Überblick" 2010er Version
"Literaturverwaltungssysteme im Überblick" 2010er VersionPeter Mayr
 
Strukturierte Metadaten in Wikipedia
Strukturierte Metadaten in WikipediaStrukturierte Metadaten in Wikipedia
Strukturierte Metadaten in WikipediaJakob .
 
Literaturverwaltungssysteme im Überblick
Literaturverwaltungssysteme im ÜberblickLiteraturverwaltungssysteme im Überblick
Literaturverwaltungssysteme im ÜberblickPeter Mayr
 
Literaturverwaltungssysteme im Überblick (2012)
Literaturverwaltungssysteme im Überblick (2012)Literaturverwaltungssysteme im Überblick (2012)
Literaturverwaltungssysteme im Überblick (2012)Peter Mayr
 
HS Soziologie des Internet
HS Soziologie des InternetHS Soziologie des Internet
HS Soziologie des InternetTina Guenther
 
DIGITAL HUMANITIES-PROJEKTE DER STAATSBIBLIOTHEK
DIGITAL HUMANITIES-PROJEKTE DER STAATSBIBLIOTHEKDIGITAL HUMANITIES-PROJEKTE DER STAATSBIBLIOTHEK
DIGITAL HUMANITIES-PROJEKTE DER STAATSBIBLIOTHEKStaatsbibliothek zu Berlin
 

Similar a SoSem 2015 | IT-Zertifikat: Tools & Methods in Digital Humanities - 01_Digitale Bibliotheken, Metadatenstandards: MARC, Dublin Core, TEI & Co. (20)

BIT I SoSem 2015 | Basisinformationstechnologie II - 04_Text
BIT I SoSem 2015 | Basisinformationstechnologie II - 04_TextBIT I SoSem 2015 | Basisinformationstechnologie II - 04_Text
BIT I SoSem 2015 | Basisinformationstechnologie II - 04_Text
 
SoSe 2013 | Basisinformationstechnologie II - 06_Text
SoSe 2013 | Basisinformationstechnologie II - 06_TextSoSe 2013 | Basisinformationstechnologie II - 06_Text
SoSe 2013 | Basisinformationstechnologie II - 06_Text
 
Semantic Web und Linked Open Data. Eine Bibliothekarische Geschichte
Semantic Web und Linked Open Data. Eine Bibliothekarische GeschichteSemantic Web und Linked Open Data. Eine Bibliothekarische Geschichte
Semantic Web und Linked Open Data. Eine Bibliothekarische Geschichte
 
Europeana und Deutsche Digitale Bibliothek
Europeana und Deutsche Digitale BibliothekEuropeana und Deutsche Digitale Bibliothek
Europeana und Deutsche Digitale Bibliothek
 
20120608_Thematische Vernetzung heterogener Informationsbestände
20120608_Thematische Vernetzung heterogener Informationsbestände20120608_Thematische Vernetzung heterogener Informationsbestände
20120608_Thematische Vernetzung heterogener Informationsbestände
 
Linked Library Data & RDA
Linked Library Data & RDALinked Library Data & RDA
Linked Library Data & RDA
 
Einführung in die Literaturverwaltung
Einführung in die LiteraturverwaltungEinführung in die Literaturverwaltung
Einführung in die Literaturverwaltung
 
Anforderungen an die Wissensrepräsentation im Social Semantic Web
Anforderungen an die Wissensrepräsentation im Social Semantic WebAnforderungen an die Wissensrepräsentation im Social Semantic Web
Anforderungen an die Wissensrepräsentation im Social Semantic Web
 
EAD – Facts & Figures. Grundlagen, Werkzeuge und die Zukunft mit EAD3
EAD – Facts & Figures. Grundlagen, Werkzeuge und die Zukunft mit EAD3EAD – Facts & Figures. Grundlagen, Werkzeuge und die Zukunft mit EAD3
EAD – Facts & Figures. Grundlagen, Werkzeuge und die Zukunft mit EAD3
 
Microformats & COinS
Microformats & COinSMicroformats & COinS
Microformats & COinS
 
Goobi für alle(s).
Goobi für alle(s).Goobi für alle(s).
Goobi für alle(s).
 
2022_46.OpenDataMeetup_MA13.pdf
2022_46.OpenDataMeetup_MA13.pdf2022_46.OpenDataMeetup_MA13.pdf
2022_46.OpenDataMeetup_MA13.pdf
 
Semantic MediaWiki im Projektmanagement
Semantic MediaWiki im Projektmanagement Semantic MediaWiki im Projektmanagement
Semantic MediaWiki im Projektmanagement
 
Literaturverwaltungssysteme im Überblick
Literaturverwaltungssysteme im ÜberblickLiteraturverwaltungssysteme im Überblick
Literaturverwaltungssysteme im Überblick
 
"Literaturverwaltungssysteme im Überblick" 2010er Version
"Literaturverwaltungssysteme im Überblick" 2010er Version"Literaturverwaltungssysteme im Überblick" 2010er Version
"Literaturverwaltungssysteme im Überblick" 2010er Version
 
Strukturierte Metadaten in Wikipedia
Strukturierte Metadaten in WikipediaStrukturierte Metadaten in Wikipedia
Strukturierte Metadaten in Wikipedia
 
Literaturverwaltungssysteme im Überblick
Literaturverwaltungssysteme im ÜberblickLiteraturverwaltungssysteme im Überblick
Literaturverwaltungssysteme im Überblick
 
Literaturverwaltungssysteme im Überblick (2012)
Literaturverwaltungssysteme im Überblick (2012)Literaturverwaltungssysteme im Überblick (2012)
Literaturverwaltungssysteme im Überblick (2012)
 
HS Soziologie des Internet
HS Soziologie des InternetHS Soziologie des Internet
HS Soziologie des Internet
 
DIGITAL HUMANITIES-PROJEKTE DER STAATSBIBLIOTHEK
DIGITAL HUMANITIES-PROJEKTE DER STAATSBIBLIOTHEKDIGITAL HUMANITIES-PROJEKTE DER STAATSBIBLIOTHEK
DIGITAL HUMANITIES-PROJEKTE DER STAATSBIBLIOTHEK
 

Más de Institute for Digital Humanities, University of Cologne

Más de Institute for Digital Humanities, University of Cologne (20)

Künstliche Intelligenz und visuelle Erzählungen: Comicanalyse | 17.04.2019 | ...
Künstliche Intelligenz und visuelle Erzählungen: Comicanalyse | 17.04.2019 | ...Künstliche Intelligenz und visuelle Erzählungen: Comicanalyse | 17.04.2019 | ...
Künstliche Intelligenz und visuelle Erzählungen: Comicanalyse | 17.04.2019 | ...
 
Augmented City –Street Art, Embodiment, Cultural Heritage & AR | 03.04.2019 |...
Augmented City –Street Art, Embodiment, Cultural Heritage & AR | 03.04.2019 |...Augmented City –Street Art, Embodiment, Cultural Heritage & AR | 03.04.2019 |...
Augmented City –Street Art, Embodiment, Cultural Heritage & AR | 03.04.2019 |...
 
Künstliche Intelligenz und visuelle Erzählungen: Comicanalyse | 03.04.2019 | ...
Künstliche Intelligenz und visuelle Erzählungen: Comicanalyse | 03.04.2019 | ...Künstliche Intelligenz und visuelle Erzählungen: Comicanalyse | 03.04.2019 | ...
Künstliche Intelligenz und visuelle Erzählungen: Comicanalyse | 03.04.2019 | ...
 
Transformation mittelhochdeutscher Erfahrungswelten – vom Text zum Computerga...
Transformation mittelhochdeutscher Erfahrungswelten – vom Text zum Computerga...Transformation mittelhochdeutscher Erfahrungswelten – vom Text zum Computerga...
Transformation mittelhochdeutscher Erfahrungswelten – vom Text zum Computerga...
 
Bit sosem 2016-wieners-sitzung-13_ki-in-games
Bit sosem 2016-wieners-sitzung-13_ki-in-gamesBit sosem 2016-wieners-sitzung-13_ki-in-games
Bit sosem 2016-wieners-sitzung-13_ki-in-games
 
Bit sosem 2016-wieners-sitzung-12_bild-iv-computer-vision
Bit sosem 2016-wieners-sitzung-12_bild-iv-computer-visionBit sosem 2016-wieners-sitzung-12_bild-iv-computer-vision
Bit sosem 2016-wieners-sitzung-12_bild-iv-computer-vision
 
Bit sosem 2016-wieners-sitzung-11_bild-iii-filter
Bit sosem 2016-wieners-sitzung-11_bild-iii-filterBit sosem 2016-wieners-sitzung-11_bild-iii-filter
Bit sosem 2016-wieners-sitzung-11_bild-iii-filter
 
Bit sosem 2016-wieners-sitzung-10_bild-ii-punktoperationen
Bit sosem 2016-wieners-sitzung-10_bild-ii-punktoperationenBit sosem 2016-wieners-sitzung-10_bild-ii-punktoperationen
Bit sosem 2016-wieners-sitzung-10_bild-ii-punktoperationen
 
Bit sosem 2016-wieners-sitzung-09_bild-i-kompression
Bit sosem 2016-wieners-sitzung-09_bild-i-kompressionBit sosem 2016-wieners-sitzung-09_bild-i-kompression
Bit sosem 2016-wieners-sitzung-09_bild-i-kompression
 
Bit sosem 2016-wieners-sitzung-08_semantic-web
Bit sosem 2016-wieners-sitzung-08_semantic-webBit sosem 2016-wieners-sitzung-08_semantic-web
Bit sosem 2016-wieners-sitzung-08_semantic-web
 
Bit sosem 2016-wieners-sitzung-07_rechnerkommunikation-ii
Bit sosem 2016-wieners-sitzung-07_rechnerkommunikation-iiBit sosem 2016-wieners-sitzung-07_rechnerkommunikation-ii
Bit sosem 2016-wieners-sitzung-07_rechnerkommunikation-ii
 
Bit sosem 2016-wieners-sitzung-06_rechnerkommunikation
Bit sosem 2016-wieners-sitzung-06_rechnerkommunikationBit sosem 2016-wieners-sitzung-06_rechnerkommunikation
Bit sosem 2016-wieners-sitzung-06_rechnerkommunikation
 
Bit sosem 2016-wieners-sitzung-05_zellulaere-automaten-conway
Bit sosem 2016-wieners-sitzung-05_zellulaere-automaten-conwayBit sosem 2016-wieners-sitzung-05_zellulaere-automaten-conway
Bit sosem 2016-wieners-sitzung-05_zellulaere-automaten-conway
 
Bit sosem 2016-wieners-sitzung-04_theoretische-informatik
Bit sosem 2016-wieners-sitzung-04_theoretische-informatikBit sosem 2016-wieners-sitzung-04_theoretische-informatik
Bit sosem 2016-wieners-sitzung-04_theoretische-informatik
 
Bit sosem 2016-wieners-sitzung-03_algorithmen
Bit sosem 2016-wieners-sitzung-03_algorithmenBit sosem 2016-wieners-sitzung-03_algorithmen
Bit sosem 2016-wieners-sitzung-03_algorithmen
 
Bit sosem 2016-wieners-sitzung-02_datenstrukturen
Bit sosem 2016-wieners-sitzung-02_datenstrukturenBit sosem 2016-wieners-sitzung-02_datenstrukturen
Bit sosem 2016-wieners-sitzung-02_datenstrukturen
 
Bit sosem 2016-wieners-sitzung-01_auffrischung
Bit sosem 2016-wieners-sitzung-01_auffrischungBit sosem 2016-wieners-sitzung-01_auffrischung
Bit sosem 2016-wieners-sitzung-01_auffrischung
 
Bit sosem 2016-wieners-sitzung-00_themenueberblick
Bit sosem 2016-wieners-sitzung-00_themenueberblickBit sosem 2016-wieners-sitzung-00_themenueberblick
Bit sosem 2016-wieners-sitzung-00_themenueberblick
 
Bit wisem 2015-wieners-sitzung-13_Zusammenfassung II
Bit wisem 2015-wieners-sitzung-13_Zusammenfassung IIBit wisem 2015-wieners-sitzung-13_Zusammenfassung II
Bit wisem 2015-wieners-sitzung-13_Zusammenfassung II
 
Bit wisem 2015-wieners-sitzung-12_Zusammenfassung I
Bit wisem 2015-wieners-sitzung-12_Zusammenfassung IBit wisem 2015-wieners-sitzung-12_Zusammenfassung I
Bit wisem 2015-wieners-sitzung-12_Zusammenfassung I
 

SoSem 2015 | IT-Zertifikat: Tools & Methods in Digital Humanities - 01_Digitale Bibliotheken, Metadatenstandards: MARC, Dublin Core, TEI & Co.

  • 1. Universität zu Köln. Historisch-Kulturwissenschaftliche Informationsverarbeitung Dr. Jan G. Wieners // jan.wieners@uni-koeln.de Tools & Methods in Digital Humanities Sommersemester 2015 09. Juni 2015 – Digitale Bibliotheken, Metadatenstandards: MARC, Dublin Core, TEI & Co.
  • 2.  „BAM“-Sektor: Bibliotheken, Archive, Museen  Digitale Bibliotheken, Digitale Archive, Digitale Museen  Bibliographische Metadaten  MARC  MAB  MARCXML  Dublin Core (DC)  Metadata Object Description Schema (MODS)  Digitale Objekte  Metadata Encoding and Transmission Standard (METS)  Ein (DER) Standard zur Codierung von Texten: TEI Überblick / ToDo
  • 5.
  • 6. Sammlung digitaler Objekte  Text  Video  Audio  3D Objekte  Simulationen, VR, etc. Bereitstellung von Zugriffsmöglichkeiten:  Benutzerseite:  Zugriff (access)  Abfrage (retrieval) von digitalen Objekten  Bibliothekarinnen-/Bibliothekarseite:  Selection  Organization  Maintenance Metadaten  Kritisch für alle Formen organisierter digitaler Inhalte Digitale Bibliothek
  • 7.
  • 8. Arten von Metadaten:  Administrative metadata for managing resources, such as rights information  Descriptive metadata for describing resources (Beispiel: Zettel des Zettelkataloges)  Preservation metadata for describing resources, such as recording preservation actions  Technical metadata related to low-level system information, such as data formats and any data compression used  Usage metadata related to system use, such as tracking user behavior  “End user’s view is only the tip of the iceberg: Much of the metadata is not intended for public display” Metadaten “End user’s view is only the tip of the iceberg: Much of the metadata is not intended for public display”
  • 9. Arten von Metadaten:  Administrative metadata for managing resources, such as rights information  Descriptive metadata for describing resources (Beispiel: Zettel des Zettelkataloges)  Preservation metadata for describing resources, such as recording preservation actions  Technical metadata related to low-level system information, such as data formats and any data compression used  Usage metadata related to system use, such as tracking user behavior  “End user’s view is only the tip of the iceberg: Much of the metadata is not intended for public display” Metadaten
  • 10.  MARC  MAB  MARCXML  Dublin Core (DC)  Metadata Object Description Schema: MODS  METS/MODS Bibliographische Metadaten: Standards, eine Auswahl
  • 11. MARC
  • 12.
  • 13. MARC: MAchine Readable Cataloging  Vorgestellt in den späten 1960er Jahren von Henriette Avram (Library of Congress)  !Grundproblem/-intention: Migration von Zettelkatalogen zu computerbasierter Repräsentation von Datensätzen (Records)  MARC-Datensätze gespeichert als Sammlung von Feldern in einem „ziemlich komplexen Format“ [Witten, Bainbridge, Nichols (2010): How to Build a Digital Library]  “Producing a MARC record for a particular publication is an onerous undertaking that is governed by a detailed set of (highly detailed) rules and guidelines called the Anglo-American Cataloging Rules (AACR2R, 2R  final revised 2nd edition).” [Witten, Bainbridge, Nichols (2010): How to Build a Digital Library] MARC
  • 15.  Variable Control Fields (00x)  Variable Data Fields  Numbers and Codes (0xx)  Main Entries (1xx)  Titles (2xx)  Edition, Imprint, etc. (2xx)  Physical Description, etc. (3xx)  Series Statements (4xx)  Notes (5xx)  […]  Vgl. die Referenz unter http://www.loc.gov/marc/bibliographic/ecbdhome.html MARC Tags (die Spitze des Eisbergs)
  • 17. MARCXML  Dublin Core http://lccn.loc.gov/79459272/dc
  • 18. Satz von 15 Elementen zur Beschreibung von Ressourcen:  Title  Creator  Subject  Description  Publisher  Contributor  Date  Type  Format  Identifier  Source  Language  Relation  Coverage  Rights  Alle Elemente sind optional und wiederholbar, die Reihenfolge ist beliebig Dublin Core
  • 19. Maschinelles Austauschformat für Bibliotheken (MAB),  MAB  1970er, Deutsche Nationalbibliothek  MAB2  1990er  Verwendung mit RAK (Regeln zur Alphabetischen Katalogisierung) Kleiner Exkurs: MAB und VD18
  • 20. Intention: Digitalisierung und Erschließung der im deutschen Sprachraum veröffentlichten Drucke des 18. Jahrhunderts Kontext VD18 VD 16 VD 17 VD 18 ~100 000 erfasste Titel ~255 000 Titel Ziel: Mehr als 600 000 Titel Förderzeitraum: 1969- 1999 Förderzeitraum: Seit Juli 1996 Förderzeitraum: Ab 2009
  • 21. VD18 – Arbeitsaufteilung / Workflow SWB KoordinierungsDB
  • 25.  Zwei sich ergänzende internationale Formate zur Kodierung von Metadaten und digitalen Objekten, die aus mehreren Teilen (Seiten, Dateien, Kapitel, etc.) bestehen (vgl. http://www.gbv.de/wikis/cls/METS/MODS):  Metadata Encoding and Transmission Standard (METS)  Metadata Object Description Schema (MODS)  Heimat von METS: http://www.loc.gov/standards/mets/  METS: „Designed to permit the representation, maintenance, and exchange of the increasingly complex digital objects that make up digital libraries. Library catalogs have for years used MARC records to fulfill these functions for their materials. The METS initiative aims to do the same for digital collections.” METS / MODS
  • 26. Sieben Hauptabschnitte:  Kopfteil (METS Header)  Erschließungsangaben (Descriptive Metadata)  Verwaltungsangaben (Administrative Metadata)  Dateienabschnitt (File Section)  Strukturbeschreibung (Structural Map)  Strukturverknüpfungen (Structural Links)  Verhalten (Behavior) Ein Beispiel:  http://vd18-proto.bibliothek.uni-halle.de/de-slub- vd18/oai/?verb=GetRecord&metadataPrefix=mets&mode =view&identifier=5270690 METS / MODS
  • 28. Hugo von Hofmannsthal – Die Beiden Sie trug den Becher in der Hand – Ihr Kinn und Mund glich seinem Rand –, So leicht und sicher war ihr Gang, Kein Tropfen aus dem Becher sprang. So leicht und fest war seine Hand: Er ritt auf einem jungen Pferde, Und mit nachlässiger Gebärde Erzwang er, daß es zitternd stand. Jedoch, wenn er aus ihrer Hand Den leichten Becher nehmen sollte, So war es beiden allzu schwer: Denn beide bebten sie so sehr, Daß keine Hand die andre fand Und dunkler Wein am Boden rollte.
  • 29. Hugo von Hofmannsthal – Die Beiden Sie trug den Becher in der Hand – Ihr Kinn und Mund glich seinem Rand –, So leicht und sicher war ihr Gang, Kein Tropfen aus dem Becher sprang. So leicht und fest war seine Hand: Er ritt auf einem jungen Pferde, Und mit nachlässiger Gebärde Erzwang er, daß es zitternd stand. Jedoch, wenn er aus ihrer Hand Den leichten Becher nehmen sollte, So war es beiden allzu schwer: Denn beide bebten sie so sehr, Daß keine Hand die andre fand Und dunkler Wein am Boden rollte. Vers Strophe
  • 30.
  • 31. Ein Standard von dem man unbedingt ‘mal gehört haben muss: Die Text Encoding Initiative (TEI)
  • 32. Eine Lösung: TEI (Text Encoding Initiative)  Fokus: Text TEI bezeichnet sowohl  das Konsortium (TEI-C),  als auch einen Standard zur Kodierung und zum Austausch von Textdokumenten „TEI hat ein unabhängiges, portables und offenes Format [für die] Speicherung, Austausch und Analyse von Texten in den Geisteswissenschaften entwickelt. Das konkrete Resultat dieser Arbeit sind sowohl Richtlinien für die Kodierung unterschiedlicher Textsorten als auch das Textkodierungsformat selber.“ (http://www.onb.ac.at/sichtungen/print/bruvik-tm-1a-print.html)  Richtlinien und Format sind frei zugänglich und kostenlos Text Encoding Initiative (TEI)
  • 33. Geschichte:  1987 entstanden als internationale Initiative von Philologinnen und Philologen  Dokumentenformat zur Repräsentation von Texten in digitaler Form  Vielseitigkeit & Praxisnähe Differenzierung: TEI bezeichnet sowohl  das Konsortium (TEI-C), 2000 gegründet  als auch Richtlinien und Empfehlungen zur Kodierung und zum Austausch von Textdokumenten. Intention: Geisteswissenschaftlerinnen und Geisteswissenschaftler sollen über größtmögliche Freiheit verfügen, textuell vorliegende Information nach eigenem Textbegriff in XML zu codieren. Text Encoding Initiative (TEI)
  • 34. Versionsgeschichte  1990: TEI P1 (P => Proposal, Entwurf / Plan) Basiert auf SGML (Standard Generalized Markup Language)  1992 / 1993: TEI P2  1994: TEI P3 ("Green Books")  2002: TEI P4 (XML-basiert)  2002: TEI Lite  2007 TEI P5 Die Text Encoding Initiative
  • 36. Modularisierung  Flexible Auswahl von TEI-Elementen aufgrund des modularen Charakters der TEI. So muss ein eigenes Schema nicht alle Elemente und Attribute der TEI enthalten.  Module, u.a.:  core für Basiselemente  header für Metadaten  textstructure für grundlegende Textstrukturen  drama für Dramen  prose, poetry, etc. Die Text Encoding Initiative
  • 37. Verortung: EAD: Encoded Archival Description METS: Metadata Encoding and Transmission Standard
  • 39. /

Notas del editor

  1. Vannevar Bush [ˌvæˈniː.vɚ] KBE (1890 in Everett, Massachusetts; † 30. Juni 1974 in Belmont, Massachusetts) war ein US-amerikanischer Ingenieur und Analogrechner-Pionier. Bush war eine der wichtigsten Personen der US-Kriegsführung im Zweiten Weltkrieg, er entwickelte in seinem 1945 publizierten Essay As we may think das Konzept des Memex (Memory Extender), der als ein Vorläufer des Personal Computers und des Hypertextes gilt.
  2. Der Memex (Memory Extender; dt. etwa: Gedächtnis-Erweiterer) ist ein als möglichst menschengerechtes, einfach bedienbares Wissensfindungs- und Verwertungssystem konzipierter Kompakt-Analog-Rechner, der 1945 von Vannevar Bush im Artikel As We May Think (Atlantic Monthly, Juli 1945, S. 101 ff.) fiktiv vorgestellt wurde.
  3. Grundfrage: Woher stammen die Metadaten? Option I: Ein Mensch hat festgelegt, dass x  Ein Mensch betrachtet und analysiert das Dokument und weist einem Metadatenelement einen bestimmten Wert zu. Option II: Ein Computerprogramm hat x analysiert und bestimmt  Ein Algorithmus verarbeitet das Dokument und gibt einen Wert für das Metadatenelement aus.
  4. Benannt nach Dublin, Ohio, wo 1995 das erste Treffen der Gruppe / Initiative veranstaltet wurde. Dublin Core (DC): Satz von vordefinierten Metadatenelementen, intendiert für Nutzung durch Nicht-Spezialisten die Beschreibung digitaler Ressourcen (i.e. Websites), die häufig keinen eigenen MARC Katalog-Eintrag erhalten würden Verglichen mit MARC: Sehr einfach Designziel: Allgemeinheit, Einfachheit
  5. Jean-Michel Basquiat
  6. Geschichte: 1987 entstanden als internationale Initiative von Philologinnen und Philologen Dokumentenformat zur Repräsentation von Texten in digitaler Form Vielseitigkeit & Praxisnähe Differenzierung: TEI bezeichnet sowohl das Konsortium (TEI-C), 2000 gegründet als auch Richtlinien und Empfehlungen zur Kodierung und zum Austausch von Textdokumenten. Intention: Geisteswissenschaftlerinnen und Geisteswissenschaftler sollen über größtmögliche Freiheit verfügen, textuell vorliegende Information nach eigenem Textbegriff in XML zu codieren.
  7. Standards und Guidelines Standards der TEI schränken die schier unendlichen Auszeichnungsmöglichkeiten von XML ein. Dabei stellen sich die folgenden Grundfragen: Welche Tags und welche Attribute lassen sich verwenden, um eigene Texte auszuzeichnen? Wie lassen sich die Tags miteinander kombinieren / verschachteln? Überblick über Richtlinien, z.B. für TEI P5: http://www.tei-c.org/release/doc/tei-p5-doc/en/Guidelines.pdf (1641 Seiten)
  8. BAMS-Sektor