Se ha denunciado esta presentación.

Digitalisierung als Dienstleistung

0

Compartir

Cargando en…3
×
1 de 31
1 de 31

Más Contenido Relacionado

Libros relacionados

Gratis con una prueba de 14 días de Scribd

Ver todo

Audiolibros relacionados

Gratis con una prueba de 14 días de Scribd

Ver todo

Digitalisierung als Dienstleistung

  1. 1. DIGITALISIERUNG ALS DIENSTLEISTUNG Images, Metadaten, Strukturdaten Stefan Krause Editura GmbH & Co. KG, Berlin http://www.editura.de
  2. 2. Editura GmbH & Co. KG • Dienstleister für Digitalisierungsprojekte • Kunden: Archive, Bibliotheken, Verlage, wissenschaftliche Einrichtungen • Imagedigitalisierung: Bücher, Zeitschriften, Akten, Fotosammlungen usw. • Volltexterfassungund Strukturierung: Findmittel, Bibliothekskataloge, alle Arten von Literatur • Datenverarbeitung: Prüfen, Korrigieren, Konvertieren, Verknüpfen Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
  3. 3. Projektbeispiele Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
  4. 4. Beispiel Volltexterfassung und Strukturierung • Retrokonversion von Findmitteln • Arbeitsformat Editura-intern, Zielformat EAD • METS für Images der Vorlagen • Verknüpfung von Findbuch und Images für einfache Kontrolle und Korrektur • MidosaXML und METSview Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
  5. 5. Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
  6. 6. Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
  7. 7. <verzeinh> ! <vzerschlang> ! ! <bemerk>ID: DC15-1</bemerk> Pfad im Dateisystem ! ! <bemerk>Image: DC15DC15_01IMG_0010a.jpg</bemerk> ! ! <laufzeit>März 1948 - Sept. 1949 (1948- 1949)</laufzeit> ! ! <signatur>DC 15/713</signatur> ! ! <titel>Organisation und Arbeitsweise der DWK</titel> ! ! <dao> ! ! ! <dateiname>../METS/METSview.html?ID=FID_DC15-DC15_01- IMG_0010a.jpg</dateiname> ! ! ! <beschreibung>Image der Vorlage</beschreibung> ! ! </dao> Link zur Anwendung mit File-ID ! ! <provenienz> ! ! ! <vorprovenienz>Sekretariat des Vors. der DWK H. Rau</vorprovenienz> ! ! ! <endprovenienz>Deutsche Wirtschaftskommission</endprovenienz> ! ! </provenienz> ! </vzerschlang> </verzeinh> Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
  8. 8. <fileSec> <fileGrp ID="FID_DC15"> […] die File-ID ist das <file ID="FID_DC15-DC15_01-IMG_0010a.jpg"> Sprungziel für die ! <FLocat LOCTYPE="URL" xlink:href="DC15/DC15_01/IMG_0010a.jpg" aus EAD Verlinkung ! ! xlink:title="Image von DC15/DC15_01/IMG_0010a.jpg"/> </file> […] <structMap> <div LABEL="DC15" ID="ID_DC15"> aus den LABEL- <div ID="ID_DC15-DC15_01" LABEL="DC15_01"> Attributen wird die […] Baumansicht erzeugt <div TYPE="standard" ID="ID_SGF_DC15-DC15_01-IMG_0010a.jpg" LABEL="IMG_0010a.jpg"> <fptr FILEID="FID_DC15-DC15_01-IMG_0010a.jpg"/> </div> […] Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
  9. 9. Beispiel Imagedigitalisierung und Datenverarbeitung • Scannenvon verfilmten Akten und Verknüpfung mit EAD-Findbuch • Arbeits- und Zielformate: EAD und METS für MEX/MIDEX • Erzeugen von METS-Dateien und HTML-Ansichten Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
  10. 10. Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
  11. 11. Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
  12. 12. <c03 level="file"> <head>Betriebskostenentwicklung</head> <did> <unitid type="bestellnummer"> 19</unitid> <unittitle>Betriebskostenentwicklung</unittitle> <unitdate normal="1925-01-01/1932-12-31">1925 - 1932</unitdate> <abstract encodinganalog="EnthaeltDarin" type="enthaelt">Enthält u. a.: Bericht zur Lohnbewegung […]</abstract> <dao xlink:href="31072_019_mets.xml" xlink:title="Akte einsehen"/> </did> Link auf METS-Datei, MEX/ </c03> MIDEX erzeugen den korrekten Link und die Benutzungsoberflächen Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
  13. 13. <fileSec> ! <fileGrp ID="FID_31072" USE="nutz"> ! ! <file ID="FID_31072_31072_019-31072_019_001" MIMETYPE="image/png" ! ! ! USE="nutz"> ! ! ! <FLocat LOCTYPE="URL" ! ! ! ! xlink:href="dao/31072_019/31072_019_001.png"/> ! ! </file> […] über TYPE-Attribute wird die Darstellung in der Benutzeroberfläche <structMap> gesteuert ! <div> ! ! <div ID="ID_SGF_31072_019-31072_019_001" TYPE="standard"> ! ! ! <fptr FILEID="FID_31072_31072_019-31072_019_001"/> ! ! </div> ! ! <div ID="ID_SGF_31072_019-31072_019_002" TYPE="bika" ! ! ! LABEL="Titelblatt"> ! ! ! <fptr FILEID="FID_31072_31072_019-31072_019_002"/> ! ! </div> Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
  14. 14. Beispiel Imagedigitalisierung • Scannen von Zeitschriften • Ausgabe als TIFF, JPEG und PDF (mit hinterlegter OCR) • METS-Dateien zum Transport der Strukturdaten und zur Überprüfung auf Vollständigkeit und Integrität Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
  15. 15. Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
  16. 16. <mets:file ID="id3E491636EFE0923FE4EBC931B0E2F118" MIMETYPE="image/jpeg" SEQ="0" SIZE="5554162" CREATED="2011-01-31T22:03:28Z" CHECKSUM="AE563748136ACC3006493C744DA50031" CHECKSUMTYPE="MD5"> ! <mets:FLocat LOCTYPE="URL" xlink:href="SinglePageImagesBig0004.jpg"/> ! <mets:FContent> mit diesen Angaben kann geprüft werden, ob die Dateien ! ! <mets:xmlData> im Dateisystem bzw. auf der Festplatte unverändert sind ! ! ! <mix:mix> ! ! ! ! […] ! ! ! ! <mix:BasicImageInformation> ! ! ! ! ! <mix:BasicImageCharacteristics> ! ! ! ! ! ! <mix:imageWidth>4075</mix:imageWidth> ! ! ! ! ! ! <mix:imageHeight>5572</mix:imageHeight> ! ! ! ! ! ! <mix:PhotometricInterpretation> ! ! ! ! ! ! ! <mix:colorSpace>RGB</mix:colorSpace> ! ! ! ! ! ! </mix:PhotometricInterpretation> eingebundene MIX-Daten: ! ! ! ! ! </mix:BasicImageCharacteristics> technische Metadaten zum Dateiinhalt, hier Pixelmaße und ! ! ! ! </mix:BasicImageInformation> Farbtiefe ! ! ! ! […] Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
  17. 17. Beispiel Image- und Volltextdigitalisierung • Scannen von Zeitschriften (durch SLUB) • Ausgabe der Images als TIFF und JPEG • Ausgabe der Volltexte als TEI • METS-Dateien aus TEI generiert, zur Darstellung im DFG-Viewer Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
  18. 18. Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
  19. 19. <mets:dmdSec ID="dMD32258227Z_pj001"> <mets:mdWrap MIMETYPE="text/xml" MDTYPE="MODS"> <mets:xmlData> <mods:mods> <mods:titleInfo> <mods:title>Polytechnisches Journal</mods:title> <mods:subTitle>Herausgegeben von Dr. Johann Gottfried Dingler, Chemiker und Fabrikanten etc. </mods:subTitle> <mods:subTitle>Mit 10 Kupfertafeln. </mods:subTitle> </mods:titleInfo> <mods:name type="personal"> <mods:displayForm authority="gnd">Dr. Johann Gottfried Dingler ! ! ! </mods:displayForm> <mods:namePart type="family">Dingler</mods:namePart> <mods:namePart type="given">Johann Gottfried</mods:namePart> <mods:namePart type="date">1778-1855</mods:namePart> […] eingebundene MODS-Daten mit bibliographischen Angaben Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
  20. 20. <mets:structMap TYPE="LOGICAL"> ! <mets:div ID="LOGdiv32258227Zd4" TYPE="volume" Strukturdaten: Schachtelung von div-Elementen, Beschriftung in ! ! ! DMDID="dMD32258227Z_pj001" ADMID="aMD32258227Z" den LABEL-Attributen ! ! ! LABEL="Polytechnisches Journal. Band 1"> ! ! <mets:div ID="LOGdiv32258227Zd4e686" TYPE="titlePage" ! ! ! LABEL="Titelblatt" DMDID="dMD32258227Z_pj001"/> ! ! <mets:div ID="LOGdiv32258227Zd4e721" TYPE="preface" ! ! ! LABEL="Vorwort" DMDID="dMD32258227Z_pj001"/> ! ! <mets:div ID="LOGdiv32258227Zd4e761" TYPE="contents" ! ! ! LABEL="Inhaltsverzeichnis" DMDID="dMD32258227Z_pj001"/> ! ! <mets:div ID="LOGdiv32258227Zd4e1355" TYPE="issue" ! ! ! LABEL="Heft 1" DMDID="dMD32258227Z_is001001"> ! ! ! <mets:div ID="LOGdiv32258227Zd4e1358" TYPE="article" ! ! ! ! LABEL="I. Marechaux über die hydraulische Presse." ! ! ! ! DMDID="dMD32258227Z_ar001001"/> ! ! ! <mets:div ID="LOGdiv32258227Zd4e3254" TYPE="article" ! ! ! ! LABEL="III. Kurrer über den neuen Seidendruck mittelst ! ! ! ! ! ! örtlicher Farben." DMDID="dMD32258227Z_ar001003"/> Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
  21. 21. METS bei Editura Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
  22. 22. (unsere) Anwendungsfälle für METS • Präsentation offline • Präsentation online • Metadatentransport • Datenüberprüfung/Langzeitarchivierung • (Abrechnung) Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
  23. 23. verwaltete Dateien • Images (Master und Derivate) als TIFF, JPEG, PNG, PDF usw. • Textdateien, teilweise strukturiert, als TXT, EAD, TEI usw. • HTML-Präsentationen • u.v.a. Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
  24. 24. Arten von Metadaten • technische Metadaten • Dateipfade • Größe, Änderungsdatum, Checksumme • Informationen zum Inhalt: Mediatype, Pixelmaße, Auflösung, Farbprofil u.v.m. • inhaltlicheMetadaten • Strukturdaten • alle anderen beschreibenden Daten wie Angaben zu Bestand, Signatur, Autor Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
  25. 25. Plädoyer für Strukturdaten • Technische Metadaten lassen sich sehr einfach erstellen, während inhaltliche Metadaten, besonders Strukturdaten, einen nennenswerten intellektuellen Aufwand erfordern. • Aber: Strukturdaten erschließen die Digitalisate und bestimmen i.d.R. die Darstellung und Navigation für Benutzer und tragen damit wesentlich zum Erfolg eines Imagedigitalisierungsprojektes bei. Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
  26. 26. • Photograph © Andrew Dunn – Website: http://www.andrewdunnphoto.com/ – CC-by-SA 2.0
  27. 27. Profile • Profilelegen fest, wie die verfügbaren Elemente eingesetzt werden, um Daten abzubilden. Sie treffen eine Auswahl unter Alternativen. • Beispiele: • DFG-Viewer • MEX/MIDEX • weitereunter http://www.loc.gov/standards/mets/ mets-profiles.html Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
  28. 28. Einsatz von METS-Profilen bei Editura • alle Profile, die unsere Kunden benötigen • ImZweifel bevorzugen wir die richtige Darstellung auf dem Zielsystem ggü. der »richtigen« Semantik. • eigenesProfil für Archivierung, eigene Software zur METS-Erzeugung und Überprüfung archivierter Dateien Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
  29. 29. unsere Wünsche an ein Profil • ein Profil; wenige Pflichtelemente, unterschiedliche Anwendungsfälle durch optionale Elemente abdecken • eherweniger Funktionen resp. Elemente und Attribute, diese aber überall vollständig unterstützt • dauerhafte Pflege des Profils (Präzisierungen, Aktualisierungen, Dokumentation) • Schema zur Validierung der Daten Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
  30. 30. unsere Wünsche an eine Software • vollständige Unterstützung des jeweiligen Profils • Erzeugung von offline-fähigen Präsentationen, d.h. ohne Internetzugang und Serverunterstützung ausführbar • Präsentation unterstützt Deep-Links, d.h. Sprung zu einem konkreten Image, mit Aufbau des Kontextes • Datei-Überprüfung und Statistik Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
  31. 31. DIGITALISIERUNG ALS DIENSTLEISTUNG Images, Metadaten, Strukturdaten Herzlichen Dank für Ihre Aufmerksamkeit! • Photograph © Andrew Dunn – Website: http://www.andrewdunnphoto.com/ – CC-by-SA 2.0 Stefan Krause Editura GmbH & Co. KG, Berlin http://www.editura.de

Notas

  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • ×