Metadatenmanagement: die ETH-Bibliothek beschreitet neue Wege
1. ||
Judith Bissegger & Barbara Wittwer, ETH-Bibliothek Zürich
Kongress BIS Luzern, 1. September 2016
01.09.2016Judith Bissegger & Barbara Wittwer, ETH-Bibliothek Zürich 1
Metadatenmanagement
Die ETH-Bibliothek beschreitet neue Wege
2. || 01.09.2016Judith Bissegger & Barbara Wittwer, ETH-Bibliothek Zürich 2
Agenda
Definition Metadaten
Ausgangslage
Konzept der Umsetzung
Phase 1: Konzentration auf eigene Abteilung und Daten im Bibliothekssystem
Phase 2: Einführung RDA / GND
Phase 3: Metadatenmanagement übergreifend
Ausblick
Fazit
Definition Metadaten
Ausgangslage
Konzept der Umsetzung
Phase 1: Konzentration auf eigene Abteilung und Daten im Bibliothekssystem
Phase 2: Einführung RDA / GND
Phase 3: Metadatenmanagement übergreifend
Ausblick
Fazit
3. || 01.09.2016Judith Bissegger & Barbara Wittwer, ETH-Bibliothek Zürich 3
Definition Metadaten
Metadaten
Strukturierte Daten, die Objekte beschreiben
Metadatenmanagement
Aufbereitung von Metadaten
Automatisierte Verfahren
Überblick über neue und bestehende Standards
Format- und Regelwerkskenntnisse
5. || 01.09.2016Judith Bissegger & Barbara Wittwer, ETH-Bibliothek Zürich 5
Konzept der Umsetzung
Metadatenmanagement
Pilotteam
Datenanalysen, -importe, -mutationen
Aufbereiten und Umwandeln der Daten
in importfähige Formate
Bewirtschaftung des Link Resolvers SFX
Gute Regelwerks- und Formatkenntnisse
Einarbeitung in RDA
Fortbildungen zu relevanten Themen
Aneignung von IT-Kenntnissen:
6. || 01.09.2016Judith Bissegger & Barbara Wittwer, ETH-Bibliothek Zürich 6
2 Jahre Pilotprojekt – 3 Phasen
Phase 3
Metadatenmanagement übergreifend verstehen
Phase 2
Einführung RDA / GND
Phase 1
Konzentration auf eigene Abteilung und Daten im
Bibliothekssystem
7. || 01.09.2016Judith Bissegger & Barbara Wittwer, ETH-Bibliothek Zürich 7
Phase 1: der Beginn
Konzentration auf eigene Abteilung
Einführung systembibliothekarische Arbeiten
Prüfung von Arbeiten der IT und Medienbearbeitung
Überblick über das Metadatenmanagement
8. || 01.09.2016Judith Bissegger & Barbara Wittwer, ETH-Bibliothek Zürich 8
Phase 1: der Beginn
Rascher Aufbau von technischen Kenntnissen
9. || 01.09.2016Judith Bissegger & Barbara Wittwer, ETH-Bibliothek Zürich 9
Phase 1: der Beginn
Vertiefung Regelwerkskenntnisse
Maschinelle Mutationen erfordern Server-Zugriff
Arbeiten und einzelne Arbeitsschritte automatisiert
10. || 01.09.2016Judith Bissegger & Barbara Wittwer, ETH-Bibliothek Zürich 10
Phase 1: Neuer Arbeitsbereich
Metadaten in mehreren Quellsystemen verwaltet
Metadatenflussdiagramm wurde erstellt
Kennenlernen von Metadaten der ETH-Bibliothek und deren Formate und
Eigenschaften
12. || 01.09.2016Judith Bissegger & Barbara Wittwer, ETH-Bibliothek Zürich 12
Phase 2: Einführung RDA / GND
Ablösung IDS MARC-Format durch FULL MARC-Format
Anpassungen von Indexierung, Datenbankabfragen, Metadaten, sowie allen
betroffenen Systemen
13. || 01.09.2016Judith Bissegger & Barbara Wittwer, ETH-Bibliothek Zürich 13
Phase 2: Einführung RDA / GND
Datenanalysen, Erstellen von Mappings, Testen von Konfigurationen, neue
Arbeitshilfen für Katalogisierende, Kurzschulungen
14. ||
Schnittstellen zu anderen Fachabteilungen
Kenntnisse in weiteren Datenformaten
Metadatenmanagement in Fachpresse und international vermehrt Thema
Neue Tools für das Metadatenmanagement
Weiterbildung zu verschiedenen Themen durch Workshops und Fachliteratur
01.09.2016Judith Bissegger & Barbara Wittwer, ETH-Bibliothek Zürich 14
Phase 3: Metadatenmanagement übergreifend
15. || 01.09.2016Judith Bissegger & Barbara Wittwer, ETH-Bibliothek Zürich 15
Phase 3: Metadatenmanagement Arbeitsfelder an der ETH-
Bibliothek
Etablierte Services: Abgleich mit Datenbank und E-Book Einspielungen
Datenanalyse
Weitergabe von Know-How
Datenanalyse und -mappings
Datenkonversionen, -mutationen, -einspielungen und -anreicherungen
Formate und Metadatenflüsse
Mithilfe in Projekten
Wissensaufbau in Datenformaten und -modellen und kontinuierliche
Weiterbildung
16. || 01.09.2016Judith Bissegger & Barbara Wittwer, ETH-Bibliothek Zürich 16
Ausblick
Verwendung von Tools für das Metadatenmanagement
Metadatenflussdiagramm pflegen und erweitern
Datenformate und -modelle
Linked (Open) Data
Neue Services: Unterstützung für die Fachabteilungen
Ablösung Bibliothekssystem
Organisatorische Verankerung
Einarbeitung neuer KollegInnen
18. || 01.09.2016Judith Bissegger & Barbara Wittwer, ETH-Bibliothek Zürich 18
Vielen Dank
Fragen?
Kontakt:
Judith Bissegger: bissegger@library.ethz.ch
Barbara Wittwer: barbara.wittwer@library.ethz.ch
Allgemeine Anfragen zum Metadatenmanagement: metadaten@library.ethz.ch
Notas del editor
Als wir uns vor knapp drei Jahren mit dem Thema Metadatenmanagement zu befassen begannen, war dies kaum Thema in der Bibliothekswelt, es gab sehr wenig Literatur dazu und sozusagen keine Schulungen oder Fortbildungen.
Unter Metadaten verstehen wir Strukturierte Daten, die Objekte beschreiben.
Unter Metadatenmanagement, eigentlich ein Begriff aus der Informatik, welcher im bibliothekarischen Umfeld für alles gebraucht wird, was über die bisherigen klassischen Katalogisierungsarbeiten hinausgeht, verstehen wir:
Aufbereitung von Metadaten mit Hilfe von Datenanalysen oder Mappings
Automatisiertes Verfahren mit grossen Datenmengen
Überblick über die Entwicklung und Weiterentwicklung von bestehenden und neuen Standards
Aufbau von Format- und Regelwerkskenntnissen
Der Grund, weshalb wir uns in der Medienbearbeitung mit MDM befassen, bestand darin, Mittel und Wege suchen, um vereinfachte und ressourcensparende Arbeitsweisen in der Katalogisierung zu erproben. Das ist nur mit technischen Mitteln, also verbesserten IT-Kenntnissen möglich, welche im Team Bibliotheks-IT-Services vorhanden sind.
Deshalb wurde das Metadatenmanagement zwischen den beiden Gruppen Bibliotheks-IT-Services und Medienbearbeitung angesiedelt.
Wir haben ein Pilotteam zusammengestellt, welches aus zwei Mitarbeiterinnen aus der Medienbearbeitung und einer Mitarbeiterin aus den Bibliotheks-IT-Services besteht. Dieses Team sollte in einem Pilotversuch auf der grünen Wiese Arbeiten zum Thema Metadatenmanagement ausloten können.
Als Aufgaben wurden damals folgende Tätigkeiten skizziert:
Zum Einen die Aneignung von IT-Kenntnissen, dazu gehört:
Datenanalyse, -importe und –mutationen
Aufbereiten und Umwandeln der Daten in importfähige Formate
Bewirtschaftung des Link Resolvers SFX
Zum Andern: Gute Regelwerks- und Formatkenntnisse, und die Einarbeitung in RDA
Und last but not least: Fortbildungen zu relevanten Themen, dies war jedoch aus mangeldem Angebot im ersten Jahr nicht möglich.
Die Entwicklung des Metadatenmanagements an der ETH-Bibliothek lässt sich grob in 3 Phasen aufteilen:
In der ersten Phase haben wir uns auf Arbeiten im eigenen Bereich und auf die Daten im Bibliothekssystem konzentriert.
Die Einführung der RDA / GND war Schwerpunkt der zweiten Phase.
Und in der dritten Phase sind Schnittstellen zu weiteren, bereichsübergreifenden Fachabteilungen entstanden und auch international wurde das Metadatenmanagement vermehrt zum Thema.
Zu Beginn konzentrierten wir uns auf die Arbeiten, die in der eigenen Abteilung anfallen.
Schwerpunkt war, den Kolleginnen aus der Medienbearbeitung systembibliothekarische Kenntnisse anzueignen, sowie Unix-Kenntnisse zu erwerben, um auf den Aleph-Servern arbeiten zu können.
Wir haben geprüft, welche Arbeiten, die von der IT erledigt werden, in ein Metadatenmanagement-Team übergeben und welche Arbeiten und Prozesse, die bei der Medienbearbeitung anfallen, automatisiert werden könnten.
Zudem galt es zu Beginn auch sich einen Überblick über das Metadatenmanagement zu verschaffen. Was bedeutet MDM und wie kann es eingesetzt werden. Wobei zu Beginn kaum Artikel und Beispiele aus anderen Bibliotheken zu finden waren.
Rasch konnte das technische Wissen aufgebaut und erste Arbeiten in Angriff genommen werden.
So zählten v.a. Datenrecherchen, -analysen und –mutationen zu den ersten Arbeiten.
Für die Datenanalyse mussten zudem Kenntnisse in Analysetools (PSPad, Excel), sowie im Datenformat MARC und dem hier gezeigten Aleph Sequential Format stark erweitert werden.
Ein grosses Arbeitsfeld war zu Beginn auch die Vertiefung der Regelwerkskenntnisse, vorerst KIDS, später auch RDA.
Hierzu wurde eine neue interne Regelwerksgruppe ins Leben gerufen, um gemeinsam das neue Regelwerk durchzuarbeiten. Mit dieser Arbeit haben wir bereits ein Jahr vor der Einführung von RDA begonnen.
Als Systembibliothekarin war dies für mich selbst auch sehr wichtig und praktisch, da ich ansonsten wohl den Anschluss an die aktuellen Entwicklungen im Katalogisierungswesen wohl verloren hätte.
Es hat sich schnell gezeigt, dass die meisten technischen Arbeiten, die wir ausprobiert hatten, beispielsweise maschinelle Mutationen und Einspielungen von Metadaten, nur mit Zugriff auf den Aleph-Server erledigt werden können und sich diese Arbeiten daher nicht für ein breites Feld von Mitarbeitern eignen, sondern nur von ausgebildeten Systembibliothekaren ausgeführt werden können.
Wir waren zwar auf der grünen Wiese, was das Metadatenmanagement anbelangte und versuchten dort auch neue Wege zu gehen. Bei der Ausführung von Arbeiten, die sich mit Metadaten in Aleph befassen, wurden uns durch die komplexe Systemarchitektur, sowie vom Aleph-System aber auch Grenzen aufgezeigt.
Dennoch war es möglich, einige Arbeiten und Arbeitsschritte zu automatisieren, z.B.:
- der automatisierte Abgleich mit der Aleph-Datenbank anhand der ISBN oder ISSN
komplexe Expertenabfragen, welche nur mit vertieften Kenntnissen der Indexierung möglich sind
verschiedene Datenmutationen, wie z.B. die Ergänzung des Abbreviated Key Title, in allen Zeitschriftenaufnahmen.
Nach einem halben Jahr haben wir unser Spektrum ausgeweitet und weitere Aufgabengebiete gesucht und auch gefunden:
Die bibliographischen Metadaten der ETH-Bibliothek werden inzwischen in mehreren Quellsystemen verwaltet, welche von verschiedenen Teams betreut werden. Eine Übersicht oder eine Darstellung davon gab es bislang noch nicht.
Das Pilotteam hat sich deshalb der Aufgabe angenommen, ein Datenflussdiagramm der Metadaten der ETH-Bibliothek zu erstellen.
Dabei konnten wir auch gleich sämtliche bibliographische Metadaten der ETH-Bibliothek und deren Formate und Eigenschaften kennen lernen.
Anhand des Diagramms lassen sich die Abhängigkeiten der Systeme erkennen und Änderungen an Metadaten können auf ihre Auswirkungen in anderen Systemen eingeschätzt werden.
So kann z.B. das Wegfallen oder Hinzukommen eines MARC-Feldes im Bibliothekssystem, Anpassungen in den Normalisierungsregeln für das Discovery System und im Statistiktool nach sich ziehen.
Viele solche Anpassungen am MARC-Format kamen mit der Einführung der neuen Katalogisierungsregeln RDA auf die ETH-Bibliothek zu. Die Vorbereitung für die RDA-Einführung war Anfang 2015 zugleich der Start in die zweite Phase des Metadatenmanagement-Pilot-Teams.
Mit der Einführung der RDA, sowie der Gemeinsamen Normdatei GND im Nebis-Verbund, sollte gleichzeitig auch das im IDS verwendete MARC-Format auf das international eingesetzte FULL MARC ausgebaut werden.
Dies bedeutete, dass zahlreiche lokale IDS-Felder abgelöst wurden. Zudem kamen einige neue Felder hinzu, die v.a. für RDA benötigt wurden.
Die Umstellung auf das Full MARC-Format erforderte zahlreiche Anpassungen der Indexierung, von Datenbankabfragen, sowie an an den Metadaten selbst. Zudem mussten alle Systeme und Programme, die Daten aus Aleph beziehen, an das erweiterte Format angepasst werden. Das zuvor erstellte Datenflussdiagramm konnte dazu genutzt werden, um die abhängigen Systeme zu erkennen. Und dies waren so ziemlich alle Systeme und Metadatenflüsse, die hier abgebildet sind.
Das Metadatenmanagement-Pilotteam konnte die technischen Arbeiten und die Fachabteilungen mit dem zuvor aufgebauten interdisziplinären Wissen optimal unterstützen, indem es Datenanalysen vornahm, Mappings für Schnittstellen erstellte und Konfigurationen testete. Zudem wurden neue Arbeitshilfen für die Katalogisierenden erstellt, sowie interne Kurzschulungen zu speziellen Themen (z.B. fortlaufende Ressourcen, E-Books, RDA und IT) abgehalten.
Auf der Folie ist ein Auszug aus einem Mapping zu sehen. Da u.a. die Codierungsfelder 906 und 907 abgelöst wurden, musste für alle einzelnen Codierungen ein Ersatz gefunden werden, sowohl für die Indexierung, die Recherche, als auch für das Discovery System.
Mit den geleisteten Arbeiten konnte das Pilotteam bereits nach kurzer Zeit massgeblich dazu beitragen, dass die Umstellung auf RDA und GND innerhalb des Nebis-Verbundes professionell und reibungslos erfolgen konnte.
Die dritte Phase begann im Laufe des Jahres 2015, als mit den verschiedenen Arbeiten für die RDA-Einführung auch Schnittstellen zu anderen Fachabteilungen der ETH-Bibliothek entstanden.
Mit dem Erstellen von diversen Mappings, konnten wir uns Wissen in verschiedenen Datenformaten, wie z.B. Dublin Core, sowie in Auszeichnungssprachen wie XML aneignen.
Zudem wurde das Metadatenmanagement auch vermehrt in der internationalen Fachpresse, in Workshops und Vorträgen zum Thema.
Neue Tools für das MDM entstanden, mit dem Ziel, dass diese auch von Nicht-Informatikern genützt werden können und somit mehr Möglichkeiten für Bibliothekare ermöglicht werden. Bei einigen davon, haben wir geprüft, ob sich diese für den Einsatz in der ETH-Bibliothek eignen.
Die einzelnen Mitarbeiterinnen des Pilotteams besuchten verschiedene Veranstaltungen zum Thema und konnten sich dadurch und durch das Lesen von Artikeln und Verfolgen der aktuellen Entwicklungen laufend weiterbilden.
Ende 2015 und im ersten halben Jahr 2016 konnten die bereits etablierten Arbeiten bereichsweit als Services angeboten werden. Dies sind v.a. Abgleiche mit der Datenbank anhand der ISBN oder ISSN oder Arbeiten rund um die E-Book Einspielungen.
Die Datenanalyse ist eine der wichtigsten Arbeiten innerhalb des MDM.
Für die Integration oder den Transfer vom Metadaten in ein System oder auch um Metadaten mit weiteren Daten anreichern zu können, ist eine vorgängige Datenanalyse unumgänglich.
Dabei müssen z.T. 100‘000e, wenn nicht Millionen von Records analysiert werden.
Dazu setzt das Metadatenmanagement-Team die geeigneten Tools und Methoden ein, um die Daten effizient und vollständig analysieren zu können.
Zudem wollen wir das während der Pilotphase erarbeitete KnowHow auch weitergegeben. Bibliotheksweit steht das Team für Fragestellungen, die sich bezüglich Metadaten im Bibliothekssystem und Metadatenflüssen ergeben, zur Verfügung.
Dies sind insbesondere:
Hilfestellung bei Fragen zu Datenanalysen und -Mappings,
Datenkonversionen, -Mutationen, -Einspielungen und Anreicherungen
Formaten und Metadatenflüssen
Zudem gibt es verschiedene Projekte, indem sich das Team als Schnittstelle zwischen IT und Fachabteilung einbringen und so für den Wissenstransfer sorgen kann.
Als weiteres Arbeitsfeld gehört die kontinuierliche Weiterbildung auf diesem Gebiet dazu.
Das Metadatenmanagement entwickelt sich gerade sehr rasch und stark weiter. Viele Artikel zum Thema erscheinen und Workshops werden abgehalten. Hier gilt es, sein Wissen kontinuierlich zu erweitern und den Überblick über die aktuellen Entwicklungen, Formate und Datenmodelle zu behalten und zu prüfen, ob sich neue Methoden oder Tools auch für die ETH-Bibliothek anwenden lassen.
Zum einen werden bestehende Aufgaben weitergeführt wie
Testen von neuen Programmen und Tools für das Metadatenmanagement
Datenflussdiagramm pflegen und erweitern
Zum anderen sollen neue Gebiete erarbeitet werden wie
Der erwähnte Wissensaufbau zum Thema Datenformate und –modelle wie z.B. Dublin Core, BIBFRAME und RDF (Resource Description Framework)
Und Linked Open Data und deren möglichen Use Cases
Es sollen aber auch neue Services angeboten werden wie
Rent a Metadata-Expert: Unterstützung in allen Fragen zu Metadaten und Hilfeleistungen für die Fachabteilungen
Zukünftige Aufgaben wie
die geplante Ablösung des Bibliothekssystems Aleph wird bestimmt Arbeiten für das Team MDM bringen
Organisatorische Änderungen:
Organisatorische Verankerung des Pilotteams offiziell bestätigen
Und last but noch least sollen weitere Kolleginnen und Kollegen ins Metadatenmanagement eingearbeitet werden
Das Fazit nach mehr als zwei Jahren Pilotversuch ergibt ein anderes Bild als im Konzept gedacht war. Das Metadatenmanagement nimmt eine andere Position ein, als ursprünglich geplant. Es hilft die Prozesse und gewisse Arbeiten in der Medienbearbeitung und IT automatisierter und effizienter zu gestalten.
Zusätzlich bedient es jedoch ganz neue Arbeitsgebiete wie sich im Vortrag mehrfach gezeigt hat, welche beim ursprünglichen Konzept nicht vorauszusehen waren und künftig an Relevanz gewinnen werden.
Und nicht zu unterschätzen ist auch die Motivation, Freude und Begeisterung der beteiligten Mitarbeiterinnen an den neuen Herausforderungen.