2. 2
• Deutsche Zentrale Fachbibliothek für Technik sowie Architektur, Chemie,
Informatik, Mathematik und Physik
• Bund-Länder-finanziert, Mitglied der Leibniz-Gemeinschaft (WGL)
• Alle 7 Jahre Evaluierung durch externe international besetzte
Gutachtergruppe (zuletzt 02.2011)
• Ergebnis (u.a.): Besonders hervorzuheben ist dabei der Betrieb der
nationalen DOI-Registrierungsagentur zur Referenzierung von
Forschungsdaten. Mit ihr bietet die TIB einen innovativen und
bedeutenden Dienst an, der auch international wahrgenommen wird.
Die Technische Informationsbibliothek
3. 3
Historie der DOI-Registrierung
• 2003:
DFG Projekt der TIB mit World DataCenters bzgl. Publikation
von Forschungsdaten
• 2005:
TIB wird erste DOI-Registrierungsagentur für Forschungsdaten.
Von Anfang an wird auch graue Literatur registriert.
• 03.2009:
Paris Memorandum bzgl. der Zusammenarbeit von 6
europäischen Informationseinrichtungen
• 12.2009:
Gründung von DataCite mit 7 Mitgliedern
• 03.2014:
22 Mitglieder, 9 assoziierte Mitglieder aus 18 Ländern der Kontinente
Amerika, Europa, Afrika, Asien und Australien.
4. 4
PIDs
• DOI
• Zitierung von wissenschaftlichen Publikationen
• In der wissenschaftlichen Gemeinschaft anerkannt
• Auflösen möglich über jeden Handle Server oder
http://dx.doi.org/{doi}
• Verantwortung und Garantien für Persistenz und
Datenqualität
• Handle
• Globales Referenzieren von Daten vor der Publikation
• Auflösen möglich über jeden Handle Server
• Keine Persistenz, keine gesicherten Verantwortlichkeiten
5. 5
PIDs
• URN
• Referenzieren lokaler Dokumente innerhalb eines geschlossenen
Systems (z.B. Hochschulschriften)
• Auflösung nur auf Server des Herausgebers
• Persistenz und Datenqualität werden gewährleistet
• ARK
• Dokumente aller Arbeitsprozesse
• Möglichkeit “persistence declaration” abzugeben
• ARKs können auch gelöscht werden
• Auflösen nur kostenfrei auf dem eigenen Server möglich, Kosten
entstehen bei Nutzung des globalen n2t.net Resolvers
• Qualitätsmanagement, keine Persistenzgarantie
6. 6
ARK
• origins in the library, archive, and museum (LAM) community (e.g., the
Internet Archive has 4 million ARKs, the National Library of France has
20 million ARKs, natural history museums are using ARKs for
specimens)
• applicable to any resource, whether digital, physical, or abstract, e.g., to
vocabulary terms or people
• flexible metadata guidelines, depending on discipline and application
• ability to declare different kinds of persistence, e.g., long-term retention
with absolute bit-level fixity, or long-term retention subject to update, or
something in between
• ARKs are URLs, with the ability to retrieve metadata by appending '?' to
the URL
• persistence declaration and organizational commitment retrievable by
appending '??'
• a time-limited persistence declaration permits some ARKs to be
deleted, as appropriate
• support for mixed case, allowing shorter identifiers in unique
combinations
Eigenschaften
Informationen von Joan Starr (CDL /
EZID)
7. 7
ARK
• no fees to assign or resolve ARKs via a local resolver; to use
ARKs with the global n2t.net resolver you must be an EZID
customer
• resolution based on simple web redirection, with open source
tools available
• you can host ARKs on your own branded web server/resolver
(e.g., the British Library uses ARKs this way)
• at low cost via EZID, you can host ARKs at a global
resolver http://n2t.net/ ; this resolver is in the process of being
replicated for high availability
• with respect to publication content, ARKs can be used for pre-
prints, post-prints, and supporting artifacts
Anwendungsfälle
Informationen von Joan Starr (CDL /
EZID)
8. 8
ARK
• support for the '?' and '??' inflections is inconsistent at the
moment
• no standardization yet for persistence declarations
• currently there is no replication for the global n2t.net resolver
• In terms of the research data life cycle, we recommend the use
of ARKs as a best practice for good data management by
assigning unique identifiers (ARKs) to the data as part of the
data documentation. Researchers benefit by keeping track of
(and remembering) aspects of their data throughout the
research project.
Schwächen
Informationen von Joan Starr (CDL /
EZID)
9. 9
Das DOI®
System
• 1998 Gründung der International DOI Foundation (IDF) als
übergeordnete Organisation
• DOI ist eine geschützte Marke; seit Mai 2012 ISO Standard
26324
• DOI ist eine Vermarktung des technisch geprägten Handle
Systems
• Teil der Qualitätskontrolle ist die verpflichtende Abgabe von
Metadaten bei jeder DOI-Registrierung.
DOI®
, DOI.ORG®
and shortDOI®
are trademarks of the International DOI Foundation
10. 10
DOI-Registrierungsagenturen
• CrossRef – Zeitschriftenartikel, Bücher, Konferenzberichte
• DataCite – Forschungsdaten, Graue Literatur, nicht-textuelle Materialien
• EIDR – Filme, TV Serien und andere kommerzielle Filmmaterialien
• Airiti, Inc. – Traditionale Chinesische Materialien
• CNKI (China National Knowledge Infrastructure) - Chinesische e-Journals,
Zeitungen, Dissertationen, Konferenzbände u.m.
• ISTIC (The Institute of Scientific and Technical Information of China) –
Zeitschriften des chinesischen Marktes
• JaLC (Japan Link Center) – wissenschaftliche und akademische
Publikationen in Japan
• mEDRA – Internet Dokumente
• OPOCE (Office des publications EU) – Dokumente der Europäischen
Union
11. 11
DataCite
• Globales Konsortium getragen von lokalen Einrichtungen
• Fokussiert auf die Verbesserung des Zugangs zu und der
Zitierung von Daten und anderen nicht-textuellen Inhalten
• Gegründet am 1. Dezember 2009 in London
• Working Groups / Staff:
• Metadata:
Entwicklung des Metadaten Schemas in Zusammenarbeit mit der
Community
• Business Practices:
Entwicklung von Standards, Workflows und Best Practices
• Tech Team:
Weiterentwicklung der technischen Infrastruktur
12. 12
Technische Informationsbibliothek (TIB)
Canada Institute for Scientific and Technical Information (CISTI),
California Digital Library, USA
Purdue University, USA
Office of Scientific and Technical
Information (OSTI), USA
Library of TU Delft,
The Netherlands
Technical Information
Center of Denmark
The British Library
ZB MED, Germany
ZBW, Germany
Gesis, Germany
Library of ETH Zürich
L’Institut de l’Information Scientifique
et Technique (INIST), France
Swedish National Data Service (SND)
Australian National Data Service (ANDS)
Conferenza dei Rettori delle Università Italiane (CRUI)
National Research Council of Thailand (NRCT)
The Hungarian Academy of Sciences
University of Tartu, Estonia
Japan Link Center (JaLC)
South African Environmental Observation Network (SAEON)
European Organization for Nuclear Research (CERN)
DataCite Mitglieder
Affiliated members:
Digital Curation Center (UK)
Microsoft Research
Interuniversity Consortium for
Political and Social Research (ICPSR)
Korea Institute of Science and
Technology Information (KISTI)
Bejiing Genomic Institute (BGI)
IEEE
Harvard University Library
World Data System (WDS)
GWDG
14. 14
TIB Datenzentren
Die TIB arbeit derzeit mit 60+ Datenzentren zusammen, die
bereits >800.000 DOI-Namen registriert haben, z.B.:
• Publishing Network for Geoscientific & Environmental Data
(PANGAEA)
• ZALF – Leibniz-Zentrum für Agrarlandschaftsforschung
• HZB - Helmholtz-Zentrum Berlin
• UB München
• UB Konstanz
• Bibliothek des KIT
• Julius-Kühn-Institut
Außerdem vergibt die TIB auch DOI-Namen für von der TIB
gespeicherte Dokumente, wie BMBF-Forschungsberichte und
Fahrtberichte, und natürlich die Medien im AV-Portal.
15. 15
DataCite Working Groups
Metadata
• 12 Mitglieder aus 7 Nationen
• Erstellen des Metadaten Schemas
• Kommunikation mit der Community
• Google Diskussionsgruppe:
https://groups.google.com/forum/?hl=en&fromgroups#!forum/datacite-metadata
Business Practices
• 9 Mitglieder aus 6 Nationen
• Entwicklung von Empfehlungen zu Geschäftsmodellen;
Formulierung der DataCite Policy, Best Practices
• Zusammenarbeit mit anderen DataCite Working Groups
• Business Models Principles: doi:10.5438/0007
16. 16
Das DataCite Metadaten Schema
• Vorgabe der IDF, ein Mindestmaß an identifizierenden
Metadaten vorzuhalten.
• Aktuelle Version ist 3.0.
• Ein Metadatenschema für die Verlinkung von Daten und
anderen Objekten.
• Disziplinübergreifend.
• Auf Dublin Core basierend.
• DOI-Namen des Schemas:
• Dokumentation: doi:10.5438/0005
• Schema Definition: doi:10.5438/0006
17. 17
Das DataCite Metadaten Schema
• Identifier (mit type Attribut)
• Creator (mit type und nameIdentifier Attributen)
• Title (mit optionalem type Attribut)
• Publisher
• PublicationYear
• Zitierung:
Creator (PublicationYear): Title. Publisher. Identifier
Pflichtfelder
18. 18
Das DataCite Metadaten Schema
• Subject (mit scheme Attribut)
• Contributor (mit type und nameIdentifier Attributen)
• Date (mit type Attribut)
• Language
• ResourceType (mit description Attribut)
• AlternateIdentifier (mit type Attribut)
• RelatedIdentifier (mit type und relationType Attributen)
• Size
• Format
• Version
• Rights
• Description (mit type Attribut)
• GeoLocation (mit point, box und place)
Optionale und Recommended Felder
19. 19
• ‚nichtsprechende‘ Zeichenfolge
• Zeichen für DOI-Namen:
• A – Z
• a – z
• 0 – 9
• : (Doppelpunkt)
• . (Punkt)
• - (Bindestrich)
• _ (Unterstrich)
• / (Schrägstrich)
Keine Umlaute und Sonderzeichen!
http://www.tib-hannover.de/fileadmin/informationsmaterial/flyer/TIB_DOI_Service_DOKU_DT.pdf
Best Practices
Der DOI-Name
20. 20
Best Practices
Drei Ansätze zur DOI-Vergabe und Zitierung:
• Cite a specific time slice (the set of updates to the dataset
made during a particular period of time);
• Cite a specific snap shot (a copy of the entire dataset made at a
specific time);
• Cite the continuously updated dataset, but add an Access Date
and Time to the citation.
Note that a “time slice” and “snap shot” are versions of the
dataset and require unique identifiers. The third option is
controversial, because it necessarily means that following the
citation does not result in observation of the resource as cited.
DataCite Metadata Documentation
Dynamische Daten
21. 21
“DataCite clients are the custodians of their data and therefore
define the granularity of the data to which they are assigning
DOIs. Because the aim of DataCite is to make data citable,
however, all data registered should be easily and clearly
citable.”
DataCite Business Models Principles
Best Practices
Granularität
22. 22
Best Practices
• Es gilt wie bei der Granularität: Jedes Datenzentrum ist selbst
für die Bestimmung von Versionen verantwortlich.
• Prinzip des „gesunden Menschenverstandes“ – kleinste
Korrekturen erfordern keinen neuen DOI, es sei denn sie
können große Auswirkungen haben.
• Kennzeichnung von Versionen: Punkt (.)
• Kennzeichnung von Teilen eines Ganzen: Schrägstriche (/)
Beispiele
• Ursprungs-DOI: 10.1234/abc123
• DOI einer neuen Version: 10.1234/abc123.1
• DOI eines Teils: 10.1234/abc123/2
Versionierung
23. 23
Kooperationen
• ORCID
• ODIN Projekt: http://odin-project.eu/
http://datacite.labs.orcid-eu.org/
• re3data.org und Databib
• Übernahme der Repository Listen:
http://www.datacite.org/node/115
• STM und DataCite Joint Statement (2012)
• bi-directional linking, increase visibility of these links:
http://www.datacite.org/node/65
• Research Data Alliance (RDA)
• MoU – organizational affiliate
24. 24
DataCite Services I
• http://mds.datacite.org
Metadata Store Userinterface zum manuellen Registrieren von
DOIs und Hochladen von Metadaten
• http://schema.datacite.org
Zugang zu allen Versionen des DataCite Metadatenschemas,
mit Dokumentation, Schema Definition und Beispielen
• http://search.datacite.org
Suchmaschine für alle von DataCite gespeicherten Metadaten
• http://stats.datacite.org
Statistiken zu Registrierungen und Aufrufen von DOI-Namen
• http://test.datacite.org
Test-Umgebung der gesamten DataCite Infrastruktur
25. 25
DataCite Services II
• http://data.datacite.org
DataCite Content Service stellt Metadaten in verschiedenen
Formaten bereit.
In Zusammenarbeit mit CrossRef:
• http://crosscite.org/citeproc
Der Citation Formater stellt Zitierungen in über 100 Formaten
bereit.
• http://crosscite.org/cn/
Über die Content Negotiation kann maschinell direkt auf
verschiedene (vorher hinterlegte) Medienformate eines
Objektes zugegriffen werden.