Tutorial over persistent identifiers tijdens cursus Leren Preserveren, mei 2017, door Remco van Veenendaal (Nationaal Archief). Netwerk Digitaal Erfgoed, Nationale Coalitie Digitale Duurzaamheid, Het Nieuwe Instituut.
3e Studiedag Webarchivering - Vrienden voor het leven
Tutorial persistent identifiers, Remco van Veenendaal
1. Tutorial Persistent Identifiers
Remco van Veenendaal, adviseur preservation NA
en projectleider NDE-PID-project
22 mei, Koninklijke Bibliotheek, Den Haag
2. Programma
Dag 2
11:00-11:45 Bespreking module A (hoofdstuk 3) en modules B en C
11.45:12:30 Bespreking opdrachten Modules A en B
12:30-13:15 Lunch
13:15-13:30 Introductie module C
13:30-14:15 Oefening m.b.t. module C (nog te bedenken)
14:15-14:45 Case Eye. Aanlevering, proces, metadata en bestandsformaten.
Walter Swagemakers (Eye).
14:45:15:15 Persistent Identifiers en behoud van toegang.
Remco van Veenendaal (Nationaal Archief).
15:15:15:30 Bespreking te maken opdracht Module C.
15:30-16:00 Nabespreking en evaluatie cursusdagen en online leeromgeving.
3. Persistent Identifiers in
Leren Preserveren
• C. De praktijkstap
– Hoofdstuk 1: De risicobestrijding
• Paragraaf Unieke referentie-informatie
• C. De praktijkstap
– Hoofdstuk 2: Van zelfevaluatie tot certificering
• Paragraaf Persistent Identifiers
4. Persistent Identifiers in
Leren Preserveren
• C. De praktijkstap
– Hoofdstuk 1: De risicobestrijding
• Paragraaf Unieke referentie-informatie
• C. De praktijkstap
– Hoofdstuk 2: Van zelfevaluatie tot certificering
• Paragraaf Persistent Identifiers
8. Persistent Identifiers in
Leren Preserveren
• C. De praktijkstap
– Hoofdstuk 1: De risicobestrijding
• Paragraaf Unieke referentie-informatie
• C. De praktijkstap
– Hoofdstuk 2: Van zelfevaluatie tot certificering
• Paragraaf Persistent Identifiers
10. Reference rot
• Link rot (‘404’) + content drift
– Science, Technology and Medicine (STM)
• Meer weblinks in artikelen (16% 2005, 25% 2012)
• STM-artikelen 70-80% reference rot (2005 – 2012)
• Recenter (2009 – 2012) 20%
– Klein M, Van de Sompel H, Sanderson R, Shankar H, Balakireva L,
Zhou K, et al. (2014) Scholarly Context Not Found: One in Five
Articles Suffers from Reference Rot. PLoS ONE 9(12): e115253.
https://doi.org/10.1371/journal.pone.0115253
– Zie bijv. ook http://hiberlink.org/
11. Hoe werkt het?
Er was eens …
•een Object
•met een (web)locatie
•en dat was goed …
•… genoeg tot de locatie
veranderde en er een 404-foutmelding optrad.
•Toen kwam er een persistent identifier (PID)
•die het Object uniek identificeerde …
•… en permanent verwees naar actuele informatie
over het Object, inclusief de locatie.
•En het Object was duurzamer toegankelijk.
URL
Object
PID
Resolver
PID1 : URL1
PID2 : URL2
…
LokaliseertIdentificeert
12. Hoe werkt het?
De Nachtwacht heeft een
persistent identifier (handle):
10934/RM0001.COLLECT.5216
{prefix}/{suffix}
De PID verwijst naar deze URL*:
https://www.rijksmuseum.nl/nl/collectie/SK-C-5
PID ResolverPID Resolver
*) Als deze URL verandert, dan moet de PID-verwijzing worden aangepast. De PID blijft gelijk.
Deze PID wordt ‘actionable’ (URL)
door er de resolver voor te zetten:
http://hdl.handle.net/10934/RM0001.COLLECT.5216
15. Persistent identifier
per•sis•tent i•den•ti•fier [p s st( )nt d nt f /]əˈ ɪ ə ʌɪˈ ɛ ɪ ʌɪə n
1. een persistent identifier is een unieke en permanente
verwijzing naar een digitaal object
Hoe lang?
Waar te
vinden?
Wat is uniek? In
welke context?
Of fysiek!
Welke
garantie?
Wat? Welke? Van
wie?
Wat?
Van wie?
Metadata?
16. • PID’s kiezen, implementeren en gebruiken is mensenwerk
• Keuzes maken:
– Wat is uw doel?
– Waar verwijzen uw PID’s naar?
– Hoe gebruikt uw
organisatie PID’s?
– Wat verwacht u van
uw PID-leverancier?
– Wat verwacht u van de
technische PID-infrastructuur?
Mensenwerk
NDE PID-project
(aug. 2015 – dec. 2017):
1.Onder aandacht
brengen
2.Kennis vergroten
3.Implementatie
ondersteunen
17. Hulp bij kiezen
• NDE PID-project:
– PID-informatie en FAQ
– PID-filmpjes
– Overzicht van PID-systemen
– PID-wijzer
Waar komt het onderwerp persistent identifiers voor in de Leeromgeving?
Unieke referentie-informatie is nuttig om (digitale) objecten te kunnen (a) vinden en (b) onderscheiden.
Paragraaf Unieke referentie-informatie, versie mei 2017.
3 niveaus: binnen je organisatie, buiten je organisatie, en duurzaam toegankelijk.
Paragraaf Unieke referentie-informatie, versie mei 2017.
Vorm: bijv. interne unieke code, URI/URL voor extern, of PID voor duurzame toegankelijkheid.
PID’s meestal gekoppeld aan wat je als organisatie als ‘digitaal object’ definieert, en beperkt tot die digitale objecten die je (online) aan je doelgroep(en) aanbiedt.
Persistent identifiers zijn een oplossing voor link rot.
Link rot resulteert meestal in een ‘404’- of ‘Not found’-foutmelding
Naast link rot speelt ook content drift een rol. Content drift is het veranderen van informatie waaraan gerefereerd wordt, zie artikel of http://hiberlink.org/.
Vragen dankbaar en met toestemming hergebruikt van Jonathan Clark, International DOI Foundation.
Dus: samen antwoord geven op de vragen uit de vorige dia. Samen bouwen aan de toekomst van PID’s.
Door NCD-PID-project ontwikkelde hulpmiddelen, zie de links die aan de afbeeldingen zijn gekoppeld.
Analyse van de resultaten van de PID-wijzer toont bijv. aan welke community’s welke voorkeuren hebben (volgens de PID-wijzer).
Helpt NDE om (a) na te gaan of de PID-wijzer ‘realistische’ resultaten oplevert en (b) gerichter te adviseren bij selectietrajecten.
Maar: het kiezen van een PID-oplossing hangt ook af van de sociale context waar je je prettig bij voelt.
Grafiek gebaseerd op informatie van 1 mei 2017.