SlideShare una empresa de Scribd logo
1 de 64
Marek Melichar
Brno, 6.3.2014
Setkání k projektu LTP pilot








Úvod - definice, cíle a terminologie „DP“
Kořeny „Digital preservation“ a první projekty
Standardy, komunita, periodika, akce
Současné možnosti, projekty, technologie
Co si z toho vybrat? - Pragmatický přístup
Důraz pro projekt LTP Pilot






Funkční kontext (alternativy k tomu, jak DP
dělá Archivematica)
Časový kontext (Co předcházelo a kam to
směřuje)
Projekt LTP pilot v kontextu aktivit v ČR








Digital preservation
Long-term (digital) preservation
Long-term archiving
Long-term Preservation of Digital Information

V češtině dlouhodobá ochrana, archivace,
uchovávání, ukládání, preservace
Terminologii by měl zavést český překlad
norem OAIS (ISO 14721:2012) a ISO
16363:2012
Short Definition
Digital preservation combines policies, strategies and
actions that ensure access to digital content over time.


Medium Definition
Digital preservation combines policies, strategies and
actions to ensure access to reformatted and born digital
content regardless of the challenges of media failure and
technological change. The goal of digital preservation is the
accurate rendering of authenticated content over time.


http://www.ala.org/alcts/resources/preserv/defdigpres0408
Long Definition
Digital preservation combines policies, strategies and
actions to ensure the accurate rendering of authenticated
content over time, regardless of the challenges of media
failure and technological change. Digital preservation
applies to both born digital and reformatted content.


Digital preservation policies document an organization’s
commitment to preserve digital content for future use;
specify file formats to be preserved and the level of
preservation to be provided; and ensure compliance with
standards and best practices for responsible stewardship of
digital information.

Digital preservation strategies and actions address content
creation, integrity and maintenance.
Digital Preservation Refers to the series of
managed activities necessary to ensure
continued access to digital materials for as
long as necessary
http://www.dpconline.org/advice/preservationhandbook/introd
uction/definitions-and-concepts






Technologie: HW, SW,
sítě, technické
dovednosti
Organizace: Mandát,
strategie, plány
ochrany, sbírkové
plány, bezpečnost
Zdroje: Zaměstnanci a
jejich kvalifikace,
prostor, financování
Digital curation involves maintaining, preserving and adding
value to digital research data throughout its lifecycle
DCC curation model a další modely, mapování na konkrétní
infrastrukturu












Conceptualize
Create
Access and Use
Appraise and Select
Destroy
Ingest
Preservation Action
Reappraise
Store
Access and Reuse
Transform





HW – zastarávání
SW – zastarávání a s ním spojené zastarání
formátů
Běžné procesy





Rizika přenosu dat
Integrita dat
Autenticita obsahu
Mis-management, chyba


Pasivní DP
◦ Integrita souborů – uchování a dost
◦ zálohy
◦ Neřeší zpřístupnění v budoucnu



Aktivní DP
◦
◦
◦
◦
◦

Pasivní je jejím předpokladem
Identifikace formátů
Validace formátů
Extrakce metadat
Identifikace rizik etc.
Technocentrický

Uchování
původního HW a SW
Obnova médií

Analytický
Digitální
archeologie
Digitální forenzní
věda

Inkrementální
Migrace (souborů,
metadat, dat,
kontextu)
Emulace (SW,
platformy)

Trvalé digitální
objekty



HW muzeum bohužel nestačí
SW preservation:

◦ Když nelze oddělit SW od dat
◦ Pokud je SW výstupem výzkumné aktivity
◦ Pokud má SW historickou hodnotu
◦ Viz současný projekt Preserving.exe

http://www.fit.vutbr.cz/FIT/museum/


Emulace
◦
◦
◦
◦
◦

Od začátku DP jedna z voleb
IBM koncept UVC
Projekt CAMiLEON
Rothenberg, Jeff 1995
EU Projekt KEEP http://www.keep-project.eu/






Motivovalo Berlínské muzeum počítačových her
4 miliony euro, konec v roce 2012
Problémy s licencemi a ovladači, větší problémy právní
Obtížné bez zapojení firem a uvolnění licencí starého SW
Emulation framework:
http://emuframework.sourceforge.net/

Avoiding Technological Quicksand: Finding a Viable Technical Foundation for Digital
Preservation , Rothenberg, Jeff ISBN 1-887334-63-7, 1999








J.R. van der Hoeven – UVC
2009 – přednáška pro NDK v IBM.CZ
Souvisí s IBM Dias a výzkumem pro KB.NL
2005 – funkční prototyp UVC pro still images
Koncept popsán na
http://citeseerx.ist.psu.edu/viewdoc/downlo
ad?doi=10.1.1.179.494&rep=rep1&type=pdf
DIAS? – KB.NL má novou verzi svého edepotu. DNB.de údajně dále DIAS používá (v
kombinaci s dalšími moduly, které si sama
vyvinula) – ovšem jako „věčný“ pilot


Migrace
◦ Dominantní paradigma v oblasti systémů typu repozitář
◦ Migrace – OAIS zná víc typů: refreshment, replication vs
repackaging, transformation
◦ Nejčastěji se mluví o migraci formátů a migraci z HW na
HW
Všechny současné LTP systémy jsou zaměřeny na migraci
jako metodu ochrany.

Digital Migration is defined to be the transfer of digital
information, while intending to preserve it, within the
OAIS.
OAIS ISO 14721:2012 str. 5-2



Dnes především forenzní analýza
Mají obvykle jiné cíle než zachování dostupností dat

◦ Stejné nástroje a postupy pro analýzu digitálních formátů
(NZME, Jhove, Unix File, file signatures) jako DP
◦ Užitečné nástroje pro zpracování velkých transferů celých
disků, sítí – bitcurator etc.
◦ Nástroje pro analýzu provenience, autenticity, odhalování
metadat, verzí souborů, dočasných a smazaných souborů,
skrytých souborů, detekci obfuskace apod.
◦ Nástroje pro analýzu a zpracování e-mailů, analýzu chování
na webu a historie
http://www.forensicswiki.org/wiki/Main_Page
Directory Snoop: http://www.briggsoft.com/dsnoop.htm
Foremost http://foremost.sourceforge.net/
Web Historian apod.
H.M. Gladney
 2004 Řada článků a monografie
 Praktické aplikace?

SNIA a jejich „SIRF“ –
Self-contained Information
Retention Format

Bit level preservation – ochrana
bitů
(zálohování, bitová replikace,
atd.)
- Pasivní ochrana (TNA supports digital preservation
but does not engage with
the digital records directly)
Information preservation –
ochrana informačního obsahu
(OAIS)
- Aktivní ochrana (TNA - Active
preservation is any proactive
action taken in the
preservation of digital records)

Procesy
Software
Context (PDI)
Obsah
Soubory

Datasety


Více kopií, více technologií, replikace k
partnerům, udržování inventáře AIPů



Transfer dat do archivu jako kritické místo
Komprese, kryptování, zálohování, fixity
Převádění dat z lokace na lokaci



Projekty z poslední doby:







http://www.bitcurator.net/
BagIt, Bagger – právě pro transfer do loc.gov (využívá
Archivematica)
Situace v knihovnách (příklad – VISK):

Kopie AIP v NK
Kopie AIP lokálně (někdy, některé AIPy)
Rozpracované AIP (bez OCR, neúplné tituly apod.)
Kopie u externího dodavatele digitalizace (neoficiálně, časově
omezené
◦ Kopie na off-line nosičích (CD, DVD, UDO, Disky)
◦ AIPy jsou „zmrazené“ – nejsou updatovány, vytvoření a dost
◦
◦
◦
◦

Neexistuje inventář všech instancí AIPů
Neexistuje poskytovatel „třetí lokace“
Řešení: Replikace/zálohování do DÚ CESNETU
•
Nějaká obecná dohoda mezi UKR a CESNETEM?
•
Manuál pro knihovny??
•
Co data pro zpřístupnění????









OAIS: ISO 14721, Paimas: ISO 20652
Důvěryhodný dlouhodobý digitální repozitář
(ISO 16363)
ISO 27001, ISO 9001

Problém vyhovění OAIS (co je a co není
compliant?) > selfaudit a certifikace
DRAMBORA, DSA, TRAC, ISO 16363








Deskriptivní MD
(MODS, EAD, DC,
atd.)
Ochranná MD
(PREMIS)
Technická MD
(MIX, TextMD,
atd.)
Strukturální
(METS)
Informační model
• AIP, SIP, DIP
• Typy informací
Standardy pro balení:
METS,
MPEG-21 DIDL
XFDU
?
Ochranná md:
PREMIS
(XIP, DNX,…)


Funkční entity:
◦
◦
◦
◦
◦
◦
◦

Ingest
Archival storage
Data Management
Administration
Preservation Planning
Access
Common Services
Možnost rozložení odpovědnosti
◦ AIP může být pouze logický celek (jiné nakládání s
MD a soubory s obsahem)
◦ OAIS také může být pouze logický celek (oddělení
funkčního modulu)
◦ Outsoursování „archival storage“ funkcí, hostování
celého systému – při auditu je ale třeba mít dost
dokumentace od všech zúčastněných organizací a o
všech systémech
◦ Část informací vyžadovaných OAIS nemusí být v
archivu přímo, stačí na ně odkazovat do jiného
systému (deskriptivní MD)
Předmětem ochrany je:
 Informační obsah (data z měření, skenovaná data)
 Další informace nutná k porozumění, použití a
uchování informačního obsahu

◦ Informace o způsobu vytvoření
◦ Informace o nastavení zařízení, osobách, předlohách,
◦ Informace o zpracování dat (kódování, komprese, způsob
zpracování vědeckých dat, filtrování, převážení atd.)
◦ kompletní informace o procesu, ve kterém data vznikla
◦ Informace o procesech a sw
◦ Interpretace, OCR, překlad….

Rozsah dalších informací, které je nutné uchovat, závisí
na znalostech/možnostech uživatelů a jejich
technických možnostech – a v čase se mění…


Maximální přístup:

◦ http://www.jisc.ac.uk/uploaded_documents/oaismets.p
df
◦ TRAC, ISO 16363, NESTOR KK
◦ Převod OAIS na funkční požadavky
◦ Jak informační model tak funkce
◦ Snaha o maximální automatizaci procesů správy dat
◦ Reorganizace procesů instituce


Minimální přístup

◦ Naplnit 6 OAIS „mandatory requirements“
◦ Informační model a funkce v podstatě formálně
◦ Omezené možnosti automatizace procesů správy dat
3.1 Závazné povinnosti OAIS (podle překladu NK 2014)










Vyjednávat s producenty informací a přijímat od nich příslušné informace.
Získat dostatečná práva k nakládání s poskytnutými informacemi tak, aby bylo
možné zajistit dlouhodobé uchování.
Určovat (ať již samostatně nebo ve spolupráci s ostatními stranami), které
komunity by se měly stát cílovými komunitami, a tudíž by měly být schopny
porozumět poskytovaným informacím. Tím je definována znalostní základna dané
komunity,
Zajišťovat, aby informace určené k uchovávání byly pro cílovou komunitu
nezávisle srozumitelné. Cílová komunita by měla být schopna informacím
porozumět bez potřeby využití speciálních zdrojů , například bez rady expertů,
kteří informace vytvořili.
Dodržovat dokumentovaná pravidla a postupy, které zajistí, že informace budou
chráněny před všemi reálně myslitelnými nepředvídatelnými událostmi (včetně
zániku archivu), a zajistit, že informace nebudou nikdy smazány (s výjimkou
případu, kdy jejich smazání bude součástí schválené strategie). Nemělo by
docházet k žádnému jednorázovému smazávání dat.
Zpřístupňovat uchovávané informace cílové komunitě a umožnit distribuci
informací v podobě kopií původních dodaných datových objektů s dokumentací
podporující jejich autenticitu nebo v takové podobě, aby bylo možné zjistit, ke
kterým původním dodaným datovým objektům se vztahují.








Udržení dlouhodobé srozumitelnosti, použitelnosti
informace bude vyžadovat změny!
Informace musí zůstat srozumitelná, autentická a
musí mít prokazatelný původ tj.
Cílem je ochrana informace, nikoli konkrétního
bitstreamu

Interní datový model a způsob fungování
archivu musí umožnit záznam změn dat i
metadat
Mapování DP problematiky na risk management
přístupy
 Risk Management – Principles and GuideIines: ISO
31000
 Information Assurance Maturity Model IAMM
Identifikace oblastí, typů rizik, dopadů rizik,…
Nástroje:
 DRAMBORA (The Digital Repository Audit Method
Based On Risk Assessment)
 TIMBUS project: ERM (Enterprise Risk Management)
nástroje rozšířeny do oblasti DP
 TRAC










POWRR (Preserving digital Object with Restricted Resources)
http://digitalpowrr.niu.edu/digital-preservation-101/
Digital Preservation Handbook
http://www.dpconline.org/advice/preservationhandbook
Digital preservation management tutorial
http://www.dpworkshop.org/dpm-eng/eng_index.html
ROSENTHAL, Colin a kol. Průvodce plánem důvěryhodného digitálního
repozitáře (PLATTER). 1. vyd. Praha: Národní knihovna České republiky,
2009. 51 s. ISBN 978-80-7050-569-4. Online
zde: http://www.ndk.cz/platter-cz
CUBR, Ladislav. Dlouhodobá ochrana digitálních dokumentů. 1. vyd.
Praha : Národní knihovna České republiky, 2010. 154 s. ISBN 978-807050-588-5.
BROWN, Adrian. Strategie digitálního archivování. Praha : Odbor archivní
správy MV ČR v Tiskárně Ministerstva vnitra, 2003. 64 s. ; 24 cm.
(Překlad a předmluva Wanner, Macek)










Ca. od roku 1960 data centra
Ca. od 1990 - digital preservation jako
reformátování do digitální podoby
1994-1996: CPA/RLG Task Force on
Archiving of Digital Information
2000 – NDIIPP (National Digital Information
Infrastructure and Preservation Program)
1995 – první verze OAIS
2002 – ISO 14721:2003
NDIIPP – 150 milionů USD (soukromé a veřejné finance)
 Loc.gov, NARA, NLM, NAL, RLG, CLIR a další nefederální
 2010 National Digital Stewardship Alliance (NDSA) – další růst komunity
 300 projektů, NDIIPP spolufinancoval vývoj desítek konkrétní nástrojů
 Nastartoval DP aktivity v archivech, muzeích, státní správě po celých
Spojených státech
 Podrobný přehled činnosti (do roku 2012)
http://www.digitalpreservation.gov/multimedia/documents/ndiipp-statesreport032612_final.pdf
RLG 1998: Digital Preservation Needs and Requirements in RLG
MemberInstitutions:
http://www.webjunction.org/content/dam/research/activities/digpresneed
s/digpres.pdf
IMAP 2001: http://www.imappreserve.org/
NL Austrálie:




1996: Web PANDORA (Preserving and Accessing Networked
Documentary Resources of Australia)
1997: Statement of Principles for the Preservation of and
Long-Term Access to Australian Digital Objects
1998: Preserving Access to Digital Information (PADI)

Další projekty do roku 2000:

 TNA UK (1998 – Preservation policy)
 BL – 1998 - Výzkumný projekt na téma náklady na DP
(http://www.ukoln.ac.uk/services/elib/papers/tavistock/hen
dley/hendley.html)
 http://www.interpares.org/ (archivy)
 NESTOR
 E-depot KB NL – OAIS LTP DIAS od 2003 (vývoj od 1999)
 UNESCO 2003 Charter on the Preservation of Digital Heritage
Hedstrom, Margaret; (1997). "Digital Preservation: A Time Bomb for Digital Libraries."
Computers and the Humanities 31 (3): 189-202.
<http://hdl.handle.net/2027.42/42573>
Projekty finacované EU v posledních 15 letech
 http://www.erpanet.org
 http://www.delos.info
 Minerva (digitalizace)
 CASPAR, PLANETS, WEPRESERVE, DPE
 WF4Ever, TIMBUS, SHAMAN, SCAPE, PROTAGE,
PrestoPRIME, KEEP, LiWA, ENSURE, BlogForever,
ARCOMEN, APARSEN etc etc


Role DPE v ČR byla velmi významná


Open source
◦
◦
◦
◦
◦
◦



Archivematica
RODA
Hoppla
Mopseus
DAITSS
….

Komerční
◦ Rosetta
◦ SDB
◦ …..




4C project http://www.4cproject.eu/
Life I-III
starší aktivity BL, Dánské NK, NA.NL
http://www.nationaalarchief.nl/sites/default/
files/docs/kennisbank/codpv1.pdf
Jak přesvědčit stakeholdery, že to má smysl?



Advokacie jako součást řízení DP projektů
Trvalá ochrana = trvalé financování



Paradoxy financování LTP projektů:



◦
◦
◦
◦

Velké finance na krátkou dobu
Problematická udržitelnost infrastruktury
Příklad cda.kultury.sk
Nepochopení nutnosti ochrany na manažerské
úrovni
Rozdílné chápání konceptu důvěryhodnosti
(Viz konference CNZ 2013 – střed dvou světů)

TRAC: “A trusted digital repository is one whose mission is
to provide reliable, long-term access to managed digital
resources to its designated community, now and in the
future“
vs
„bezpečný identifikátor“, časová razítka, elektronické
podpisy a certifikáty, SSL


K prokázání autenticity nejsou v paměťových
institucích nutné elekt. podpisy, postačí i
metadata (eventy)
Tyllor and Cox v ČR
- Certifikace „SW“ podle ISO 16363:2012???
IBM Filenet, Datera…
◦ http://www.cnz.cz/ke-stazeni/2013/konference2013/CNZ%202013-IBM%20prezentace.pdf
EasyPLM – TD-IS s.r.o.
◦ http://www.td-is.cz/doc/certification/tdis_certificate_iso16363-12.pdf
ISO 16363:2012: „An archive that conforms to this
Recommended Practice shall have satisfied the auditor
on each of the requirements.“






Základní certifikace (Basic certification) –
Data Seal of Approval (DSA).
Rozšířená certifikace (Extended
certification) - Základní certifikace + ,
externě posouzený a strukturovaný
veřejně dostupný selfaudit podle ISO
16363 nebo DIN 31644.
Formální certifikace (Formal
certification) –plně externí, nezávislý
audit a certifikaci dle ISO 16363 nebo
DIN 31644.
Veřejně dostupná dokumentace k certifikace podle
TRAC
 HathiTrust
 Portico
 Chronopolis
 Scholars Portal
 CDA kultury
DSA: 23 institucí
http://datasealofapproval.org/en/assessment/
Nestror seal
http://files.dnb.de/nestor/materialien/nestor_mat_17_eng.pdf
Australský NA (Digital Preservation Software Platform)
http://www.aa.gov.au/collection/preserving/digitalrecords/index.aspx
Manifest Maker

supports the transfer of digital records from agencies to the National Archives. It produces a
list of all digital records being transferred, their checksum, and the relationship between the
digital records and their related item numbers in RecordSearch, our archive management
system
Xena

(XML Electronic Normalising for Archives) – determines the file format of a digital record and
converts it to an appropriate preservation file format based on open standards. Xena can also
be used to view and/or export Xena files
Digital Preservation Recorder

(DPR) – manages the digital preservation workflow, recording audit information about each
transfer in to the digital archive. DPR uses Xena to perform digital record conversions
Checksum Checker

monitors the contents of the National Archives' digital archive for data loss or corruption.


DNB.de
◦
◦
◦
◦











velmi záhy DIAS, pak „přešlapuje“
NESTOR, řada EU projektů
Kolibri http://kopal.langzeitarchivierung.de/index_koLibRI
DP4LIB http://dp4lib.langzeitarchivierung.de/

KB NL – Dias 2003, nový LTP 2012 – centrum výzkumu
BL

◦ Aktivní v řadě EU projektů (SCAPE, APARSEN, SPRUCE, LIFE, PLANETS,
preserv.)
◦ Národní britské aktivity (DCC, DPC, v rámci JISC)

NL NZ – Rosetta (Kronos) – 2008 1. verze
Norská NK (masová digitalizace)
Dánská NK (archivace broadcastingu atd.)
BNF.fr (SPAR – Fedora Commons + iRods + Athos Origin)
Německé knihovny (SLUB, TIB, ETH, BSB) Rosetta
Open Planets Foundation
http://www.openplanetsfoundation.org/


Planets suite
◦ Preservation Planning Tool, Plato
(http://www.ifs.tuwien.ac.at/dp/plato/intro.html )
◦ Planets Testbed
◦ Interoperability Framework
SCAPE
◦ Repository API

 Report API
 Management API
 Data connector API (search,
access, modify files)
 Platform

◦ Preservation WATCH
 Scout

◦ PLATO – preservation
planning

 Definovat požadavky,
zhodnotit alternativy a
výsledky, definovat
preservation plan
SCAPE
http://wiki.opflabs.org/display/SP/Ho
me

RODA (2009-)
http://www.rodacommunity.org/
Keep-solutions.com
http://www.sbaresearch.org/
Z líhně TU Wien
SNIA

– SIRF: Selfcontained Information
Retention Format
◦Logical container of
„storage container“
◦Logical and physical
storage considered as a
unit

CDMI

–

◦ standard
interoperabílniho
formátu pro přesun dat a
metadat mezi
poskytovateli cloudu

SIRF obsahuje:
•Magic

object – identifikace
a verzovani
•Preservation objects (to co
se nemění a je předmětem
ochrany)
•Catalog (průběžně se
upravují, obsahuje
metadata, která mají
zajistit budoucí
přenositelnost preservation
objects bez potřeby
vnějších funkcí)


Archivace průmyslových informací
(Product and Manufacturing Information
(PMI) Working Group)
◦ http://www.lotar-international.org/
◦ ISO 10303 (automotive, 3d modeling, CAD)



Archivace DICOM/PACs z oblasti medical
imagining



Právní data, geologická data, nuclear
waste






iPres (2004-), Archiving, ANADP, PASIG
(http://www.preservationandarchivingsig.org)
APA, Personal digital archiving, akce IIPC
Časopisy (IJDC, d-lib, Code4lib, Ariadne…)
Školení
◦ http://www.dptp.org/
◦ TIMBUS Digital Preservation Advanced Practitioner
Training


Formátové knihovny (PRONOM, UDFR, Loc.gov)
Seznamy nástrojů



Příklady policies atd.



◦ Library of Congress http://www.loc.gov/standards/mets/metstools.html
http://www.loc.gov/standards/premis/tools.html
Orbeon: http://www.orbeon.com/
OPF Knowledge Base:http://wiki.opf-labs.org/display/KB/Home
OPF Tools registry: http://wiki.opflabs.org/display/TR/Digital+Preservation+Tool+Registry
Presto Prime, Tools: https://prestocentre.org/library/tools
Library of Congress Tool
Registry: http://www.digitalpreservation.gov/tools/
FileFormat.Info Registry: http://www.fileformat.info/index.htm
COPTR: http://coptr.digipres.org/Main_Page
DCH-RP project registry (planned) - see report pages 3042 http://www.dch-rp.eu/getFile.php?id=166
„Digitální dokumenty je na rozdíl od mikrofilmu, mnohem
obtížnější uchovat ve zpřístupnitelné podobě v dlouhodobé časové
perspektivě, což je dáno vývojem v oblasti výpočetní techniky a …
inovačními cykly přinášejícími zásadní změny v technické podpoře
platforem, formátů…“
POLIŠENSKÝ, Jiří. 2002. Konsorcium pro zpřístupňování a archivaci dokumentů pro výzkum a vývoj v České
republice. In: CASLIN 2002. Ochrana a sprístupňovanie dokumentov: nové trendy: Zborník z konferencie, konanej
23.- 27. júna 2000 v Pribyline. Martin: Slovenská národná knižnica, 2002, s. 57-63.

VISK
– Mikrofilmování do roku 2012
- Data archivuje NK – do roku 2012
Jan Hutař, Marek Melichar: České paměřové instituce a digitální data - historický exkurz, současný stav a
předpokládaný vývoj










DPE
LiWA
CASPAR (Langweilův model)
IIPC
SCAPE (VUT)
NDK
NDA
CDK
Nové role vědeckých knihoven
2011: REPORT ON INTEGRATION OF DATA AND PUBLICATIONS (KB.NL, BL, DNB,
LIBER, STM Publishers)
http://www.alliancepermanentaccess.org/wpcontent/uploads/downloads/2011/11/ODEReportOnIntegrationOfDataAndPublications-1_1.pdf


2013: LERU Roadmap for science data
http://www.leru.org/files/publications/AP14_LERU_Roadmap_for_Research_data_fina
l.pdf


Horizon 2020 – větší zapojení vědeckých knihoven do výzkumné infrastruktury,
posílení dostupnosti dat paměťových institucí
http://ec.europa.eu/research/horizon2020/pdf/proposals/com%282011%29_811_fi
nal.pdf
http://ec.europa.eu/dgs/connect/en/content/mission-and-priorities
http://ec.europa.eu/dgs/connect/en/content/online-accessibility-and-digitalpreservation-europes-cultural-heritage










Availability
Findability
Interpretability
Re-usability
Citability
Curation
Preservation

ODE REPORT ON INTEGRATION OF DATA AND PUBLICATIONS http://www.alliancepermanentaccess.org/wp-content/uploads/downloads/2011/11/ODEReportOnIntegrationOfDataAndPublications-1_1.pdf






Small sciences vs Big sciences
Liší se v typech dat, způsobech zpracování
dat, rychlosti publikačního cyklu, rychlosti
citování atd.
Big sciences – APARSEN, společně s EUDAT,
SCIDIP-ES, DPHEP
Data z online vzdělávacích systémů – trendy:








3D Printing
MOOCs
Big Data
Digital Textbooks
Gamification
The Flipped Classroom
Mobile Learning

◦ Co z toho archivovat?


Galleries, Libraries, Archives, Muzeums
◦
◦
◦
◦

Větší integrace knihoven do heritages
Jednotné systémy pro správu metadat a autorit
Co všechno ještě bude v knihovním katalogu?
Co všechno bude muset ještě knihovna archivovat?

Příklad využítí Archivematiky v muzeu v Berlíně:
urn:nbn:de:0297-zib-43020






Řeší tu jednodušší třetinu (technologie) –
nikoli organizaci a zdroje!
„Důvěryhodná“ ve smyslu ISO norem nemůže
být žádná demo instalace – důvěryhodnost se
posuzuje v kontextu konkrétní organizace
Normy připouští outrsourcování části činnosti
jiné organizaci (CESNET jako poskytovatel
OAIS funkcí „archival storage“ musí
poskytnout dokumentaci)




Nezapomenout na potřebu bit replikace
Význam projektu pro MUNI – další krok by
mělo být větší zapojení knihovny do archivace
vědeckých dat (využít eu programů?)
Nezapomenout na řízení a strategické
dokumenty - instituce, která není strategicky
řízená nemůže provozovat LTP systém
V našich podmínkách se obvykle velmi podceňuje
plánování - Instituce nemají:
-

-

Mission statement
Plány rozvoje
Plány financování
Plán řízení lidských zdrojů
Ani collection plan apod.
Děkuji
http://digital-preservation-cz.blogspot.cz/

Más contenido relacionado

Similar a LTP Pilot - Archivematica Projekt v CR

Datová úložiště CESNET
Datová úložiště CESNETDatová úložiště CESNET
Datová úložiště CESNETCESNET
 
04 Strategie dlouhodobé ochrany.pptx
04 Strategie dlouhodobé ochrany.pptx04 Strategie dlouhodobé ochrany.pptx
04 Strategie dlouhodobé ochrany.pptxMagdalnaBohuslavov
 
Denisa Parkosová: Knowledge management a jeho vazba na rozhodovací a plánovac...
Denisa Parkosová: Knowledge management a jeho vazba na rozhodovací a plánovac...Denisa Parkosová: Knowledge management a jeho vazba na rozhodovací a plánovac...
Denisa Parkosová: Knowledge management a jeho vazba na rozhodovací a plánovac...ÚISK FF UK
 
Miroslav Bartošek - Úvod k workshopu, projekt LTP-pilot a Archivematica
Miroslav Bartošek - Úvod k workshopu, projekt LTP-pilot a ArchivematicaMiroslav Bartošek - Úvod k workshopu, projekt LTP-pilot a Archivematica
Miroslav Bartošek - Úvod k workshopu, projekt LTP-pilot a ArchivematicaLTP-portal-cz
 
Data management a jak psát data management plan
Data management a jak psát data management planData management a jak psát data management plan
Data management a jak psát data management planPetra Dedicova
 
Data management a jak psát data management plan
Data management a jak psát data management planData management a jak psát data management plan
Data management a jak psát data management planUstredni knihovna VUT
 
Blok expertů KISK: Ditigalizace, Metadata, Pojekty
Blok expertů KISK: Ditigalizace, Metadata, PojektyBlok expertů KISK: Ditigalizace, Metadata, Pojekty
Blok expertů KISK: Ditigalizace, Metadata, PojektyMoravskaZemskaKnihovna
 
DSA a jiné možnosti "self-auditu"
DSA a jiné možnosti "self-auditu"DSA a jiné možnosti "self-auditu"
DSA a jiné možnosti "self-auditu"Andrea Fojtu
 
McAfee - ochrana dat, DLP, šifrování, database security
McAfee - ochrana dat, DLP, šifrování, database securityMcAfee - ochrana dat, DLP, šifrování, database security
McAfee - ochrana dat, DLP, šifrování, database securityMarketingArrowECS_CZ
 
Digitalizace a dlouhodobá ochrana digitálních dokumentů
Digitalizace a dlouhodobá ochrana digitálních dokumentůDigitalizace a dlouhodobá ochrana digitálních dokumentů
Digitalizace a dlouhodobá ochrana digitálních dokumentůMoravskaZemskaKnihovna
 
Michal Růžička - Napojení systému Archivematica na úložiště CESNET
Michal Růžička - Napojení systému Archivematica na úložiště CESNETMichal Růžička - Napojení systému Archivematica na úložiště CESNET
Michal Růžička - Napojení systému Archivematica na úložiště CESNETLTP-portal-cz
 

Similar a LTP Pilot - Archivematica Projekt v CR (20)

05 Standardy a nástroje.pptx
05 Standardy a nástroje.pptx05 Standardy a nástroje.pptx
05 Standardy a nástroje.pptx
 
Datová úložiště CESNET
Datová úložiště CESNETDatová úložiště CESNET
Datová úložiště CESNET
 
Ndk mu
Ndk muNdk mu
Ndk mu
 
02 OAIS.pptx
02 OAIS.pptx02 OAIS.pptx
02 OAIS.pptx
 
04 Strategie dlouhodobé ochrany.pptx
04 Strategie dlouhodobé ochrany.pptx04 Strategie dlouhodobé ochrany.pptx
04 Strategie dlouhodobé ochrany.pptx
 
Denisa Parkosová: Knowledge management a jeho vazba na rozhodovací a plánovac...
Denisa Parkosová: Knowledge management a jeho vazba na rozhodovací a plánovac...Denisa Parkosová: Knowledge management a jeho vazba na rozhodovací a plánovac...
Denisa Parkosová: Knowledge management a jeho vazba na rozhodovací a plánovac...
 
02 Funkční model OAIS.pptx
02 Funkční model OAIS.pptx02 Funkční model OAIS.pptx
02 Funkční model OAIS.pptx
 
Miroslav Bartošek - Úvod k workshopu, projekt LTP-pilot a Archivematica
Miroslav Bartošek - Úvod k workshopu, projekt LTP-pilot a ArchivematicaMiroslav Bartošek - Úvod k workshopu, projekt LTP-pilot a Archivematica
Miroslav Bartošek - Úvod k workshopu, projekt LTP-pilot a Archivematica
 
06 Cvičení.pptx
06 Cvičení.pptx06 Cvičení.pptx
06 Cvičení.pptx
 
Data management a jak psát data management plan
Data management a jak psát data management planData management a jak psát data management plan
Data management a jak psát data management plan
 
Data management a jak psát data management plan
Data management a jak psát data management planData management a jak psát data management plan
Data management a jak psát data management plan
 
Blok expertů KISK: Ditigalizace, Metadata, Pojekty
Blok expertů KISK: Ditigalizace, Metadata, PojektyBlok expertů KISK: Ditigalizace, Metadata, Pojekty
Blok expertů KISK: Ditigalizace, Metadata, Pojekty
 
LTP-workshop
LTP-workshopLTP-workshop
LTP-workshop
 
DSA a jiné možnosti "self-auditu"
DSA a jiné možnosti "self-auditu"DSA a jiné možnosti "self-auditu"
DSA a jiné možnosti "self-auditu"
 
McAfee - ochrana dat, DLP, šifrování, database security
McAfee - ochrana dat, DLP, šifrování, database securityMcAfee - ochrana dat, DLP, šifrování, database security
McAfee - ochrana dat, DLP, šifrování, database security
 
TNPW2-2016-04
TNPW2-2016-04TNPW2-2016-04
TNPW2-2016-04
 
Data management
Data managementData management
Data management
 
TNPW2-2014-04
TNPW2-2014-04TNPW2-2014-04
TNPW2-2014-04
 
Digitalizace a dlouhodobá ochrana digitálních dokumentů
Digitalizace a dlouhodobá ochrana digitálních dokumentůDigitalizace a dlouhodobá ochrana digitálních dokumentů
Digitalizace a dlouhodobá ochrana digitálních dokumentů
 
Michal Růžička - Napojení systému Archivematica na úložiště CESNET
Michal Růžička - Napojení systému Archivematica na úložiště CESNETMichal Růžička - Napojení systému Archivematica na úložiště CESNET
Michal Růžička - Napojení systému Archivematica na úložiště CESNET
 

LTP Pilot - Archivematica Projekt v CR

  • 2.       Úvod - definice, cíle a terminologie „DP“ Kořeny „Digital preservation“ a první projekty Standardy, komunita, periodika, akce Současné možnosti, projekty, technologie Co si z toho vybrat? - Pragmatický přístup Důraz pro projekt LTP Pilot
  • 3.    Funkční kontext (alternativy k tomu, jak DP dělá Archivematica) Časový kontext (Co předcházelo a kam to směřuje) Projekt LTP pilot v kontextu aktivit v ČR
  • 4.       Digital preservation Long-term (digital) preservation Long-term archiving Long-term Preservation of Digital Information V češtině dlouhodobá ochrana, archivace, uchovávání, ukládání, preservace Terminologii by měl zavést český překlad norem OAIS (ISO 14721:2012) a ISO 16363:2012
  • 5. Short Definition Digital preservation combines policies, strategies and actions that ensure access to digital content over time.  Medium Definition Digital preservation combines policies, strategies and actions to ensure access to reformatted and born digital content regardless of the challenges of media failure and technological change. The goal of digital preservation is the accurate rendering of authenticated content over time.  http://www.ala.org/alcts/resources/preserv/defdigpres0408
  • 6. Long Definition Digital preservation combines policies, strategies and actions to ensure the accurate rendering of authenticated content over time, regardless of the challenges of media failure and technological change. Digital preservation applies to both born digital and reformatted content.  Digital preservation policies document an organization’s commitment to preserve digital content for future use; specify file formats to be preserved and the level of preservation to be provided; and ensure compliance with standards and best practices for responsible stewardship of digital information. Digital preservation strategies and actions address content creation, integrity and maintenance.
  • 7. Digital Preservation Refers to the series of managed activities necessary to ensure continued access to digital materials for as long as necessary http://www.dpconline.org/advice/preservationhandbook/introd uction/definitions-and-concepts
  • 8.    Technologie: HW, SW, sítě, technické dovednosti Organizace: Mandát, strategie, plány ochrany, sbírkové plány, bezpečnost Zdroje: Zaměstnanci a jejich kvalifikace, prostor, financování
  • 9. Digital curation involves maintaining, preserving and adding value to digital research data throughout its lifecycle DCC curation model a další modely, mapování na konkrétní infrastrukturu            Conceptualize Create Access and Use Appraise and Select Destroy Ingest Preservation Action Reappraise Store Access and Reuse Transform
  • 10.    HW – zastarávání SW – zastarávání a s ním spojené zastarání formátů Běžné procesy     Rizika přenosu dat Integrita dat Autenticita obsahu Mis-management, chyba
  • 11.  Pasivní DP ◦ Integrita souborů – uchování a dost ◦ zálohy ◦ Neřeší zpřístupnění v budoucnu  Aktivní DP ◦ ◦ ◦ ◦ ◦ Pasivní je jejím předpokladem Identifikace formátů Validace formátů Extrakce metadat Identifikace rizik etc.
  • 12. Technocentrický Uchování původního HW a SW Obnova médií Analytický Digitální archeologie Digitální forenzní věda Inkrementální Migrace (souborů, metadat, dat, kontextu) Emulace (SW, platformy) Trvalé digitální objekty
  • 13.   HW muzeum bohužel nestačí SW preservation: ◦ Když nelze oddělit SW od dat ◦ Pokud je SW výstupem výzkumné aktivity ◦ Pokud má SW historickou hodnotu ◦ Viz současný projekt Preserving.exe http://www.fit.vutbr.cz/FIT/museum/
  • 14.  Emulace ◦ ◦ ◦ ◦ ◦ Od začátku DP jedna z voleb IBM koncept UVC Projekt CAMiLEON Rothenberg, Jeff 1995 EU Projekt KEEP http://www.keep-project.eu/      Motivovalo Berlínské muzeum počítačových her 4 miliony euro, konec v roce 2012 Problémy s licencemi a ovladači, větší problémy právní Obtížné bez zapojení firem a uvolnění licencí starého SW Emulation framework: http://emuframework.sourceforge.net/ Avoiding Technological Quicksand: Finding a Viable Technical Foundation for Digital Preservation , Rothenberg, Jeff ISBN 1-887334-63-7, 1999
  • 15.       J.R. van der Hoeven – UVC 2009 – přednáška pro NDK v IBM.CZ Souvisí s IBM Dias a výzkumem pro KB.NL 2005 – funkční prototyp UVC pro still images Koncept popsán na http://citeseerx.ist.psu.edu/viewdoc/downlo ad?doi=10.1.1.179.494&rep=rep1&type=pdf DIAS? – KB.NL má novou verzi svého edepotu. DNB.de údajně dále DIAS používá (v kombinaci s dalšími moduly, které si sama vyvinula) – ovšem jako „věčný“ pilot
  • 16.  Migrace ◦ Dominantní paradigma v oblasti systémů typu repozitář ◦ Migrace – OAIS zná víc typů: refreshment, replication vs repackaging, transformation ◦ Nejčastěji se mluví o migraci formátů a migraci z HW na HW Všechny současné LTP systémy jsou zaměřeny na migraci jako metodu ochrany. Digital Migration is defined to be the transfer of digital information, while intending to preserve it, within the OAIS. OAIS ISO 14721:2012 str. 5-2
  • 17.   Dnes především forenzní analýza Mají obvykle jiné cíle než zachování dostupností dat ◦ Stejné nástroje a postupy pro analýzu digitálních formátů (NZME, Jhove, Unix File, file signatures) jako DP ◦ Užitečné nástroje pro zpracování velkých transferů celých disků, sítí – bitcurator etc. ◦ Nástroje pro analýzu provenience, autenticity, odhalování metadat, verzí souborů, dočasných a smazaných souborů, skrytých souborů, detekci obfuskace apod. ◦ Nástroje pro analýzu a zpracování e-mailů, analýzu chování na webu a historie http://www.forensicswiki.org/wiki/Main_Page Directory Snoop: http://www.briggsoft.com/dsnoop.htm Foremost http://foremost.sourceforge.net/ Web Historian apod.
  • 18. H.M. Gladney  2004 Řada článků a monografie  Praktické aplikace? SNIA a jejich „SIRF“ – Self-contained Information Retention Format 
  • 19. Bit level preservation – ochrana bitů (zálohování, bitová replikace, atd.) - Pasivní ochrana (TNA supports digital preservation but does not engage with the digital records directly) Information preservation – ochrana informačního obsahu (OAIS) - Aktivní ochrana (TNA - Active preservation is any proactive action taken in the preservation of digital records) Procesy Software Context (PDI) Obsah Soubory Datasety
  • 20.  Více kopií, více technologií, replikace k partnerům, udržování inventáře AIPů  Transfer dat do archivu jako kritické místo Komprese, kryptování, zálohování, fixity Převádění dat z lokace na lokaci  Projekty z poslední doby:     http://www.bitcurator.net/ BagIt, Bagger – právě pro transfer do loc.gov (využívá Archivematica)
  • 21. Situace v knihovnách (příklad – VISK): Kopie AIP v NK Kopie AIP lokálně (někdy, některé AIPy) Rozpracované AIP (bez OCR, neúplné tituly apod.) Kopie u externího dodavatele digitalizace (neoficiálně, časově omezené ◦ Kopie na off-line nosičích (CD, DVD, UDO, Disky) ◦ AIPy jsou „zmrazené“ – nejsou updatovány, vytvoření a dost ◦ ◦ ◦ ◦ Neexistuje inventář všech instancí AIPů Neexistuje poskytovatel „třetí lokace“ Řešení: Replikace/zálohování do DÚ CESNETU • Nějaká obecná dohoda mezi UKR a CESNETEM? • Manuál pro knihovny?? • Co data pro zpřístupnění????
  • 22.      OAIS: ISO 14721, Paimas: ISO 20652 Důvěryhodný dlouhodobý digitální repozitář (ISO 16363) ISO 27001, ISO 9001 Problém vyhovění OAIS (co je a co není compliant?) > selfaudit a certifikace DRAMBORA, DSA, TRAC, ISO 16363
  • 23.     Deskriptivní MD (MODS, EAD, DC, atd.) Ochranná MD (PREMIS) Technická MD (MIX, TextMD, atd.) Strukturální (METS)
  • 24. Informační model • AIP, SIP, DIP • Typy informací Standardy pro balení: METS, MPEG-21 DIDL XFDU ? Ochranná md: PREMIS (XIP, DNX,…)
  • 25.  Funkční entity: ◦ ◦ ◦ ◦ ◦ ◦ ◦ Ingest Archival storage Data Management Administration Preservation Planning Access Common Services
  • 26. Možnost rozložení odpovědnosti ◦ AIP může být pouze logický celek (jiné nakládání s MD a soubory s obsahem) ◦ OAIS také může být pouze logický celek (oddělení funkčního modulu) ◦ Outsoursování „archival storage“ funkcí, hostování celého systému – při auditu je ale třeba mít dost dokumentace od všech zúčastněných organizací a o všech systémech ◦ Část informací vyžadovaných OAIS nemusí být v archivu přímo, stačí na ně odkazovat do jiného systému (deskriptivní MD)
  • 27. Předmětem ochrany je:  Informační obsah (data z měření, skenovaná data)  Další informace nutná k porozumění, použití a uchování informačního obsahu ◦ Informace o způsobu vytvoření ◦ Informace o nastavení zařízení, osobách, předlohách, ◦ Informace o zpracování dat (kódování, komprese, způsob zpracování vědeckých dat, filtrování, převážení atd.) ◦ kompletní informace o procesu, ve kterém data vznikla ◦ Informace o procesech a sw ◦ Interpretace, OCR, překlad…. Rozsah dalších informací, které je nutné uchovat, závisí na znalostech/možnostech uživatelů a jejich technických možnostech – a v čase se mění…
  • 28.  Maximální přístup: ◦ http://www.jisc.ac.uk/uploaded_documents/oaismets.p df ◦ TRAC, ISO 16363, NESTOR KK ◦ Převod OAIS na funkční požadavky ◦ Jak informační model tak funkce ◦ Snaha o maximální automatizaci procesů správy dat ◦ Reorganizace procesů instituce  Minimální přístup ◦ Naplnit 6 OAIS „mandatory requirements“ ◦ Informační model a funkce v podstatě formálně ◦ Omezené možnosti automatizace procesů správy dat
  • 29. 3.1 Závazné povinnosti OAIS (podle překladu NK 2014)       Vyjednávat s producenty informací a přijímat od nich příslušné informace. Získat dostatečná práva k nakládání s poskytnutými informacemi tak, aby bylo možné zajistit dlouhodobé uchování. Určovat (ať již samostatně nebo ve spolupráci s ostatními stranami), které komunity by se měly stát cílovými komunitami, a tudíž by měly být schopny porozumět poskytovaným informacím. Tím je definována znalostní základna dané komunity, Zajišťovat, aby informace určené k uchovávání byly pro cílovou komunitu nezávisle srozumitelné. Cílová komunita by měla být schopna informacím porozumět bez potřeby využití speciálních zdrojů , například bez rady expertů, kteří informace vytvořili. Dodržovat dokumentovaná pravidla a postupy, které zajistí, že informace budou chráněny před všemi reálně myslitelnými nepředvídatelnými událostmi (včetně zániku archivu), a zajistit, že informace nebudou nikdy smazány (s výjimkou případu, kdy jejich smazání bude součástí schválené strategie). Nemělo by docházet k žádnému jednorázovému smazávání dat. Zpřístupňovat uchovávané informace cílové komunitě a umožnit distribuci informací v podobě kopií původních dodaných datových objektů s dokumentací podporující jejich autenticitu nebo v takové podobě, aby bylo možné zjistit, ke kterým původním dodaným datovým objektům se vztahují.
  • 30.     Udržení dlouhodobé srozumitelnosti, použitelnosti informace bude vyžadovat změny! Informace musí zůstat srozumitelná, autentická a musí mít prokazatelný původ tj. Cílem je ochrana informace, nikoli konkrétního bitstreamu Interní datový model a způsob fungování archivu musí umožnit záznam změn dat i metadat
  • 31. Mapování DP problematiky na risk management přístupy  Risk Management – Principles and GuideIines: ISO 31000  Information Assurance Maturity Model IAMM Identifikace oblastí, typů rizik, dopadů rizik,… Nástroje:  DRAMBORA (The Digital Repository Audit Method Based On Risk Assessment)  TIMBUS project: ERM (Enterprise Risk Management) nástroje rozšířeny do oblasti DP  TRAC
  • 32.
  • 33.       POWRR (Preserving digital Object with Restricted Resources) http://digitalpowrr.niu.edu/digital-preservation-101/ Digital Preservation Handbook http://www.dpconline.org/advice/preservationhandbook Digital preservation management tutorial http://www.dpworkshop.org/dpm-eng/eng_index.html ROSENTHAL, Colin a kol. Průvodce plánem důvěryhodného digitálního repozitáře (PLATTER). 1. vyd. Praha: Národní knihovna České republiky, 2009. 51 s. ISBN 978-80-7050-569-4. Online zde: http://www.ndk.cz/platter-cz CUBR, Ladislav. Dlouhodobá ochrana digitálních dokumentů. 1. vyd. Praha : Národní knihovna České republiky, 2010. 154 s. ISBN 978-807050-588-5. BROWN, Adrian. Strategie digitálního archivování. Praha : Odbor archivní správy MV ČR v Tiskárně Ministerstva vnitra, 2003. 64 s. ; 24 cm. (Překlad a předmluva Wanner, Macek)
  • 34.       Ca. od roku 1960 data centra Ca. od 1990 - digital preservation jako reformátování do digitální podoby 1994-1996: CPA/RLG Task Force on Archiving of Digital Information 2000 – NDIIPP (National Digital Information Infrastructure and Preservation Program) 1995 – první verze OAIS 2002 – ISO 14721:2003
  • 35. NDIIPP – 150 milionů USD (soukromé a veřejné finance)  Loc.gov, NARA, NLM, NAL, RLG, CLIR a další nefederální  2010 National Digital Stewardship Alliance (NDSA) – další růst komunity  300 projektů, NDIIPP spolufinancoval vývoj desítek konkrétní nástrojů  Nastartoval DP aktivity v archivech, muzeích, státní správě po celých Spojených státech  Podrobný přehled činnosti (do roku 2012) http://www.digitalpreservation.gov/multimedia/documents/ndiipp-statesreport032612_final.pdf RLG 1998: Digital Preservation Needs and Requirements in RLG MemberInstitutions: http://www.webjunction.org/content/dam/research/activities/digpresneed s/digpres.pdf IMAP 2001: http://www.imappreserve.org/
  • 36. NL Austrálie:    1996: Web PANDORA (Preserving and Accessing Networked Documentary Resources of Australia) 1997: Statement of Principles for the Preservation of and Long-Term Access to Australian Digital Objects 1998: Preserving Access to Digital Information (PADI) Další projekty do roku 2000:  TNA UK (1998 – Preservation policy)  BL – 1998 - Výzkumný projekt na téma náklady na DP (http://www.ukoln.ac.uk/services/elib/papers/tavistock/hen dley/hendley.html)  http://www.interpares.org/ (archivy)  NESTOR  E-depot KB NL – OAIS LTP DIAS od 2003 (vývoj od 1999)  UNESCO 2003 Charter on the Preservation of Digital Heritage Hedstrom, Margaret; (1997). "Digital Preservation: A Time Bomb for Digital Libraries." Computers and the Humanities 31 (3): 189-202. <http://hdl.handle.net/2027.42/42573>
  • 37. Projekty finacované EU v posledních 15 letech  http://www.erpanet.org  http://www.delos.info  Minerva (digitalizace)  CASPAR, PLANETS, WEPRESERVE, DPE  WF4Ever, TIMBUS, SHAMAN, SCAPE, PROTAGE, PrestoPRIME, KEEP, LiWA, ENSURE, BlogForever, ARCOMEN, APARSEN etc etc  Role DPE v ČR byla velmi významná
  • 39.    4C project http://www.4cproject.eu/ Life I-III starší aktivity BL, Dánské NK, NA.NL http://www.nationaalarchief.nl/sites/default/ files/docs/kennisbank/codpv1.pdf
  • 40. Jak přesvědčit stakeholdery, že to má smysl?  Advokacie jako součást řízení DP projektů Trvalá ochrana = trvalé financování  Paradoxy financování LTP projektů:  ◦ ◦ ◦ ◦ Velké finance na krátkou dobu Problematická udržitelnost infrastruktury Příklad cda.kultury.sk Nepochopení nutnosti ochrany na manažerské úrovni
  • 41. Rozdílné chápání konceptu důvěryhodnosti (Viz konference CNZ 2013 – střed dvou světů) TRAC: “A trusted digital repository is one whose mission is to provide reliable, long-term access to managed digital resources to its designated community, now and in the future“ vs „bezpečný identifikátor“, časová razítka, elektronické podpisy a certifikáty, SSL  K prokázání autenticity nejsou v paměťových institucích nutné elekt. podpisy, postačí i metadata (eventy)
  • 42. Tyllor and Cox v ČR - Certifikace „SW“ podle ISO 16363:2012??? IBM Filenet, Datera… ◦ http://www.cnz.cz/ke-stazeni/2013/konference2013/CNZ%202013-IBM%20prezentace.pdf EasyPLM – TD-IS s.r.o. ◦ http://www.td-is.cz/doc/certification/tdis_certificate_iso16363-12.pdf ISO 16363:2012: „An archive that conforms to this Recommended Practice shall have satisfied the auditor on each of the requirements.“
  • 43.    Základní certifikace (Basic certification) – Data Seal of Approval (DSA). Rozšířená certifikace (Extended certification) - Základní certifikace + , externě posouzený a strukturovaný veřejně dostupný selfaudit podle ISO 16363 nebo DIN 31644. Formální certifikace (Formal certification) –plně externí, nezávislý audit a certifikaci dle ISO 16363 nebo DIN 31644.
  • 44. Veřejně dostupná dokumentace k certifikace podle TRAC  HathiTrust  Portico  Chronopolis  Scholars Portal  CDA kultury DSA: 23 institucí http://datasealofapproval.org/en/assessment/ Nestror seal http://files.dnb.de/nestor/materialien/nestor_mat_17_eng.pdf
  • 45. Australský NA (Digital Preservation Software Platform) http://www.aa.gov.au/collection/preserving/digitalrecords/index.aspx Manifest Maker  supports the transfer of digital records from agencies to the National Archives. It produces a list of all digital records being transferred, their checksum, and the relationship between the digital records and their related item numbers in RecordSearch, our archive management system Xena  (XML Electronic Normalising for Archives) – determines the file format of a digital record and converts it to an appropriate preservation file format based on open standards. Xena can also be used to view and/or export Xena files Digital Preservation Recorder  (DPR) – manages the digital preservation workflow, recording audit information about each transfer in to the digital archive. DPR uses Xena to perform digital record conversions Checksum Checker  monitors the contents of the National Archives' digital archive for data loss or corruption.
  • 46.  DNB.de ◦ ◦ ◦ ◦        velmi záhy DIAS, pak „přešlapuje“ NESTOR, řada EU projektů Kolibri http://kopal.langzeitarchivierung.de/index_koLibRI DP4LIB http://dp4lib.langzeitarchivierung.de/ KB NL – Dias 2003, nový LTP 2012 – centrum výzkumu BL ◦ Aktivní v řadě EU projektů (SCAPE, APARSEN, SPRUCE, LIFE, PLANETS, preserv.) ◦ Národní britské aktivity (DCC, DPC, v rámci JISC) NL NZ – Rosetta (Kronos) – 2008 1. verze Norská NK (masová digitalizace) Dánská NK (archivace broadcastingu atd.) BNF.fr (SPAR – Fedora Commons + iRods + Athos Origin) Německé knihovny (SLUB, TIB, ETH, BSB) Rosetta
  • 47. Open Planets Foundation http://www.openplanetsfoundation.org/  Planets suite ◦ Preservation Planning Tool, Plato (http://www.ifs.tuwien.ac.at/dp/plato/intro.html ) ◦ Planets Testbed ◦ Interoperability Framework
  • 48. SCAPE ◦ Repository API  Report API  Management API  Data connector API (search, access, modify files)  Platform ◦ Preservation WATCH  Scout ◦ PLATO – preservation planning  Definovat požadavky, zhodnotit alternativy a výsledky, definovat preservation plan
  • 50. SNIA – SIRF: Selfcontained Information Retention Format ◦Logical container of „storage container“ ◦Logical and physical storage considered as a unit CDMI – ◦ standard interoperabílniho formátu pro přesun dat a metadat mezi poskytovateli cloudu SIRF obsahuje: •Magic object – identifikace a verzovani •Preservation objects (to co se nemění a je předmětem ochrany) •Catalog (průběžně se upravují, obsahuje metadata, která mají zajistit budoucí přenositelnost preservation objects bez potřeby vnějších funkcí)
  • 51.  Archivace průmyslových informací (Product and Manufacturing Information (PMI) Working Group) ◦ http://www.lotar-international.org/ ◦ ISO 10303 (automotive, 3d modeling, CAD)  Archivace DICOM/PACs z oblasti medical imagining  Právní data, geologická data, nuclear waste
  • 52.     iPres (2004-), Archiving, ANADP, PASIG (http://www.preservationandarchivingsig.org) APA, Personal digital archiving, akce IIPC Časopisy (IJDC, d-lib, Code4lib, Ariadne…) Školení ◦ http://www.dptp.org/ ◦ TIMBUS Digital Preservation Advanced Practitioner Training
  • 53.  Formátové knihovny (PRONOM, UDFR, Loc.gov) Seznamy nástrojů  Příklady policies atd.  ◦ Library of Congress http://www.loc.gov/standards/mets/metstools.html http://www.loc.gov/standards/premis/tools.html Orbeon: http://www.orbeon.com/ OPF Knowledge Base:http://wiki.opf-labs.org/display/KB/Home OPF Tools registry: http://wiki.opflabs.org/display/TR/Digital+Preservation+Tool+Registry Presto Prime, Tools: https://prestocentre.org/library/tools Library of Congress Tool Registry: http://www.digitalpreservation.gov/tools/ FileFormat.Info Registry: http://www.fileformat.info/index.htm COPTR: http://coptr.digipres.org/Main_Page DCH-RP project registry (planned) - see report pages 3042 http://www.dch-rp.eu/getFile.php?id=166
  • 54. „Digitální dokumenty je na rozdíl od mikrofilmu, mnohem obtížnější uchovat ve zpřístupnitelné podobě v dlouhodobé časové perspektivě, což je dáno vývojem v oblasti výpočetní techniky a … inovačními cykly přinášejícími zásadní změny v technické podpoře platforem, formátů…“ POLIŠENSKÝ, Jiří. 2002. Konsorcium pro zpřístupňování a archivaci dokumentů pro výzkum a vývoj v České republice. In: CASLIN 2002. Ochrana a sprístupňovanie dokumentov: nové trendy: Zborník z konferencie, konanej 23.- 27. júna 2000 v Pribyline. Martin: Slovenská národná knižnica, 2002, s. 57-63. VISK – Mikrofilmování do roku 2012 - Data archivuje NK – do roku 2012 Jan Hutař, Marek Melichar: České paměřové instituce a digitální data - historický exkurz, současný stav a předpokládaný vývoj
  • 56. Nové role vědeckých knihoven 2011: REPORT ON INTEGRATION OF DATA AND PUBLICATIONS (KB.NL, BL, DNB, LIBER, STM Publishers) http://www.alliancepermanentaccess.org/wpcontent/uploads/downloads/2011/11/ODEReportOnIntegrationOfDataAndPublications-1_1.pdf  2013: LERU Roadmap for science data http://www.leru.org/files/publications/AP14_LERU_Roadmap_for_Research_data_fina l.pdf  Horizon 2020 – větší zapojení vědeckých knihoven do výzkumné infrastruktury, posílení dostupnosti dat paměťových institucí http://ec.europa.eu/research/horizon2020/pdf/proposals/com%282011%29_811_fi nal.pdf http://ec.europa.eu/dgs/connect/en/content/mission-and-priorities http://ec.europa.eu/dgs/connect/en/content/online-accessibility-and-digitalpreservation-europes-cultural-heritage 
  • 57.        Availability Findability Interpretability Re-usability Citability Curation Preservation ODE REPORT ON INTEGRATION OF DATA AND PUBLICATIONS http://www.alliancepermanentaccess.org/wp-content/uploads/downloads/2011/11/ODEReportOnIntegrationOfDataAndPublications-1_1.pdf
  • 58.    Small sciences vs Big sciences Liší se v typech dat, způsobech zpracování dat, rychlosti publikačního cyklu, rychlosti citování atd. Big sciences – APARSEN, společně s EUDAT, SCIDIP-ES, DPHEP
  • 59. Data z online vzdělávacích systémů – trendy:        3D Printing MOOCs Big Data Digital Textbooks Gamification The Flipped Classroom Mobile Learning ◦ Co z toho archivovat?
  • 60.  Galleries, Libraries, Archives, Muzeums ◦ ◦ ◦ ◦ Větší integrace knihoven do heritages Jednotné systémy pro správu metadat a autorit Co všechno ještě bude v knihovním katalogu? Co všechno bude muset ještě knihovna archivovat? Příklad využítí Archivematiky v muzeu v Berlíně: urn:nbn:de:0297-zib-43020
  • 61.    Řeší tu jednodušší třetinu (technologie) – nikoli organizaci a zdroje! „Důvěryhodná“ ve smyslu ISO norem nemůže být žádná demo instalace – důvěryhodnost se posuzuje v kontextu konkrétní organizace Normy připouští outrsourcování části činnosti jiné organizaci (CESNET jako poskytovatel OAIS funkcí „archival storage“ musí poskytnout dokumentaci)
  • 62.   Nezapomenout na potřebu bit replikace Význam projektu pro MUNI – další krok by mělo být větší zapojení knihovny do archivace vědeckých dat (využít eu programů?)
  • 63. Nezapomenout na řízení a strategické dokumenty - instituce, která není strategicky řízená nemůže provozovat LTP systém V našich podmínkách se obvykle velmi podceňuje plánování - Instituce nemají: - - Mission statement Plány rozvoje Plány financování Plán řízení lidských zdrojů Ani collection plan apod.