SlideShare una empresa de Scribd logo
1 de 43
Descargar para leer sin conexión
Metadata a metadatové
standardy užívané v knihovnách

Pavla Švástová
Moravská zemská knihovna

9.12.2010 Univerzita Pardubice
Obsah

1. Metadata a metadatová schémata –
   teorie
2. Knihovnické metadatové standardy
3. Výroba metadat v praxi
4. Digitální knihovny
5. Využití v praxi – zajímavé projekty
Metadata


 ⁄ data o datech ???
     – tuto definici lze použít v případě, že chcete člověka
       ještě více zmást :)
     – vyjadřuje teoretickou podstatu, ALE:
     – nepomůže pochopit, co to vlastně metadata jsou a k
       čemu slouží
     – jak se liší data a metadata?




 Moravská zemská knihovna
Moravská zemská knihovna
Moravská zemská knihovna
Moravská zemská knihovna
Moravská zemská knihovna
Metadata

⁄ „metadata is constructed, constructive and
  actionable“ (Understanding the Semantic Web: Bibliographic Data
  and Metadata, Karen Coyle
  http://alatechsource.metapress.com/content/p3022442071g7655)

⁄ Constructed – metadata jsou uměle vytvořená,
  nenacházejí se v přírodě, jsou nadstavbou nad
  něčím jiným, lidskou invencí
⁄ Constructive – metadata jsou vytvářena cíleně,
  aby vyřešila nějaký problém
⁄ Actionable – cílem metadat je, aby byla
  smysluplně využita
  Moravská zemská knihovna
Rozdělení metadat

⁄ aspekty metadat:
   – sémantika – co chceme popsat
   – syntaxe – jak to chceme zapsat
   – struktura – jak vyjádřit případné vztahy
⁄ typ metadat:
   –   popisná (deskriptivní, bibliografická)
   –   strukturální
   –   technická
   –   administrativní
⁄ další možná třídění:
   – jednoduchá x složitá
 Moravská zemská knihovna
Knihovní metadata

⁄ knihovnictví je od počátků založeno na vytváření
  a využívání metadat
⁄ knihovní metadata řeší problém, jak se vyznat v
  rozsáhlejších sbírkách dat
      – přírůstkové katalogy – seznam majetku knihovny
      – lískové katalogy (rozdělení dle autorů, názvů, témat,
        jazyků...)
⁄ vznik schémat – jak popsat knihu? co zažívá
  knihovník při popisu knížky?
⁄    http://aleph.mzk.cz:80/F?func=direct&doc_number=000059616&local_base=MZK01&format=999



     Moravská zemská knihovna
Metadatové schéma

⁄ soubor prvků určitého formátu, díky němuž lze
  metadata zaznamenat a vytvořit jejich strukturu
⁄ důležité je využívat mezinárodní standardy pro
  vyjádření a výměnu a vytvořit metadatové
  schéma tak, aby bylo využitelné pokud možno
  jednoznačně
⁄ v syntaxi dnes jednoznačně vede XML
   – specifikace formátu
   – DTD
   – jmenné tagy

 Moravská zemská knihovna
Knihovní metadata - vývoj

⁄ původně vznikaly fyzicky vyjádřená metadata o
  fyzických dokumentech (kniha byla
  zkatalogizována a její metadata zapsána na
  katalogizační lístek)
⁄ nástup počítačového zápisu a zpracování
  fyzických knihovních jednotek – MARC
⁄ zdigitalizované dokumenty a born digital
  dokumenty – nové potřeby možností popisu –
  DC, MODS, METS


  Moravská zemská knihovna
Popisná metadata

⁄ popisná = bibliografická = deskriptivní = ta
  klasická, co se využívají odjakživa pro popis
  fyzických dokumentů uložených v knihovně
⁄ popis dokumentů:
   – jmenný popis – autor, název, rok vydaní, nakladatel, ...
   – věcný popis – pokus o popis obsahu či tématu dokumentu
     – určuje, kam je potom kniha v knihovně zařazena
     (předmětová hesla, MDT, klíčová slova, atd.)
⁄ rozdíly mezi popisem fyzických a digitálních
  dokumentů nejsou tak dramatické

 Moravská zemská knihovna
Katalogizační lístek




⁄ i ten je standardizovaný! (http://www.knihomol.wz.cz/listek.php)
⁄ projekty na retrokonverzi knihovních lístků - Retrokon
 Moravská zemská knihovna
MARC

⁄ http://www.loc.gov/marc/
⁄ Machine Readable Cataloguing – strojově čitelný –
  umožňuje strojové zpracování a výměnu
⁄ je vyvíjen jako standard pro výměnu katalogizačních
  záznamů od poloviny 60.let Kongresovou
  knihovnou, další rozšíření nastalo v 70. letech
⁄ vzniklo mnoho tzv. národních formátů se základem
  MARC, později byl vytvořen mezinárodní formát
  MARC 21 (v ČR přechod z UNIMARC v roce 2004)
  (http://www.ikaros.cz/node/1761)



    Moravská zemská knihovna
MARC 21 - struktura

                            ⁄ základem zápisu
                              jsou tři prvky:
                              – struktura záznamu
                              – označení obsahu –
                                třímístné číselné kódy
                                a jejich podpole
                              – obsah záznamu
                                (definován dalšími
                                standardy – ISBD,
                                AACR2)



 Moravská zemská knihovna
MARCXML

⁄ MARC 21 ve formátu XML
⁄ popisná metadata v digitálních knihovnách jsou
  uchovávána ve formátu XML
⁄ potřebný při konverzích mezi schématy




  Moravská zemská knihovna
MARCXML




 Moravská zemská knihovna
MARC 21 – výhody, nevýhody

⁄ výhodou a zároveň nevýhodou je jeho rozsáhlost a
  náročnost – na jednu stranu je možné popsat dokument do
  nejmenšího detailu, nevýhodou je náročnost na zaškolení
  katalogizátorů
⁄ pro digitální objekty nebyl původně zamýšlen, takže není
  úplně vhodný
⁄ přechod na MARC ve formátu XML – umožňuje výměnu i
  jinými cestami, než jen přes knihovnický protokol Z39.50,
  např. OAI PMH
⁄ prakticky: pokud digitalizujeme objekt, který je již v
  knihovním katalogu popsán ve formátu MARC 21
  konvertujeme jej do MODS a dogenerujeme další potřebné
  prvky
  Moravská zemská knihovna
Dublin Core (DC)

⁄ formát vznikl v roce 1995 z požadavků na minimální
  univerzální popis dokumentu
⁄ požadavky:
  –   dostatečná jednoduchost
  –   zároveň dostatečný rozsah, schopnost popsat zdroj detailně
  –   možnost popisu prakticky jakéhokoliv zdroje
  –   interoperabilita mezi dalšími formáty
⁄ vznikl standard, který tvoří 15 základních metadat prvků
⁄ rozšíření je možné na tzv. kvalifikovaný Dublin Core –
  základem je DC, rozšíření záleží na tvůrci standardu
⁄ http://dublincore.org/
⁄ http://www.ics.muni.cz/dublin_core/
 Moravská zemská knihovna
Dublin Core - prvky

⁄ Obsah:                ⁄ Intelektuální vlastnictví:   ⁄ Zdroj:
⁄    Název              ⁄   Tvůrce                     ⁄   Datum
⁄    Předmět a klíčová ⁄    Vydavatel                  ⁄   Formát
     slova             ⁄    Přispěvatel                ⁄   Identifikátor
⁄    Popis             ⁄    Autorská práva             ⁄   Jazyk
⁄    Typ zdroje
⁄    Zdroj
⁄    Vztah
⁄    Pokrytí

     http://www.webarchiv.cz/generator/dc_generator.php

     Moravská zemská knihovna
ESE

⁄ Europeana Semantic Elements
⁄    http://www.google.cz/url?sa=t&source=web&cd=1&sqi=2&ved=0CBoQFjAA&url=h

⁄ metadatové schéma založené na Dublin Core
  pro publikování v evropské digitální knihovně
  Europeana http://www.europeana.eu/portal/
⁄ standard obsahuje oproti DC několik prvků
  navíc (např. odkaz na jeden nebo několik
  náhledů na digitalizovaný dokument)



    Moravská zemská knihovna
Metadata Object Description Schema
(MODS)
⁄ schéma bylo představeno v roce 2002 jako
  kompromis mezi složitým popisem v MARC a
  nedostatečným popisem v DC
⁄ důraz na popis digitálních zdrojů, ale lze jím
  popsat prakticky jakýkoliv dokument
⁄ XML – eXtensible Markup Language
  http://www.w3.org/XML/, http://www.w3schools.com/xml/default.asp
⁄ interoperabilita s dalšími schématy
⁄ využití v digitálních knihovnách
⁄ http://www.loc.gov/standards/mods/
 Moravská zemská knihovna
MODS - struktura




 Moravská zemská knihovna
TEI – Text Encoding Iniciative

⁄ TEI je konsorcium, které vyvíjí standardy pro
  reprezentaci textů v digitální podobě
⁄ http://www.tei-c.org/index.xml
⁄ využívá se pro podrobný popis rukopisů, včetně
  přepisu plných textů
⁄ specifikace, která je využívána pro popis
  rukopisů nejen bibliografický popis, obsahuje
  též popis struktury a počítá s problematikou
⁄ TEI P5, MASTER
⁄ Manuscritorium - http://www.manuscriptorium.com/
 Moravská zemská knihovna
VRA CORE

⁄ http://www.loc.gov/standards/vracore/
⁄ standard pro popis uměleckých předmětů,
  uměleckých objektů a audiovizuálních
  dokumentů (včetně architektonických staveb,
  soch a dalších 3D předmětů, obrazů, fotografií,
  filmů, atd.)
⁄    http://www.archivision.com/outgoing/vracore4/examplesindex.html




    Moravská zemská knihovna
Technická metadata


 ⁄ týkají se spíše digitalizovaných / digitálních
   dokumentů
 ⁄ informace např. o:
     – použitých softwarových nástrojích a jejich verzích
       (není .doc jako .doc)
     – hardwarových nástrojích (typ skeneru)
     – obrazových souborech (formát a jeho specifikace,
       rozlišení, velikost obrázku, barevnost...)
     – kódování
     – kompatibilitě

 Moravská zemská knihovna
MIX

⁄ informace o obrazových souborech




  Moravská zemská knihovna
ALTO

⁄ http://www.loc.gov/standards/alto/
⁄ standard pro ukládání informací o vzhledu a
  obsahu digitalizovaného dokumentu ve formátu
  XML
⁄ „nadstavba“ nad OCR, které v tomto případě
  není pouze .txt
⁄ určuje pozici slov, řádků i odstavců na stránce s
  přesností na desetinu milimetru
⁄ zaznamenává typ a velikost písma

 Moravská zemská knihovna
ALTO - příklad




 Moravská zemská knihovna
ALTO - použití

⁄ možnost vygenerování obrázku pouze z xml
  souboru (záleží na kvalitě OCR, jak to bude
  potom čitelné :)
⁄ rozdělení na články
⁄ odlišení obrázků, textu a bílého místa na
  stránce
⁄ opravy OCR - http://trove.nla.gov.au/newspaper
⁄ projekt Impact
⁄ další?

 Moravská zemská knihovna
Administrativní a autorsko-právní
metadata

⁄ autorsko-právní otázky – kdo vlastní práva k
  dokumentu, kdy bude volně přístupný, za jakých
  podmínek apod.
⁄ prezervační funkce
⁄ co se s dokumentem děje za celou jeho kariéru
  od vzniku až po zpřístupnění – konverze do
  nových verzí či jiných formátů




 Moravská zemská knihovna
PREMIS – The Preservation Metadata
Implementation Strategies

 ⁄ http://www.loc.gov/standards/premis/
 ⁄ formát vznikl za účelem ochrany a
   dlouhodobého uchování dokumentů




 Moravská zemská knihovna
PREMIS - struktura

⁄    http://www.rinascimento-digitale.it/eventi/premis/premis-tutorial/Premis-pt1.
⁄ intelektuální entita (kniha, fotka, webová stránka,
  mapa, databáze...)
⁄ objekt (kapitola knihy v pdf, fotka v tiff, html
  soubor...)
⁄ událost (validace souboru, transformace,
  konverze, migrace...)
⁄ agent (autor, instituce, program...)
⁄ autorská práva (copyright, licence, další...)

     Moravská zemská knihovna
PREMIS




 Moravská zemská knihovna
Strukturální metadata


 ⁄ digitální objekty tvoří souhrn dat a metadat,
   které je potřeba logicky provázat
 ⁄ př. naskenovanou a metadaty opatřenou
   knihu tvoří:
     – soubor obrázků v různé kvalitě a různých formátech
     – xml soubor bibliografických metadat ve formátu MODS
     – xml soubor technických metadat ve formátu MIX
     – xml soubor administrativních metadat ve formátu
       PREMIS
     – xml soubor OCR ve formátu ALTO

 Moravská zemská knihovna
DTD pro periodika a monografie


 ⁄ starší český formát metadat pro zpřístupnění v digitální
   knihovně Kramerius (např. http://kramerius.mzk.cz)
 ⁄ umožňuje popsat v podstatě jen monografii a periodikum
   – vytvořen účelově
 ⁄ obsahuje všechny typy metadat – popisná, strukturální i
   elementární technická a administrativní – jeden soubor
   ve formátu XML
 ⁄ dodnes se používá, ale v současnosti probíhá v NK a
   MZK konverze do formátů využívaných v nové verzi
   Krameria 4 (http://krameriusdemo.mzk.cz)


 Moravská zemská knihovna
METS – Metadata Encoding and
Transmission Standard

⁄ http://www.loc.gov/standards/mets/
⁄ kontejnerový formát pro uchování a výměnu
  metadat v digitálních knihovnách založený na
  XML
⁄ určuje strukturu dokumentu
⁄ provazuje všechny typy metadat v jeden
  složený objekt



 Moravská zemská knihovna
METS - struktura

⁄ může obsahovat 5 sekcí:
   –   metsHdr - hlavička
   –   dmdSec - popisná metadata
   –   admSec - administrativní metadata
   –   fileSec – objekty, soubory
   –   structMap – strukturální mapa
   –   behaviourSec – chování dle obsahu
⁄ nemusí být použity všechny sekce
⁄ každá sekce může obsahovat další typy
  metadat nebo na ně odkazovat

 Moravská zemská knihovna
Výroba metadat – metadatové editory


 ⁄ většina metadat je generovaná automaticky –
   software je vyrábí automaticky dle nastavení v
   požadovaném formátu
 ⁄ některá je třeba ručně dodělat – popřípadě
   opravit špatně vygenerovaná, zkonvertovaná
   apod.
 ⁄ https://meditor.mzk.cz/



 Moravská zemská knihovna
Digitální knihovna


  ⁄ úložiště digitálních dokumentů
  ⁄ potřebuje pro svůj provoz všechny výše
    zmíněné typy metadat
  ⁄ umožňuje vyhledávání a prohlížení
    dokumentů
  ⁄ umožňuje správu dokumentů




 Moravská zemská knihovna
Příklady využití metadatových formátů
v digitálních knihovnách

  ⁄   http://krameriusdemo.mzk.cz
  ⁄   http://trove.nla.gov.au/newspaper
  ⁄   http://www.georeferencer.org/maps/domain/images
  ⁄   http://www.registrdigitalizace.cz
  ⁄   http://kramerius.mzk.cz
  ⁄   ...




 Moravská zemská knihovna
Děkuji za pozornost



Pavla Švástová
pavla.svastova@gmail.com


Moravská zemská knihovna v Brně
www.mzk.cz

Más contenido relacionado

La actualidad más candente

الإستفادة من تقنيات الذكاء الاصطناعي في تطوير أساليب البحث واسترجاع المعلومات...
الإستفادة من تقنيات الذكاء الاصطناعي في تطوير أساليب البحث واسترجاع المعلومات...الإستفادة من تقنيات الذكاء الاصطناعي في تطوير أساليب البحث واسترجاع المعلومات...
الإستفادة من تقنيات الذكاء الاصطناعي في تطوير أساليب البحث واسترجاع المعلومات...Dr.Kareman Baknam Sedki
 
[DL輪読会]Deep Learning for Sampling from Arbitrary Probability Distributions
[DL輪読会]Deep Learning for Sampling from Arbitrary Probability Distributions[DL輪読会]Deep Learning for Sampling from Arbitrary Probability Distributions
[DL輪読会]Deep Learning for Sampling from Arbitrary Probability DistributionsDeep Learning JP
 
Arithmetic coding
Arithmetic codingArithmetic coding
Arithmetic codingVikas Goyal
 
StanとRでベイズ統計モデリング読書会 導入編(1章~3章)
StanとRでベイズ統計モデリング読書会 導入編(1章~3章)StanとRでベイズ統計モデリング読書会 導入編(1章~3章)
StanとRでベイズ統計モデリング読書会 導入編(1章~3章)Hiroshi Shimizu
 
Informacni veda: Pocitace
Informacni veda: PocitaceInformacni veda: Pocitace
Informacni veda: PocitaceJosef Šlerka
 
Digital humanities a změna paradigmatu
Digital humanities a změna paradigmatuDigital humanities a změna paradigmatu
Digital humanities a změna paradigmatuJosef Šlerka
 
PRML復々習レーン#2 2.3.6 - 2.3.7
PRML復々習レーン#2 2.3.6 - 2.3.7PRML復々習レーン#2 2.3.6 - 2.3.7
PRML復々習レーン#2 2.3.6 - 2.3.7sleepy_yoshi
 
Greed is Good: 劣モジュラ関数最大化とその発展
Greed is Good: 劣モジュラ関数最大化とその発展Greed is Good: 劣モジュラ関数最大化とその発展
Greed is Good: 劣モジュラ関数最大化とその発展Yuichi Yoshida
 
機械学習研究の現状とこれから
機械学習研究の現状とこれから機械学習研究の現状とこれから
機械学習研究の現状とこれからMLSE
 
مقدمة عن الفيجوال بيسك 9-2019
مقدمة عن الفيجوال بيسك  9-2019مقدمة عن الفيجوال بيسك  9-2019
مقدمة عن الفيجوال بيسك 9-2019Amr Rashed
 
カーネル法:正定値カーネルの理論
カーネル法:正定値カーネルの理論カーネル法:正定値カーネルの理論
カーネル法:正定値カーネルの理論Daiki Tanaka
 
ベイズ機械学習(an introduction to bayesian machine learning)
ベイズ機械学習(an introduction to bayesian machine learning)ベイズ機械学習(an introduction to bayesian machine learning)
ベイズ機械学習(an introduction to bayesian machine learning)医療IT数学同好会 T/T
 
確率的バンディット問題
確率的バンディット問題確率的バンディット問題
確率的バンディット問題jkomiyama
 
Representing and comparing probabilities
Representing and comparing probabilitiesRepresenting and comparing probabilities
Representing and comparing probabilitiesMLReview
 
Fuzzy relations
Fuzzy relationsFuzzy relations
Fuzzy relationsnaugariya
 
PRML 2.3.2-2.3.4 ガウス分布
PRML 2.3.2-2.3.4 ガウス分布PRML 2.3.2-2.3.4 ガウス分布
PRML 2.3.2-2.3.4 ガウス分布Akihiro Nitta
 
Znaky, znaky, modely
Znaky, znaky, modelyZnaky, znaky, modely
Znaky, znaky, modelyJosef Šlerka
 

La actualidad más candente (20)

الإستفادة من تقنيات الذكاء الاصطناعي في تطوير أساليب البحث واسترجاع المعلومات...
الإستفادة من تقنيات الذكاء الاصطناعي في تطوير أساليب البحث واسترجاع المعلومات...الإستفادة من تقنيات الذكاء الاصطناعي في تطوير أساليب البحث واسترجاع المعلومات...
الإستفادة من تقنيات الذكاء الاصطناعي في تطوير أساليب البحث واسترجاع المعلومات...
 
Informační etika
Informační etikaInformační etika
Informační etika
 
[DL輪読会]Deep Learning for Sampling from Arbitrary Probability Distributions
[DL輪読会]Deep Learning for Sampling from Arbitrary Probability Distributions[DL輪読会]Deep Learning for Sampling from Arbitrary Probability Distributions
[DL輪読会]Deep Learning for Sampling from Arbitrary Probability Distributions
 
Arithmetic coding
Arithmetic codingArithmetic coding
Arithmetic coding
 
StanとRでベイズ統計モデリング読書会 導入編(1章~3章)
StanとRでベイズ統計モデリング読書会 導入編(1章~3章)StanとRでベイズ統計モデリング読書会 導入編(1章~3章)
StanとRでベイズ統計モデリング読書会 導入編(1章~3章)
 
Informacni veda: Pocitace
Informacni veda: PocitaceInformacni veda: Pocitace
Informacni veda: Pocitace
 
Digital humanities a změna paradigmatu
Digital humanities a změna paradigmatuDigital humanities a změna paradigmatu
Digital humanities a změna paradigmatu
 
PRML復々習レーン#2 2.3.6 - 2.3.7
PRML復々習レーン#2 2.3.6 - 2.3.7PRML復々習レーン#2 2.3.6 - 2.3.7
PRML復々習レーン#2 2.3.6 - 2.3.7
 
Greed is Good: 劣モジュラ関数最大化とその発展
Greed is Good: 劣モジュラ関数最大化とその発展Greed is Good: 劣モジュラ関数最大化とその発展
Greed is Good: 劣モジュラ関数最大化とその発展
 
機械学習研究の現状とこれから
機械学習研究の現状とこれから機械学習研究の現状とこれから
機械学習研究の現状とこれから
 
مقدمة عن الفيجوال بيسك 9-2019
مقدمة عن الفيجوال بيسك  9-2019مقدمة عن الفيجوال بيسك  9-2019
مقدمة عن الفيجوال بيسك 9-2019
 
カーネル法:正定値カーネルの理論
カーネル法:正定値カーネルの理論カーネル法:正定値カーネルの理論
カーネル法:正定値カーネルの理論
 
発表スライド
発表スライド発表スライド
発表スライド
 
ベイズ機械学習(an introduction to bayesian machine learning)
ベイズ機械学習(an introduction to bayesian machine learning)ベイズ機械学習(an introduction to bayesian machine learning)
ベイズ機械学習(an introduction to bayesian machine learning)
 
確率的バンディット問題
確率的バンディット問題確率的バンディット問題
確率的バンディット問題
 
Representing and comparing probabilities
Representing and comparing probabilitiesRepresenting and comparing probabilities
Representing and comparing probabilities
 
Fonctions logarithmes
Fonctions logarithmesFonctions logarithmes
Fonctions logarithmes
 
Fuzzy relations
Fuzzy relationsFuzzy relations
Fuzzy relations
 
PRML 2.3.2-2.3.4 ガウス分布
PRML 2.3.2-2.3.4 ガウス分布PRML 2.3.2-2.3.4 ガウス分布
PRML 2.3.2-2.3.4 ガウス分布
 
Znaky, znaky, modely
Znaky, znaky, modelyZnaky, znaky, modely
Znaky, znaky, modely
 

Destacado

Právní aspekty nakládání s knižním kulturním dědictvím - co všechno ještě ne...
Právní aspekty nakládání s knižním kulturním dědictvím - co  všechno ještě ne...Právní aspekty nakládání s knižním kulturním dědictvím - co  všechno ještě ne...
Právní aspekty nakládání s knižním kulturním dědictvím - co všechno ještě ne...Books Discovered Once Again
 
Introduction of the project "Books Discovered Once Again"
Introduction of the project "Books Discovered Once Again" Introduction of the project "Books Discovered Once Again"
Introduction of the project "Books Discovered Once Again" Books Discovered Once Again
 
Československé knihovnictví v letech 1939-1959
Československé knihovnictví v letech 1939-1959Československé knihovnictví v letech 1939-1959
Československé knihovnictví v letech 1939-1959Books Discovered Once Again
 
Národní kulturní komise pro správu státního kulturního majetku (1947–1951)
Národní kulturní komise pro správu státního kulturního majetku  (1947–1951)Národní kulturní komise pro správu státního kulturního majetku  (1947–1951)
Národní kulturní komise pro správu státního kulturního majetku (1947–1951)Books Discovered Once Again
 
Konfiskované knihy v období po 2. světové válce
Konfiskované knihy v období po 2. světové válceKonfiskované knihy v období po 2. světové válce
Konfiskované knihy v období po 2. světové válceBooks Discovered Once Again
 
"Za závadná se považují...": cenzura v českých knihovnách po roce 1945
"Za závadná se považují...": cenzura v českých knihovnách po  roce 1945"Za závadná se považují...": cenzura v českých knihovnách po  roce 1945
"Za závadná se považují...": cenzura v českých knihovnách po roce 1945Books Discovered Once Again
 
Europeana Newspaper metadata LIBER2013
Europeana Newspaper metadata LIBER2013Europeana Newspaper metadata LIBER2013
Europeana Newspaper metadata LIBER2013Europeana Newspapers
 
Europeana Newspapers LIBER2013 Workshop intro
Europeana Newspapers LIBER2013 Workshop introEuropeana Newspapers LIBER2013 Workshop intro
Europeana Newspapers LIBER2013 Workshop introEuropeana Newspapers
 
Knihy znovu nalezené: příspěvek o interdisciplinárním přístupu ke knižnímu k...
Knihy znovu nalezené: příspěvek o interdisciplinárním přístupu ke  knižnímu k...Knihy znovu nalezené: příspěvek o interdisciplinárním přístupu ke  knižnímu k...
Knihy znovu nalezené: příspěvek o interdisciplinárním přístupu ke knižnímu k...Books Discovered Once Again
 
Literary censorship in national socialist Norway
Literary censorship in national socialist NorwayLiterary censorship in national socialist Norway
Literary censorship in national socialist NorwayBooks Discovered Once Again
 
The Nazification of Norwegian Cultural Politics and the work of Frithjof Sælen
The Nazification of Norwegian Cultural Politics and the work of  Frithjof SælenThe Nazification of Norwegian Cultural Politics and the work of  Frithjof Sælen
The Nazification of Norwegian Cultural Politics and the work of Frithjof SælenBooks Discovered Once Again
 
Digitised historic newspapers in Europe
Digitised historic newspapers in EuropeDigitised historic newspapers in Europe
Digitised historic newspapers in EuropeTU Delft, Netherlands
 

Destacado (20)

Website: Experience so far
Website: Experience so farWebsite: Experience so far
Website: Experience so far
 
Právní aspekty nakládání s knižním kulturním dědictvím - co všechno ještě ne...
Právní aspekty nakládání s knižním kulturním dědictvím - co  všechno ještě ne...Právní aspekty nakládání s knižním kulturním dědictvím - co  všechno ještě ne...
Právní aspekty nakládání s knižním kulturním dědictvím - co všechno ještě ne...
 
Introduction of the project "Books Discovered Once Again"
Introduction of the project "Books Discovered Once Again" Introduction of the project "Books Discovered Once Again"
Introduction of the project "Books Discovered Once Again"
 
Československé knihovnictví v letech 1939-1959
Československé knihovnictví v letech 1939-1959Československé knihovnictví v letech 1939-1959
Československé knihovnictví v letech 1939-1959
 
Workshop 2 presentation, Sem
Workshop 2 presentation, SemWorkshop 2 presentation, Sem
Workshop 2 presentation, Sem
 
Manuál pro zvídavé čtenáře
Manuál pro zvídavé čtenářeManuál pro zvídavé čtenáře
Manuál pro zvídavé čtenáře
 
Národní kulturní komise pro správu státního kulturního majetku (1947–1951)
Národní kulturní komise pro správu státního kulturního majetku  (1947–1951)Národní kulturní komise pro správu státního kulturního majetku  (1947–1951)
Národní kulturní komise pro správu státního kulturního majetku (1947–1951)
 
Konfiskované knihy v období po 2. světové válce
Konfiskované knihy v období po 2. světové válceKonfiskované knihy v období po 2. světové válce
Konfiskované knihy v období po 2. světové válce
 
"Za závadná se považují...": cenzura v českých knihovnách po roce 1945
"Za závadná se považují...": cenzura v českých knihovnách po  roce 1945"Za závadná se považují...": cenzura v českých knihovnách po  roce 1945
"Za závadná se považují...": cenzura v českých knihovnách po roce 1945
 
Europeana Newspaper metadata LIBER2013
Europeana Newspaper metadata LIBER2013Europeana Newspaper metadata LIBER2013
Europeana Newspaper metadata LIBER2013
 
Europeana Newspapers LIBER2013 Workshop intro
Europeana Newspapers LIBER2013 Workshop introEuropeana Newspapers LIBER2013 Workshop intro
Europeana Newspapers LIBER2013 Workshop intro
 
Knihy znovu nalezené: příspěvek o interdisciplinárním přístupu ke knižnímu k...
Knihy znovu nalezené: příspěvek o interdisciplinárním přístupu ke  knižnímu k...Knihy znovu nalezené: příspěvek o interdisciplinárním přístupu ke  knižnímu k...
Knihy znovu nalezené: příspěvek o interdisciplinárním přístupu ke knižnímu k...
 
Literary censorship in national socialist Norway
Literary censorship in national socialist NorwayLiterary censorship in national socialist Norway
Literary censorship in national socialist Norway
 
The Nazification of Norwegian Cultural Politics and the work of Frithjof Sælen
The Nazification of Norwegian Cultural Politics and the work of  Frithjof SælenThe Nazification of Norwegian Cultural Politics and the work of  Frithjof Sælen
The Nazification of Norwegian Cultural Politics and the work of Frithjof Sælen
 
Promotion and PR activities
Promotion and PR activitiesPromotion and PR activities
Promotion and PR activities
 
Books disvovered once again - final summary
Books disvovered once again - final summaryBooks disvovered once again - final summary
Books disvovered once again - final summary
 
The Big Bang Theory and the project
The Big Bang Theory and the projectThe Big Bang Theory and the project
The Big Bang Theory and the project
 
Historical research
Historical researchHistorical research
Historical research
 
Introduction of National Library
Introduction of National Library Introduction of National Library
Introduction of National Library
 
Digitised historic newspapers in Europe
Digitised historic newspapers in EuropeDigitised historic newspapers in Europe
Digitised historic newspapers in Europe
 

Similar a Metadata a metadatové formáty používané v knihovnách

Metadata a metadatové standardy užívané v knihovnách
Metadata a metadatové standardy užívané v knihovnáchMetadata a metadatové standardy užívané v knihovnách
Metadata a metadatové standardy užívané v knihovnáchMoravskaZemskaKnihovna
 
Blok expertů KISK: Ditigalizace, Metadata, Pojekty
Blok expertů KISK: Ditigalizace, Metadata, PojektyBlok expertů KISK: Ditigalizace, Metadata, Pojekty
Blok expertů KISK: Ditigalizace, Metadata, PojektyMoravskaZemskaKnihovna
 
5. 3. O Digitalizace A Vedecke Digitalni Knihovny Martin Lhotak
5. 3. O Digitalizace A  Vedecke  Digitalni Knihovny  Martin Lhotak5. 3. O Digitalizace A  Vedecke  Digitalni Knihovny  Martin Lhotak
5. 3. O Digitalizace A Vedecke Digitalni Knihovny Martin LhotakKISK FF MU
 
Klára Rösslerová: Proměny výměnných formátů bibliografických dat v čase
Klára Rösslerová: Proměny výměnných formátů bibliografických dat v časeKlára Rösslerová: Proměny výměnných formátů bibliografických dat v čase
Klára Rösslerová: Proměny výměnných formátů bibliografických dat v časeÚISK FF UK
 
Informační zdroje pro obor klasická studia
Informační zdroje pro obor klasická studia Informační zdroje pro obor klasická studia
Informační zdroje pro obor klasická studia Ústřední knihovna FF MU
 
Elektronické informační zdroje pro českou literaturu
Elektronické informační zdroje pro českou literaturuElektronické informační zdroje pro českou literaturu
Elektronické informační zdroje pro českou literaturuÚstřední knihovna FF MU
 
Linked data (nejen) v knihovnách
Linked data (nejen) v knihovnáchLinked data (nejen) v knihovnách
Linked data (nejen) v knihovnáchMilan Janíček
 
Jiří Šilha - OPAC 2.0 v českých podmínkách
Jiří Šilha - OPAC 2.0 v českých podmínkáchJiří Šilha - OPAC 2.0 v českých podmínkách
Jiří Šilha - OPAC 2.0 v českých podmínkáchKISK FF MU
 
Elektronické informační zdroje pro studium humanitních oborů
Elektronické informační zdroje pro studium humanitních oborůElektronické informační zdroje pro studium humanitních oborů
Elektronické informační zdroje pro studium humanitních oborůÚstřední knihovna FF MU
 
Průvodce databázemi pro studenty oboru Novořecký jazyk a literatura
Průvodce databázemi pro studenty oboru Novořecký  jazyk a literaturaPrůvodce databázemi pro studenty oboru Novořecký  jazyk a literatura
Průvodce databázemi pro studenty oboru Novořecký jazyk a literaturaÚstřední knihovna FF MU
 
Pruvodce EIZ aneb kvalitní zdroje pro vaše studium (jaro 2012)
Pruvodce EIZ aneb kvalitní zdroje pro vaše studium (jaro 2012)Pruvodce EIZ aneb kvalitní zdroje pro vaše studium (jaro 2012)
Pruvodce EIZ aneb kvalitní zdroje pro vaše studium (jaro 2012)Ústřední knihovna FF MU
 
Marie Balíková: Databáze věcných autorit
Marie Balíková: Databáze věcných autoritMarie Balíková: Databáze věcných autorit
Marie Balíková: Databáze věcných autoritÚISK FF UK
 
Digitalizace a dlouhodobá ochrana digitálních dokumentů
Digitalizace a dlouhodobá ochrana digitálních dokumentůDigitalizace a dlouhodobá ochrana digitálních dokumentů
Digitalizace a dlouhodobá ochrana digitálních dokumentůMoravskaZemskaKnihovna
 
Adolf Knoll - Digitální knihovna Manuscriptorium
Adolf Knoll - Digitální knihovna ManuscriptoriumAdolf Knoll - Digitální knihovna Manuscriptorium
Adolf Knoll - Digitální knihovna ManuscriptoriumKISK FF MU
 
Experimentální OPAC
Experimentální OPACExperimentální OPAC
Experimentální OPACkadlec
 
Průvodce EIZ MU aneb Kvalitní zdroje pro vaše studium
 Průvodce EIZ MU aneb Kvalitní zdroje pro vaše studium Průvodce EIZ MU aneb Kvalitní zdroje pro vaše studium
Průvodce EIZ MU aneb Kvalitní zdroje pro vaše studiumÚstřední knihovna FF MU
 

Similar a Metadata a metadatové formáty používané v knihovnách (20)

Metadata a metadatové standardy užívané v knihovnách
Metadata a metadatové standardy užívané v knihovnáchMetadata a metadatové standardy užívané v knihovnách
Metadata a metadatové standardy užívané v knihovnách
 
Blok expertů KISK: Ditigalizace, Metadata, Pojekty
Blok expertů KISK: Ditigalizace, Metadata, PojektyBlok expertů KISK: Ditigalizace, Metadata, Pojekty
Blok expertů KISK: Ditigalizace, Metadata, Pojekty
 
Online sluzby knihoven 2012
Online sluzby knihoven 2012Online sluzby knihoven 2012
Online sluzby knihoven 2012
 
Online služby knihoven - MZK
Online služby knihoven - MZKOnline služby knihoven - MZK
Online služby knihoven - MZK
 
5. 3. O Digitalizace A Vedecke Digitalni Knihovny Martin Lhotak
5. 3. O Digitalizace A  Vedecke  Digitalni Knihovny  Martin Lhotak5. 3. O Digitalizace A  Vedecke  Digitalni Knihovny  Martin Lhotak
5. 3. O Digitalizace A Vedecke Digitalni Knihovny Martin Lhotak
 
Klára Rösslerová: Proměny výměnných formátů bibliografických dat v čase
Klára Rösslerová: Proměny výměnných formátů bibliografických dat v časeKlára Rösslerová: Proměny výměnných formátů bibliografických dat v čase
Klára Rösslerová: Proměny výměnných formátů bibliografických dat v čase
 
Informační zdroje pro obor klasická studia
Informační zdroje pro obor klasická studia Informační zdroje pro obor klasická studia
Informační zdroje pro obor klasická studia
 
Elektronické informační zdroje pro českou literaturu
Elektronické informační zdroje pro českou literaturuElektronické informační zdroje pro českou literaturu
Elektronické informační zdroje pro českou literaturu
 
EIZ pro klasická studia
EIZ pro klasická studiaEIZ pro klasická studia
EIZ pro klasická studia
 
Linked data (nejen) v knihovnách
Linked data (nejen) v knihovnáchLinked data (nejen) v knihovnách
Linked data (nejen) v knihovnách
 
Miroslav Bartošek: Česká digitální matematická knihovna (Nominované projekty ...
Miroslav Bartošek: Česká digitální matematická knihovna (Nominované projekty ...Miroslav Bartošek: Česká digitální matematická knihovna (Nominované projekty ...
Miroslav Bartošek: Česká digitální matematická knihovna (Nominované projekty ...
 
Jiří Šilha - OPAC 2.0 v českých podmínkách
Jiří Šilha - OPAC 2.0 v českých podmínkáchJiří Šilha - OPAC 2.0 v českých podmínkách
Jiří Šilha - OPAC 2.0 v českých podmínkách
 
Elektronické informační zdroje pro studium humanitních oborů
Elektronické informační zdroje pro studium humanitních oborůElektronické informační zdroje pro studium humanitních oborů
Elektronické informační zdroje pro studium humanitních oborů
 
Průvodce databázemi pro studenty oboru Novořecký jazyk a literatura
Průvodce databázemi pro studenty oboru Novořecký  jazyk a literaturaPrůvodce databázemi pro studenty oboru Novořecký  jazyk a literatura
Průvodce databázemi pro studenty oboru Novořecký jazyk a literatura
 
Pruvodce EIZ aneb kvalitní zdroje pro vaše studium (jaro 2012)
Pruvodce EIZ aneb kvalitní zdroje pro vaše studium (jaro 2012)Pruvodce EIZ aneb kvalitní zdroje pro vaše studium (jaro 2012)
Pruvodce EIZ aneb kvalitní zdroje pro vaše studium (jaro 2012)
 
Marie Balíková: Databáze věcných autorit
Marie Balíková: Databáze věcných autoritMarie Balíková: Databáze věcných autorit
Marie Balíková: Databáze věcných autorit
 
Digitalizace a dlouhodobá ochrana digitálních dokumentů
Digitalizace a dlouhodobá ochrana digitálních dokumentůDigitalizace a dlouhodobá ochrana digitálních dokumentů
Digitalizace a dlouhodobá ochrana digitálních dokumentů
 
Adolf Knoll - Digitální knihovna Manuscriptorium
Adolf Knoll - Digitální knihovna ManuscriptoriumAdolf Knoll - Digitální knihovna Manuscriptorium
Adolf Knoll - Digitální knihovna Manuscriptorium
 
Experimentální OPAC
Experimentální OPACExperimentální OPAC
Experimentální OPAC
 
Průvodce EIZ MU aneb Kvalitní zdroje pro vaše studium
 Průvodce EIZ MU aneb Kvalitní zdroje pro vaše studium Průvodce EIZ MU aneb Kvalitní zdroje pro vaše studium
Průvodce EIZ MU aneb Kvalitní zdroje pro vaše studium
 

Metadata a metadatové formáty používané v knihovnách

  • 1. Metadata a metadatové standardy užívané v knihovnách Pavla Švástová Moravská zemská knihovna 9.12.2010 Univerzita Pardubice
  • 2. Obsah 1. Metadata a metadatová schémata – teorie 2. Knihovnické metadatové standardy 3. Výroba metadat v praxi 4. Digitální knihovny 5. Využití v praxi – zajímavé projekty
  • 3. Metadata ⁄ data o datech ??? – tuto definici lze použít v případě, že chcete člověka ještě více zmást :) – vyjadřuje teoretickou podstatu, ALE: – nepomůže pochopit, co to vlastně metadata jsou a k čemu slouží – jak se liší data a metadata? Moravská zemská knihovna
  • 8. Metadata ⁄ „metadata is constructed, constructive and actionable“ (Understanding the Semantic Web: Bibliographic Data and Metadata, Karen Coyle http://alatechsource.metapress.com/content/p3022442071g7655) ⁄ Constructed – metadata jsou uměle vytvořená, nenacházejí se v přírodě, jsou nadstavbou nad něčím jiným, lidskou invencí ⁄ Constructive – metadata jsou vytvářena cíleně, aby vyřešila nějaký problém ⁄ Actionable – cílem metadat je, aby byla smysluplně využita Moravská zemská knihovna
  • 9. Rozdělení metadat ⁄ aspekty metadat: – sémantika – co chceme popsat – syntaxe – jak to chceme zapsat – struktura – jak vyjádřit případné vztahy ⁄ typ metadat: – popisná (deskriptivní, bibliografická) – strukturální – technická – administrativní ⁄ další možná třídění: – jednoduchá x složitá Moravská zemská knihovna
  • 10. Knihovní metadata ⁄ knihovnictví je od počátků založeno na vytváření a využívání metadat ⁄ knihovní metadata řeší problém, jak se vyznat v rozsáhlejších sbírkách dat – přírůstkové katalogy – seznam majetku knihovny – lískové katalogy (rozdělení dle autorů, názvů, témat, jazyků...) ⁄ vznik schémat – jak popsat knihu? co zažívá knihovník při popisu knížky? ⁄ http://aleph.mzk.cz:80/F?func=direct&doc_number=000059616&local_base=MZK01&format=999 Moravská zemská knihovna
  • 11. Metadatové schéma ⁄ soubor prvků určitého formátu, díky němuž lze metadata zaznamenat a vytvořit jejich strukturu ⁄ důležité je využívat mezinárodní standardy pro vyjádření a výměnu a vytvořit metadatové schéma tak, aby bylo využitelné pokud možno jednoznačně ⁄ v syntaxi dnes jednoznačně vede XML – specifikace formátu – DTD – jmenné tagy Moravská zemská knihovna
  • 12. Knihovní metadata - vývoj ⁄ původně vznikaly fyzicky vyjádřená metadata o fyzických dokumentech (kniha byla zkatalogizována a její metadata zapsána na katalogizační lístek) ⁄ nástup počítačového zápisu a zpracování fyzických knihovních jednotek – MARC ⁄ zdigitalizované dokumenty a born digital dokumenty – nové potřeby možností popisu – DC, MODS, METS Moravská zemská knihovna
  • 13. Popisná metadata ⁄ popisná = bibliografická = deskriptivní = ta klasická, co se využívají odjakživa pro popis fyzických dokumentů uložených v knihovně ⁄ popis dokumentů: – jmenný popis – autor, název, rok vydaní, nakladatel, ... – věcný popis – pokus o popis obsahu či tématu dokumentu – určuje, kam je potom kniha v knihovně zařazena (předmětová hesla, MDT, klíčová slova, atd.) ⁄ rozdíly mezi popisem fyzických a digitálních dokumentů nejsou tak dramatické Moravská zemská knihovna
  • 14. Katalogizační lístek ⁄ i ten je standardizovaný! (http://www.knihomol.wz.cz/listek.php) ⁄ projekty na retrokonverzi knihovních lístků - Retrokon Moravská zemská knihovna
  • 15. MARC ⁄ http://www.loc.gov/marc/ ⁄ Machine Readable Cataloguing – strojově čitelný – umožňuje strojové zpracování a výměnu ⁄ je vyvíjen jako standard pro výměnu katalogizačních záznamů od poloviny 60.let Kongresovou knihovnou, další rozšíření nastalo v 70. letech ⁄ vzniklo mnoho tzv. národních formátů se základem MARC, později byl vytvořen mezinárodní formát MARC 21 (v ČR přechod z UNIMARC v roce 2004) (http://www.ikaros.cz/node/1761) Moravská zemská knihovna
  • 16. MARC 21 - struktura ⁄ základem zápisu jsou tři prvky: – struktura záznamu – označení obsahu – třímístné číselné kódy a jejich podpole – obsah záznamu (definován dalšími standardy – ISBD, AACR2) Moravská zemská knihovna
  • 17. MARCXML ⁄ MARC 21 ve formátu XML ⁄ popisná metadata v digitálních knihovnách jsou uchovávána ve formátu XML ⁄ potřebný při konverzích mezi schématy Moravská zemská knihovna
  • 19. MARC 21 – výhody, nevýhody ⁄ výhodou a zároveň nevýhodou je jeho rozsáhlost a náročnost – na jednu stranu je možné popsat dokument do nejmenšího detailu, nevýhodou je náročnost na zaškolení katalogizátorů ⁄ pro digitální objekty nebyl původně zamýšlen, takže není úplně vhodný ⁄ přechod na MARC ve formátu XML – umožňuje výměnu i jinými cestami, než jen přes knihovnický protokol Z39.50, např. OAI PMH ⁄ prakticky: pokud digitalizujeme objekt, který je již v knihovním katalogu popsán ve formátu MARC 21 konvertujeme jej do MODS a dogenerujeme další potřebné prvky Moravská zemská knihovna
  • 20. Dublin Core (DC) ⁄ formát vznikl v roce 1995 z požadavků na minimální univerzální popis dokumentu ⁄ požadavky: – dostatečná jednoduchost – zároveň dostatečný rozsah, schopnost popsat zdroj detailně – možnost popisu prakticky jakéhokoliv zdroje – interoperabilita mezi dalšími formáty ⁄ vznikl standard, který tvoří 15 základních metadat prvků ⁄ rozšíření je možné na tzv. kvalifikovaný Dublin Core – základem je DC, rozšíření záleží na tvůrci standardu ⁄ http://dublincore.org/ ⁄ http://www.ics.muni.cz/dublin_core/ Moravská zemská knihovna
  • 21. Dublin Core - prvky ⁄ Obsah: ⁄ Intelektuální vlastnictví: ⁄ Zdroj: ⁄ Název ⁄ Tvůrce ⁄ Datum ⁄ Předmět a klíčová ⁄ Vydavatel ⁄ Formát slova ⁄ Přispěvatel ⁄ Identifikátor ⁄ Popis ⁄ Autorská práva ⁄ Jazyk ⁄ Typ zdroje ⁄ Zdroj ⁄ Vztah ⁄ Pokrytí http://www.webarchiv.cz/generator/dc_generator.php Moravská zemská knihovna
  • 22. ESE ⁄ Europeana Semantic Elements ⁄ http://www.google.cz/url?sa=t&source=web&cd=1&sqi=2&ved=0CBoQFjAA&url=h ⁄ metadatové schéma založené na Dublin Core pro publikování v evropské digitální knihovně Europeana http://www.europeana.eu/portal/ ⁄ standard obsahuje oproti DC několik prvků navíc (např. odkaz na jeden nebo několik náhledů na digitalizovaný dokument) Moravská zemská knihovna
  • 23. Metadata Object Description Schema (MODS) ⁄ schéma bylo představeno v roce 2002 jako kompromis mezi složitým popisem v MARC a nedostatečným popisem v DC ⁄ důraz na popis digitálních zdrojů, ale lze jím popsat prakticky jakýkoliv dokument ⁄ XML – eXtensible Markup Language http://www.w3.org/XML/, http://www.w3schools.com/xml/default.asp ⁄ interoperabilita s dalšími schématy ⁄ využití v digitálních knihovnách ⁄ http://www.loc.gov/standards/mods/ Moravská zemská knihovna
  • 24. MODS - struktura Moravská zemská knihovna
  • 25. TEI – Text Encoding Iniciative ⁄ TEI je konsorcium, které vyvíjí standardy pro reprezentaci textů v digitální podobě ⁄ http://www.tei-c.org/index.xml ⁄ využívá se pro podrobný popis rukopisů, včetně přepisu plných textů ⁄ specifikace, která je využívána pro popis rukopisů nejen bibliografický popis, obsahuje též popis struktury a počítá s problematikou ⁄ TEI P5, MASTER ⁄ Manuscritorium - http://www.manuscriptorium.com/ Moravská zemská knihovna
  • 26. VRA CORE ⁄ http://www.loc.gov/standards/vracore/ ⁄ standard pro popis uměleckých předmětů, uměleckých objektů a audiovizuálních dokumentů (včetně architektonických staveb, soch a dalších 3D předmětů, obrazů, fotografií, filmů, atd.) ⁄ http://www.archivision.com/outgoing/vracore4/examplesindex.html Moravská zemská knihovna
  • 27. Technická metadata ⁄ týkají se spíše digitalizovaných / digitálních dokumentů ⁄ informace např. o: – použitých softwarových nástrojích a jejich verzích (není .doc jako .doc) – hardwarových nástrojích (typ skeneru) – obrazových souborech (formát a jeho specifikace, rozlišení, velikost obrázku, barevnost...) – kódování – kompatibilitě Moravská zemská knihovna
  • 28. MIX ⁄ informace o obrazových souborech Moravská zemská knihovna
  • 29. ALTO ⁄ http://www.loc.gov/standards/alto/ ⁄ standard pro ukládání informací o vzhledu a obsahu digitalizovaného dokumentu ve formátu XML ⁄ „nadstavba“ nad OCR, které v tomto případě není pouze .txt ⁄ určuje pozici slov, řádků i odstavců na stránce s přesností na desetinu milimetru ⁄ zaznamenává typ a velikost písma Moravská zemská knihovna
  • 30. ALTO - příklad Moravská zemská knihovna
  • 31. ALTO - použití ⁄ možnost vygenerování obrázku pouze z xml souboru (záleží na kvalitě OCR, jak to bude potom čitelné :) ⁄ rozdělení na články ⁄ odlišení obrázků, textu a bílého místa na stránce ⁄ opravy OCR - http://trove.nla.gov.au/newspaper ⁄ projekt Impact ⁄ další? Moravská zemská knihovna
  • 32. Administrativní a autorsko-právní metadata ⁄ autorsko-právní otázky – kdo vlastní práva k dokumentu, kdy bude volně přístupný, za jakých podmínek apod. ⁄ prezervační funkce ⁄ co se s dokumentem děje za celou jeho kariéru od vzniku až po zpřístupnění – konverze do nových verzí či jiných formátů Moravská zemská knihovna
  • 33. PREMIS – The Preservation Metadata Implementation Strategies ⁄ http://www.loc.gov/standards/premis/ ⁄ formát vznikl za účelem ochrany a dlouhodobého uchování dokumentů Moravská zemská knihovna
  • 34. PREMIS - struktura ⁄ http://www.rinascimento-digitale.it/eventi/premis/premis-tutorial/Premis-pt1. ⁄ intelektuální entita (kniha, fotka, webová stránka, mapa, databáze...) ⁄ objekt (kapitola knihy v pdf, fotka v tiff, html soubor...) ⁄ událost (validace souboru, transformace, konverze, migrace...) ⁄ agent (autor, instituce, program...) ⁄ autorská práva (copyright, licence, další...) Moravská zemská knihovna
  • 36. Strukturální metadata ⁄ digitální objekty tvoří souhrn dat a metadat, které je potřeba logicky provázat ⁄ př. naskenovanou a metadaty opatřenou knihu tvoří: – soubor obrázků v různé kvalitě a různých formátech – xml soubor bibliografických metadat ve formátu MODS – xml soubor technických metadat ve formátu MIX – xml soubor administrativních metadat ve formátu PREMIS – xml soubor OCR ve formátu ALTO Moravská zemská knihovna
  • 37. DTD pro periodika a monografie ⁄ starší český formát metadat pro zpřístupnění v digitální knihovně Kramerius (např. http://kramerius.mzk.cz) ⁄ umožňuje popsat v podstatě jen monografii a periodikum – vytvořen účelově ⁄ obsahuje všechny typy metadat – popisná, strukturální i elementární technická a administrativní – jeden soubor ve formátu XML ⁄ dodnes se používá, ale v současnosti probíhá v NK a MZK konverze do formátů využívaných v nové verzi Krameria 4 (http://krameriusdemo.mzk.cz) Moravská zemská knihovna
  • 38. METS – Metadata Encoding and Transmission Standard ⁄ http://www.loc.gov/standards/mets/ ⁄ kontejnerový formát pro uchování a výměnu metadat v digitálních knihovnách založený na XML ⁄ určuje strukturu dokumentu ⁄ provazuje všechny typy metadat v jeden složený objekt Moravská zemská knihovna
  • 39. METS - struktura ⁄ může obsahovat 5 sekcí: – metsHdr - hlavička – dmdSec - popisná metadata – admSec - administrativní metadata – fileSec – objekty, soubory – structMap – strukturální mapa – behaviourSec – chování dle obsahu ⁄ nemusí být použity všechny sekce ⁄ každá sekce může obsahovat další typy metadat nebo na ně odkazovat Moravská zemská knihovna
  • 40. Výroba metadat – metadatové editory ⁄ většina metadat je generovaná automaticky – software je vyrábí automaticky dle nastavení v požadovaném formátu ⁄ některá je třeba ručně dodělat – popřípadě opravit špatně vygenerovaná, zkonvertovaná apod. ⁄ https://meditor.mzk.cz/ Moravská zemská knihovna
  • 41. Digitální knihovna ⁄ úložiště digitálních dokumentů ⁄ potřebuje pro svůj provoz všechny výše zmíněné typy metadat ⁄ umožňuje vyhledávání a prohlížení dokumentů ⁄ umožňuje správu dokumentů Moravská zemská knihovna
  • 42. Příklady využití metadatových formátů v digitálních knihovnách ⁄ http://krameriusdemo.mzk.cz ⁄ http://trove.nla.gov.au/newspaper ⁄ http://www.georeferencer.org/maps/domain/images ⁄ http://www.registrdigitalizace.cz ⁄ http://kramerius.mzk.cz ⁄ ... Moravská zemská knihovna
  • 43. Děkuji za pozornost Pavla Švástová pavla.svastova@gmail.com Moravská zemská knihovna v Brně www.mzk.cz