Esitys Kansalliskirjaston Missä mennään -webinaarissa, 4.12.2018. Jarmo Saarikko ja Matias Frosterus, Kansalliskirjasto, YSAsta ja Allärsista YSOon projekti
4. KANSALLISKIRJASTO
Konversioyhteistyöryhmä
Valmistelee konversiosäännöt
Auktoriteettitietueille (Asteri) SKOS → MARCXML
Bibliografisille tietueille (Melinda)
Kokoontuu 8 kertaa tänä vuonna
Edustettuina
Kansalliskirjasto, Helsingin yliopiston kirjasto, Åbo Akademi
Bibliotek, Piki- ja Vaski-kirjastot, Sisällönkuvailun
asiantuntijaryhmä, Kuvailevan metatiedon asiantuntijaryhmä,
Musiikin metatiedon asiantuntijaryhmä, Kuvailustandardiryhmä
5. KANSALLISKIRJASTO
Konversio bibliografisille tietueille
käytännössä
Konvertoidaan kentät 648, 650, 651 ja 655
Tulostuksia tulee muihinkin kenttiin
Vain kentät, joissa osakentän $2 arvo on ysa tai allars
Haetaan vastineet YSOsta, YSO-paikoista tai SLM:stä
Vielä auki lisätäänkö termit vain yhdellä kielellä vai
useammalla
URI lisätään osakenttään $0
Alkuperäiset ysa- ja allars-kentät voidaan jättää
tietueeseen tai konversio-ohjelma voi poistaa ne
6. KANSALLISKIRJASTO
Entä ketjut?
Ketjut puretaan konversion yhteydessä
Sisällönkuvailuoppaan mukaan tulee välttää ketjujen
rakentamista
Eri kenttiin, osa eri sanastoihin -- säännöt
konversioryhmässä
Eri säännöt eri aineistotyypeille: kirjat, äänitteet,
videot/elokuvat
YSOlla ei ole mielekästä ketjuttaa, sillä
Ketjuja ei ole auktorisoitu
YSOn URIt viittaavat yksittäiseen käsitteeseen, ei
ketjuun Linkitetty data
Finna ei tue ketjuja
7. KANSALLISKIRJASTO
Ketjujen käsittelystä
Käsitellään kunkin MARC-kentän kaikki osakentät
yksitellen
Kunkin osakentän kohdalla selvitetään
Mikä osakenttä on kyseessä?
aihe, lisämääre, aika, paikka, muoto, jne.
Mistä sanastosta termin vastaavuus löytyy?
Aineistotyyppi, osakenttä ja vastaavuus vaikuttavat
mihin MARC-kenttään vastine asetetaan
8. KANSALLISKIRJASTO
YSOa käytettäessä ketjutus ei toimi - esimerkki
Virheelliset kentät Melindassa:
650 7 |a sienet |x tuoksuvalmuska |2 yso |0 http://www.yso.fi/onto/yso/p90
650 7 |a sienet |x kauppa |2 yso |0 http://www.yso.fi/onto/yso/p90
650 7 |a metsät |x ekologia |2 yso |0 http://www.yso.fi/onto/yso/p5454
0-kentän URI viittaa vain ensimmäiseen käsitteeseen
Ketju tarkoittaa jotakin aivan muuta!
Ketjuja ei auktorisoida
Sisällönkuvailijan korjaamana: (konversio ei tee automaattisesti)
650 7 |a tuoksuvalmuska |2 yso |0 http://www.yso.fi/onto/yso/p23248
650 7 |a kauppasienet |2 yso |0 http://www.yso.fi/onto/yso/p22067
650 7 |a metsäekologia |2 yso |0 http://www.yso.fi/onto/yso/p8062
10. KANSALLISKIRJASTO
Uusia käsitteitä ketjujen tilalle
Entä jos ketjua vastaavaa käsitettä ei löydy?
Sanastoja ylläpidetään jatkuvasti
Ehdotuksia uusiksi käsitteiksi otetaan vastaan
Finton ehdotusjärjestelmän kautta
https://ehdotus.finto.fi/
11. KANSALLISKIRJASTO
YSAsta YSOon eri kirjastojärjestelmissä?
Melindan konvertointi suunniteltu kesälle 2019
Paikalliskannat
Kansalliskirjasto tarjoaa muunnostyökalun
Periaatteessa konversio voitaisiin tehdä Melinda-
replikoinnin kautta, mutta käytännössä muutosmäärä
on liian suuri
Selvitetään voidaanko toteuttaa keskitetysti Voyager- ja
Koha-kirjastoille
15. KANSALLISKIRJASTO
YSOa ei ketjuteta - miksi ei?
MARC 650 |0 osakenttä on toistettava kenttä
MUTTA
Linkitetyn datan käsittelyssä ei voida
automaattisesti tunnistaa mihin osakenttään (|a, |v,
|x, |y, |z, jne.) kukin linkki liittyy
Siksi YSOa käytettäessä talletetaan
vain yksi |a käsite |0 URI pari per kenttä
Projektin dokumentit, kokousmuistiot, suunnitelmat ja konversiosäännöt on sijoitettu tähän työtilaan.
Itse ohjelmistot sijoitetaan Githubiin Finto-datan tools kansioon: https://github.com/NatLibFi/Finto-data/tree/master/tools
YSAsta, Allärsista, (Musasta ja Cillasta) → YSOon, YSO-paikkoihin, SLM:ään (suomalainen laji -ja muototyyppisanasto)
Fintossa yso ja yso-paikat ovat erikseen, mutta MARC-muodossa yso-paikat sisältyvät samaan sanastoon (sama sanastotunnus)
Konversio ei käsittele musa- ja cilla sanastoihin merkittyjä kenttiä. Ne on konvertoitava etukäteen ysa ja allars ja slm -termeiksi.
Konversiyhteistyöryhmä on määräaikainen ja lopetetaan, kun konversiosäännöt ovat valmiit. Tavoitteena, että konversiosäännöt olisivat valmiina vuoden 2019 alkupuolella, minkä jälkeen kirjoitetaan varsinainen konversio-ohjelma.
Marcxml-muotoiset auktoriteettitiedostot tulevat ladattaviksi myös Finto-palvelusta
Tulostuskenttiä esimerkiksi 370 luontipaikka, 388 luomisaika, 884 konversion tiedot
On myös asiasanastoja joiden rakenteeseen ja/tai indeksointikäytäntöön kuuluvat ketjut. Esimerkeinä LCSH, MeSH ja Svenska ämnesord
Kopioluetteloinnissa otettava huomioon: kun näitä halutaan konvertoida yso:n termeiksi, ketjut on purettava.
YSOssa löytyy englanninkieliset vastineet käsitteille sekä monille LCSH käsitteille lähes vastaava käsite
Linkitetyssä datassa ohjelmat ja robotit käyttävät käsitteiden kieriliriippumattomia tunnisteita apuna aineistojen yhdistelyssä
Ketjujen käsittelyn periaatteet konversiossa yleisellä tasolla
Ketjut, jotka korvautuvat yhdellä käsitteellä tulisi käsitellä manuaalisesti ennen konversiota
Konversion jälkeen tämän voi tehdä esimerkiksi selvittämällä yhdessä esiintyviä asiasanoja
Tämä on vain MARC formaatista tuotettu esimerkki siitä miten ysa:n käsitteet voidaan korvata yso:n tai slm:n käsitteillä eri aineistotyypeissä
Käsitteen lisäämisen edellytys on yleensä se, että sitä tarvitaan aineiston kuvailussa eli sanasto ei kata kaikkia suomen kielen sanoja. Ehdotuksen yhteydessä tulee miettiä myös käsitteen hierarkiasuhteet, ylä- ja alakäsitteet, assosiatiiviset käsitteet sekä aiheryhmä, johon käsite voisi kuulua. Myös mahdolliset ohjaustermit (esim. synonyymit) sekä mäppäykset wikidataan ja kongressin kirjaston asiasanastoon (LCSH) lisäävät todennäköisyyttä, että käsite otetaan sanastoon.
Muunnostyökalu on konversio-ohjelma, jolle syötetään BIB-tietueet marcxml-muodossa ja se tuottaa täydennetyt tietueet marcxml-muodossa..
BIB-tietueiden tiedot tuodaan ja viedään marcxml-muodossa. Muunnostyökalu voi haluttaessa poistaa tietueesta alkuperäiset ysa- ja allars-kentätMuunnostyökalu voi tuottaa tietueeseen yso-termit yhdellä tai kahdella kielellä valinnan mukaan