SlideShare una empresa de Scribd logo
1 de 15
KANSALLISKIRJASTO
Ontologioiden
käyttöönotto kirjastoissa,
mutta kuka lohduttaisi
ketjuja?
Jarmo Saarikko ja Matias Frosterus
Missä Mennään -webinaari 4.12.2018
KANSALLISKIRJASTO
YSAsta YSOon
www.kiwi.fi/display/ysall2yso
KANSALLISKIRJASTO
Siirtymään liittyvät sanastot
ysa
musa
allars
cilla
yso/fin
yso/swe
(sis. yso-paikat)
slm/fin
slm/swe
KANSALLISKIRJASTO
Konversioyhteistyöryhmä
 Valmistelee konversiosäännöt
 Auktoriteettitietueille (Asteri) SKOS → MARCXML
 Bibliografisille tietueille (Melinda)
 Kokoontuu 8 kertaa tänä vuonna
 Edustettuina
 Kansalliskirjasto, Helsingin yliopiston kirjasto, Åbo Akademi
Bibliotek, Piki- ja Vaski-kirjastot, Sisällönkuvailun
asiantuntijaryhmä, Kuvailevan metatiedon asiantuntijaryhmä,
Musiikin metatiedon asiantuntijaryhmä, Kuvailustandardiryhmä
KANSALLISKIRJASTO
Konversio bibliografisille tietueille
käytännössä
 Konvertoidaan kentät 648, 650, 651 ja 655
 Tulostuksia tulee muihinkin kenttiin
 Vain kentät, joissa osakentän $2 arvo on ysa tai allars
 Haetaan vastineet YSOsta, YSO-paikoista tai SLM:stä
 Vielä auki lisätäänkö termit vain yhdellä kielellä vai
useammalla
 URI lisätään osakenttään $0
 Alkuperäiset ysa- ja allars-kentät voidaan jättää
tietueeseen tai konversio-ohjelma voi poistaa ne
KANSALLISKIRJASTO
Entä ketjut?
 Ketjut puretaan konversion yhteydessä
 Sisällönkuvailuoppaan mukaan tulee välttää ketjujen
rakentamista
 Eri kenttiin, osa eri sanastoihin -- säännöt
konversioryhmässä
 Eri säännöt eri aineistotyypeille: kirjat, äänitteet,
videot/elokuvat
 YSOlla ei ole mielekästä ketjuttaa, sillä
 Ketjuja ei ole auktorisoitu
 YSOn URIt viittaavat yksittäiseen käsitteeseen, ei
ketjuun  Linkitetty data
 Finna ei tue ketjuja
KANSALLISKIRJASTO
Ketjujen käsittelystä
 Käsitellään kunkin MARC-kentän kaikki osakentät
yksitellen
 Kunkin osakentän kohdalla selvitetään
 Mikä osakenttä on kyseessä?
 aihe, lisämääre, aika, paikka, muoto, jne.
 Mistä sanastosta termin vastaavuus löytyy?
 Aineistotyyppi, osakenttä ja vastaavuus vaikuttavat
mihin MARC-kenttään vastine asetetaan
KANSALLISKIRJASTO
YSOa käytettäessä ketjutus ei toimi - esimerkki
Virheelliset kentät Melindassa:
650 7 |a sienet |x tuoksuvalmuska |2 yso |0 http://www.yso.fi/onto/yso/p90
650 7 |a sienet |x kauppa |2 yso |0 http://www.yso.fi/onto/yso/p90
650 7 |a metsät |x ekologia |2 yso |0 http://www.yso.fi/onto/yso/p5454
 0-kentän URI viittaa vain ensimmäiseen käsitteeseen
 Ketju tarkoittaa jotakin aivan muuta!
 Ketjuja ei auktorisoida
Sisällönkuvailijan korjaamana: (konversio ei tee automaattisesti)
650 7 |a tuoksuvalmuska |2 yso |0 http://www.yso.fi/onto/yso/p23248
650 7 |a kauppasienet |2 yso |0 http://www.yso.fi/onto/yso/p22067
650 7 |a metsäekologia |2 yso |0 http://www.yso.fi/onto/yso/p8062
KANSALLISKIRJASTO
Esimerkkisääntö ketjun purkamisesta
Esimerkki muokattu Marc-formaatin ohjeesta
KANSALLISKIRJASTO
Uusia käsitteitä ketjujen tilalle
Entä jos ketjua vastaavaa käsitettä ei löydy?
 Sanastoja ylläpidetään jatkuvasti
 Ehdotuksia uusiksi käsitteiksi otetaan vastaan
Finton ehdotusjärjestelmän kautta
https://ehdotus.finto.fi/
KANSALLISKIRJASTO
YSAsta YSOon eri kirjastojärjestelmissä?
 Melindan konvertointi suunniteltu kesälle 2019
 Paikalliskannat
 Kansalliskirjasto tarjoaa muunnostyökalun
 Periaatteessa konversio voitaisiin tehdä Melinda-
replikoinnin kautta, mutta käytännössä muutosmäärä
on liian suuri
 Selvitetään voidaanko toteuttaa keskitetysti Voyager- ja
Koha-kirjastoille
KANSALLISKIRJASTO
Kansalliskirjaston muunnostyökalu
MARCX
ML
Alustava
aikataulu
KANSALLISKIRJASTO
Kiitos
Lisätietoja:
https://www.kiwi.fi/display/ysall2yso
finto-posti@helsinki.fi
KANSALLISKIRJASTO
YSOa ei ketjuteta - miksi ei?
MARC 650 |0 osakenttä on toistettava kenttä
MUTTA
 Linkitetyn datan käsittelyssä ei voida
automaattisesti tunnistaa mihin osakenttään (|a, |v,
|x, |y, |z, jne.) kukin linkki liittyy
 Siksi YSOa käytettäessä talletetaan
vain yksi |a käsite |0 URI pari per kenttä

Más contenido relacionado

Más de Jarmo Saarikko

Näin käytän Twitteriä
Näin käytän TwitteriäNäin käytän Twitteriä
Näin käytän TwitteriäJarmo Saarikko
 
Udk Tyoelamapaiva 2009 04 03 jarmosaarikko
Udk Tyoelamapaiva 2009 04 03 jarmosaarikkoUdk Tyoelamapaiva 2009 04 03 jarmosaarikko
Udk Tyoelamapaiva 2009 04 03 jarmosaarikkoJarmo Saarikko
 
Plant Sciences Libraries 2.0 / SLA 2008, Seattle
Plant Sciences Libraries 2.0  / SLA 2008, SeattlePlant Sciences Libraries 2.0  / SLA 2008, Seattle
Plant Sciences Libraries 2.0 / SLA 2008, SeattleJarmo Saarikko
 
Metsäntutkimuslaitoksen verkkopalvelut nyt ja tulevaisuudessa (6.11.1998)
Metsäntutkimuslaitoksen verkkopalvelut nyt ja tulevaisuudessa (6.11.1998)Metsäntutkimuslaitoksen verkkopalvelut nyt ja tulevaisuudessa (6.11.1998)
Metsäntutkimuslaitoksen verkkopalvelut nyt ja tulevaisuudessa (6.11.1998)Jarmo Saarikko
 
Electronic communication and knowledge systems
Electronic communication and knowledge systemsElectronic communication and knowledge systems
Electronic communication and knowledge systemsJarmo Saarikko
 
Information server prototype for GFIS
Information server prototype for GFISInformation server prototype for GFIS
Information server prototype for GFISJarmo Saarikko
 
Global Forest Decimal Classification Revitalization
Global Forest Decimal Classification RevitalizationGlobal Forest Decimal Classification Revitalization
Global Forest Decimal Classification RevitalizationJarmo Saarikko
 

Más de Jarmo Saarikko (8)

Näin käytän Twitteriä
Näin käytän TwitteriäNäin käytän Twitteriä
Näin käytän Twitteriä
 
Udk Tyoelamapaiva 2009 04 03 jarmosaarikko
Udk Tyoelamapaiva 2009 04 03 jarmosaarikkoUdk Tyoelamapaiva 2009 04 03 jarmosaarikko
Udk Tyoelamapaiva 2009 04 03 jarmosaarikko
 
Plant Sciences Libraries 2.0 / SLA 2008, Seattle
Plant Sciences Libraries 2.0  / SLA 2008, SeattlePlant Sciences Libraries 2.0  / SLA 2008, Seattle
Plant Sciences Libraries 2.0 / SLA 2008, Seattle
 
Metsäntutkimuslaitoksen verkkopalvelut nyt ja tulevaisuudessa (6.11.1998)
Metsäntutkimuslaitoksen verkkopalvelut nyt ja tulevaisuudessa (6.11.1998)Metsäntutkimuslaitoksen verkkopalvelut nyt ja tulevaisuudessa (6.11.1998)
Metsäntutkimuslaitoksen verkkopalvelut nyt ja tulevaisuudessa (6.11.1998)
 
Electronic communication and knowledge systems
Electronic communication and knowledge systemsElectronic communication and knowledge systems
Electronic communication and knowledge systems
 
Information server prototype for GFIS
Information server prototype for GFISInformation server prototype for GFIS
Information server prototype for GFIS
 
Global Forest Decimal Classification Revitalization
Global Forest Decimal Classification RevitalizationGlobal Forest Decimal Classification Revitalization
Global Forest Decimal Classification Revitalization
 
GFDC and GFIS
GFDC and GFISGFDC and GFIS
GFDC and GFIS
 

Onotologioiden käyttöönotto kirjastoissa, mutta kuka lohduttaisi ketjuja?

Notas del editor

  1. Jarmo Saarikko, tietoasiantuntija, fil lis. ORCID https://orcid.org/0000-0002-6801-6151, https://www.linkedin.com/in/jarmosaarikko/ Matias Frosterus, tietojärjestelmäpäällikkö, DI, https://www.linkedin.com/in/matias-frosterus-b78b861/
  2. Projektin dokumentit, kokousmuistiot, suunnitelmat ja konversiosäännöt on sijoitettu tähän työtilaan. Itse ohjelmistot sijoitetaan Githubiin Finto-datan tools kansioon: https://github.com/NatLibFi/Finto-data/tree/master/tools
  3. YSAsta, Allärsista, (Musasta ja Cillasta) → YSOon, YSO-paikkoihin, SLM:ään (suomalainen laji -ja muototyyppisanasto) Fintossa yso ja yso-paikat ovat erikseen, mutta MARC-muodossa yso-paikat sisältyvät samaan sanastoon (sama sanastotunnus) Konversio ei käsittele musa- ja cilla sanastoihin merkittyjä kenttiä. Ne on konvertoitava etukäteen ysa ja allars ja slm -termeiksi.
  4. Konversiyhteistyöryhmä on määräaikainen ja lopetetaan, kun konversiosäännöt ovat valmiit. Tavoitteena, että konversiosäännöt olisivat valmiina vuoden 2019 alkupuolella, minkä jälkeen kirjoitetaan varsinainen konversio-ohjelma. Marcxml-muotoiset auktoriteettitiedostot tulevat ladattaviksi myös Finto-palvelusta
  5. Tulostuskenttiä esimerkiksi 370 luontipaikka, 388 luomisaika, 884 konversion tiedot
  6. On myös asiasanastoja joiden rakenteeseen ja/tai indeksointikäytäntöön kuuluvat ketjut. Esimerkeinä LCSH, MeSH ja Svenska ämnesord Kopioluetteloinnissa otettava huomioon: kun näitä halutaan konvertoida yso:n termeiksi, ketjut on purettava. YSOssa löytyy englanninkieliset vastineet käsitteille sekä monille LCSH käsitteille lähes vastaava käsite Linkitetyssä datassa ohjelmat ja robotit käyttävät käsitteiden kieriliriippumattomia tunnisteita apuna aineistojen yhdistelyssä
  7. Ketjujen käsittelyn periaatteet konversiossa yleisellä tasolla
  8. Ketjut, jotka korvautuvat yhdellä käsitteellä tulisi käsitellä manuaalisesti ennen konversiota Konversion jälkeen tämän voi tehdä esimerkiksi selvittämällä yhdessä esiintyviä asiasanoja
  9. Tämä on vain MARC formaatista tuotettu esimerkki siitä miten ysa:n käsitteet voidaan korvata yso:n tai slm:n käsitteillä eri aineistotyypeissä
  10. Käsitteen lisäämisen edellytys on yleensä se, että sitä tarvitaan aineiston kuvailussa eli sanasto ei kata kaikkia suomen kielen sanoja. Ehdotuksen yhteydessä tulee miettiä myös käsitteen hierarkiasuhteet, ylä- ja alakäsitteet, assosiatiiviset käsitteet sekä aiheryhmä, johon käsite voisi kuulua. Myös mahdolliset ohjaustermit (esim. synonyymit) sekä mäppäykset wikidataan ja kongressin kirjaston asiasanastoon (LCSH) lisäävät todennäköisyyttä, että käsite otetaan sanastoon.
  11. Muunnostyökalu on konversio-ohjelma, jolle syötetään BIB-tietueet marcxml-muodossa ja se tuottaa täydennetyt tietueet marcxml-muodossa..
  12. BIB-tietueiden tiedot tuodaan ja viedään marcxml-muodossa. Muunnostyökalu voi haluttaessa poistaa tietueesta alkuperäiset ysa- ja allars-kentät Muunnostyökalu voi tuottaa tietueeseen yso-termit yhdellä tai kahdella kielellä valinnan mukaan
  13. Aikataulu saattaa muuttua
  14. Miksi vain yksi termi per aihekenttä?