Yhteisluettelosta metatietovarannoksi

Laila Heinemann, Nina Hyvönen ja Terhi Mikkola
Kansalliskirjasto

Tämän artikkelin pysyvä osoite on http://urn.fi/URN:NBN:fi-fe201201111049

 

Kansallinen yhteisluettelo -hanke käynnistyi vuonna 2010 edellisenä vuonna tehdyn esiselvityksen pohjalta (ks. Hyvönen & Tonteri: Kansallinen yhteisluettelo nyt ja tulevaisuudessa, Tietolinja 2/2009). Kahden vuoden kuluessa hanke on laajentunut niin, että se on ollut pakko pilkkoa pienemmiksi alaprojekteiksi. Niistä Fennican integrointi mukaan ja auktoriteettitietokannan rakentaminen ovat jo käynnissä. Yleisten kirjastojen projekti on alkamassa toden teolla vuonna 2012 ja päätös ammattikorkeakoulujen mukaantulon rahoituksesta on myös juuri saatu.

Muita alakokonaisuuksia ovat Violan ja Arton tuotannon integrointi sekä erikoiskirjastojen ja julkaisuarkistojen mukaantulo. Tietokannan katteen laajennusta tukevia projekteja ovat kuvailukäytäntöjen yhtenäistäminen, sosiaalisen metadatan integrointi ja uuden luettelointityökalun rakentaminen. Myös sellaisilla suurilla hankkeilla kuin KDK ja uuden kirjastojärjestelmän suunnittelu on kiinteät liittymäkohdat yhteisluettelohankkeeseen. Eri alaprojekteilla on useilla myös omia liittymäkohtia muihin hankekokonaisuuksiin, kuten esimerkiksi kansainvälinen auktoriteettitietokanta VIAF ja kansallinen julkaisurekisterihanke JURE.

Kuva: Kansallinen metatietovaranto -hankekokonaisuus ml. tärkeimmät liittyvät hankkeet (vihreällä)

Kuva: Kansallinen metatietovaranto -hankekokonaisuus ml. tärkeimmät liittyvät hankkeet (vihreällä)

Kuten yllä olevasta voi jo helposti nähdä, lopputulos on jo paljon, paljon enemmän kuin perinteinen yhteisluettelo. Siksi nyt on alettu puhua kirjastojen kansallisesta metatietovarannosta.

Hankesuunnitelmassa kokonaisuuden lopputulema on kiteytetty sanoilla: Yhteinen metatietovaranto kaikille Suomen kirjastoille. Se on määritelty tarkemmin seuraavasti:

Kansallinen metatietovaranto tarjoaa kirjastojen metatiedon tuotannolle uuden työskentely- ja toimintaympäristön ja tehostaa kuvailuprosessia kirjastoissa merkittävästi. Metatietojen yhteiskäytön myötä muiden kirjastojen tekemän työn täysipainoinen hyödyntäminen helpottuu ja erilliset kuvailutarpeet vähenevät.

Kansallinen metatietovaranto on keskitetty tietovaranto, joka on kirjastojärjestelmäkokonaisuuden ydin. Sen sisältämää metatietoa voidaan esittää asiakkaille eri asiakasliittymissä. Kirjastojen metatiedon säilytystä hallitaan keskitetysti Kansalliskirjastossa, jolloin palvelinratkaisut ja hyvä tietoturva tuovat toimintaan kustannussäästöjä ja tehokkuutta.

Mitä on jo tehty?

Yhteisluettelohankkeen ensimmäisessä vaiheessa siirrettiin LINDA-tietokanta Voyager-järjestelmästä Aleph-järjestelmään. Siirto ei sujunut aivan kivuttomasti ja se poiki paljon ylimääräistä työtä jälkikäteen. Suurin osa ongelmista on nyt ratkaistu ja on päästy taas normaaliin tuotantokäyttöön. Tämä puolestaan mahdollistaa tietokannan sisällöllisen katteen laajentamisen.

Varsinaisen yhteisluettelon toimintaympäristöön kuuluvista muista projekteistakin on muutama jo käynnissä.

Auktoriteettitietokantahanke alkoi vuonna 2010. Tästä hankkeesta on kirjoitettu Tietolinjaan aiemmin oma artikkelinsa (ks. Heinemann: Asteri Lindalle, Tietolinja 1/2010).

Auktoriteettitietokanta on yksi edellytys kansallisbibliografia FENNICAn integroimiselle mukaan LINDAan. FENNICAn integrointi LINDAan yhteisluettelotoimintojen osalta on oma alaprojektinsa, jonka selvitystyö valmistui kesällä 2011. Selvityksen perusteella todettiin, että FENNICAn luettelointi, sisällönkuvailu, auktoriteettivalvonta ja ennakkotietojen vastaanotto voidaan aloittaa LINDAssa tarvittavan valmistelutyön ja yhteistyökumppaneiden kanssa käytyjen sopimusneuvottelujen jälkeen. Muut FENNICAssa tehtävät toiminnot, kuten esimerkiksi vapaakappaleiden vastaanotto ja aineiston saapumisvalvonta, tehdään edelleen FENNICAssa, koska näiden toimintojen rakentaminen LINDAan vaatisi huomattavasti suunnittelua, testausta ja resursseja. Uuden kirjastojärjestelmän valinnan yhteydessä FENNICAn ja yhteisluettelon suhteet käsitellään uudelleen.

FENNICA-luettelointi LINDAssa aloitetaan vaiheittain. Vuoden 2011 lopussa se on aloitettu Kansalliskirjastossa tehtävien ennakkotietueiden osalta. LINDAssa FENNICAan meneviä tietueita kohdellaan samoin kuin muitakin tietueita eli kaikki kirjastot voivat esimerkiksi lisätä niihin asiasanoja. Tietueiden replikoinnin (siirron) yhteydessä filteröidään (suodatetaan) halutut ja tietyt ehdot täyttävät MARC-kentät LINDAsta FENNICAan.

Yhteistietokannan katteen laajentaminen yleisiin kirjastoihin tuli mahdolliseksi, kun opetus- ja kulttuuriministeriö myönsi tälle projektille rahoituksen vuonna 2011. Terhi Mikkola aloitti projektin asiantuntijana kesällä ja ryhtyi valmistelemaan varsinaisen työn aloittamista. Yleisten kirjastojen neuvosto nimitti edustajat projektiryhmään lokakuussa ja ryhmä kokoontui ensimmäisen kerran 21.11.2011.

Kahden eri tuotantojärjestelmän kanssa työskentelyä helpottamaan on Kansalliskirjastossa ryhdytty rakentamaan omaa verkkoselaimen kautta toimivaa luettelointityökalua. Tällä työkaluohjelmalla voi täydentää kahdessa eri järjestelmässä olevia tietueita yhtä aikaa. Tämän kehittely on jo käyttöliittymäsuunnitteluvaiheessa.

Mitä tehdään seuraavaksi?

Auktoriteettitietokanta saadaan vaiheittain tuotantoon vuoden 2012 loppuun mennessä. Ensimmäisessä vaiheessa se tulee kattamaan kaikki Kansalliskirjaston vastuulla olevat asiasanastot (YSA, Allärs, MUSA ja Cilla) sekä FENNICAn ja ALMAn henkilötekijät. Yhteisötekijät otetaan mukaan myöhemmin, samoin musiikin auktoriteetit (ks. Violan integrointi alla).

Muiden kirjastojen tuottamien auktoriteettien lisäämistä aletaan pilotoida loppuvuonna 2012, ja – tämän tuloksista riippuen – ne pyritään saamaan käyttöön mahdollisimman pian. Myös auktoriteettitietojen vaihtoa muiden muistiorganisaatioiden (museot, arkistot) ja eräiden muiden hankkeiden (esim. tutkimusdatavaranto) kanssa ryhdytään selvittämään. Kansainvälistä auktoriteettivaihtoa pyritään edistämään VIAF- ja ISNI-hankkeissa, joita on myös esitetty aloitettaviksi vuonna 2012.

Kansallisdiskografia VIOLAn integrointi ei ole yhtä helppoa kuin FENNICAn johtuen monista musiikkiaineiston erityispiirteistä. Koska LINDAssa ei aiemmin ole ollut mukana musiikkia, on esimerkiksi osakohdeluettelointia jouduttu testaamaan Aleph-järjestelmässä erikseen. Musiikkiauktoriteetit – mukaan lukien erityisesti teosauktoriteetit – ovat monimutkaisempia kuin kirja-aineistoissa ja vaativat nekin tarkempaa suunnittelua. Koska myös yleisten kirjastojen aineistoissa on runsaasti musiikkia, nämä kysymykset pyritään selvittämään omana kokonaisuutenaan.

Yleisten kirjastojen pilotointi alkaa 2012. Parhaillaan ollaan valitsemassa pilottikirjastoa – edellytyksenä on MARC 21 -formaatin käyttö, mikä rajaa toistaiseksi mahdollisten ehdokkaiden määrää. Ennen pilotoinnin aloittamista on kuitenkin ensin selvitettävä metatietojen omistukseen liittyvät kysymykset ja eri järjestelmien välisten rajapintojen toimivuus.

Ammattikorkeakoulujen liittyminen mukaan yhteiseen metatietovarantoon tuli sekin mahdolliseksi, kun opetus- ja kulttuuriministeriö myönsi siihen rahoituksen vuoden 2011 lopussa. Ammattikorkeakoulukirjastojen tilanne on sikäli yksinkertaisempi kuin yleisten, koska niillä on käytössään sama Voyager-järjestelmä kuin yliopistokirjastoilla. Ne voidaan ottaa mukaan yksitellen erillisinä käyttöönottoprojekteina, joissa pystytään hyödyntämään yliopistokirjastojen kokemuksia.

Myös kuvailukäytäntöjen yhtenäistämistä, joka on olennaista yhteistietokannan laadun kannalta, ryhdytään edistämään omana alaprojektinaan. Projektin suunnittelussa ja toteuttamisessa on lähdetty liikkeelle seuraavista lähtökohdista: metatiedon yhteentoimivuus ja vaihdettavuus, yhteisöllinen tuotantoprosessi (tietojen täydennettävyys) sekä yhtenäiset käytännöt kaikkiin kirjastoihin. Keskeisiä toimenpiteitä ovat mm. uusien ISBD-luettelointisääntöjen käyttöönottoon ja RDA-kuvailustandardin kehittämisen seurantaan liittyvät asiat, samoin MARC-formaatin seuraajan kehittämisen seuranta (ja käyttöönotto kun aika tulee). Uusien metatietovarantoon mukaan tulevien kirjastojen ohjeistuksen suunnittelu ja toteutus sekä Dublin Core -perusteisten julkaisarkistojen kuvailun yhtenäistäminen ja ohjeistus ovat myös tärkeitä tehtäviä. Projektilla on useita sidosryhmiä, joiden työhön se osallistuu, kuten sisällönkuvailuverkosto ja kansallisen kuvailun ohjausryhmä.

Mitä jää vielä tehtäväksi?

Erikoiskirjastojen piirissä on myös kiinnostusta liittyä mukaan, mutta koska ne kuuluvat monen eri ministeriön hallinnonaloihin, keskitetyn rahoitusratkaisun löytyminen on haasteellisempaa.

ARTO-tietokannan ja julkaisuarkistojen integrointi mukaan yhteiseen metatietovarantoon olisi looginen jatkumo tälle kehitykselle. Näitä kysymyksiä ei kuitenkaan vielä ole pohdittu tarkemmin, vaan ne saavat toistaiseksi odottaa vuoroaan.

Sosiaalinen metadata sen sijaan on otettu esille jo useaan otteeseen, sekä yleisten kirjastojen taholta että KDK-hankkeessa. Sen keräämistä, tallentamista ja hyödyntämistä on tarkoitus selvittää omana erillisenä projektinaan.

Yhteistietokannan integrointi Kansallisen digitaalisen kirjaston asiakasliittymään vaatii myös oman alaprojektinsa, jonka aikataulu riippuu KDK-hankkeen etenemisestä.

Lopputulos…

Muutaman vuoden kuluttua LINDAsta on kuoriutunut entistä ehompi MELINDA. Tämä on tosin vasta työnimi, joka on lyhenne metatietovaranto-Lindasta. Jos niin halutaan, se voisi merkitä myös ”meidän kaikkien yhteistä Lindaa”.

Prosessia voi seurata hankkeelle rakennettavilla wiki-sivuilla osoitteessa: https://wiki.helsinki.fi/display/Metiva/

Taustatietoa:

Kirjoittajien yhteystiedot

Laila Heinemann, tietojärjestelmäasiantuntija
Nina Hyvönen, tietojärjestelmäpäällikkö
Terhi Mikkola, tietojärjestelmäasiantuntija

Kansalliskirjasto / Kirjastoverkkopalvelut
PL 26 (Teollisuuskatu 23)
00014 Helsingin yliopisto
sähköposti: etunimi.sukunimi [at] helsinki.fi