Kansalliskirjaston Metatietovisio ennustaa 2020-lukua

Kuvituskuva. Ihmisen ja robotin etusormet koskettavat toisiaan.

Metatieto tekoälyn ja ihmisen rajapinnassa. Kuva: Laura Lipponen.

Frosterus M (2021). Kansalliskirjaston Metatietovisio ennustaa 2020-lukua. Tietolinja, 2021(1). Pysyvä osoite: https://urn.fi/URN:NBN:fi-fe2021061938978

Kansalliskirjaston Metatietovisio tarkastelee metatiedon kehitystä keskipitkällä aikavälillä. Teknologisen ja yhteiskunnallisen kehityksen myötä odotukset ja vaatimukset kulttuuriperintösektorin tarjoamille digitaalisille palveluille muuttuvat ja kasvavat 2020-luvulla. Muutosten myötä myös metatiedon rooli korostuu entisestään. Metatietovisio peräänkuuluttaa tiivistyvää yhteistyötä, suunnitelmallisuutta ja rohkeutta ottaa haltuun uudet roolit, joita kulttuuriperintöorganisaatioiden ainutlaatuiset kokoelmat ja tietotaito mahdollistavat muuttuvassa toimintaympäristössämme.

Kansalliskirjasto julkaisi Metatietovisionsa vuoden 2020 helmikuussa. Julkaisun tavoitteena oli esitellä Kansalliskirjaston visio metatiedon kehityksestä keskipitkällä aikavälillä white paper -hengessä. Ajatuksena oli toimia keskustelunavauksena siitä, miten metatiedon ja sitä ympäröivien järjestelmien tulisi kulttuuriperintösektorilla kehittyä. Metatieto nähdään edellytyksenä kulttuuriperintötiedon, tieteellisen tiedon ja tutkimusdatan hallinnalle, käytölle ja säilyttämiselle digitaalisessa ympäristössä (kuvio 1).

Metatietovisio keskittyy kuvailevaan metatietoon ja sitä ohjaaviin tietovarantoihin. Tunnisteet sekä tekninen ja hallinnollinen metatieto jäävät sivuosaan.

Kuvio 1: Visio keskittyy kuvailevaan metatietoon.

Metatiedon eri osa-alueista Metatietovisio keskittyy kuvailevaan metatietoon, joka auttaa tiedon löytämisessä. Kun kuvailevaa metatietoa tuotetaan yhtenäisin periaattein ja linkitetään rikkaasti yhteen, saadaan tuloksena jotain suurempaa kuin osiensa summa. Tiedonhakijan kannalta yhteentoimiva linkitetty tieto tarjoaa mahdollisuuden lähestyä tietoa haluamastaan kulmasta – tiettyyn paikkaan, tiettyyn henkilöön tai vaikkapa tiettyyn sukuun liittyen.

Metatietovisiossa keskeinen, toistuva käsite on semanttinen yhteentoimivuus: kahden järjestelmän kyky vaihtaa tietoja keskenään siten, että tiedon merkitys säilyy. Toisin sanoen metatietoa pitää laatia siten, että sen merkitys ei muutu, vaikka se irrotettaisiin tuotantokontekstistaan. Tämä vaatii kontekstin eksplikointia, mutta myös yhteisiä metatietoa ohjaavia tietovarantoja.

Yhteistyöllä tuotettu metatieto on enemmän kuin osiensa summa

Metatietovisio korostaa yhteistyön tärkeyttä metatiedon tuotannon tulevaisuudessa. Yhteistyön kautta resurssit riittävät paremmin, kun turhaa päällekkäistä työtä saadaan karsittua ja ylläpitovastuita voidaan yhtäältä hajauttaa sekä toisaalta keskittää tiedon itsensä eikä organisaatiorakenteiden ehdoilla. Esimerkiksi jonkin tietyn aihealueen erikoisontologian kehitys ja ylläpito voidaan keskittää aiheesta parhaiten tietävän organisaation tehtäväksi. Toisaalta taas vaikkapa toimijoiden kuvailu voidaan hajauttaa eri organisaatioihin, koska toimijatietoja tarvitaan kaikkeen kuvailutietoon liittyen.

Kulttuuriperintöorganisaatioiden keskinäiset eroavuudet ovat johtaneet erilaisiin periaatteisiin metatiedon tuotannossa. Esimerkiksi kirjastoissa metatietoa on tuotettu aineiston löydettävyyden näkökulmasta – tavoitteena ei ole ollut esimerkiksi aineiston määrittely tai julkaisun elinkaaren hallinta. Yhteiskäyttöisiä metatietovarantoja varten pitää selvittää eri osallistuvien organisaatioiden näkökulmien yhteiset nimittäjät ja muodostaa varantojen perusta näiden pohjalta. Yhteisiä nimittäjiä etsittäessä on varauduttava kompromisseihin, mutta omista semanttisista lähtökohdista, ydinasiakkaista ja esimerkiksi kansainvälisestä yhteentoimivuudesta tinkimättä. Yhteistä perustaa voidaan täydentää kunkin sektorin omien vaatimusten mukaisella tiedolla. (Kuvio 2.)

Kuvio 2: Yhteentoimivan metatiedon kautta avautuu uusia mahdollisuuksia eri käyttäjäryhmien palvelemiseen.

Siiloutuneiden tietovarantojen käyttöliittymät rakennetaan tietovarannon ehdoilla. Koska tietovarannon oma käyttöliittymä on ainoa tie sen sisältämään tietoon, on se rakennettava toimimaan mahdollisimman hyvin kaikelle sen tietovarannon sisällölle. Yhteentoimiva metatieto ja avoimet rajapinnat sen sijaan mahdollistavat palvelut, jotka yhdistelevät tietoa eri lähteistä ja optimoidaan palvelemaan tiettyä käyttötapausta ja käyttäjäryhmää.

Metatietovisio nostaa myös vahvasti esiin tekoälyn kehityksen merkityksen niin metatiedon tuotannon kuin sen käytönkin osalta. Muistiorganisaatiot tuottavat laadukasta metatietoa neutraalista näkökulmasta ilman kaupallisia tai ideologisia vinoumia, joka toimii ideaalina polttoaineena oppiville järjestelmille. Toisaalta tekoäly kehittyessään tarjoaa myös erinomaisia mahdollisuuksia tehostaa metatiedon tuotantoa. Rutiiniluonteisia työnosia automatisoitaessa kuvailijat voivat keskittää työpanoksensa paremmin ihmistyötä ja osaamista vaativiin tehtäviin.

Yhteentoimivuus, yhteistyö ja tekoälyn hyödyntäminen vaativat kuitenkin myös sitä, että metatietoa hyödyntävien järjestelmien pitää kehittyä. Kuvailujärjestelmien pitää tukea kuvailijaa mahdollisimman tehokkaasti tunnisteiden käytössä, linkkien luomisessa ja esimerkiksi provenienssitiedon kirjaamisessa. Järjestelmiltä vaaditaan räätälöitävyyttä ja modulaarisuutta, minkä lisäksi monimutkaisuus on voitava piilottaa peruskäyttäjiltä. Se pitää kuitenkin olla kaivettavissa esiin tarpeen vaatiessa, jotta järjestelmää voidaan säätää ja kehittää. Sama pätee myös hakujärjestelmiin: monipuolisemman ja kehittyneemmän metatiedon hyödyt tulee ottaa käyttöön hakujärjestelmissä. Toisaalta tiedonhakijalla tulisi olla myös mahdollisuus ymmärtää miten hakutulokset muodostuvat ja kyetä vaikuttamaan käytetyn automaation määrään.

Metatietovisiota toteuttamassa: yhteiset toimijatiedot

Metatietovision julkaisusta on tätä kirjoitettaessa kulunut runsas vuosi. Miten visio on otettu vastaan ja onko sen toteuttaminen lähtenyt käyntiin?

Metatietovisiota käsittelevä seminaari järjestettiin vuoden 2020 syksyllä. Seminaarissa kuultiin eri kulttuuriperintö- ja julkishallinnon organisaatioiden näkemyksiä metatiedon tulevaisuudesta. Metatietovisiota pidettiin ansiokkaana avauksena ja pitkän tähtäimen suunnittelua tarpeellisena, jotta kulttuuriperintösektori voi vastata tekniikan ja yhteiskunnan kehityksen mukanaan tuomiin haasteisiin.

Vuonna 2020 toteutettiin myös muistiorganisaatiosektorin yhteisen Nimitietopalvelun pilottiprojekti, joka toi esiin yhteistyön tärkeyden metatiedon tuotannon tulevaisuudessa. Nimitietopalvelun tavoitteena on koota yhteen arkistojen, kirjastojen ja museoiden toimijatiedot henkilöiden, yhteisöjen ja sukujen osalta Nimitietopalvelusta tehtyjen esiselvitysten mukaisesti. Toimijatietojen yhteiskäyttö mahdollistui muistiorganisaatiosektorin otettua RDA-kuvailusäännöt toimijoiden kuvailun yhteiseksi pohjaksi yhtenäistäen näin lähtökohtansa metatietojen tällä alueella. Projektiryhmään kuului edustajia kaikilta sektoreilta ja yhteistyö oli vilkkaan hedelmällistä.

Pilottiprojekti jalosti edelleen ensimmäisessä esiselvityksessä laadittua Nimitietopalvelun tietomallia toimivaksi käytännön skeemaksi, jota voidaan soveltaa todelliseen dataan. Malli linkitettiin eri sektorien tuotantojärjestelmissä käytettyihin tietomalleihin mahdollistaen näin tietojen yhdistelyn myöhemmässä vaiheessa. Projektissa testattiin myös mahdollisia ratkaisuja yhteiskäyttöiseksi toimijatiedon tuotantoalustaksi, mutta lopullisia päätöksiä järjestelmän suhteen ei ole vielä tehty.

Pilottiprojekti ei saanut jatkorahoitusta vuodelle 2021, mutta aihe on tärkeä. Nimitietopalvelun tavoite otetaan joka tapauksessa huomioon muussa kehitystyössä, sillä se pohjustaa hyvin tulevia projekteja.

Paikkatietoa ja tekoälyä

Toimijatiedot ei ole suinkaan ainoa yhteinen ohjaavan metatiedon varanto, jolla on suuri potentiaali parantaa kulttuuriperintösektorin digitaalista palvelutuotantoa. Vuoden 2021 alusta käynnistyi Kansalliskirjastossa Paikkatietopalveluprojekti, joka tähtää kulttuuriperintösektorin paikkatiedon ja siihen liittyvän yhteistyön kehittämiseen. Kuluvan vuoden päätavoitteena projektilla on Digime-tietoarkkitehtuuriryhmässä kehitetyn paikkatiedon uuden tietomallin dokumentointi ja julkaisu. Tietomalli parantaa erityisesti mahdollisuuksia ilmaista paikassa tapahtuvia ajallisia muutoksia, mikä on tunnistettu puutteeksi muissa paikkatiedon lähteissä. Mallia tullaan soveltamaan YSO-paikkoihin, joka on kulttuuriperintösektorilla laajasti käyttöön otettu Kansalliskirjaston ylläpitämä paikkatietoresurssi.

Eräitä keskeisiä metatiedon tuotantoa ja käyttöä mullistavia teknologioita ovat tekoäly ja koneoppiminen. CSC, Kansallisarkisto ja Kansalliskirjasto solmivat syksyllä 2018 tekoälykumppanuussopimuksen, jonka tavoitteena on tekoälyn hyödyntämiseen liittyvä yhteistyö. Yhteistyö poiki mm. High Performance Digitization -projektin, joka edisti kuvailun automatisaatiota kulttuuriperintöorganisaatioissa kehittämällä koneoppimiseen perustuvia automaattisen kuvailun menetelmiä ja työkaluja. Projekti yhdisti hedelmällisesti CSC:n suurteholaskennan ja kulttuuriperintösektorin laadukkaasti kuvaillut aineistot ja aiheeseen pyritään palaamaan tulevissa projekteissa.

Ontologia- ja sanastopalvelu Finton kehitystä jatketaan ja viime vuonna lanseerattiin uutena avauksena automaattisen asiasanoituksen palvelu Finto AI. Finto AI toimii kolmella kielellä ja antaa sille syötetylle tekstille aihe-ehdotuksia, jotka perustuvat Yleisen suomalaisen ontologian YSO:n käsitteisiin. Metatietovision ajatuksia toteuttaa myös Finton mahdollistama kansallinen ontologiainfrastruktuuri, jossa eri alojen erikoisontologioita ylläpidetään kunkin alan asiantuntijaorganisaatiossa ja tarjotaan sitten kaikkien käyttöön Finton kautta. Erikoisalojen ontologiat laajentavat yleisontologia YSOa ja näin ollen muodostavat linkitetyn ja koneluettavan kokonaisuuden, jonka avaamia mahdollisuuksia esimerkiksi hauille tutkitaan tänä vuonna muun muassa Finnassa.

Viimeisin merkittävä uusi avaus Metatietovision toteutumisen näkökulmasta on Digitaalisen kulttuuriperinnön pyöreä pöytä, joka perustettiin tarkastelemaan kulttuuriperintösektorin yhteistyön mahdollisuuksia laajemmasta perspektiivistä ja strategisemmasta näkökulmasta. Uuden tyyppinen yhteistyö avaa uusia ovia kokonaisvaltaisempiin lähestymistapoihin mitä tulee teknologian ja yhteiskunnan kehityksestä kumpuaviin muutosvoimiin, joita Metatietovisiossakin nostettiin esiin.

Kirjoittaja

Matias Frosterus, tietojärjestelmäpäällikkö
Kansalliskirjasto, kirjastoverkkopalvelut
etunimi.sukunimi[at]helsinki.fi
https://orcid.org/0000-0002-8355-0256

Kuva: Laura Lipponen
Kuviot: Matias Frosterus

Leave a Reply

This site uses Akismet to reduce spam. Learn how your comment data is processed.