Halutaan heterogeeninen ja ajantasainen Finto

Finto-palvelun sidosryhmien ontologioihin liittyvistä käytännöistä ja toiveista

Susanna Nykyri ja Tuomas Palonen
Kansalliskirjasto

Tämän artikkelin pysyvä osoite on: http://urn.fi/URN:NBN:fi-fe2014052225983

 

Laaja kirjo haastateltavia ja moninaisia kehitystoiveita

ONKI-projekti on Kansalliskirjaston, valtiovarainministeriön sekä opetus- ja kulttuuriministeriön yhteishanke, joka vastaa kansallisen ontologiapalvelun Finton sekä Yleisen suomalaisen ontologian YSOn kehittämisestä ja ylläpidosta. YSO perustuu Yleiseen suomalaiseen asiasanastoon YSAan, jota niin ikään kehitetään Kansalliskirjastossa. Finto toimii sisällönkuvailun ja tiedonhaun sanastollisena apuvälineenä palvellen monia toimialoja kansallisella tasolla.

ONKI-projekti on tehnyt sidosryhmähaastatteluja ja julkaissut näistä raportin. Haastattelujen tavoite oli kerätä palautetta, kokemuksia ja ideoita erityisesti YSOn kehitystä ja ylläpitoa silmällä pitäen. Haastateltaviksi valittiin organisaatioita ja henkilöitä, jotka tunsivat ontologiapalvelun tai YSOn entuudestaan. Kehittämistarpeiden kartoittamisessa oli tukena myös Kansalliskirjaston sisäinen asiantuntemus, mm. ONKI-projektiryhmään kuuluvat sisällönkuvailijat. Koska palvelua ja ontologiaa kehitetään laajemmalle käyttäjäryhmälle ja myös muille kuin perinteisille kirjastoalan organisaatioille, on heidän kuulemisensa koettu erityisen tärkeäksi. Tässä artikkelissa valotamme raportin keskeistä sisältöä ja tuloksia.

Raportti julkaistiin 11.2.2014 ja sen kirjoittivat tietoasiantuntijat Susanna Nykyri ja Tuomas Palonen yhteistyössä muun projektiryhmän kanssa. Raportti koostuu haastattelujen temaattisesta läpikäynnistä, jossa on huomioitu haastateltavien oma ääni ja painotukset. Teksti sisältää myös suoria sitaatteja haastateltavilta.

Sidosryhmien tarpeet ovat heterogeenisia, ja ne eivät ole kaikilta osin identtisiä kirjastoalan tarpeiden kanssa; kirjastoala on edelleen palvelun tärkeä ja varsin keskeinen asiakasryhmä, mutta mukana on myös muita käyttäjäryhmiä, joilla on osin eriävät tarpeet ja odotukset Kansalliskirjaston ontologiapalveluille. Haastatteluissa ja tapaamisissa on painottunut keskeisen kirjastoalan lisäksi erityisesti julkishallinto, media-ala ja verkkosivustojen kehittäjät. Olemme pyrkineet kuulemaan käyttäjiä laajasti, ja tarkoituksemme on jatkaa toiveiden ja käytäntöjen kuulemista koko projektin ajan.

Haastateltavia tahoja oli yhteensä kaksitoista: Svenska YLE, YLEn Elävä arkisto, YLEn kirjastotietopalvelu, Brages Pressarkiv, Kirjasampo, Terveyden ja hyvinvoinnin laitos (THL), Julkishallinnon ontologian JUHOn laatijoita, Suomalaisen Kirjallisuuden Seura (SKS), Viikin tiedekirjasto, Helsingin kaupungin verkkopalvelu (julkisen hallinnon palveluontologia JUPOn käyttäjiä), Yritys-Suomi sekä Museo 2015.

Raportti käsittelee ontologioihin liittyviä toiveita ja käyttökokemuksia. Haastattelut ajoittuivat projektin alkuun, vuoteen 2013, ja niissä esitettyjä toiveita on jo osin toteutettukin. Ontologiapalvelun kehittäminen on nyt dynaamisessa vaiheessa: raportti keskittyykin haastatteluaineistoon eikä kuvaa itse palvelua tai sitä kehitystyötä, jota haastattelujen perusteella on lähdetty toteuttamaan.

Raportissa esitellään haastateltavien sisällönkuvailukäytäntöjä ja -tavoitteita sekä järjestelmiä, joissa sisällönkuvailu ja tiedonhaku tapahtuu. Usea haastateltava taho on kehittänyt omaan toimialaansa liittyvän erikoisontologian ja raportissa käydään läpi myös näihin liittyviä ylläpitokysymyksiä. Edelleen käsitellään näkemyksiä ontologioihin liittyvistä hyödyistä, haasteista ja kehityssuunnista. Lopussa ONKI-projektiryhmä esittää yhtäältä omia ajatuksiaan siitä, miten kehitystoiveisiin voidaan vastata, ja toisaalta tarjoaa kehitysideoita sidosryhmille.

Haastatteluja on tehty niin laajasti, että raportti toimii myös läpileikkauksena suomalaisten ontologioiden käyttöön ja ontologiapalveluun kohdistuviin toiveisiin.

 

Kättä pidempää sisällönkuvailuun

Haastateltavat pitivät sisällönkuvailua tärkeänä ja erityisosaamista vaativana työnä. He kuitenkin usein kokivat, että sen hyödyt, hyödynnettävyys ja funktio eivät aina avaudu muille kuin sisällönkuvailun ammattilaisille, ja että ei-ammattilaisten tekemä sisällönkuvailu ei ole laadultaan ammattilaisten tasoa.

Sisällönkuvailun tavoitteena on haastatelluissa organisaatioissa sisällönkuvaillun aineiston löydettävyys. Osassa organisaatioista tuotetaan itse myös kuvailtava aineisto, ja primaarilähteen tuottaja on myös sen metadatan laatija – näin on esimerkiksi Svenska YLEllä, jossa toimittajat sisällönkuvailevat itse omat juttunsa.

Haastateltavat erottelivat usein sisällönkuvailun tarpeet ja käytännöt ja analysoivat niitä sen mukaan, laaditaanko sisällönkuvailu alan ammattilaisia ja/tai oman organisaation sisäisiä toimijoita vai oman organisaation ulkoisia käyttäjiä ajatellen. Tiedonhaun on ajateltu kuitenkin yleensä kohdistuvan verkkoympäristössä kaikkiin kuvailtavassa aineistossa esiintyviin sanoihin, mukaan lukien asiasanoihin. Asiasanastojen laadinnassa ja käytössä ajatellaan usein aiheenmukaista löydettävyyttä, mutta myös erityisten instanssien löytäminen on koettu tärkeäksi.

Huolimatta sisällönkuvailun ja sen välineiden – kuten ontologioiden – haasteista, asiasanoittamisen ja ontologioiden kehittämisen koettiin kuitenkin olevan elimellisen tärkeää. Haastateltavien joukossa eniten hajontaa aiheutti kysymys siitä, kenelle kuuluu käytännön vastuu asiasanoittamisesta – vastuuta pyritään siirtämään toiselle organisaatiolle tai toimijataholle. Toinen merkittävä ero oli sisällönkuvailijoiden perehtyneisyydessä itse sisällönkuvailuun: osalle toimijoista se on pääasiallinen tehtävä, osalle taas  yksi päätyön ohessa tapahtuva lisätehtävä, johon ei ole kouluttauduttu.

 

Uinuvia sanastoprojekteja ja ontologian käyttöönottohaasteita

Ontologioihin suhtaudutaan muistiorganisaatioissa, julkishallinnossa ja median puolella varsin myönteisesti ja kiinnostuneesti. Ne organisaatiot, joiden järjestelmässä ontologia on käytössä, ovat olleet tyytyväisiä ontologian tuomiin etuihin kuten hierarkian hyödyntämiseen sisällönkuvailussa ja haussa. Kaikkia ontologian mahdollistamia hyötyjä, kuten esimerkiksi haunlaajennusta tai assosiatiivisia suhteita, ei ole vielä kunnolla sovellettu järjestelmissä. Toisaalta monessakaan organisaatiossa ei ole siirrytty asiasanastoista ontologioihin, vaikka kiinnostusta onkin. Näin saattaa olla, vaikka organisaation oma asiasanasto olisi jo ontologisoitu.

Syitä siihen, miksi ontologioita ei ole otettu käyttöön, on useita: keskeisiä ovat teknisten resurssien puute, ontologiatuntemuksen vähäisyys, toimivien esikuvien puuttuminen, järjestelmäuudistusten työläys sekä Aalto-yliopiston FinnONTO-projektin loppuminen, joka sai monet organisaatiot odottavalle kannalle. Isoihin järjestelmäinvestointeihin ei haluttu lähteä ennen kuin tiedettiin, mikä on keskitetyn kansallisen ontologiapalvelun tulevaisuus. Nyt kun ontologiapalvelun jatkuvuus on Kansalliskirjaston ONKI-projektin myötä saatu varmistettua, kiinnostus ontologioihin on taas kasvussa ja käyttöönottoa suunnitellaan monella taholla.

Mikäli ontologiaa ei ole otettu organisaatiossa käyttöön, on varsin tyypillistä, että myös sen ylläpito on keskeytynyt. Kuitenkin yleensä näissä tapauksissa ontologiaan perustuvan asiasanaston ylläpitoa on  jatkettu. Kansalliskirjaston tavoitteena on jatkossa auttaa tällaisia organisaatioita käynnistämään ontologiaylläpitonsa uudestaan.

 

Toiveita ja johtopäätöksiä

Haastatteluissa esitetyt toiveet ja kehitysehdotukset kohdistuivat moniaalle: osa liittyi itse palvelun sisällölliseen ja tekniseen toteutukseen ja osa toimintatapoihin, tiedottamiseen ja koulutukseen.

Sidosryhmien aiemmat kokemukset ontologiatyön haasteista osoittavat, että Kansalliskirjastossa on syytä panostaa tiedottamiseen, opastukseen ja ideointiyhteistyöhön sidosryhmien kanssa, jotta erikoisontologioiden ylläpito ja ontologioiden sovelluskäyttö sujuvat jatkossa jouhevasti. Myös palvelun vakaus ja nopeus ovat erittäin tärkeitä seikkoja, joihin on kiinnitettävä huomiota.

Haastateltavia askarrutti YSOn ja YSAn suhde ja moni näki ne toisilleen vaihtoehtoina. Toisaalta ontologioita ja linkitetyn datan maailmaa ei vielä tunneta kovin laajasti. YSOon kohdistuu ontologiamuotoisena, uudenlaisessa käyttöympäristössä toimivana sanastona uusia käyttötarpeita ja odotuksia sisällöistä. Semanttinen web toimintaympäristönä asettaa uudenlaisia vaatimuksia sanaston sisällölliselle ylläpidolle. Sidosryhmät kaipaavat sanastotyössä aiempaa nopeampaa reagointia muutos- ja lisäystoiveisiin. Etenkin hallinnon ja median näkökulmasta päivityksen nopeus on keskeinen käytettävyyskriteeri. Tämän vuoksi ONKI-projektissa on ryhdytty kehittämään sanaston päivitysprosessia ja ehdotusjärjestelmää. Uuden sanastotyökalun tulisi kuitenkin myös taata yhteys vanhempiin kuvailutietoihin.

Sanaston sisältöön kohdistuvia toiveita esitettiin varsin runsaasti. Keskeisiä toiveita olivat sanaston temaattisuuden ja assosiatiivisten suhteiden lisääminen, rikkaampi synonymia ja hierarkkisen rakenteen selkeyttäminen. Toisaalta semanttisen webin ja linkitetyn datan toimintaperiaate pohjautuu pitkälti koneluettavuuteen, mutta sanaston ja palvelun tulisi silti tukea inhimillistä ja käyttäjäystävällisempää käyttötapaa.

Konkreettinen ja kaikkien jakama kehitystarve on instanssiontologioiden kehittäminen ja liittäminen osaksi ontologiapalvelua. Toimija-, tapahtuma ja erityisesti paikkatieto koettiin kuvailun ja tiedonhaun kannalta jopa ratkaisevan tärkeiksi.

Ontologiapalvelun kehittämisen tulee perustua laaja-alaiseen yhteistoimintaan ja asiantuntemukseen. Raportissa onkin pohdittu sidosryhmien ja Kansalliskirjaston roolinjakoa. Sidosryhmien tarjoamaa erityisalojen substanssiosaamista tarvitaan ontologiapalvelun kehittämisessä ja ylläpidossa. Yhteisesti muodostetulla visiolla ja linjauksella ontologiat auttavat semanttisen webin ja linkitetyn datan edistämistä.

 

Lisää tietoa:

  • Ontologioiden käytön moninaisuudesta ja tulevaisuusnäkymistä : Finto-palvelun sidosryhmien ontologiapalvelulle kohdistamat kehitystoiveet -raportti (pdf), http://urn.fi/URN:NBN:fi-fe201402111454

 

Kirjoittajien yhteystiedot:

Susanna Nykyri, tietoasiantuntija
sähköposti: susanna.nykyri[at]helsinki.fi

Tuomas Palonen, tietoasiantuntija
sähköposti. tuomas.palonen[at]helsinki.fi

Kansalliskirjasto / Tutkimuskirjasto
PL 26, 00014 HELSINGIN YLIOPISTO

 

1 Comment

  1. Atro Niiniluoto

    Aineiston löydettävyys tosiaan paranee, kun löytyy oikea sana.

Leave a Reply

This site uses Akismet to reduce spam. Learn how your comment data is processed.