Annifin kuulumisia

Lehtinen M (2022). Annifin kuulumisia. Tietolinja, 2022(2). Pysyvä osoite: https://urn.fi/URN:NBN:fi-fe2022121571947

annif-logo

Annif on Kansalliskirjastossa kehitettävä automaattisen kuvailun työkalu, joka pohjautuu kieliteknologiaan ja koneoppimiseen. Ainakin osa Tietolinjan lukijoista tuntee sen jo entuudestaan aiempien julkaisujen perusteella. Annifista voi lukea lisää myös osoitteesta annif.org tai Finton asiakaswikistä.

Annif

Sisällönkuvailua tehdään yleensä asiantuntijatyönä KAM-sektorilla (kirjastot, arkistot ja museot). Verkkomaailmassa sisällönkuvailua tehdään esimerkiksi uutisartikkelin tai vaikka blogitekstin löydettävyyden parantamiseksi. Kuvailtavan aineistomäärän kasvaessa katsetta on käännetty tekoälyratkaisujen puoleen, tarkoituksena nopeuttaa ja helpottaa ihmisvoimin tehtävää kuvailutyötä.

Annifiin perustuen on rakennettu automaattisen kuvailun palvelu Finto AI. Finto AI:n käytöstä puoliautomaattisessa sisällönkuvailussa on julkaistu ohje Finton asiakaswikissä. Ohjeessa kerrotaan, miten verkkolomakkeen kautta saa tekstille asiasanaehdotuksia. Samasta yhteydestä löytyy myös esittely Finto AI -palvelusta itsestään sekä puoliautomaattisesta ja automaattisesta sisällönkuvailusta yleisesti. Automaattista kuvailua ja Annifia on esitelty myös Tietolinjassa aiemminkin (ks. esim. Lehtinen ym. 2019 & Inkinen ym. 2021).

Annifin & Finto AI:n käyttö kansallisen julkaisuperinnön kuvailussa

Finto AI on käytössä useassa Kansalliskirjaston ylläpitämässä julkaisuarkistossa sekä e-vapaakappaleiden vastaanotossa. Lisäksi Kirjavälitys Oy käyttää Finto AI:n rajapintaa tuottaessaan ennakkotietoja uusista kirjoista ja tekee sen avulla alustavan asiasanoituksen. Lisäksi sisällönkuvailijat käyttävät itsenäisesti Finto AI:ta verkkosivun lomakkeen kautta. Isossa osassa kirjastoissa tapahtuvaa YSO-pohjaista sisällönkuvailua hyödynnetään siis jo nyt tavalla tai toisella Finto AI:ta ja sen ydintä Annifia.

Finto AI:ta käytetään myös museoaineston kuvailussa. Se on käytössä museoiden Collecte-järjestelmässä. Collecten käyttäjä, joita on viimeisimmän tiedon mukaan yli 40 museossa, voi kuvaillessaan kirjoittaa järjestelmään vapaata tekstiä kuvailemaansa museoaineistoon liittyen. Tämän tekstin perusteella Finto AI  tarjoaa Yleisestä suomalaisesta ontologiasta YSO:sta poimittuja ehdotuksia. Käyttäjä valitsee haluamansa termit, jotka päätyvät normaalia reittiä muiden asiasanojen kanssa hakupalvelu Finnaan.

Tulevaisuudessa tekoälyratkaisut saattavat kulttuuriperintöaineiston kuvailussa sisältää myös enenevässä määrin automaattista puheen-, kuvan- tai tekstintunnistusta, jonka lopputuloksena syntynyt teksti voidaan esimerkiksi syöttää Annifille tai käyttää muuten apuna kuvailutyössä. Mielenkiintoisia tulevaisuuden näkymiä ovat myös automaattisen kuvailun laajentaminen esim. kaunokirjallisuuden puolelle ja luokitusjärjestelmiin (esim. YKL).

Annif maailmalla

Ruotsin kansalliskirjasto ilmoitti lokakuun 2022 lopulla ottaneensa Annifin käyttöön SwePub-julkaisurekisterissä (https://swepub.kb.se/).
Tässä käyttötapauksessa Annif antaa ehdotuksia julkaisun tieteenalaluokasta pohjautuen alan ruotsalaiseen luokitukseen (Standard för svensk indelning av forskningsämnen). Annif korvasi SwePubin aiemman automaattisen luokituksen järjestelmän. Käyttöönotosta kerrotaan ruotsin kielellä Ruotsin kansalliskirjaston verkkosivuilla (kohdassa Ämnesklassificering) ja sen tekninen toteutus on kuvattu GitHubissa.

28.11.– 2.12.2022 verkossa järjestetyssä SWIB22-konferenssissa saimme myös kuulla Cristoph Poleyn esityksen Saksan kansalliskirjaston uudehkosta automaattisesta sisällönkuvailujärjestelmästä EMa:sta (Erschließungsmaschine), jonka ytimessä on Annif. Esityksen kalvot ja tallenne löytyvät verkosta (englanniksi). Samassa konferenssissa järjestimme myös työpajan, jossa opetimme Annifin omatoimista käyttöä. Työpajan pohjana on nk. Annif-tutoriaali, joka on avoin englanninkielinen itseopiskelumateriaali Annifin käyttöön.

Viitteet

Lehtinen M, Inkinen J & Suominen O (2019). Aaveita koneessa: Automaattisen sisällönkuvailun arviointia Kirjastoverkkopäivillä 2019. Tietolinja, 2019(2). Pysyvä osoite: http://urn.fi/URN:NBN:fi-fe2019120445612

Inkinen J, Lehtinen M & Suominen O (2021). Automaattisen kuvailun arvoituksia Kirjastoverkkopäivillä 2021.Tietolinja, 2021(2). Pysyvä osoite: https://urn.fi/URN:NBN:fi-fe2021121661232

Kirjoittaja

Mona Lehtinen, tietoasiantuntija
Kansalliskirjasto, kirjastoverkkopalvelut
mona.lehtinen [at] helsinki.fi

Leave a Reply

This site uses Akismet to reduce spam. Learn how your comment data is processed.