Kansalliskirjaston ISNI-toiminnan taival

Engberg M, Sornova K, Vainonen O (2021). Kansalliskirjaston ISNI-toiminnan taival. Tietolinja, 2021(1). Pysyvä osoite: https://urn.fi/URN:NBN:fi-fe2021061938980

ISNI (International Standard Name Identifier) on ISO-standardiin ISO 27729 perustuva toimijoiden julkisten identiteettien 16-merkkinen tunnus. Sen tarkoituksena on identifioida globaalisti, ainutkertaisesti ja pysyvästi henkilöiden ja yhteisöjen julkiset identiteetit sekä erottaa samannimiset henkilöt ja yhteisöt toisistaan. ISNI-standardin mukaan julkisilla identiteeteillä tarkoitetaan nimiä, joita toimijat käyttävät luodessaan, tuottaessaan, hallinnoidessaan ja välittäessään tietosisältöjä.

Isni-tunnuksen graafi

Kuva 1: ISNI-tunnuksen käyttö on yleistymään päin.

ISNI-tunnuksia ylläpidetään kansainvälisessä ISNI-tietokannassa, ja niitä voi hakea ainoastaan rekisteröintitoimistojen (ISNI Registration Agencies, RAG) kautta. Kansalliskirjasto liittyi kansainvälisen ISNI-verkoston jäseneksi lokakuussa 2013 ja aloitti ISNI-tunnusten rekisteröintitoimistona seitsemän vuotta myöhemmin. Alussa Kansalliskirjasto oli mukana ISNI-verkoston toiminnassa lähinnä tarkkailijana, mutta ISNI-projektin (2018–2020) ansiosta päästiin toiminnassamme eteenpäin.

ISNI-tunnuksen ympärillä oleva toiminta alkaa pikkuhiljaa hahmottua, ja Kansalliskirjasto voi asettua kansallisen ISNI-toiminnan koordinoijan asemaan. Tähänastisista saavutuksista merkittävin on ehkä Kansalliskirjaston ylläpitämässä Asteri-nimitietokannassa olevien henkilöiden ja yhteisöjen isnittäminen eli ISNI-tunnusten hankkiminen. Tätä kirjoitettaessa, kesäkuussa 2021, Kansalliskirjaston nimitietokannassa yli 80 prosentilla toimijoista on ISNI-tunnus (tämä tarkoittaa vähän yli 167 000 ISNI-tunnusta). Tärkeisiin saavutuksiin kuuluvat myös onnistunut verkostoituminen muiden ISNI-rekisteröintitoimistojen kanssa ja Kansalliskirjaston sisäisen ISNI-prosessin sujuvoittaminen.

Tässä artikkelissa sukelletaan ISNI-maailmaan, pysähdytään hetkeksi perusasioiden äärelle, kerrotaan tarkemmin, mitä on julkinen identiteetti ja miten nimiä hallinnoidaan. Tämän jälkeen analysoidaan Kansalliskirjaston ISNI-tunnuksiin liittyvän hakuprosessin vaiheita. Lisäksi selvennetään, miten ISNI-tunnus eroaa ORCID-tunnuksesta, jota myös käytetään toimijoiden identifioinnissa. Lopuksi pohditaan, miten ISNI-tunnusten käyttöä voitaisiin edistää Suomessa.

ISNI-tunnus ja julkiset identiteetit

ISNI-tunnuksen tarkoitus on erottaa julkiset identiteetit toisistaan. Julkisella identiteetillä tarkoitetaan kaikkia nimiä, joita toimija käyttää luodessaan, tuottaessaan, hallinnoidessaan ja välittäessään tietosisältöjä muun muassa viestintävälineissä. Yhden julkisen identiteetin takana ovat siis kaikki ne nimenmuodot, joilla toimija esiintyy julkisuudessa.

Yhdellä henkilöllä voi olla useampi julkinen identiteetti. Jos kirjailija julkaisee kirjoja sekä omalla nimellään että eri pseudonyymeillä tai taiteilijanimillä, hänellä on silloin useampi julkinen identiteetti. Ja jokaisella näistä kuuluu olla oma ISNI-tunnus.

Esimerkiksi

Se, mitä pidetään julkisena identiteettinä ja mikä ei, perustuu yksinkertaisesti siihen, mitä nimeä henkilö käyttää julkaisussaan. Joskus taiteilijat eivät käytä heidän todellista nimeään. Esimerkiksi Kauko Röyhkä on julkinen identiteetti, jolla on ISNI-tunnus (ISNI 0000000038670131), mutta nimen takana olevalla luonnollisella henkilöllä Jukka-Pekka Välimaalla ei ainakaan toistaiseksi ole omaa ISNI-tunnusta. Tässä tapauksessa sekä Kauko Röyhkä (taiteilijanimi) että Jukka-Pekka Välimaa (syntymänimi) yhdistyvät saman ISNI-tunnuksen alle, koska Välimaa ei ole julkaissut omalla nimellään kirjoja tai äänitteitä, eikä sitä voida ISNI-ajattelun mukaan nähdä julkisena identiteettinä.

Saman nimen eri muodot eli miten nimiä hallinnoidaan

Monet kirjastot ylläpitävät auktoriteetti- tai nimitietokantoja, joiden tarkoitus on ohjeistaa kuvailijoita käyttämään yhtä hakumuotoa tekijästä ja auttaa tiedonhakijoita haussa. Auktorisoinnin keskeinen ajatus on valita eri aineistoissa käytetyistä nimenmuodoista yksi, jota kuvailussa käytetään ensisijaisena hakumuotona. Muut nimenmuodot merkitään vaihtoehtoisiksi nimenmuodoiksi, joiden tarkoitus on ohjata tiedonhakijaa löytämään toimijan ensisijainen nimi ja sen kautta toimijaan liittyvät aineistot.

Auktorisoidut hakumuodot saattavat olla erilaisia eri maissa. Esimerkiksi Pjotr Tšaikovskin ensisijainen kirjoitusasu eli kirjaston kuvailukielellä auktorisoitu hakumuoto on Ranskan kansalliskirjastossa Čajkovskij, Petr Ilʹič, Kongressin kirjastossa Tchaikovsky, Peter Ilich, Kungliga bibliotekissa Tjajkovskij, Pjotr ja meillä Kansalliskirjastossa puolestaan Tšaikovski, Pjotr. Eri kansalliskirjastojen hakumuotoja voi selailla esimerkiksi VIAF-tietokannassa.

Jos eri tiedontoimittajat lähettävät ISNI-tietokantaan erilaisia kirjoitusasuja ja nimenmuotoja samasta toimijasta, ISNI-tunnus kokoaa nämä yhteen. Esimerkiksi yllä mainitun Pjotr Tšaikovskin nimestä on ISNI-tietokannassa tämän artikkelin kirjoitushetkellä 443 variaatiota, esimerkiksi

  • Pëtr Čajkovskij
  • Peter Tchaikovsky
  • Pjotr Tshaikovski
  • Peter Tjajkovskij
  • Петр Чайковский
  • Пётр Чайковский
  • 柴可夫斯基
  • شايكوفسكي، بيتر إيلت.

Kaikkia näitä variaatioita yhdistää yksi ISNI-tunnus: ISNI 0000000121449518. ISNI-tunnuksen ansiosta Tšaikovskin kirjoitusasun ei tarvitse olla identtinen tietokantojen välisessä tietoliikenteessä, jotta järjestelmät voivat tunnistaa halutun toimijan tiedot. ISNI-tunnus toimii sillanrakentajana eri tietokantojen välillä.

ISNI-tunnuksen avulla voi identifioida pysyvästi toimijoiden julkiset identiteetit eli ne nimen variaatiot, joilla esimerkiksi henkilö on tuottanut aineistoja. Toisin kuin Kansalliskirjaston ylläpitämässä Asteri-nimitietokannassa, ISNI-tietokannan tarkoituksena ei ole valita yhtä ensisijaista nimenmuotoa käytettäväksi henkilöstä tai yhteisöstä, vaan nimen eri variaatiot ja translitteroinnit listataan samanarvoisina. ISNI-tietokannassa muodostetun tunnuksen tarkoitus on yhdistää yhden julkisen identiteetin eri nimenmuodot yhden tunnisteen alle.

Yksi ISNI-tietokanta, monta tiedontoimittajaa

Uudet ISNI-tunnukset generoidaan yhdessä paikassa, Hollannin Leidenissa sijaitsevassa tietokannassa, jota ylläpitää ISNI Assignment Agency (ISNI-AA). Tietokannan tarkoitus on tuottaa luotettavasti ISNI-tunnuksia tiedontoimittajien lähettämien tietojen perusteella. ISNIn tiedontoimittajina toimivat käytännössä kaikki ISNI-verkostoon kuuluvat jäsenet mukaan lukien rekisteröintitoimistot. ISNI-verkostoon kuuluvat joidenkin kansalliskirjastojen lisäksi muiden muassa myös tekijänoikeusjärjestöt ja musiikintuottajat. Verkostoon kuuluvia organisaatioita voi tarkastella ISNIn verkkosivuilla (https://isni.org/page/isni-community/), Kansalliskirjasto on yksi rekisteröintitoimistoista. ISNI-tietokannan sisällöllisestä ylläpidosta ja korjauksista vastaa ISNI Quality Team, jossa Ranskan ja Iso-Britannian kansalliskirjastot ovat tärkeässä roolissa.

ISNI-tietokannan tavoitteena ei ole sisältää kattavia henkilötietoja tai täydellisiä bibliografioita, mutta tietokantaan lähetettävien tietojen tulee olla tarpeeksi yksilöivää ja sisältää laadukasta metadataa, joilla toimijoita voidaan erottaa toisistaan. Esimerkiksi henkilöiden kuvailussa keskeisiä tietoja ovat henkilön nimi, nimen erilaiset kirjoitusmuodot ja jonkinlainen otos henkilöön liittyvästä julkaisutuotannosta. Muita tietoja, jotka auttavat henkilön yksiselitteisessä identifioinnissa, ovat elinvuodet, henkilön täydellinen nimi, kansalaisuus ja henkilöön liittyvät yhteisöt.

Lähetysten kivinen tie

ISNI-projektin tavoitteena oli toimittaa Kansalliskirjaston nimitietokantaan tallennettuja kuvailutietoja toimijoista kansainväliseen ISNI-tietokantaan. ISNI-tunnuksia haluttiin kaikille nimitietokannassa oleville henkilöille ja yhteisöille, joita silloin oli vähän yli 170 000. Nykyisin luku on noin 200 000.

Koska yhteisöjä oli määrällisesti vähemmän kuin henkilöitä ja niiden lähettämisen oletettiin olevan helpommasta päästä, aloitettiin työskentely niistä. Nopeasti kuitenkin huomattiin, että oletus oli väärä: yhteisöjä koskevat kuvailusäännöt eivät nimittäin käyneet yhteen ISNIssä määriteltyjen vaatimusten ja käytäntöjen kanssa.

Esimerkiksi yhteisöön liittyvää maata ei ole aiemmin kirjaston kuvailutiedoissa katsottu olennaiseksi, mutta kansainvälisessä ISNI-tietokannassa tieto nähtiin välttämättömänä. Kansallisbibliografiaan on kuvailtu muitakin kuin suomalaisia yhteisöjä, minkä takia yhteisöön liittyvä maa jouduttiin päättelemään koneellisesti yhteisön nimen ja yhteisön käyttämän kielen perusteella. Päättelyssä toki käytettiin muitakin kriteereitä, ja lopuksi saatiin lisättyä tarvittavat tiedot dataan. Valitettavasti ongelmat eivät loppuneet tähän.

Seuraavan testilähetyksen tulosten perusteella päädyttiin siihen, että lopullisesta lähetyksestä jätetään suosiolla pois neljäsosa Kansalliskirjaston yhteisötietueista, sillä ne olisivat aiheuttaneet ongelmia ISNI-tietokannassa. Ongelmallisiksi osoittautuivat tässä erityisesti yhteisöt, joilla on edeltäjiä ja seuraajia. Jotta ISNI-tietokannassa vältyttäisiin tuplista, järjestelmä vertailee lähettäjien antamia tietoja (erityisesti toimijoiden ja teosten nimiä) ISNI-tietokannassa ennestään oleviin tietoihin. Koska yhteisöjen edeltäjien ja seuraajien nimet ovat usein samankaltaisia, järjestelmä halusi yhdistää ne yhdeksi yhteisöksi.

Esimerkkinä tästä on Helsingin normaalilyseo, jonka nimet ovat vaihtuneet useasti:

  • Helsingin Suomalainen Normaalilysee
  • Helsingin Suomalainen Normaalilyseo
  • Helsingin Normaalilyseo (1950–1974)
  • Helsingin I normaalikoulu
  • Helsingin normaalilyseo (1995–).

Nimien koneellinen vertailu halusi yhdistää erityisesti Helsingin normaalilyseon nykyisen nimen ja vuosina 1950–1974 käytössä olleen nimen samaksi yhteisöksi, kun näillä kummallakin oli vielä sama vaihtoehtoinen nimitys Norssi. Jotta tietueet eivät sekoittuisi, ISNI-tunnusta haettiin vain uusimmalle nimenmuodolle

Tällä hetkellä Kansalliskirjaston Asteri-nimitietokannassa olevista yhteisöistä vähän yli 75 prosentilla on ISNI-tunnus, mihin on syytä olla tyytyväinen. Kun uusia ISNI-tunnuksia haetaan yhteisöille, on syytä tiedostaa, että kirjastojen kuvailusääntöjen mukaan yhteisöjä käsitellään vähän eri tavalla kuin kaikille toimijoille tarkoitetussa ISNI-tietokannassa (esimerkiksi yhteisön nimenmuutos ei ole peruste uudelle ISNI-tunnukselle). Jatkossa on entistä tarkemmin mietittävä, milloin yhteisö muuttuu uudeksi yhteisöksi niin paljon, että sille halutaan uusi ISNI-tunniste. Jos yhteisön nimeen tulee vain pieniä muutoksia ja yhteisön toiminta pysyy samankaltaisena, uutta ISNI-tunnusta ei haeta, vaikka uudesta nimenmuodosta tehtäisiinkin kirjaston nimitietokantaan uusi tietue.

Kun henkilöiden liittyvien tietojen lähettäminen tuli lopulta ajankohtaiseksi, yhteisöjen testilähetysten tuloksista otettiin opiksi. Kirjaston nimitietokannassa on vanhoista kuvailukäytännöistä johtuen useita auktoriteettitietueita henkilöistä, joiden sukunimi oli muuttunut. Koska kyse oli yhteen julkiseen identiteettiin liittyvistä nimenmuodoista, henkilön identiteettiin liittyvät nimet yhdistettiin ohjelmallisesti kansainväliseen tietokantaan lähetettävään tiedostoon. Näin mittavien muutosten tekeminen ei olisi onnistunut suoraan Asteri-nimitietokannassa, mutta tiedonsiirron yhteydessä eri Asteri-tietueissa olevien nimien yhdistäminen oli suhteellisen helppoa. Esimerkiksi kirjailija Anja Snellman on julkaissut kirjoja nimillä Anja Kauranen, Anja Kauranen-Snellman ja Anja Snellman, ja kirjaston nimitietokannassa jokaiseen nimeen liittyy yksi auktoriteetti. Koska kaikki nämä nimet ovat todellisen henkilön todellisia nimiä, viennin yhteydessä nimet yhdistettiin ja Snellman sai yhden ISNI-tunnuksen. Tietueiden yhdistämisestä oli apua, ja selvitettävien tapausten määrä väheni selvästi. Tällä hetkellä vähän yli 80 prosentilla Asteri-nimitietokannassa olevilla henkilöillä on identifioiva ISNI-tunnus.

Myönnettyjen ISNI-tunnusten kattavuus ja haettavuus

Monivaiheisen prosessin ja monien nimitietokantaan tehtyjen täydennyskorjausten jälkeen kesän 2020 alussa suurin osan Asterin toimijatiedoista saatiin vietyä kansainväliseen ISNI-tietokantaan ja sieltä saadut ISNI-tunnukset täydennettyä Asteri-nimitietokantaan. ISNI-tunnusten kattavuus on tällä hetkellä noin 80 prosenttia. ISNI-tunnuksia on Asteri-nimitietokannassa reippaasti yli 165 000. Uurastaminen siis kannatti.

Kuviossa havainnollistetaan, että keväällä 2021 ISNI-tunnuksia on ollut Asterissa 82 %.

Kuvio 1: ISNI-tunnusten tilanne Asterissa keväällä 2021.

Ilman ISNI-tunnusta jäi siis vähän alle 20 prosenttia nimitietokannassa olevista toimijoista.

Noin 7 prosenttia lähetetyistä tietueista jäi ilman tunnusta, sillä niiden tiedot olivat liian niukat, jotta niillä pystyisi yksiselitteisesti identifioimaan julkisia identiteettejä ja erottamaan esimerkiksi kaksi samannimistä toisistaan. Tällaisissa tapauksissa kirjaston auktoriteettitietueessa ei ole muita tietoja kuin nimi. ISNI-tunnus voidaan saada myöhemmin, jos Asterissa olevia tietoja tarkennetaan tai jos joku toinen tiedontuottaja toimittaa kansainväliseen ISNI-tietokantaan tietoja, joiden perusteella voidaan päätellä, että kyseessä on sama toimija.

Lisäksi lähettämättä jäi noin 11 prosenttia nimitietokannassa olevista tietueista. Näiden joukossa ovat edellä mainitut yhteisöjen edeltäjät, joille ei haluttu omaa ISNIä ja tekijät, joihin on viitattu ainoastaan teosten aiheena ja jotka eivät ole osallistuneet teosten tekemiseen.

Tällä hetkellä uusia tietueita ISNI-tietokantaan toimitetaan säännöllisin väliajoin. Toimijoiden nykyinen kuvailutaso täyttää ISNIn määrittämät laatuvaatimukset, ja uusille toimijoille saadaan ISNI-tunnukset erittäin todennäköisesti.

Kansalliskirjaston tietojärjestelmiin tallennetut toimijoiden julkisten identiteettien ISNI-tunnukset ovat kaikkien vapaasti käytettävissä. ISNI-tunnuksia voi hakea toimijan nimellä Kanto-nimisestä tietoresurssista (http://finto.fi/finaf) tai Kansalliskirjaston hakupalvelusta (https://kansalliskirjasto.finna.fi/Authority).

ISNI- ja ORCID-tunnukset: kuin kaksi marjaa?

ISNI on lyhenne sanoista International Standard Name Identifier ja ORCID puolestaan Open Researcher and Contributor ID. Joskus ISNIstä puhutaan nimitunnisteena ja ORCIDista tutkijatunnisteena. Tunnisteilla on paljon yhtäläisyyksiä mutta myös joitakin eroja.

Molemmat ovat pysyviä ja yksilöiviä tunnisteita, joiden tarkoitus on sama eli erottaa samannimiset henkilöt toisistaan, yhdistää nimien erilaiset kirjoitusasut ja ratkaista muitakin nimen eri muotoihin liittyviä sekaannuksia. Molemmat tunnukset muodostuvat 16 merkistä ja molempien käyttö yleistyy maailmalla.

Erojen lista on vähintään yhtä pitkä. Siinä missä ORCID on tarkoitettu lähinnä tutkijoiden käyttöön, ISNI voidaan antaa sekä tieteellisen että taiteellisen luovan työn tekijöille (mm. kirjoittajat, säveltäjät, tutkijat, kustantajat). Kun ORCID-tunnus on suunnattu pääasiassa elossa oleville tieteentekijöille, ISNIä voidaan puolestaan hakea sekä yhteisöille että henkilöille ja sen avulla voidaan identifioida sekä edesmenneitä että eläviä henkilöitä. ORCID-tunnuksen voi hakea itse, mutta ISNI-tunnuksen pystyy hakemaan joko ISNI-organisaation tai rekisteröintitoimiston kautta. Koska ISNI-tunnuksia luodaan keskitetysti, toimija ei välttämättä aina tiedä, että hänellä on ISNI-tunnus. Suomessa ORCID-koordinaattorina toimii CSC, ISNI-toiminnasta vastaa puolestaan Kansalliskirjasto.

On tärkeätä, että molempien tunnusten käyttöä edistetään, koska nämä auttavat tekijöiden yksiselitteisessä identifioinnissa.

Kansalliskirjasto ISNI-toiminnan koordinoijana

Kansalliskirjaston tavoitteena on suomalaisten tieteellisen ja taiteellisen luovan työn toimijoiden julkisten identiteettien luotettava identifiointi ISNI-tunnistejärjestelmän avulla. Toimijoiden itsensä lisäksi tästä hyötyvät myös muun muassa kirjastot, arkistot, museot sekä kustantajat ja tekijänoikeusjärjestöt.

Tavoitteenamme on, että ISNI-tunnukset leviävät mahdollisimman laajasti käyttöön. Jotta ISNI-tunnukset leviäisivät mahdollisimman varhaisessa vaiheessa jakelutietojen mukana, kustantajien ja metadatavälittäjien on oltava mukana ISNI-toiminnassa. Tiedon laatu on tärkeässä asemassa, sillä laadukas metadata mahdollistaa tietojen vaihdon ja takaa ISNI-tunnuksen luotettavuuden.

Kansalliskirjasto pyrkii edistämään ISNIn käyttöönottoa ja rakentamaan ISNI-toiminnan ympärillä yhteistyöverkoston kansallisista toimijoista. Toimintaan liittyvät toimintamallit ja prosessit ovat vielä kesken, mutta kiinnostusta ja tahtoa näyttää olevan.

Kirjoittajat:

Martin Engberg, tietoasiantuntija. Kansalliskirjasto, kirjastoverkkopalvelut

Katerina Sornova, tietoasiantuntija. Kansalliskirjasto, kirjastoverkkopalvelut
https://orcid.org/0000-0002-4589-0751

Okko Vainonen, tietojärjestelmäasiantuntija. Kansalliskirjasto, kirjastoverkkopalvelut
https://orcid.org/0000-0002-2662-7333

Kirjoittajien sähköpostiosoitteet ovat muodossa [email protected].

Lisätietoja:

Tietopaketti ISNIstä: https://www.kiwi.fi/x/NAAOCw

Aiemmin kirjoitettua:

Puuska, Hanna-Mari (2016). ORCID-tunnisteen käyttöönotto yleistyy. Tietolinja 2016/1, http://urn.fi/URN:NBN:fi-fe201602105318.

Huttunen, Maarit (2012). Kansallinen ISNI-hanke: Nimien kansainvälisen standarditunnuksen käyttöönotto. Tietolinja 2012/2, http://urn.fi/URN:NBN:fi-fe2012121410309.

Hakala, Juha (2010). ISNI (International Standard Name Identifier): johdatus julkisten toimijoiden tunnistamiseen. Tietolinja 2010/1, http://urn.fi/URN:NBN:fi-fe201005211890.

 

 

 

Leave a Reply

This site uses Akismet to reduce spam. Learn how your comment data is processed.