ISNI (International Standard Name Identifier): johdatus julkisten toimijoiden tunnistamiseen

Juha Hakala
Kansalliskirjasto
Kansainvälisen ISNI -työryhmän jäsen

Tämän artikkelin pysyvä osoite on: http://urn.fi/URN:NBN:fi-fe201005211890

 
ISO (The International Organization for Standardization) [1] kehittää ISNI-tunnusta eli International Standard Name Identifieria (ISO 27729) julkisten toimijoiden (public identities of parties) yksiselitteiseen tunnistamiseen. Luonnosversio standardista on ollut lausuntokierroksella talvella 2009-2010. Tarkempaa tietoa löytyy hankkeen verkkosivuilta osoitteesta http://www.isni.org/ [2], jossa on oma osionsa myös usein kysytyille kysymyksille [3]. Tässä artikkelissa kuvataan itse standardia ja sen soveltamiseen liittyviä haasteita.

Julkiset toimijat

ISNI-tunnuksen päätavoite on mahdollistaa julkisten toimijoiden tunnistaminen yksiselitteisesti silloin kun on olemassa sekaannuksen vaara. Esimerkiksi Suomen kansallisbibliografiassa on kuusi eri Juha Hakala -nimistä tekijää, jotka nyt on erotettu toisistaan numeroinnilla (ks. [6]). Koska henkilön syntymä- ja kuolinvuosi ovat Suomen tietosuojalain mukaan luottamuksellista tietoa kunnes henkilön kuolemasta on kulunut 100 vuotta, näitä tietoja ei voi näyttää käyttöliittymässä eikä välittää kansainvälisessä auktoriteettitietojen vaihdossa esim. OCLCn kanssa.

Fennicassa Juha Hakalat on eroteltu toisistaan, vaikkakaan ei asiakkaiden kannalta kovin informatiivisesti. WoldCat -tietokannassa kaikki Juha Hakalat näyttäytyvät yhtenä henkilönä, koska erotteluun käytettävää syntymävuotta ei voida lähettää OCLC:lle. ISNI tarjoaa kansainvälisesti ainutkertaisen pysyvän tunnisteen, jolla tällainen erottelu voidaan tehdä tehokkaasti. ISNIn käytössä ei ole tietosuojaongelmia, joten se voidaan liittää auktoriteetti- ja bibliografisiin tietueisiin. Tulevaisuudessa suurin osa bibliografisista järjestelmistä pystynee käsittelemään ISNI-tunnuksia, jos standardi ”lyö itsensä läpi”.

ISNIn käyttösäännöt ovat yksinkertaiset, ainakin teoriassa. Mutta on tärkeää ensin ymmärtää, mihin ”julkisen toimijan tunnistetta” on tarkoitus soveltaa. ”Toimija” (party) on geneerinen termi, jolla viitataan luonnolliseen tai juridiseen henkilöön tai kuvitteelliseen hahmoon, tai mihin tahansa näistä koostuvaan ryhmään. Niin kuolleet kuin elävätkin luonnolliset henkilöt voidaan tunnistaa ISNIn avulla – tunnus voidaan antaa takautuvasti vaikkapa Homerokselle. ”Julkinen toimija” on identiteetti, jota luonnollinen henkilö / henkilöt tai organisaatio haluaa käyttää julkaisutoiminnassa. Esimerkiksi Frederic Dannay ja Manfred B. Lee käyttivät identiteettiä Ellery Queen julkaistessaan – käännökset huomioon ottaen – kaikkiaan 1238 teosta yhteensä 3390 julkaisussa 31 kielellä (ks. [7]).

Saman julkisen toimijan eri kirjoitusmuodot saavat saman ISNI-tunnuksen. Tämä koskee myös eri merkistöjä ja translitterointeja. On monia tapoja kirjoittaa nimi Anton Pavlovic Cehov – pitkä mutta tuskin täydellinen lista eri variaatioista löytyy OCLCn nimiauktoriteettitiedostosta [8]) – mutta nämä kaikki variaatiot viittaavat samaan julkiseen toimijaan ja siksi niille pitää antaa sama ISNI-tunnus.

Toimijalla voi olla useita julkisia identiteettejä. Esimerkiksi tuotantonsa varhaisvaiheessa mainittu Anton Cehov julkaisi teoksensa salanimellä Antosa Cehonte. Antosa Cehonte saa oman ISNI-tunnuksen, toisin kuin esimerkiksi Anton Tšehov, joka on yleinen kirjailijan oikeasta nimestä käytetty kirjoitusasu Suomessa. Tällaisia variaatioita on useita riippuen translitterointijärjestelmästä ja kansallisista käytänteistä. Täydellisen ISNI-viitetietokannan (ks. edempänä) avulla voidaan yhdellä haulla saada tulosjoukkoon kaikki nämä nimen eri variaatiot, mukaan lukien saman henkilön muut julkiset identiteetit. Jälkimmäiset saadaan mukaan linkittämällä nämä ISNI-tunnukset keskenään viitetietokannassa.

Periaatteessa ISNI-tunnus voidaan antaa kaikille luonnollisille ja juridisille henkilöille maan päällä, mutta käytännössä järjestelmä tullaan rajaamaan henkilöihin ja yhteisöihin, jotka ovat tavalla tai toisella tekemisissä henkisen luomistyön kanssa. Kaikki kuusi yllämainittua Juha Hakalaa ovat kirjoittaneet yhden tai useampia tekstimuotoisia teoksia ja voivat näin ollen saada oman ISNI-tunnuksen, mutta on olemassa iso joukko muita Juha Hakaloita, joille tällaista tunnusta ei tarvitse antaa ennen kuin hekin ovat julkaisseet jotain. Tästä käyttörajoituksesta johtuen ISNI-tunnus ei haasta tai korvaa muita olemassa olevia henkilötunnuksia kuten sosiaaliturvatunnusta.

Ajatus kehittää tunnistejärjestelmä kulttuurialan julkisille toimijoille ei suinkaan ole uusi. Esimerkiksi ISADN-tunnusta (International Standard Authority Data Number) ehdotettiin jo vuonna 1984. Kirjastot kuitenkin päättivät tuolloin olla luomatta uutta tunnistejärjestelmää ja keskittyivät sen sijaan määrittelemään auktoriteettitietojen funktionaalisia vaatimuksia (ks. Patton [4]). Nimien disambiguaatiolla on kuitenkin vieläkin pitempi historia, jonka kuluessa on kehitetty toinen toistaan sofistikoidumpia sääntöjä (ks. esim. saksalaiset ohjeet [9]). Vaikka ISNI-tunnuksessa ei voidakaan uusiokäyttää olemassa olevia nimitunnisteita (ISNIn rakenne ei mahdollista tätä) auktoriteettitietokannat, kuten Saksan kansalliskirjaston Personennamendatei (PND), voivat tarjota metatietoja ISNI-järjestelmään.

ISNIn rakenne

ISNI-tunnusta kehittävä työryhmä joutui valitsemaan kahden vaihtoehdon välillä: joko tunnuksesta tulee semanttinen (rakenne sisältää tulkittavissa olevan merkityksen) tai ei-semanttinen (”tyhmä”). Olemassa olevista standarditunnisteista ISBN edustaa edellistä tyyppiä, ISSN puolestaan jälkimmäistä. Vahvin vaihtoehto semanttiseksi tunnukseksi olisi alkanut maakoodilla. Tämä olisi mahdollistanut hajautetun tunnusten jakelun, mutta siitä olisi voinut aiheutua myös sekaannusta, jos kaksi maata kumpikin antaa oman ISNI-tunnuksen henkilölle, joka on ”toiminut julkisesti” molemmissa maissa.

Keskitetysti annettu ”tyhmä” ISNI-tunnus ei liity kansallisuuteen eikä alueeseen, eikä tunnuksen antaminen monessa kulttuurissa toimineille kuuluisille taiteilijoille näin ollen ole ongelmallista. Itävallan, Unkarin ja Saksan ei tarvitse kiistellä siitä kenelle ”kuuluu” Franz Liszt – tai Ferenc Liszt – koska ISNI ei ota kantaa tähän kysymykseen: nimen kaikki variantit – molemmat tässä mainitut ja muualla käytetyt muut muodot – ovat yhdenvertaisia ja itse ISNI ei ilmaise kansallisuutta, ei ainakaan rakenteen tasolla.

ISNI-tunnus muodostuu 16 merkistä, mutta mahdollistaa vain sadan triljoonan tunnuksen antamisen, koska viimeisin merkki on tarkistusmerkki. Työryhmä uskoo ilmeisen hyvin perustein, että, toisin kuin ISBNn kohdalla kävi, nämä tunnukset eivät lopu kesken muutamassa vuosikymmenessä, eivät edes vuosisadassa.

Kirjoitettuna ISNI-tunnus näyttää tältä:

ISNI 1422 4586 3573 0476

tai tältä:

ISNI 3456 7890 3456 666X

Oman ISNI:n muistaminen ulkoa ei tule onnistumaan aivan kaikilta…

ISNI-tunnusten hallinnointi

ISNI-järjestelmää hallinnoi kansainvälinen rekisteröintitoimisto Registration Authority (RA). Rekisteröintitoimiston vastuulla on rakentaa ISNI-tunnusten viitetietokanta ja ylläpitää sitä. Se huolehtii myös itse ISNI-standardin hallinnoinnista. Tätä elintä ei vielä ole nimetty, mutta ehdolla tehtävään on konsortio, jonka jäsenillä on runsaasti käytännön kokemusta nimitietokantojen ylläpidosta. Ehdokkaan valitsee ISO TC 46 SC9 ja nimityksen vahvistaa virallisesti ISO:n Technical Management Board.

ISNI-rekisteröintitoimiston lisäksi järjestelmää hallinnoivat ISNI-keskukset eli elimet nimeltä ISNI Registration Agencies (RAGs). Ne nimittää kansainvälinen ISNI-keskus eli ISNI International Agency (joka toimii samalla rekisteröintitoimistona) ja niiden päätehtävänä on toimia välittäjinä kansainvälisen keskuksen ja käyttäjien välillä. Yksittäisiä toimijoita edustaa aina joku ISNI-keskus, he eivät voi asioida suoraan rekisteröintitoimiston kanssa. Mikä tahansa yhteisö, joka todistettavasti on kiinnostunut ISNI:n toimialasta, voi saada ISNI-keskus -oikeudet. Yksinoikeutta ei voi saada sen enempää maantieteellisen alueen kuin markkinasektorinkaan (esim. kirjateollisuus, musiikkiteollisuus) perusteella. ISNI- rekisteröintitoimisto voi kuitenkin määritellä erilaisia luokkia ISNI-keskuksille antaen niille oikeuksia edustaa erilaisia toimijoita [5, s. 6]. Vielä ei ole selvää miten nämä luokat määritellään ja millaisiin sääntöihin niiden oikeudet tulevat perustumaan.

Koko ISNI-järjestelmän toimivuus tulee olemaan hyvin riippuvainen viitetietokannan laadusta. Alusta alkaen sen pitäisi olla niin kattava ja virheetön kuin mahdollista. ISNI-keskuksilla tulee olemaan dataan vain lukuoikeudet. Vain ja ainoastaan rekisteröintitoimisto pystyy lisäämään, muuttamaan tai poistamaan ISNI-metadataa. Tämä tapahtuu ISNI-keskusten anomusten perusteella.

ISNI-rekisteröintitoimistona toimivan kansainvälisen ISNI-keskuksen perustajajäsenet ovat:

  • CISAC – International Confederation of Societies of Authors and Composers
  • IFRRO – International Federation of Reproduction Rights Organisations
  • IPDA – International Performers’ Database Association
  • Bowker
  • OCLC – Online Computer Library Center
  • Bibliothèque Nationale de France ja
  • The British Library

Näillä järjestöillä / organisaatioilla on jo nyt valtavat julkisten toimijoiden rekisterit – tai nimiauktoriteettitietokannat, kuten kirjastoissa on tapana niitä kutsua. ISNI-tietokannan rakentaminen ja tunnusten luomisen aloittaminen tulee silti olemaan suuri ponnistus, mutta näiden ehdokkaiden avulla järjestelmä saisi tukevan perustan. Sen jälkeen kaikki riippuu ISNI-keskuksista. Koska maaliskuussa päättyneellä äänestyskierroksella kukaan ei vastaustanut standarditekstin julkaisemista eikä esittänyt siihen merkittäviä muutoksia, ensimmäiset ISNI-keskukset voitaneen nimetä jo 2010.

ISNI metadata

Kun ISNI-keskus anoo ISNI-tunnusta, sen täytyy toimittaa rekisteröintitoimistolle ISNI-metadata jokaisesta tunnistettavasta julkisesta toimijasta. Tämän metadatan pitää olla kyllin yksityiskohtaista, jotta toimija voidaan erottaa muista viitetietokannassa. ISNI-keskusten on myös tarkistettava viitetietokannasta, että kyseinen toimija ei vielä ole saanut ISNI-tunnusta. Tällainen tarkistus säästää sekä aikaa että rahaa: ISNI-tunnukset eivät kenties ole ilmaisia vaikka rekisteröintitoimisto (ja ISNI-keskukset itse) toimivat samalla voittoa tuottamattomalla periaatteella kuin kaikki ISO-standardit. Vaikka ISNI-tunnus olisikin jo myönnetty, ISNI-keskukset voivat halutessaan lisätä eri kirjoitusasuja tai muokata ISNI-tunnusta tai täydentää siihen liittyvää metadataa.

Ongelmiakin syntyy väistämättä: yksi julkinen toimija saattaa erehdyksessä saada useita ISNI-tunnuksia, jos viitetietokannassa ei pystytä yhdistämään nimen eri muotoja oikein toisiinsa, ja yksi julkinen toimija (kuten esimerkiksi Juha Hakala) voidaan joutua jakamaan useaksi eri toimijaksi. Rekisteröintitoimiston vastuulla on korjata tällaiset ongelmatapaukset.

ISNI-tunnuksen metadatassa on vain kolme pakollista elementtiä: julkisen toimijan nimi, toimijan tyyppi (luonnollinen henkilö, juridinen henkilö jne.) ja yksi tai useampi seuraavista elementeistä:

  • 1. URI, konelukuinen linkki ulkoiseen tietueeseen, joka sisältää tiedon kohdissa 2) ja 3) mainitusta teosluokasta ja/tai roolista
  • 2. Teosluokka, poimitaan ISNI-rekisteröintitoimiston julkaisemalta sallittujen teosluokkien listalta (esim. musiikkiteos, kirjallinen teos, audiovisuaalinen teos).
  • 3. Rooli, jossa toimija on ollut teosta luotaessa, poimitaan ISNI-rekisteröintitoimiston julkaisemalta roolilistalta (esim. kirjoittaja, julkaisija, ohjaaja).

Esimerkiksi Juha Hakala on ollut kirjoittajana useissa kirjallisissa teoksissa, mukaan lukien tämä artikkeli.

Tämä metadata ei aina riitä toimijoiden erottelemiseen toisistaan. ISNI-rekisteröintitoimiston vastuulla on lisätä, mahdollisesti yhden tai useamman ISNI-keskuksen pyynnöstä, ISNI-tunnuksen metadatatietueeseen kaksi lisäelementtiä: aikamääre tyyppeineen sekä paikka tyyppeineen. Aikamääre voi olla syntymä- tai kuolinvuosi tai molemmat, kun kyseessä on henkilö, tai organisaation perustamis- ja lakkautusvuosi. Paikka voi olla esimerkiksi syntymä- tai kuolinmaa tai maa, jossa henkilö asui taiteellisen kukoistuskautensa aikana. Standardin täydennykseksi laaditaan kattava lista paikka- ja aikamääreiden sallituista arvoista.

Kahta lisäelementtiä voi vielä käyttää täydentämään rekisteröintitoimistolle lähetettävää auktoriteettitietuetta. ISNI rekisteröintitoimisto voi määritellä seuraavat tiedot, joko oma-aloitteisesti tai yhden tai useamman ISNI-keskuksen pyynnöstä:

  • Liittyvä ISNI, toisen kyseiseen identiteettiin liittyvän julkisen toimijan ISNI-tunnus.
  • Suhde, ISNI-rekisteröintitoimiston sallima arvo, joka kuvaa kyseistä suhdetta (esim. käyttämä salanimi).

Näiden elementtien avulla voidaan linkittää julkisia toimijoita toisiinsa.

ISNI-tunnuksen metadata on jonkin verran yksinkertaisempaa verrattuna joihinkin jo olemassa oleviin järjestelmiin, kuten saksalaiseen PND:hen. Vielä ei ole selvää tuleeko tämä mahdollisesti aiheuttamaan ongelmia toimijoiden erottelemisessa toisistaan.

ISNI-rekisteröintitoimisto laatii ohjeet viitetietokannan metadatan päivittämiseen. Tämä tulee olemaan jokseenkin haasteellista, koska ISNI-rekisteröintitoimisto joutuu korjaamaan virheitä ja ratkaisemaan ISNI-keskusten lähettämien ISNI-tunnushakemusten välisiä ristiriitoja. Ei ole mitenkään helppoa löytää kaikkia julkisen toimijan nimen eri kirjoitusasuja, koska ongelmat voivat olla lähtöisin kansalliselta tasolta. Kustaa Mauri Armfelt ja Gustav Mauritz Armfelt ovat yksi ja sama henkilö, mutta nämä ja kyseisen julkisen identiteetin mahdolliset muut kirjoitusasut saavat eri ISNI-tunnukset ellei kirjoitusasuja yhdistetä samaan nimiauktoriteettitietueeseen ennen datan lähettämistä rekisteröintitoimistoon.

Algoritmien kehittäminen eri varianttien automaattista siltausta varten voi olla vaikeaa, varsinkin silloin kun erot kasvavat suuriksi. Useimmat saksalaiset ja noin puolet suomalaisista voivat helposti arvata kuka on Michaelis Schumacheris, vaikka nimen latvialainen kirjoitusasu eroaa alkuperäisestä, mutta algoritmi ei välttämättä tunnista sellaisiakaan kirjoitusasuja, joka ihmiselle ovat ilmiselviä. Kiinalaiset ja japanilaiset variantit voivat puolestaan tuottaa vaikeuksia ihmisillekin, kun ne on translitteroitu latinalaisin kirjaimin.

Lopuksi

Jo ennen kun ISOn piirissä aloitettiin ISNI-tunnuksen kehittäminen, oli kirjastoalalla keskusteltu nimiauktoriteettien tunnisteesta. Nämä keskustelut eivät olleet kovin hedelmällisiä johtuen ennen muuta siitä, että järjestelmän rakentamisen haasteet tuntuivat liian suurilta.

Lopulta standardointiponnistukseen tarvittiin kirjailija- ja säveltäjäjärjestöjen, kirjateollisuuden ja kirjastojen yhteistyötä. ISNI-standardin hyväksyminen ISO-standardiksi tulee viemään aikaa (nyt ollaan vasta DIS- eli luonnosvaiheessa) eikä tarvittavaa teknistä infrastruktuuria ole rakennettu, mutta työryhmän jäsenenä suhtaudun silti optimistisesti siihen, että tästä hankkeesta syntyy jotain hyödyllistä. Järjestelmä ei heti alkuun ole täydellinen, mutta ISNI-rekisterin ei tarvitsekaan olla täydellinen ollakseen hyödyllinen. Kun ISNI-tietokanta julkistetaan, siellä on varmasti virheitä ja puutteita, mutta rekisteröintitoimiston ja ISNI-keskusten tiiviillä yhteistyöllä järjestelmän laatua ja kattavuutta voidaan parantaa.

Maissa, joissa henkilökohtaista tietosuojaa pidetään tärkeänä, on syytä selventää ennen ISNI-järjestelmän käyttöönottoa, mitä henkilökohtaisia tietoja voidaan toimittaa ISNI-rekisteröintitoimistolle rikkomatta tietosuojalakia. Suomessa Kansalliskirjastolla ei ole oikeutta välittää yhteistyökumppaneilleen tietoja kirjailijan syntymä- ja kuolinvuosista, mutta ISNIn keskustietokanta saattaisi mahdollisesti olla poikkeustapaus. ISNI-tietokanta ei sellaisenaan ole julkisesti saatavilla samaan tapaan kuin kirjastojen näyttöluettelot, koska vain ISNI-keskuksilla on siihen lukuoikeudet (tosin vielä ei ole määritelty, miten tämä käytännössä toteutetaan), ja ainakin teoriassa jotkut metadataelementit voidaan määritellä näkymään vain sille ISNI-keskukselle, joka tiedot on toimittanut.

Lähteet

[1] http://www.iso.org/iso/home.htm
[2] http://www.isni.org/
[3] ISNI Frequently Asked Questions. Version 2.0 November 2009. Electronic resource, available at http://www.isni.org/docs/isni_faq.pdf. (checked 2009-11-22).
[4] Patton, Glenn: FRANAR: A Conceptual Model for Authority Data. Electronic resource, available at http://www.sba.unifi.it/ac/relazioni/patton_eng.pdf (checked 2009-12-14).
[5] ISO/DIS 27729. International Standard Name Identifier. Geneva, International Organization for Standardization, 2009.
[6] https://fennica.linneanet.fi/
[7] http://www.worldcat.org/wcidentities/lccn-n79-139599
[8] http://www.worldcat.org/wcidentities/lccn-n79-130807
[9] http://www.d-nb.de/standardisierung/pdf/praxisregel_individualisierung_911.pdf

 

Kirjoittajan yhteystiedot

Juha Hakala, kehittämisjohtaja
Kansalliskirjasto
PL 15, 00014 HELSINGIN YLIOPISTO
Sähköposti: juha.hakala (at) helsinki.fi