Meillä on vain nimet : URN-tunnukset helpottavat tiedonhakua

Esa-Pekka Keskitalo
Kansalliskirjasto

Tämän artikkelin pysyvä osoite on: http://urn.fi/URN:NBN:fi-fe20071298

 

Stat rosa pristina nomine, nomina nuda tenemus.

 

Verkkojulkaisut tarvitsevat tunnuksia

URN-tunnukset (URN = Uniform Resource Name) ovat verkossa julkaistaville dokumenteille annettavia pysyviä, ainutkertaisia tunnisteita. Niiden avulla voidaan helpottaa dokumenttien tunnistamista, löytämistä ja linkittämistä. URN-tunnukset täydentävät WWW-osoitteita verkkoaineistoihin viittaamisen ja linkittämisen välineenä, aivan kuten ihmisten nimet ja osoitteet täydentävät toisiaan. Nimi yksin ei riitä henkilön tavoittamiseen vaan tarvitaan myös osoite, jonka voi saada selville nimen perusteella; nimet pysyvät vaikka osoitteet muuttuvat; ihminen ei muutu toiseksi, vaikka hänen osoitteensa muuttuu. URN-tunnuksiin liittyy lisäksi myös toiminnallisuus, joka helpottaa siirtymistä viitteestä kohteeseen.

Erilaisia tunnisteita on käytetty kustannustoiminnassa, kirjakaupoissa ja kirjastoissa jo vuosia, ja ne ovat nykyään lähes välttämätön osa kirja-alan toiminnassa. Verkkojulkaisemisessa tunnusten käyttö on alkanut yleistyä vasta vähitellen. Verkkojulkaisuihin viitataan yleensä niiden WWW-osoitteella. Se on nimenomaan osoite, ei tunnus. Osoitteella identifioiminen aiheuttaa kaikille tuttuja ongelmia, kun dokumentin sijainti muuttuu. Parhaassa tapauksessa linkki menee rikki – pahimmassa tapauksessa dokumentti on korvattu toisella, jonka eroa alkuperäiseen on vaikea äkätä. Samaan aikaan oikea dokumentti saattaa olla saatavilla monessakin muussa paikassa. Selkeän tunnistejärjestelmän ja siihen liittyvien palveluiden avulla näitä ongelmia voidaan lievittää.

Verkkojulkaisemisen piiriin on syntynyt useitakin järjestelmiä, joista tunnetuimpia ratkaisuja lienevät Handle, siihen perustuva DOI sekä PURL. DOI:n taustalla oleva säätiö on melko lailla suurten kansainvälisten tiedekustantajien määräysvallassa. Handlea hallitsee CNRI (Corporation for National Research Initiatives) ja PURLia OCLC (Online Computer Library Center); molemmat yhdysvaltalaisia organisaatioita.

Teknisesti kaikki järjestelmät toimivat samalla tavalla. URN poikkeaa muista siinä, että sen ylläpito ja hallinnointi kuuluu tyypillisesti kansalliskirjastoille, eli se on tavallaan julkinen palvelu, kuten julkaisualalla vanhastaan käytetyt tunnistestandardit.

URN kierrättää tuttuja tunnisteita

URN-tunnukset tunnistaa aina alun ”URN:”-osasta. Sen jälkeen tunnuksessa määritellään käytetty tunnusjärjestelmä eli nimiavaruus, ja sen jälkeen tuon nimiavaruuden sääntöjen mukaan annettu identifioiva osa:

urn:nbn:ch:bel-9373

urn nbn ch:bel-9373
kiinteä osa nimiavaruus identifioiva osa

URN-tunnus sisältää aina jonkin muun tunnuksen! Standardi ei lainkaan sisällä mekanismia tunnusten luomiseen, vaan siinä käytetään hyväksi olemassa olevia tunnusjärjestelmiä. URN-tunnusten käyttöönotto ei siis vaikuta mitenkään ISBN- ja ISSN-tunnusten antamiseen, vaan siinä noudatetaan aivan samoja periaatteita kuin ennenkin.

URN-tunnuksen luomisessa mahdollisia tunnusjärjestelmiä on lukuisia, mutta useimmat niistä eivät ole olennaisia kirjastoissa. Kukin meistä voisi ilmaista mm. pankkitilinsä numeron URN-tunnuksena! Julkaisujen kannalta tärkeitä nimiavaruuksia ovat ISBN ja ISSN. ISBN-numero annetaan dokumentille, joka sisällöltään vastaa kirjaa ja on tarkoitettu julkiseen käyttöön. ISSN-numero taas kuuluu jatkuvasti ilmestyville julkaisuille, kuten lehdille, sekä jatkuvasti päivitettäville julkaisuille, esim. verkkolehdille. Näistä muodostetaan URN-tunnus yksinkertaisten sääntöjen mukaan:

ISBN 978-951-98479-4-8 -> URN-tunnus URN:ISBN:978-951-98479-4-8
ISSN 1456-2979 -> URN-tunnus URN:ISSN:1456-2979

NBN täydentää tunnusvalikoimaa

Verkossa pelkät ISBN- ja ISSN-tunnukset eivät kuitenkaan riitä. Suuri osa tunnuksia tarvitsevista dokumenteista ei suinkaan täytä kirjan sen enempää kuin jatkuvan julkaisunkaan tunnusmerkkejä. Tyypillisesti tunnusta kaipaa yksittäinen, artikkelinomainen dokumentti. Verkossa julkaistavat gradut ja muut pienemmät opinnäytteet myös tarvitsevat tunnuksen mutta eivät voi saada ISBN-numeroa. Näissä tapauksissa voi käyttää NBN-numeroa (National Bibliographic Number), joita kansalliskirjastot voivat jaella. NBN-numeron julkaisulle voi hankkia kahdella tavalla. Ensinnäkin Kansalliskirjastolla on verkossa URN-generaattori, josta kuka tahansa voi käydä noutamassa ainutkertaisia, NBN-numeroon perustuvia URN-tunnuksia. Toisaalta julkaisija voi saada oman NBN-alinimiavaruuden, jolloin se voi hoitaa tunnusten jakelun itsenäisesti. Tämä on hyvä vaihtoehto, jos tunnusten jakelua halutaan automatisoida. – Korostettakoon vielä, että NBN-numeroilla ei voi eikä kannata korvata ISBN- tai ISSN-numeroita, vaan eri järjestelmät täydentävät toisiaan.

NBN-numeron perusteella muodostettu URN-tunnus näyttää tältä:

URN:NBN:fi-fe20071259 (Kansalliskirjastolta saatu tunnus)
URN:NBN:fi:stadia-1177406026-3 (korkeakoulun omasta nimiavaruudesta annettu)

Vain oikein käyttö on hyödyksi

NBN-numeroiden käyttö vaatii samaa vastuullisuutta kuin ISBN- ja ISSN-numeroiden. Ensinnäkin tulee pitää huolta siitä, että samaa NBN-numeroa ei anneta kahdelle dokumentille. Samalle dokumentille ei myöskään tule yleensä antaa kahta tunnusta, sen enempää kahta NBN-numeroa kuin sekä NBN-numeroa että ISBN-numeroa. Saman dokumentin kopioilla on luonnollisesti sama NBN-numero (myös, jos ne eroavat toisistaan esim. tiedostomuodoltaan).

Toiseksi: dokumenttia ei sovi mennä sormeilemaan numeron antamisen jälkeen. Jonkin vähäisen pilkkuvirheen korjaaminen lienee hyväksyttävissä, mutta mitä tehdä, jos on sattunut kirjoittamaan v. 1232 solmitusta Pähkinäsaaren rauhasta dokumentissa? Mikä on siihen vetoavan kirjoittajan tilanne, jos vuosiluku käydäänkin vaivihkaa oikaisemassa? Kaikki tilanteet kattavia ohjeita on vaikea antaa, mutta tarkkaa harkintaa on syytä harjoittaa.

Numerosarjasta toimivaksi linkiksi

Voimme siis antaa verkossa julkaistaville dokumenteille ainutkertaisia tunnisteita. Että dokumentilla on määrämuotoinen, ainutkertainen identifikaatiotunnus, on tietenkin hyödyllistä. Tiedonhakija voi yhdellä silmäyksellä tarkistaa, onko verkosta löytynyt dokumentti oikea, jos URN-tunnus käy ilmi kirjallisuusviitteestä. URN-tunnuksen käyttö hakukoneessa hakuterminä tuottaa yleensä melko täsmällisiä hakutuloksia.

Mutta tämä ei vielä riitä. Tiedonhakijat kuitenkin vaativat saumatonta liikkumista dokumenttien ja järjestelmien välillä, ja pelkkä yksiselitteinen tunnus ei sitä vielä takaa. Sen takia URN-tunnusten antamiseen pitää liittää niiden rekisteröinti. Rekisteröinti tarkoittaa sitä, että julkaisija ilmoittaa Kansalliskirjastolle julkaisun WWW-osoitteen eli URLin ja sitä vastaavan URNin. Kansalliskirjasto pitää yllä linkityspalvelinta, joka osaa ohjata kyselijän URNin perusteella oikeaan URLiin. Rekisteröiminen voidaan melko helposti järjestää automaattiseksi. Kansalliskirjasto voi OAI-haravoida julkaisuarkistoa, tai julkaisija voi asettaa tiedot Kansalliskirjaston saataville määrämuotoisena XML-tiedostona.

Näin julkaisulle muodostuu URN-tunnuksesta pysyvä osoite, joka toimii aina, dokumentin kulloisestakin sijainnista piittaamatta, kunhan rekisteri pidetään ajan tasalla.

Esimerkiksi osoitteessa http://www.lib.helsinki.fi/tietolinja/0206/kaukopalvelu.html

olevan Tietolinjan artikkelin URN-tunnus on
URN:NBN:fi-fe20061586

URN-tunnuksesta muodostettu pysyvä osoite on silloin http://urn.fi/URN:NBN:fi-fe20061586

Linkityspalvelin lähettää yllä olevan osoitteen käyttäjän varsinaiseen osoitteeseen. (Käytännössä määränpää saattaa olla myös kuvailutietue, josta on yksiselitteinen linkki itse dokumenttiin.)

Kun Tietolinjan WWW-osoitteet joskus muuttuvat, tieto uudesta sijainnista päivitetään rekisteriin, ja pysyvä tunniste toimii edelleen.

Tämän toiminnallisuuden saavuttaminen vaatii URN-tunnusten antajilta pitkäjänteistä vastuuta. On periaatteessa mahdollista, että yksityishenkilö hakee jollekin dokumentille URN-tunnuksen ja rekisteröi sen. Mutta kuinka todennäköisesti hän muistaa päivittää rekisterin tietoja, jos dokumentin varsinainen URL muuttuu tai jos se poistetaan verkosta kokonaan? Ainakin alkuvaiheessa Kansalliskirjasto tulee keskittymään ennen kaikkea siihen, että URN-tunnukset yleistyvät vakiintuneiden organisaatioiden julkaisutoiminnassa.

URN ja OpenURL täydentävät toisiaan

URN-tunnukset ja OpenURL-järjestelmä molemmat perustuvat ”linkityspalvelimeen”, mutta tämä on ainoastaan pinnallinen yhtäläisyys. Ne eivät ole päällekkäisiä vaan täydentävät toinen toistaan. URN-tunnus on sellainen eksakti tieto, joka parantaa OpenURLin toimintaa. (OpenURLista tarkemmin ks. Hakala, Juha: ”OpenURL: rakenne ja käyttö”. Tietolinja 1/2003 http://www.lib.helsinki.fi/tietolinja/0103/openURL.html.) Tuntuisikin järkevältä, että jos OpenURL on käytössä, se olisi edelleen ensisijainen tapa ohjata asiakas hakutuloksesta eteenpäin. Mikäli tietueeseen on luetteloitu URN-tunnus, sen avulla voi luoda asiakkaalle OpenURL-palveluvalikkoon linkin itse aineistoon. Tällä tavalla vältetään ongelmat siinäkin epätodennäköisessä tapauksessa, että itse URN-linkityspalvelin siirtyisi pois urn.fi-osoitteesta.

Kansalliset palvelut, kansainvälinen verkosto

URN-tunnukset ovat jo varsin laajassa käytössä muun muassa Ruotsissa, Saksassa ja Sveitsissä. Ne ylläpitävät samanlaista palvelua kuin urn.fi. Eri URN-linkityspalvelimet voivat lisäksi ohjata kyselyitä toisilleen. Niinpä urn.fi-palvelu osaa linkittää myös julkaisuun, jolla on ruotsalainen URN-tunnus, esim. http://urn.fi/urn:nbn:se:uu:diva-630 – kysely lähetetään Ruotsin linkityspalvelimeen, joka on osoitteessa urn.kb.se.

Suomessa URN-tunnukset ja niiden rekisteröinti on jo käytössä muutamissa yliopistoissa ja korkeakouluissa – Teknillinen korkeakouluhan on ollut tienraivaaja. Kansalliskirjasto on toteuttanut URN-tunnusten integroinnin DSpace-julkaisuarkistoalustaan esim. Helsingin yliopiston Ethesis-palvelussa (http://ethesis.helsinki.fi)

Ainakin Euroopassa URN-järjestelmä on saamassa ilmaa siipien alle: CENL (The Conference of European National Librarians) pyrkii edistämään sen käyttöä, ja tätä koskevat käytännön toimenpiteet ovat paraikaa valmisteltavina.

Lisätietoja

URN-tunnusten suhteen tapahtuu juuri nyt paljon. Kansalliskirjasto valmistelee tarkempia ohjeita julkaisijoille tunnusten antamisesta ja rekisteröimisestä. Ajankohtaiset tiedot sekä yhteyshenkilöt, joilta voi kysyä lisää, löytyvät Kansalliskirjaston verkkosivuilta osoitteessa http://www.kansalliskirjasto.fi/ > Julkaisuala > URN.

 

Kirjoittajan yhteystiedot

Esa-Pekka Keskitalo, pääsuunnittelija
Kansalliskirjasto / Kirjastoverkkopalvelut
PL 26, 00014 HELSINGIN YLIOPISTO
Email: esa-pekka.keskitalo (at) helsinki.fi