Julkaisuarkistojen infrastruktuuri -hanke

Jyrki Ilva
Kansalliskirjasto

Tämän artikkelin pysyvä osoite on http://urn.fi/urn:nbn:fi-fe200812182274

 

Uusi hanke tukee julkaisuarkistoja ja rinnakkaisjulkaisemista

Kansalliskirjasto koordinoi vuodenvaihteessa alkavaa Julkaisuarkistojen infrastruktuuri -hanketta, jolle opetusministeriö on myöntänyt rahoituksen vuosiksi 2009-2010. Hankkeen tavoitteena on vahvistaa julkaisuarkistojen toimintaedellytyksiä Suomessa. Teknisen kehitystyön ja infrastruktuurin rakentamisen lisäksi hankkeen tavoitteena on tukea etenkin rinnakkaisjulkaisemisen tarvitsemien prosessien ja käytäntöjen luomista. Kansalliskirjaston lisäksi hankkeessa ovat aktiivisina toimijoina mukana myös Oulun yliopiston kirjasto ja Helsingin yliopiston kirjastopalveluiden koordinointiyksikkö.

Hankkeen painotusten taustalla on osaltaan Helsingin yliopiston käänteentekevä päätös yliopistossa tuotettujen tieteellisten artikkelien tallennusmandaatista. Rehtorin viime toukokuussa allekirjoittamassa päätöksessä yliopiston henkilökunta velvoitetaan tallentamaan tieteelliset artikkelinsa yliopiston omaan avoimeen julkaisuarkistoon. Tallennusvelvoite astuu voimaan vuoden 2010 alusta lukien (tarkempia tietoja tallennusvelvoitteesta löytyy yliopiston e-julkaisemisen sivuilta). Julkaisuarkistojen infrastruktuuri -hanke tukee Helsingin yliopiston tallennusvelvoitteen käytännön toteuttamista, ja luo samalla pohjaa muiden korkeakoulujen ja tutkimuslaitosten vastaaville päätöksille. Hankkeen tavoitteena on nostaa Suomi myös kansainvälisesti rinnakkaisjulkaisemisen edelläkävijöiden joukkoon.

Hanke rakentaa julkaisuarkistojen infrastruktuuria ensisijaisesti parhaiden, jo olemassa olevien kansallisten ja kansainvälisten ratkaisujen pohjalta. Kaksivuotiseksi suunniteltu hanke koostuu kolmesta erillisestä, toisiinsa niveltyvästä osiosta, minkä lisäksi resursseja käytetään hankkeen koordinointiin ja sen vaatimaan tiedotukseen. Hanke koostuu kolmesta modulista, joiden vastuut on jaettu hankkeessa mukana olevien organisaatioiden kesken. Hankkeen ohjausryhmän puheenjohtajana toimii Helsingin yliopiston vararehtori Hannele Niemi.

Kansalliskirjasto kehittää teknistä infrastruktuuria

Kuten edellisessä Tietolinjassa jo todettiin, suurimmalla osalla suomalaisista korkeakouluista on jo toiminnassa ainakin jonkinlainen julkaisuarkisto. Nämä on toistaiseksi rakennettu joko DSpace-ohjelmiston tai omien paikallisesti kehitettyjen ohjelmistoratkaisujen varaan. Nyt alkamassa olevan hankkeen tavoitteena on vähentää paikallisesti tehtävää päällekkäistä työtä tarjoamalla arkistojen ylläpitäjille koulutusta, teknistä tukea ja valmiita työkaluja. Tätä varten tarvitaan osaamiskeskusta, jolla on riittävät resurssit etenkin kansainvälisen DSpace-kehitystyön seuraamiseen ja siihen liittyvien kansallisten kehittämistarpeiden edistämiseen.

Kansalliskirjasto on luonteva ylläpitäjä tälle toiminnalle, sillä se on jo rakentanut kirjastoverkolle tarjottavan, DSpace-ohjelmistoon perustuvaa julkaisuarkistoympäristön (Doria). Dorian kehitystyö tapahtui suurelta osin vuosina 2006-2007 toimineen, niinikään opetusministeriön rahoittaman OA-JES-hankkeen puitteissa. Dorian yhteydessä omaksutussa toimintamallissa Kansalliskirjasto vastaa yhteisestä teknisestä infrastruktuurista, kun taas yliopistot ja tutkimuslaitokset vastaavat järjestelmään tallennettavien kokoelmiensa sisällöstä ja kokoelmien hallinnoinnista. Dorian rinnalle on syksyllä 2008 avattu myös ammattikorkeakoulujen yhteinen verkkokirjasto Theseus, joka sekin pohjautuu Dorian yhteydessä tehtyyn kehitystyöhön (Theseuksesta ks. myös Samu Viidan juttu tässä samassa Tietolinjan numerossa).

Osaamiskeskus pyrkii koordinoimaan kansallisella tasolla tehtävää kehitystyötä siten, että turhaa päällekkäistä työtä voitaisiin mahdollisimman pitkälle välttää. Tavoitteena on myös se, että hanke palvelee niitäkin jo pidemmälle ehtineitä organisaatioita, joilla on oma tekninen infrastruktuurinsa. Keskitetyn palvelun asiakkaille ja muille DSpace-pohjaisille arkistoille tarjottavien palveluiden lisäksi osahankkeessa pyritään kehittämään sellaisia mm. pysyviin tunnisteisiin ja julkaisuarkistoaineistojen pitkäaikaissäilytykseen liittyviä käytäntöjä ja työkaluja, jotka hyödyttävät myös muunlaisissa teknisissä ympäristöissä toimivia arkistoja.

Lisäksi hankkeen tavoitteena on edistää julkaisuarkistoihin tallennettujen aineistojen kansallista ja kansainvälistä näkyvyyttä. Kansallisella tasolla tämä tarkoittaa erityisesti yhteistyötä mahdollisen muistiorganisaatioiden yhteisen järestelmäarkkitehtuurihankkeen kanssa. Kansainvälisellä tasolla pyritään edistämään erityisesti arkistojen tarjoamien teknisten rajapintojen kehittymistä, jotta niiden sisältämien aineistojen viitetiedot saadaan haravoitua myös kansainvälisiin hakupalveluihin ja portaaleihin.

Oulussa dokumentoidaan uutta järjestelmää

Oulun yliopiston kirjastossa tehtävässä osahankkeessa mallinnetaan ja dokumentoidaan yhden yksittäisen yliopiston tasolla tehtävää kehitystyötä ja sen tuottamia toimintamalleja. Oulun yliopisto on kuulunut tieteellisen verkkojulkaisemisen pioneereihin Suomessa. Se on julkaisuut väitöskirjojaan ja sarjajulkaisujaan verkossa jo toistakymmentä vuotta. Viime vuosikymmellä kehitetty nykyinen julkaisujärjestelmä alkaa kuitenkin olla jo uusimisen tarpeessa.

Oulun yliopiston kirjasto on saanut yliopistolta rahoituksen uuteen järjestelmään liittyvään selvitys- ja kehitystyöhön. Kirjaston kansallisen hankkeen puitteissa saama rahoitus tukee tätä prosessia ja tarjoaa mahdollisuuden kehitystyön yhteydessä tehtävien ratkaisujen dokumentointiin, mistä on hyötyä myös muille organisaatioille.

Helsingin yliopistossa luodaan rinnakkaisjulkaisemisen käytäntöjä

Rehtorin tekemän tallennusmandaattipäätöksen myötä Helsingin yliopisto on siirtynyt rinnakkaisjulkaisemisen edelläkävijöiden joukkoon. Tämä edellyttää luonnollisesti kokonaan uusien käytäntöjen ja toimintamallien luomista tilanteessa, jossa valmiita esikuvia ei ole vielä kovin runsaasti tarjolla. Erityisen suuria haasteita liittyy edelleen mm. tutkijoiden motivointiin, aineistojen tallentamisen prosesseihin ja julkaisujen tekijänoikeuksiin liittyviin kysymyksiin.

Tallennuksen käytäntöjä koskevien periaatteiden ja tallennuspolitiikkaa koskevien suositusten luominen on järkevää tehdä kansallisella tasolla, jolloin jokaisen korkeakoulun tai tutkimuslaitoksen ei tarvitse miettiä niitä erikseen. Tavoitteena on se, että Helsingin yliopistossa tehtävän selvitystyön tulokset voidaan tarjota myös muiden korkeakoulujen ja tutkimuslaitosten käyttöön. Hankerahoituksella selvitetään erityisesti rinnakkaisjulkaisemisen tekijänoikeuksiin liittyviä kysymyksiä, joista pyritään laatimaan mahdollisimman selkeät ohjeet.

Yhteydet tutkimuksenhallintaan ja julkaisurekistereihin

Tekniseen infrastruktuuriin liittyy läheisesti kysymys järjestelmiin tallennettavan metadatan laadusta ja yhteismitallisuudesta. Suuri osa julkaisuarkistojen tarvitsemasta metadatasta olisi saatavissa erilaisista koti- ja ulkomaisista tietokannoista. Samaa metadataa olisi mahdollista hyö­dyn­tää julkaisurekisterien ja tutkimuksenhallintajärjestelmien ylläpidossa, jolloin päällek­käi­sen työn määrä vähentyisi merkittävästi. Kaikkien näiden järjestelmien palveleminen edellyttää kui­tenkin prosessien huolellista miettimistä, eri lähteistä kerätyn metadatan yhdenmukaistamista sekä konversioihin ja tietojen tarkistamiseen tarvittavien työkalujen luomista.

Alkuperäisessä hankeanomuksessa hahmottelimme myös erillistä nimenomaan metadatan hallintaan keskittyvää modulia, mutta resurssisyistä tämä kuitenkin tipahti pois. Tämä ei tarkoita sitä, etteivätkö metadatan hallintaan liittyvät kysymykset olisi hankkeessa esillä osahankkeissa. Esim. Helsingin yliopisto on juuri hankkinut uuden tutkimustietojärjestelmän, joka tulee käyttöön vuoden 2009 aikana. Tämä järjestelmä korvaa myös yliopiston nykymuotoisen julkaisurekisterin (Julki-tietokanta), jonka päivittäminen siis loppuu. Hankittu järjestelmä (tanskalaisen Atiran PURE) soveltuu myös valmiiden metatietojen haravointiin muualta, ja sitä onkin tarkoitus käyttää rinnakkaisjulkaisemisen osalta syöttöjärjestelmänä, jossa tutkijat tunnistavat julkaisujensa metatiedot, ja jonka kautta ne ja mahdollisesti myös kokotekstit siirtyvät eteenpäin varsinaiseen julkaisuarkistosovellukseen. Tarkempia tietoja HY:n uuteen tutkimustietojärjestelmään liittyvistä suunnitelmista löytyy järjestelmän käyttöönottoa valmistelevan Tuhat-hankkeen wikistä.

Vaikka eri yliopistoissa on käytössä erilaisia julkaisujen ja tutkimustiedon hallintaan tarkoitettuja järjestelmiä, ja myös niihin liittyvät prosessit vaihtelevat, hankkeeseen osallistuvien Helsingin yliopiston ja Oulun yliopiston esimerkkitapaukset ovat kuitenkin merkittäviä myös muiden korkeakoulujen kannalta. Käytäntöjen ja julkaisujen metadatan yhdenmukaistaminen on tärkeä päämäärä senkin vuoksi, että opetusministeriö kaavailee yliopistojen julkaisutietojen haravoimista paikallisista tietokannoista yhteiseen kansalliseen tietokantaan. Vaikka kansallisen julkaisutietokannan toteutumisen aikataulu ja monet siihen liittyvät käytännön yksityiskohdat ovat yhä hämärän peitossa, tämä yhteinen päämäärä motivoi varmasti myös omia paikallisia järjestelmiään miettiviä korkeakouluja etsimään sellaisia ratkaisuja, joiden voi olettaa olevan pitkällä tähtäimellä järkeviä.

 

Kirjoittajan yhteystiedot

Jyrki Ilva, sovellussuunnittelija
Kansalliskirjasto
PL 26, 00014 HELSINGIN YLIOPISTO
Email: jyrki.ilva(at)helsinki.fi