Julkaisuarkistot : mitä, missä, miten

Jyrki Ilva
Kansalliskirjasto

Tämän artikkelin pysyvä osoite on: http://urn.fi/URN:NBN:fi-fe200804301289

 

Avoimia julkaisuarkistoja (engl. institutional repository) on nyt rakennettu muutaman vuoden ajan. Opinnäytteiden ja sarjajulkaisujen julkaiseminen verkossa alkoi toki monissa Suomen korkeakouluissa jo viime vuosikymmenen puolella, mutta vuosien 2003-2004 tienoilla kansainvälisen Open Access –liikkeen vaikutuksesta liikkeelle lähtenyt keskustelu julkaisuarkistoista on antanut tälle toiminnalle uudenlaista näkyvyyttä ja uusia ulottuvuuksia. Opinnäytteiden ja sarjajulkaisujen rinnalle on tullut uutena tulokkaana ajatus muualla julkaistujen tieteellisten artikkelien rinnakkaisjulkaisemisesta.

Suomessa julkaisuarkistojen perustamista on edistänyt etenkin FinnOA eli Suomen Open Access –työryhmä (http://www.finnoa.fi). Suurelta osin FinnOA:n aloitteesta käynnistetty Open Access –julkaisemisen edistäminen Suomessa –hanke (OA-JES) sai Opetusministeriöltä rahoituksen vuosiksi 2006-2007. Kansalliskirjasto sai tässä yhteydessä rahoitusta julkaisuarkistojen tekniseen tukeen ja keskitetysti ylläpidetyn teknisen infrastruktuurin rakentamiseen (OA-JES-hankkeen tavoitteista ks. ”Kansalliskirjasto mukana rakentamassa julkaisuarkistoja”, Tietolinja 1/2006). Suomalaisten julkaisuarkistojen tilannetta on selvitetty myös syksyllä 2007 tehdyssä Nordbib-hankkeen kyselyssä, jonka tuloksista Joel Peltonen raportoi Tietolinjan numerossa 2/2007 (”Verkkojulkaisun käytäntöjä : pohjoismaisen Nordbib-kyselyn tuloksia”).

Muutamassa vuodessa tilanne on kehittynyt siten, että lähes kaikilla yliopistoilla ja myös monilla tutkimuslaitoksilla on jo olemassa ainakin jonkinlainen julkaisuarkisto. Teknisissä ratkaisuissa on eroja, ja myös sisällön määrä ja luonne vaihtelee. Julkaisuarkistojen keskinäisen verkostoitumisen edellytyksiin kuuluva yhteensopivuus metadatan haravointiin käytettävän OAI-PMH-protokollan kanssa kuuluu myös yhä useamman arkiston ominaisuuksiin. Osa arkistoista sisältää pääasiassa julkaisujen metadataa (eli ne muistuttavat pikemminkin julkaisurekisteriä), osassa taas on keskitetty julkaisuarkistoideologian mukaisesti pelkästään kokotekstijulkaisuihin. Rinnakkaisjulkaiseminen ei ole vielä päässyt kunnolla vauhtiin, ja sen tueksi odotellaan yhä poliittisia päätöksiä.

Julkaisuarkistoja Suomen kartalla

Teknisten ratkaisujen osalta suomalaisten julkaisuarkistojen kenttä jakautuu karkeasti kahteen eri ryhmään. Vaikka DSpace-ohjelmistoa hyödyntävien arkistojen määrä on kasvanut, monet yliopistot luottavat yhä omiin, itsenäisesti rakennettuihin järjestelmiin. Tämä koskee etenkin julkaisutoimintansa ensimmäisten joukossa aloittaneita yliopistoja, joiden halukkuus luopua jo olemassa olevista, yliopiston omiin tarpeisiin räätälöidyistä ohjelmistoratkaisuista on ymmärrettävästi vähäinen. Tähän ryhmään kuuluvat mm. Joensuun yliopisto (http://joypub.joensuu.fi/), Oulun yliopisto (http://herkules.oulu.fi/), Teknillinen korkeakoulu (http://www.otalib.fi/tkk/edoc/) ja Tampereen yliopisto (väitöskirjat: http://acta.uta.fi/, gradut: http://tutkielmat.uta.fi ja muut verkkojulkaisut: http://tampub.uta.fi/).

Kaikki uudet julkaisuarkistot on kuitenkin pääsääntöisesti rakennettu DSpace-ohjelmiston varaan. Muut kansainvälisesti laajassa käytössä olevat ohjelmistot eli EPrints ja Fedora eivät ainakaan toistaiseksi ole saaneet Suomessa pysyvää jalansijaa. DSpace-arkistot jakautuvat lisäksi kahteen ryhmään: osa arkistoista hyödyntää Kansalliskirjaston ylläpitämää Doria-palvelua (https://oa.doria.fi), osa taas on rakennettu oman paikallisen DSpace-instanssin ja omin voimin tehtävän ylläpidon ja kehitystyön varaan.

Yliopistojen omin voimin ylläpidettyjä DSpace-arkistoja on joko käytössä tai rakenteilla ainakin Hankenilla (DHanken, http://dhanken.shh.fi/dspace/), Jyväskylässä (JyX, https://jyx.jyu.fi/dspace/) ja Tampereen alueen yliopistoissa. DSpaceen liittyvää kehitystyötä on tehty myös yhteisvoimin Suomen virtuaaliyliopiston valtakunnallisessa Julkaisukanava-hankkeessa, jota koordinoi Jyväskylän yliopisto. Tieteellisten julkaisujen lisäksi hankkeessa on tutkittu oppimateriaalien tallentamiseen liittyviä kysymyksiä (mm. julkaisusopimusten hallinta). Julkaisukanava-hankkeesta löytyy tuoretta tietoa mm. Stefan Oinon Tampereen yliopiston kirjaston verkkolehteen Bulletiinin numeroon 1/2008 kirjoittamasta artikkelista.

Erikoislaatuisin tilanne on Helsingin yliopistossa, jonne on yliopiston opinnäytteitä julkaisevan E-thesis-palvelun rinnalle syntynyt peräti neljä kampustasolla toimivaa julkaisuarkistoa: Viikin kampuksen DViikki (http://www.tiedekirjasto.helsinki.fi/dspace/), Meilahden kampuksen Terkko Document Space (http://tds.terkko.helsinki.fi/dspace/), Kumpulan kampuksen Katja (http://katja.kumpula.helsinki.fi/) ja keskustakampuksen Carhu (https://dspace.it.helsinki.fi/manakin/). Kaikki kampusarkistot on rakennettu DSpace-ohjelmiston varaan, ja niiden teknisestä ylläpidosta on ainakin tähän asti huolehdittu kampustasolla. Arkistojen tämänhetkinen määrä selittyy suurelta osin pioneerivaiheen aikana syntyneellä spontaanilla innostuksella, mutta kehitys on Helsingin yliopistossakin viemässä kohti yhtenäisempää ja keskitetympää toimintamallia.

Kansalliskirjaston rakentama Doria-palvelu tarjoaa valmista, keskitetysti ylläpidettyä julkaisuarkistoalustaa kaikille kiinnostuneille (Dorian kehitystyöstä tarkemmin ks. ”Kansalliskirjaston DSpace-projekti etenee”, Tietolinja 2/2006). Työnjaon periaatteena on se, että Kansalliskirjasto vastaa yhteisen teknisen infrastruktuurin ylläpidosta, kun taas korkeakoulut vastaavat järjestelmään tallennettavien kokoelmiensa sisällöstä ja kokoelmien hallinnoinnista. Palvelun rakentaminen on edennyt suunnitelmien mukaan, ja sen tekniset ratkaisut ovat saaneet positiivista huomiota myös kansainväliseltä DSpace-kehittäjien yhteisöltä. Eniten kiitosta on tullut käyttöliittymän räätälöinnistä ja monikielisyyden tuesta. Yhtä ja toista on toki yhä tekemättäkin, ja palvelun kehitystyö jatkuu.

Doriaan tallennetuista aineistoista avattiin julkiseen käyttöön ensimmäisenä Helsingin yliopiston opinnäytejulkaisuja sisältävä E-thesis (helmikuu 2007), ja tämän jälkeen palvelun sisältämät yhteisöt ja kokoelmat ovat laajentuneet nopeasti. Yliopistoista Doriaan ovat toistaiseksi tulleet mukaan Turun yliopisto, Åbo Akademi, Lappeenrannan teknillinen yliopisto ja Sibelius-akatemia. Ammattikorkeakouluista mukana ovat olleet Jyväskylän ammattikorkeakoulu, Tampereen ammattikorkeakoulu ja Stadia. Lisäksi palveluun on tallennettu myös Kansalliskirjaston omia aineistoja.

Yliopistoista poiketen ammattikorkeakoulut ovat lähteneet kehittämään julkaisuarkistotoimintaansa yhteisenä kansallisen tason hankkeena. Lähiaikoina avattava ammattikorkeakoulujen yhteinen verkkokirjasto Theseus.fi keskittyy ainakin alkuvaiheessa nimensä mukaisesti opinnäytteisiin. Siinä missä yliopistot vielä monin paikoin empivät esim. gradujensa julkaisemisen järkevyyttä, ammattikorkeakoulujen kunnianhimoisena päämääränä on saada verkkoon kaikki niissä tehdyt opinnäytetyöt.

Theseus.fi on toteutettu yhteistyössä Kansalliskirjaston kanssa siten, että Kansalliskirjasto vastaa palvelun teknisestä ylläpidosta ja kehittämisestä. Vaikka sillä on oma verkko-osoitteensa ja erillinen DSpace-instanssi, se hyödyntää kuitenkin suoraan Doriaa varten tehtyä kehitystyötä.

Sektoritutkimuslaitosten osalta julkaisuarkistojen perustaminen on vielä melko sekavassa vaiheessa: muutamalla suurimmalla tutkimuslaitoksella on jo oma arkistonsa, muutamat muut ovat vasta miettimässä, ja osa laitoksista on päätynyt yhteistyöhön Helsingin yliopiston kampusarkistojen kanssa.

Rinnakkaisjulkaisemisen haasteet

Julkaisuarkistojen perustamista on Suomessa – monien muiden maiden tavoin – hallinnut hyvin vahvasti tekninen näkökulma. Tiedostojen tallentamiseen ja jakeluun soveltuva tekninen järjestelmä on kuitenkin vain yksi toimivan julkaisuarkiston edellytyksistä. Julkaisuarkisto ei ole julkaisuarkisto, ellei sinne saada myös sisältöä eli julkaisuja.

Useimmat suomalaiset sähköiset julkaisupalvelut ovat toistaiseksi keskittyneet vanhaan tapaan lähinnä opinnäytteisiin ja korkeakoulujen omiin sarjajulkaisuihin, eli niiden osalta julkaisuarkisto-termin yleistyminen ei ole merkinnyt oleellista sisällöllistä muutosta. Vaikka teknisissä ratkaisuissa on tapahtunut jonkin verran yhdenmukaistumista DSpacen yleistymisen myötä, ”julkaisuarkisto” on näiden palveluiden kannalta merkinnyt pääasiassa uuden mukavan kattotermin omaksumista omalle, monissa tapauksissa jo muutenkin vakiintuneelle toiminnalle.

Keskeisin julkaisuarkiston mukanaan tuoma uusi ajatus on ollut rinnakkaisjulkaiseminen, eli ajatus siitä, että korkeakoulut ja tutkimuslaitokset kokoaisivat omien tutkijoidensa muualla ilmestyneet julkaisut (lähinnä tieteelliset artikkelit) organisaation omaan, avoimeen julkaisuarkistoon. Akuuttina taustana rinnakkaisjulkaisemiselle on ollut tieteellisten lehtien hintojen jatkuva kallistuminen. Open access -lehtien ohella myös yksittäisten julkaisuarkistojen muodostamasta maailmanlaajuisesta verkostosta on toivottu ilmaista ja helposti tavoitettavaa vaihtoehtoa kaupallisten kustantajien suljetuille tietokannoille.

Opinnäytteisiin tai sarjajulkaisuihin verrattuna tieteellisten artikkelien rinnakkaisjulkaiseminen korkeakoulujen julkaisuarkistoissa on yleistynyt tuskallisen hitaasti. Suomessa rinnakkaisjulkaisemista on toistaiseksi harrastettu vähänkään merkittävissä määrin ainoastaan DViikissä ja Teknillisen korkeakoulun elektroniset väitöskirjat –palvelussa (http://lib.tkk.fi/Diss/). Vuodesta 2004 asti toimineessa DViikissä on tähän mennessä ilmestynyt (muun materiaalin ohessa) joitakin satoja muualla julkaistuja artikkeleita. TKK:lla puolestaan on julkaistu nippuväitöskirjojen yhteydessä niihin sisältyneitä artikkeleita. Kyse on siis edelleen varsin pienistä aineistoista, etenkin jos sitä verrataan tieteellisen julkaisemisen kokonaisvolyymiin.

Hitaan etenemisen taustalla on ollut useita syitä. Tutkijoiden omin voimin tekemän artikkelien itsearkistoinnin toteuttaminen on käytännössä osoittautunut huomattavasti odotettua hankalammaksi. Varhaisvaiheen julkaisuarkistovisioissa arkiston perustaminen tarkoitti näet yksinkertaisesti sitä, että laitetaan jokin julkaisuarkisto-ohjelmisto pystyyn ja sen jälkeen artikkelien oletettiin alkavan aivan itsestään valua arkiston täytteeksi. Käytännössä aineiston saaminen edellyttää kuitenkin sekä voimakasta markkinointia ja tutkijoiden asenteiden muokkausta että myös jonkinlaisen tallennusta opastavan – tai siitä huolehtivan – palvelun luomista. Tiedostoformaatteihin ja tallennuslomakkeiden käyttöön liittyvän opastuksen lisäksi tutkijat tarvitsevat usein apua etenkin tekijänoikeuksiin ja julkaisusopimuksiin liittyvissä kysymyksissä.

Julkaisuarkistojen rakentaminen on myös jäänyt usein liiaksi pelkästään kirjastojen vastuulle, eikä toiminnan varsinaista kohderyhmää eli tutkijoita ole välttämättä saatu riittävissä määrin houkuteltua mukaan. Tähän ongelmaan on viime aikoina pyritty puuttumaan erilaisilla yliopistojen ja tutkimusrahoittajien antamilla tallennussuosituksilla ja -velvoitteilla. Yleinen kokemus on se, että suosituksilla ei vielä ole ratkaisevaa vaikutusta tallentamisen yleistymiseen, mutta velvoitteet saattavat sen sijaan tepsiä, jos ne muotoillaan järkevästi ja tutkijoille tarjotaan riittävästi tukea ja mahdollisimman helppokäyttöisiä tallennusvälineitä. Kepin lisäksi on toki hyvä tarjota myös porkkanaa, eli tutkijoille olisi hyvä pystyä tarjoamaan sellaisia palveluita, jotka he itsekin kokevat hyödyllisiksi.

Tallennusvelvoitteet ovat kansainvälisestikin yhä melko tuore asia, ja Suomessa ne tekevät vasta tuloaan. Pisimmälle on ennätetty Helsingin yliopistossa, jossa odotellaan rehtorin päätöstä tallennusvelvoitteesta vielä tämän kevään aikana. Velvoitteen sanamuoto lienee tämän jutun kirjoitusajankohtana jossain määrin auki, mutta päämääränä on joka tapauksessa yliopiston tieteellisten julkaisujen mahdollisimman kattava tallentaminen yliopiston omaan julkaisuarkistoon. Lisäksi Helsingin yliopistossa on pohdittu myös julkaisuarkistojen, julkaisurekisterin ja suunnitteilla olevan uuden tutkimuksenhallintajärjestelmän välisiä yhteyksiä, jotta päällekkäistä työtä voitaisiin vähentää esim. hyödyntämällä samaa metadataa kaikissa eri päämääriä palvelevissa järjestelmissä.

Infrastruktuurin kehittäminen jatkuu

Avoimen julkaisemisen ideaaleihin ja uusiin julkaisuarkisto-ohjelmistoihin liittyneen alkuinnostuksen vähitellen haihduttua on käynyt selväksi, että julkaisuarkistojen kaltaisten tieteellistä julkaisemista mullistavien palveluiden ja käytäntöjen vakiinnuttaminen vaatii väistämättä runsaasti pitkäjänteistä työtä. Paikallisesti tehtävän työn lisäksi tarvitaan yhteistyötä kansallisella ja kansainvälisellä tasolla.

Kansalliskirjasto ja Helsingin yliopisto lähtivät syksyllä 2007 suunnittelemaan yhteistä Julkaisuarkistojen infrastruktuuri –hanketta, jonka päämääränä on erityisesti rinnakkaisjulkaisemisen käytäntöjen edistäminen ja vakiinnuttaminen Suomessa. Vuosille 2009-2010 ajoitettuun hankkeeseen on alustavasti kaavailtu kolmea osaa, jotka liittyvät julkaisuarkistojen tekniseen arkkitehtuuriin, julkaisuarkistojen käyttämän metadatan hallintaan sekä rinnakkaistallennuksen prosessien ja tekijänoikeuksien tukeen.

Kansalliskirjaston osuus hankkeessa liittyy etenkin tekniseen infrastruktuuriin. Doria-palvelun kehittämistä jatketaan, ja Kansalliskirjasto pyrkii alustavien suunnitelmien mukaan myös tarjoamaan koulutusta ja tukea muiden arkistojen ylläpitäjille. Lisäksi tavoitteena on osallistua aiempaa aktiivisemmin kansainväliseen julkaisuarkistoyhteistyöhön mm. DSpace-kehittäjäyhteisön kautta, jotta Suomessa tehty tekninen kehitystyö ei jäisi tulevien DSpace-versiopäivitysten jalkoihin.

 

Kirjoittajan yhteystiedot

Jyrki Ilva, sovellussuunnittelija
Kansalliskirjasto / Kirjastoverkkopalvelut
PL 26, 00014 HELSINGIN YLIOPISTO
Email: jyrki.ilva(at)helsinki.fi