Vallankumous tieteellisessä julkaisemisessa on alkanut?

Jyrki Ilva
Kansalliskirjasto

Tämän artikkelin pysyvä osoite on http://urn.fi/URN:NBN:fi-fe200812182276

 

Helsingin yliopisto edelläkävijänä

Helsingin yliopiston rehtorin viimekeväinen päätös tieteellisten artikkelien tallennusmandaatista sai tuoreeltaan yllättävän vähän huomiota suomalaissa tiedotusvälineissä. Kyseessä on kuitenkin hyvin merkittävä paradigman muutos, jota edistäessään Helsingin yliopisto kulkee aivan edelläkävijöiden etujoukossa myös kansainvälisellä tasolla.

Rehtorin päätös velvoittaa yliopiston henkilökunnan tallentamaan tieteelliset artikkelinsa yliopiston julkaisuarkistoon, jossa ne ovat vapaasti saatavilla. Jos kaikki rehtorin päätökseen liittyvät suunnitelmat toteutuvat ja muut yliopistot vielä seuraavat Helsingin yliopiston esimerkkiä, tieteellisten julkaisujen välityksessä tapahtuu muutos, jota voi ihan hyvillä perusteilla kutsua vaikkapa vallankumoukseksi.

Muualla julkaistujen (tai julkaistavien) artikkelien tallentamista avoimeen julkaisuarkistoon kutsutaan rinnakkaisjulkaisemiseksi tai rinnakkaistallentamiseksi. Itse preferoin termiä ”rinnakkaisjulkaiseminen”, koska kyse on todellakin myös julkaisemisesta – artikkeli tallennetaan julkaisuarkistoon sen takia, että se olisi vapaasti saatavilla. Käytännössä rinnakkaisjulkaisemisen yleistymisen tiellä on toki vielä monenlaisia esteitä ja ongelmia, ja myös julkaisuarkistojen kehitystyön perusideat ovat saaneet viime aikoina osakseen varsin purevaakin kritiikkiä (kritiikkiä on referoitu esim. Digitaalinen kirjasto -blogin artikkelissa ”Kaikki hyvin, julkaisuarkistot?”).

Tässä artikkelissa jätän kuitenkin arkiset käytännön murheet hetkeksi syrjään, ja yritän miettiä sitä, millaista mullistusta rinnakkaisjulkaiseminen oikein merkitsee ja millainen tiedonhaun maailma meille on tulevaisuudessa tarjolla, jos siitä tulee tiedejulkaisemisen vallitseva käytäntö. Olemme nyt kenties viiden, kymmenen tai viidentoista vuoden päässä tilanteesta, jossa valtaosa tieteellisistä julkaisuista (ainakin artikkeleista) on saatavilla avoimesti verkosta joko välittömästi tai lyhyellä viiveellä. Seuraavat näkemykset ovat luonnollisesti monilta osin spekulatiivisia ja paikoin ehkä hivenen poleemisiakin.

Rinnakkaisjulkaisemisen vaihtoehtoja

Open access -liikkeen hahmottelemassa ideaalimaailmassa tieteelliset lehdet olisivat sellaisenaan vapaasti verkossa kaikkien kiinnostuneiden luettavissa. Käytännössä lehtien – vanhojen tai uusien – Open Access -julkaiseminen on kuitenkin yleistynyt hitaasti, ja niihin liittyy voimakkaita kaupallisia intressejä. Niinpä julkaisuarkistojen kautta tapahtuva rinnakkaisjulkaiseminen on alkanut näyttää yhä houkuttelevammalta väylältä aineistojen vapaaseen saatavuuteen.

Kyseessä ei siis ole ainakaan yksiselitteisesti parhaana pidetty ratkaisu, vaan eräänlainen oikotie, joka tosin tarjoaa myös tiettyjä etuja. Open access -liikkeen sisälläkin mielipiteet hajoavat itse asiassa jonkin verran sen suhteen onko tärkeintä päästä avoimeen saatavuuteen nyt heti, vai onko fiksumpaa pyrkiä saman tien johonkin mahdollisimman optimaaliseen toimintamalliin (vaikka se vaatisi vähän enemmän aikaa).

Rinnakkaisjulkaisemista on mahdollista harjoittaa joko organisaation omassa tai tiettyyn tieteenalaan keskittyvässä, usein kansainvälisen yhteistyön varaan rakennetussa julkaisuarkistossa. Vaikka muutamat näkyvimmistä julkaisuarkistoista (mm. fyysikkojen ArXiv) ovat olleet alakohtaisia, alakohtaisien arkistojen organisoiminen on kuitenkin useimmilla aloilla edennyt hitaasti. Ongelmana on ollut sekä resurssien että riittävän yhteisen tahdon puuttuminen. Lisäksi tieteenalakohtaisien arkistojen perustamista hankaloittaa myös se, että tieteenalojen välisiä raja-aitoja on kovin vaikea määritellä: miten olisi mahdollista perustaa laaja ja kattava alakohtaisten arkistojen verkosto, joka ei samalla sisältäisi merkittäviä päällekkäisyyksiä raja-alueiden osalta?

Organisaatiokohtaisten arkistojen osalta resurssien ja yhteisen tahdon löytäminen on ollut aavistuksen verran helpompaa, vaikka totuus toki on, että arkistoja on useimmiten rakennettu kovin pienillä resursseilla ja matalalla profiililla. Alakohtaisiin arkistoihin verrattuna organisaatiokohtaisen arkiston ongelmana on kuitenkin se, että tietyn tieteenalan tuottama materiaali hajautuu käytännössä lukemattomiin eri puolilla maailmaa sijaitseviin arkistoihin, joiden kattavuus, julkaisukäytännöt ja kuvailutiedot saattavat vaihdella.

Rinnakkaisjulkaiseminen on ainakin toistaiseksi nähty sekundäärisenä julkaisemisena: Julkaisuarkistoon tallennetun artikkelin virallinen versio ilmestyy jossain muualla, ja arkistossa on artikkelista vain kopio, jonka vastaavuus virallisen version kanssa saattaa vaihdella. Tieteellisellä lehdellä, artikkelikokoelmalla ja konferenssijulkaisulla onkin edelleen sellaisia funktioita, joita julkaisuarkistot eivät ainakaan tällä hetkellä pysty korvaamaan. Julkaisuarkistot ovat toistaiseksi lähinnä valmiin aineiston tallennuspaikkoja. Niiden yhteydessä ei siis tehdä sisällöllistä toimitustyötä tai laadunvarmistusta, jotka kuitenkin ovat oleellisia toimintoja mm. tutkijoiden tieteellisen meritoitumisen kannalta.

Tieteellisessä julkaisemisessa tärkeän vertaisarvioinnin kytkemistä julkaisuarkistoihin on toki mietitty, mutta saattaa olla että ainakin organisaatiokohtaisissa arkistoissa tyydyttävästi toimivien ratkaisujen löytäminen voi olla vaikeaa, alakohtaisessa mallissa sen sijaan mahdollisuudet olisivat paremmat. Laadunvarmistuksen siirtäminen yksittäisen organisaation tasolle olisi selkeä taka-askel tieteellisen julkaisemisen globaaliin merkittävyyteen tähtäävien päämäärien kannalta. Alakohtaisen arkiston potentiaalisesti sisältämä tietyn alan sisäinen yhteisöllisyys saattaisi sen sijaan tarjota mahdollisuuksia tähänkin. Toistaiseksi näyttää kuitenkin siltä, että tieteelliset lehdet ja tieteelliset kustantajat säilyttävät useimmilla aloilla roolinsa vielä pitkään, riippumatta siitä miten perinteisille paperille painetuille julkaisuille lopulta käy.

Rinnakkaisjulkaiseminen ja tieteellisen julkaisemisen käytännöt

Rinnakkaisjulkaiseminen pyrkii muuttamaan tasapainoa tieteellisen lehden ja kustantajan, tekijän ja hänen taustaorganisaationsa (korkeakoulun tai tutkimuslaitoksen) sekä aineiston tilaajien ja käyttäjien välillä. Kirjastojen näkökulmasta ongelmana on ollut etenkin kustannusalan keskittyminen ja lehtien tilaushintojen kasvu, joka on johtanut niiden kannalta vaikeaan yhtälöön: lehtien tilaushinnat kasvavat huomattavasti nopeammin kuin kirjastojen hankintamäärärahat. Toiveena on se, että rinnakkaisjulkaiseminen pakottaa kustantajat vähitellen tarkistamaan aineistojensa hintoja, vaikkei avoin saatavuus ehkä niitä kokonaan korvaisikaan.

Asetelma tekijät/yliopistot vastaan isot ja pahat kustantajat on toki jossain määrin turhan mustavalkoinen. Lisäksi rinnakkaisjulkaisemiseen liittyviä visioita on rakennettu ehkä turhankin kapeasti tiettyjen edelläkävijäalojen (luonnontieteet, lääketiede, jne.) näkökulmasta. Näille aloille tyypillinen kuvio, jossa tutkimusprojektin tuloksena syntynyttä lähes valmista artikkelia tarjotaan parhaan mahdollisen lehden julkaistavaksi ei ole yleistettävissä kaikkeen tieteelliseen julkaisemiseen. Esim. humanistis-yhteiskuntatieteellisillä aloilla lehdet voivat usein toimia aktiivisesti artikkelien hankkijoina ja tilaajina (esim. teemanumerot), eli artikkelit eivät syntyisi ollenkaan ilman niiden panosta. Lisäksi lehdet ovat etenkin kansallisella tasolla usein myös julkaisevan seuran jäsenlehtiä, eli niillä saattaa olla myös tieteenalan sisäistä yhteisöllisyyttä ylläpitäviä piirteitä, joita rinnakkaisjulkaiseminen ei sinällään korvaa.

Vaikka rinnakkaisjulkaisemista on perusteltu nimenomaan kansainvälisten lehtien hintojen jatkuvalla kasvulla, ironista kyllä se vaikuttaa alkuvaiheessa akuuteimmin kotimaiseen julkaisemiseen, joissa kustannuksiin liittyviä ongelmia ei ole ollut. Kotimaiset kustantajat ovat pääasiassa tieteellisiä seuroja, jotka toimivat tyypillisesti (muutamaa poikkeusta lukuunottamatta) hyvin pienillä resursseilla. Lehden saama julkaisutuki ja tilaus- tai jäsenmaksut riittävät juuri ja juuri kattamaan lehden toimittamisesta ja painamisesta aiheutuvat menot. Niinpä lehdet ovat varsin haavoittuvia, jos rinnakkaisjulkaiseminen alkaa murentaa niiden perinteisiä tulonlähteitä.

Käytännössä tämä voi johtaa siihen, että lehdet joutuvat miettimään sitä, onko paperimuotoinen julkaiseminen (johon suuri osa rahasta menee) ylipäänsä järkevää, ja epäilemättä myös lehtien saaman julkisen tuen lisäämiseen kohdistuu yhä voimakkaampia paineita. Yksi mahdollisuus on tietysti sekin, että rinnakkaisjulkaisemista harjoittavat organisaatiot ryhtyvät maksamaan lehdille jonkinlaisia tukimaksuja nykyisten tilausmaksujen sijasta tai ohella.

Rinnakkaisjulkaisemisella voi olla laajempiakin vaikutuksia tieteellisen julkaisemisen käytäntöihin. Esim. Gaudeamuksen kustannuspäällikkö Tuomas Seppä epäili syksyllä järjestetyssä FinnOA:n tekijänoikeusseminaarissa, että artikkelikokoelma julkaisumuotona tulee rinnakkaisjulkaisemisen myötä tiensä päähän. Artikkelikokoelmat ovat olleet merkittävä julkaisumuoto mm. humanistisissa ja yhteiskuntatieteissä, mutta niiden taloudellinen kannattavuus kustantajien näkökulmasta on ollut jo pitkään heikko, osin senkin takia että julkaisemisen saama julkinen tuki on vähitellen vähentynyt murto-osaan aiemmasta. Jos artikkelit tulevat saataville myös muuta kautta ja teosten myynti entisestään vähenee, kustantajat todennäköisesti keskittyvät kannattavampiin julkaisutyyppeihin (esim. monografiat ja oppikirjat). Luontevien julkaisukanavien puuttuminen voi siten vaikuttaa epäsuorasti myös julkaisutoiminnan suuntautumiseen ja julkaisujen määrään.

Kirjaston rooli muuttuu

Kirjastot ovat olleet merkittävässä roolissa etenkin organisaatiokohtaisten julkaisuarkistojen perustamisessa, vaikka tämän toiminnon sijoittuminen nimenomaan kirjaston tehtäväksi ei ehkä ole sinällään ollut aivan itsestäänselvää. Vaikka osa etenkin tieteellisistä kirjastoista on jo aiemmin harjoittanut myös julkaisutoimintaa, julkaisuarkistojen ylläpito muuttaa kuitenkin oleellisesti kirjastojen roolia tieteellisten julkaisujen välittäjinä.

Kirjastojen päätehtävänä on perinteisesti ollut tarjota muualla tuotettuja aineistoja omille paikallisille asiakkailleen. Julkaisuarkistojen ja rinnakkaisjulkaisemisen osalta tilanne kääntyy tältä osin päälaelleen. Kirjastosta tulee paikallisesti tuotettujen aineistojen julkaisija tai jakelija, ja vaikka niitä toki luetaan myös oman organisaation sisällä, suurin osa yleisöstä on kuitenkin täysin ulkopuolisia. Tämä vaatii kirjastoilta uudenlaista mentaalista orientoitumista sen suhteen, ketä varten palveluita tehdään ja miten niiden menestystä mitataan. Toiminnan kohdeyleisön osittainen vaihtuminen voi myös vaatia kirjaston verkkopalveluiden ja käyttöliittymien uudelleenarviointia.

Ensisilmäyksellä saattaa tuntua houkuttelevalta ennustaa, että viitetietojen ja viitetietokantojen merkitys vähenee, kun yhä suurempi osa julkaisuista tulee saataville kokotekstiversiona. Asia ei ole kuitenkaan näin yksinkertainen. Vaikka esim. Google kykenee indeksoimaan julkaisujen kokotekstin, aineistojen identifiointiin ja käyttöliittymien rakentamiseen tarvitaan väistämättä myös julkaisujen metatietoja. Samoin viitetiedot ja niihin liittyvät julkaisufoorumitiedot ovat oleellisia myös tutkimuksenhallinnan ja laadunarvioinnin kannalta.

Tieteelliset kirjastot ovat toki jo aiemmin olleet suuressa roolissa tutkimuksenhallintaan liittyvien henkilökunnan julkaisutietojen kerääjinä ja tallentajina. Rinnakkaisjulkaiseminen kytkeytyy myös tähän kuvioon, vaikka sen ja tutkimuksenhallinnan perimmäiset intressit ovatkin jossain määrin erilaisia. Vaikka julkaisutietojen hallintaan ja julkaisuarkistojen ylläpitoon käytetään yleensä erillisiä sovelluksia, julkaisutietojen tallentamisen ja kokotekstiartikkelien julkaisemisen prosessit olisi hyvä saada sovitettua mahdollisimman joustavasti toistensa yhteyteen. Viitetietojen käyttötavat ja niiden tuotantoon ja välittämiseen liittyvät prosessit ovat muutenkin muutoksessa, ja yhä enemmän siirrytään malliin, jossa julkaisun kuvailutiedot tuotetaan keskitetysti yhden kerran, ja sen jälkeen niitä haravoidaan, kopioidaan ja konvertoidaan järjestelmästä toiseen.

Innostuvatko tutkijat?

Ehkä keskeisin haasteista Open Access -julkaisemisen yleistymisen tiellä on se, että tutkijoita on ollut toistaiseksi vaikea saada kiinnostumaan laajemmista julkaisutoiminnan kustannusrakenteeseen liittyvistä kysymyksistä. Esim. kirjastojen paikalliskäyttöön hankkimien verkkoaineistojen kohdalla on edelleen laajaa epätietoisuutta siitä, kuka aineistot on hankkinut tai miten suurista summista niiden hankinnan yhteydessä oikein on kysymys. Niinpä avoin saatavuus on toistaiseksi pysynyt useimpien tutkijoiden kohdalla aika toissijaisena kriteerinä oman tutkimuksen julkaisufoorumeja koskevissa valinnoissa.

Samat ongelmat koskevat varsin pitkälle myös rinnakkaisjulkaisemista. Vaikka artikkelien tallentamista on yritetty perustella myös avoimen julkaisemisen sitaatioeduilla (ts. OA-julkaisuhin viitataan keskimääräistä enemmän, edun suuruus tosin vaihtelee alasta riippuen), tutkijoiden mielenkiinto on ollut muualla. Tähänastisten kansainvälisten kokemusten perusteella pelkät suositukset eivät riitä lisäämään artikkelien tallentamista merkittävissä määrin, vaan sitä varten tarvitaan tiukempia määräyksiä joko tutkimusrahoittajilta tai yliopistoilta ja tutkimuslaitoksilta.

Helsingin yliopiston päätöksen kaltainen tallennusmandaatti, ts. rinnakkaisjulkaisemisen tekeminen enemmän tai vähemmän pakolliseksi on tietysti yksi ratkaisu tähän ongelmaan. Pakkokeinojen ongelmana on kuitenkin se, että ne ovat harvoin kovin suosittuja. Toivottavaa olisikin, että tutkijoiden tietoisuus julkaisemisen kustannuksista ja myös siihen liittyvistä tekijänoikeuskysymyksistä paranisi myös muista syistä. Avoimen julkaisemisen tarpeellisuutta ja sen tarjoamia etuja olisi hyvä päästä perustelemaan nykyistä enemmän myös tutkijoiden omille foorumeille.

Toisaalta tutkijoiden asennoituminen avointa julkaisemista ja rinnakkaisjulkaisemista kohtaan riippuu ehkä kuitenkin viime kädessä siitä, miten hyvin aineistojen tallentamisen prosessit sujuvat ja miten hyödyllisiksi toiminnan tuloksena syntyvät hakupalvelut koetaan. Näissä asioissa on varmasti vielä paljon haasteita tallennuslomakkeiden ja hakukäyttöliittymien rakentajille.

Tiedonhakijan näkökulma

Julkaisuarkistojen yhteydessä on puhuttu paljon julkaisujen viitetietojen haravoinnin avulla luotavista hakupalveluista, jotka sisältäisivät vain tiukan tieteellistä materiaalia. Käytännössä tähänastiset yritykset koota julkaisuarkistojen sisältöä esim. OAI-PMH-protokollan avulla toimivaksi portaaliksi tai hakupalveluksi eivät kuitenkaan ole olleet kovin vakuuttavia. Julkaisuarkistojen tarjoamista teknisistä rajapinnoista huolimatta yksittäisten julkaisuarkistojen sisältämien kuvailutietojen laatu vaihtelee niin huomattavasti, että todella toimivan viitetietoihin perustuvan hakupalvelun tuottaminen on vaikeaa. Lisäksi tällaisia tieteelliseen aineistoon keskittyviä palveluita vaivaavat myös osin samat ongelmat kuin alakohtaisia arkistojakin: resursseja on vaikea saada, ja rajanvetojen teko palvelujen profiloimisen suhteen on hankalaa.

Toistaiseksi julkaisuarkistojen tarjoama tiedonhakuympäristö onkin tiedonhakijan näkökulmasta katsottuna kovin sotkuinen. Julkaisuarkistoissa ilmestyneet tieteelliset aineistot ovat hajallaan eri puolilla verkkoa, ja esim. yhden yksittäisen lehden artikkelit sijaitsevat sikinsokin useilla eri palvelimilla. Niin kauan kuin rinnakkaisjulkaisemista ei tehdä yhtä kattavasti kaikissa organisaatioissa, on myös tiedonhakijan kannalta sattumanvaraista, mitkä artikkelit löytyvät verkosta ja mitkä eivät. Tiedonhakijoiden usein kaipaamaa selailumahdollisuutta on tätä kautta myös vaikea järjestää – tai ainakin selailu perustuu lehti- ja numerokohtaisen järjestyksen sijaan esim. julkaisijaorganisaation laitosrakenteeseen.

Lisäksi verkossa saattaa olla (osin kustantajien vaihtelevista politiikoista johtuen) saatavilla useita erilaisia versioita kustakin artikkelista. Erot saattavat olla sekä ulkoasullisia että myös sisällölisiä. Tämä asettaa vaatimuksia tiedonhakijoille, joiden pitää olla valppaana sen suhteen mitä artikkeliversiota he käyttävät ja mihin he viittaavat.

Järjestystä ja yksinkertaisia ratkaisuja rakastavien ihmisten toiveisiin tämä uusi maailma ei siis välttämättä vastaa. Toki on hyvä muistaa, että nykytilannekin on tältä osin kaukana ideaalisesta. Avoin saatavuus parantaa tilannetta ainakin sikäli, etteivät tieteelliset aineistot enää hautaudu yksittäisten kustantajien tai aggregaattorien tarjoamiin suljettuihin käyttöliittymiin, vaan ne ovat löydettävissä monenlaisten hakupalveluiden kautta. Käytännössä näyttääkin siltä, että julkaisuarkistoihin tallennettujen aineistojen globaalina käyttöliittymänä toimii ainakin alkuvaiheessa Google – joko tieteellisiin aineistoihin keskittynyt Google Scholar -hakupalvelu tai sitten vain yksinkertaisesti tavallinen Googlen perushaku, johon myös Google Scholarin hakutulokset äskettäin integroitiin.

Kansallisella tasolla ratkaisuna voi toimia myös muistiorganisaatioiden yhteinen asiakasliittymä, johon voidaan haravoida ja indeksoida erilaisia aineistoja erilaisista palveluista. Vaikka julkaisuarkistojen hajanaisuus on asiakasliittymänkin kannalta haaste, se tarjoaa kuitenkin toivon mukaan nykyistä parempia välineitä eri lähteistä koottuihin aineistoihin kohdistuviin tiedonhakuihin ja hakutulosten jäsentämiseen tiedonhakijan tarpeiden kannalta järkevällä tavalla. Asiakasliittymä tarjoaa myös – valitusta sovelluksesta riippuen – web 2.0 -henkisiä lisäpalveluita, joilla niilläkin voi olla arvoa tiedon jäsentämisen ja hakutulosten rikastamisen kannalta.

Valmiiden hakupalveluiden ja käyttöliittymien lisäksi tulevaisuuden tiedonhakijoita kiinnostavat todennäköisesti myös julkaisuarkistojen tekniset rajapinnat. Monilla tieteenaloilla on jo ryhdytty pohtimaan automaattisilla välineillä tehtävän tiedon louhinnan mahdollisuuksia, mikä asettaa vaatimuksia rajapintojen lisäksi myös arkistojen käyttämille tekijänoikeusratkaisuille. Käytännössä tämä tarkoittaa siis sitä, että valmiiden käyttöliittymien lisäksi kirjastoilla pitäisi olla valmiuksia tarjoa palveluita myös sellaisille asiakkaille, jotka haluavat rakentaa itse omat käyttöliittymänsä ja indeksointityökalunsa.

Lopuksi

Vaikka tämä tieteellisten julkaisujen runsaudensarvi ehkä onkin lähitulevaisuudessa kaikkien kiinnostuneiden ulottuvilla, kannattaa myös pitää mielessä, että tutkijoilla on edelleen käytettävissä vain rajallinen määrä aikaa lukemiseen, kirjoittamiseen ja tutkimiseen. Tieteellisen julkaisemisen volyymi on jo nyt niin suuri, että kovin merkittäviä kasvua ei ehkä enää ole (ainakaan länsimaissa) näköpiirissä. Näyttääkin todennäköiseltä, että jos ja kun rinnakkaisjulkaisemisesta tulee yleinen normi, tieteellisen julkaisemisen toimijoiden kesken päädytään jonkinlaiseen uuteen tasapainotilaan, joka toki kenties poikkeaa nykyisestä joiltakin osin.

Rinnakkaisjulkaiseminen parantaa tieteellisten aineistojen saatavuutta ja tehostaa epäilemättä joiltakin osin tiedeyhteisön toimintaa. Toisaalta jää kuitenkin nähtäväksi, merkitseekö se samalla myös jonkinlaista sisällöllistä tai laadullista muutosta niissä tavoissa, joilla tässä maailmassa tiedettä tehdään.

 

Kirjoittajan yhteystiedot

Jyrki Ilva, sovellussuunnittelija
Kansalliskirjasto
PL 26, 00014 HELSINGIN YLIOPISTO
Email: jyrki.ilva(at)helsinki.fi