Lehtiaineistojen tutkimuskäyttö laajenee Tutkain-hankkeessa

Hakkarainen J-P (2019). Lehtiaineistojen tutkimuskäyttö laajenee Tutkain-hankkeessa. Tietolinja, 2019(2). Pysyvä osoite: http://urn.fi/URN:NBN:fi-fe2019120445611

Kansalliskirjasto ja Kopiosto sopivat marraskuussa 2019 kotimaisten lehtiaineistojen välittämisestä  tutkimuskäyttöön osana Tutkain-hanketta vuosina 2020–2022. Tutkaimeen liittyi 15 korkeakoulua, jotka saavat antaa HAKA-tunnuksilla autentikoiduille käyttäjille pääsyn Kansalliskirjaston digitaalisessa muodossa oleviin lehtiaineistoihin tutkimusta varten digi.kansalliskirjasto.fi -palvelun kautta.

Kuva: Tutkain-hankkeen aineistoja käytetään digi.kansalliskirjasto.fi -palvelussa

Haka-pilotin kokemuksista oppia Tutkaimeen

Tutkain on jatkoa vuosina 2018–2019 toteutetulle niin kutsutulle Haka-pilotille. Pilottiin osallistui kuusi erilaista ja eri kokoista käyttäjäryhmää, muun muassa Kulttuurihistorian oppiaineen tutkimusryhmäTurun yliopistosta, Helsingin yliopiston Ruralia-Instituutin henkilökunta,  Helsingin yliopiston humanistinen tiedekunta ja Jyväskylän yliopisto kokonaisuudessaan. Käyttäjäryhmät saivat käyttöönsä tekijänoikeuksien alaisia lehtiaineistoja digitaalisessa muodossa Kansalliskirjaston digi.kansalliskirjasto.fi -palvelussa kirjautumalla HAKA-tunnuksin ja täyttämällä käyttötarkoituskyselyn.

Pilotilla oli kaksi keskeistä tavoitetta. Ensinnä haluttiin edistää lehtiaineistojen käyttöä tutkimuksessa. Pilotin keskeisenä tavoitteena oli lehtiaineistojen tutkimuskäytön edistäminen. Toiseksi haluttiin varmistaa, että tekninen toteutus erityisesti käyttäjien tunnistamisen ja erilaisten käyttäjäryhmien räätälöinnin suhteen toimisi.

Käyttäjäryhmien rajaaminen teknisesti onnistui, mutta näiden ryhmien räätälöinti aiheutti lisätyötä niin Kansalliskirjastossa kuin pilottiin osallistuneissa organisaatioissa. Hankalinta oli Helsingin yliopiston humanistisen tiedekunnan kohdalla. Koko tiedekuntaa kattavaa HAKA-attribuuttia etsittiin pitkään, kun huomattiin ettei kaikilla käyttäjillä ollut pääsyä aineistoihin. HAKA-attribuutti määräytyi kustannuspaikan mukaan, jolloin esimerkiksi perustutkinto-opiskelijat rajautuvat aluksi pilotin ulkopuolelle. Yhdistelemällä erilaisia tietoja käyttöoikeus saatiin lopulta kattamaan lähes kaikkia tiedekunnan opiskelijoita ja henkilökuntaa, mutta tällöinkään apurahatutkijoita ei saatu liitettyä käyttöoikeuden piiriin. Heitä toki voitiin lisätä yksitellen käyttäjiksi yksilöivien HAKA-tunnisteiden perusteella, mutta tämä menettely ei ollut tarkoituksenmukaista.

Syksyllä 2018 ja talvella 2019 Kansalliskirjaston edustajat vierailivat Haka-pilotissa mukana olleissa organisaatiossa. Näissä tapaamisissa keskustelimme käyttäjäkokemusten lisäksi myös jatkohankkeesta. Aika varhain muodostui yleiseksi käsitykseksi se, että räätälöidyistä käyttäjäryhmistä tulisi Haka-pilotin kokemusten perusteella jatkohankkeen aikana luopua. Pilottiaineiston käyttöoikeuksista päätti jokainen korkeakoulu itse, eikä Kansalliskirjastolla ollut valtuuksia antaa yksittäisille käyttäjille pääsyä pilottiaineistoon. Tavoitteeksi asetettiin käyttöoikeuden myöntäminen mahdollisimman laajalle ryhmälle jokaisen jatkohankkeeseen osallistuvan korkeakoulun sisällä. Tällä ratkaisulla pyrittiin myös vähentämään räätälöidyistä käyttäjäryhmistä aiheutunutta lisätyötä ja tarpeetonta kitkaa käyttäjien, pilottiorganisaatioiden ja Kansalliskirjaston välillä.

Tutkain-hankkeessa käyttäjien tunnistaminen on toteutettu samoin kuin Haka-pilotissa. Toisin sanoen aineistojen käyttöön oikeutettu käyttäjä saa Tutkaimen aineistot käyttöönsä tunnistautumalla HAKA-tunnuksilla digi.kansalliskirjasto.fi:hin ja täyttämällä käyttölupalomakkeen ensimmäisellä käyttökerralla. Käyttölupalomakkeella kysytään aineistojen käyttötarkoitukseen liittyviä tietoja, kuten aineistojen käyttötarkoitus ja tutkimusala. Käyttölupalomake tulee täyttää uudelleen vuosittain.

Kuva: Käyttölupalomakkeen voi täyttää myös mobiililaitteella.

Uusia tavoitteita pilotoinnin pohjalta

Neuvottelut jatkohankkeesta aloitettiin huhtikuussa 2019. Tuolloin Kansalliskirjastolla oli jo vahva näkemys siitä, mitä pilotissa havaittuja puutteita haluaisimme korjata ja millaisia uusia avauksia tulisi tehdä. Tavoitteena oli löytää yhteinen ymmärrys jatkohankkeen ajallisesta kestosta, aineistoista ja niiden kattavuudesta, käyttäjäryhmistä, tutkijoiden tarpeista, rahoituksesta ja suunnittelevasta ohjausryhmästä. Visiona oli, että Kopioston ja Kansalliskirjaston sopimus tekijänoikeudenalaisen lehtiaineiston avaamisesta tutkimuskäyttöön vuoden 2020 alusta alkaen mahdollistaisi pitkäjänteisemmän ja tarkoituksenmukaisen sanoma- ja aikakausilehtiin kohdistuvan tutkimuksen kotimaisissa korkeakouluissa.

Pilottikausi oli vain vajaan puolentoista vuoden mittainen. Näin lyhyeltä ajalta kunnollista käytön tilastointia oli vaikea saada. Ajatus pidemmästä hankekaudesta rakentui akateemisen vuodenkierron ympärille. Jatkohankkeen ajalliseksi kestoksi tavoittelimme kolmen vuoden jaksoa. Tällöin hankekaudelta saataisiin riittävästi tietoa sekä käyttäjistä että aineistojen käytöstä. Lehtiaineistoihin kohdistuva tutkimus on luonteeltaan usein pitkäkestoista, ja pidempi sopimuskausi mahdollistaisi aineistojen tarkoituksenmukaisen hyödyntämisen. Kenties myös tutkimuksen tuotoksiakin saataisiin paremmin julki.

Toinen tavoitteistamme oli saattaa yhä tuoreempia lehtiaineistoja tutkijankunnan ulottuville. Haka-pilotissa aikaraja oli vedetty vuoteen 2010, mutta Tutkaimessa tavoittelimme aineistojen avaamista kahden vuoden embargolla siten, että uusi vuosikerta olisi asetettu aina kalenterivuoden alussa tutkijoiden käyttöön. Kävi kuitenkin ilmi, että tämän toteuttaminen olisi kovin hankalaa. Käytettävissä olleen ajan puitteissa neuvottelujen käyminen, hinnoittelumallin löytäminen ja kustannustenhallinnan järjestäminen ei olisi onnistunut. Päädyimme lopulta avaamaan aineistot Tutkaimessa aina vuoteen 2018 saakka koko hankekauden ajalta. Näin käyttäjät saavat tutkittavakseen noin 2,8 miljoonaa sanomalehtisivua enemmän vuosilta 2011–2018 kuin Haka-pilotissa. Tuoreempi lehtiaineisto mahdollistaa lähimenneisyyden julkisen keskustelun tutkimisen ja houkuttelee ehkä uusia ryhmiä aineiston käyttäjiksi.

Kuva: Tutkaimessa avataan digitoituja lehtiaineistoja vuosilta 1930-2018.

Jo Haka-pilotointia koskevassa sopimuksessa oli mahdollistettu tiedonlouhinta, mutta sopimus ei kuitenkaan tukenut datalähtöistä tutkimusotetta tarkoituksenmukaisesti. Määritelmänä oli käytetty yliopistojen ja Kopioston välistä kopiointiluvan muotoilua ja lehtiaineistosta tuotetut datasetit sai tallentaa vain Tietoarkistoon. Jatkohankkeessa halusimme mahdollistaa rikastettujen datasettien tallentamisen verifiointia varten sellaisessa ympäristössä, mikä palvelee tutkijoita parhaalla mahdollisella tavalla. Jatkohanketta koskevaan sopimukseen asia muotoiltiinkin toisin: Tutkaimessa mukana olevista tekijänoikeussuojan piirissä olevista aineistoista tai niiden osista luotuja datasettejä saa tallentaa tutkimuksen verifiointia ja myöhempää tutkimusta varten tutkijoiden saataville tutkijan valitsemassa data-arkistossa tai vastaavassa palvelussa. Lisäksi tekijänoikeuden suojaamia aineistoja tai niiden osia saa tallentaa tutkimuksen verifiointia ja myöhempää tutkimusta varten tutkijoiden saataville suljetussa sertifioidussa arkistossa, kuten Tietoarkistossa. Tällainen tapaus voisi olla vaikkapa yksittäisen tutkijan keräämä jonkin julkaisun muokkaamaton vuosikerta.

Miten aineistojen käyttö rahoitetaan?

Haka-pilotin kustannukset olivat kertaluontoisia, eivätkä ne muodostaneet mallia, jonka pohjalta Tutkaimen kustannukset olisi voitu laskea. Pilotin aikana Jyväskylän yliopistosta saatu tieto käyttäjämääristä toimi kuitenkin suhdelukuna, jota hyödynnettiin Tutkaimen kustannusten arvioinnissa. Tämä ei kuitenkaan vielä riittänyt kustannusten mallintamiseen, sillä halusimme Tutkaimeen mukaan lisää organisaatioita ilman rajattuja käyttäjäryhmiä. Tarvitsimme kustannusten arviointia varten tiedot potentiaalisista käyttäjämääristä kotimaisissa yliopistoissa ja ammattikorkeakouluissa. Saimme Tutkaimeen liittyvien organisaatioiden opiskelijoiden ja tutkimushenkilökunnan lukumääriä koskevat tiedot FinElib-toimiston keräämistä tilastoista. Tutkaimen kustannukset muodostuivat useiden eri elementtien pohjalta: Kopioston laskema mukana oleviin aineistoihin perustuva tariffi, potentiaalisten käyttäjien lukumäärä ja Jyväskylän yliopistosta saatu suhdeluku Haka-pilotin aikaisesta käyttäjämääristä.

Mietimme pitkään, miten Tutkain rahoitettaisiin. Hankekaudesta oli suunniteltu kolmivuotista ja halusimme tarjota aineistot mahdollisimman monelle korkeakoululle. Tämä tarkoitti sitä, että hankkeesta syntyisi enemmän kustannuksia kuin aikaisemmin. Tässä vaiheessa kustannusten jako yhdessä Tutkaimeen liittyvien organisaatioiden ja Kansalliskirjaston kesken olisi tuskin ollut realistinen vaihtoehto, sillä arvioimme organisaatioiden intressin maksaa tässä vaiheessa aineistoista vähäiseksi. Aineistojen tuottamaa hyötyä korkeakouluissa tehtävälle tutkimukselle on etukäteen vaikea osoittaa.

Kansalliskirjastossa päätettiin lopulta, että Tutkain olisi liittyville organisaatioille maksuton ja että Kansalliskirjasto vastaa aineistojen lisensoinnista koituvista kustannuksista yksin. Mikäli Tutkainta olisi tarjottu kaikille yliopistoille ja ammattikorkeakouluille tällä rahoitusmallilla, kustannukset olisivat ylittäneet Kansalliskirjaston kipurajan selkeästi. Koska emme voineet vaikuttaa lisenssikorvauksen perustana käytettyyn tariffiin ja käyttäjien suhdelukuun, niin ainoa keino kustannusten hillitsemiseen oli osallistuvien organisaatioiden määrän rajoittaminen.

Hinnoittelumalli luonnollisesti vaikutti siihen, kuinka laajalle käyttäjäkunnalle Tutkainta tarjottaisiin. Mikäli mukana olisivat olleet kaikki tiedekorkeakoulut ja ammattikorkeakoulut, kustannukset olisivat kasvaneet liian korkeiksi Kansalliskirjaston yksin hoidettavaksi. Kysyimme yliopistoilta alustaa kiinnostusta Tutkaimeen liittymisestä kesäkuussa 2019, ja lopullinen käyttäjäorganisaatioiden määrä vahvistui marraskuussa 2019. Tutkaimeen liittyi lopulta 15 korkeakoulua, mukaan lukien muutama ammattikorkeakoulu, joiden kirjastopalvelut on hoidettu yhteistyössä yliopistokirjastojen kanssa.

Hinnoittelu on voimassa koko sopimuskauden silläkin riskillä, että käyttäjämäärät olisivat pilottikauden käytöstä saatua suhdelukua suurempia. Tutkaimeen voi liittyä mukaan myös myöhemmin, mutta tästä on sovittava Kopioston kanssa erikseen. Myös lisensoinnin kustannukset määritellään jokaiselle liittyvälle organisaatiolle erikseen.

Sekä pilotin että nyt meneillään olevan Tutkaimen tavoite on ollut avata lehtiaineistoja tutkimuksen käyttöön. Kansalliskirjasto toivoo, että käytännöstä tulisi arkinen tapa. Tämän takaamiseksi tarvitaan kestävä ja pysyvä kustannusten jakamisen malli, ja sitä valmistelemaan tarvitaan ainakin Kopiosto, Kansalliskirjasto ja käyttäjäorganisaatiot, ehkä myös opetus- ja kulttuuriministeriö.

Entäs sitten?

Tutkain-hankkeessa mukana olevien aineistojen käyttö alkaa 1.1.2020, mutta hankkeeseen liittyvä työ ei ole suinkaan lopussa. Tutkaimen käyttäjinä on useita organisaatioita, joissa Kansalliskirjastossa digitoitujen aineistojen käyttö voi olla uudehko asia. Näiden käyttäjien kanssa toimiminen on ollut Kansalliskirjastolle uuden oppimisen paikka. Yritämme tutustua toisiimme mahdollisimman pian organisaatiovierailujen muodossa, ja alkuvuodesta 2020 on luvassa käyttäjäryhmille suunnattua käyttöopastusta ainakin webinaarin muodossa.

Niille korkeakouluille, joilla ei vapaakappalekirjaston statusta, Tutkaimen kautta avautuvat aineistot luovat uusia tutkimusmahdollisuuksia. Tutkaimen kautta käytettävä lehtiaineisto ei tosin vastaa laajuudeltaan vapaakappaletyöasemien kautta käytettäviä tekijänoikeuksien alaisia aineistoja, mutta se parantaa lehtiaineistojen saavutettavuutta ja tutkimuskäyttöä merkittävästi. On mielenkiintoista nähdä, millaiseksi yhteistyö ja lehtiaineiston tutkimuskäyttö esimerkiksi ammattikorkeakouluissa muodostuu.

Kansalliskirjasto on sopinut Tutkaimeen liittyneiden organisaatioiden kanssa siitä, että käyttötilastot jaetaan osallisten kesken vuosittain. Kopioston kanssa on puolestaan sovittu, että aineistojen käyttöä seurataan. Tätä tarkoitusta varten perustamme Tutkaimelle ohjausryhmän, johon pyydetään edustajat niin Kansalliskirjastosta, Kopiostosta kuin käyttäjäorganisaatioistakin. Tilastoinnin purkaminen on yksi tulevan ohjausryhmän tehtävä. Toinen voisi hyvinkin olla Tutkaimen jälkeisen ajan suunnittelu.

Kirjoittajan yhteystiedot

Jussi-Pekka Hakkarainen, tietoasiantuntija, Tutkaimen projektipäällikkö
Kansalliskirjasto, tutkimuskirjasto
Unioninkatu 36, 00014 Helsingin yliopisto
jussi-pekka.hakkarainen [at] helsinki.fi

Leave a Reply

This site uses Akismet to reduce spam. Learn how your comment data is processed.