Omalta koneelta käyttämään tekijänoikeuden alaisia aineistoja

Hakkarainen J-P, Pääkkönen T, Rautiainen J (2018). Omalta koneelta käyttämään tekijänoikeuden alaisia aineistoja. Tietolinja, 2018(2). Pysyvä osoite: http://urn.fi/URN:NBN:fi-fe2018092236394

Kansalliskirjasto on käynnistänyt kesällä 2018 yhdessä Kopioston ja kuuden korkeakoulun kanssa pilottihankkeen, jonka tarkoituksena on edistää sanoma- ja aikakausilehtien tutkimuskäyttöä. Vuoden 2019 loppuun kestävässä pilottihankkeessa Kansalliskirjaston Digi-palveluun tunnistautunut käyttäjä voi selata, tehdä hakuja, ladata ja louhia kaikkia Digissä olevia aineistoja aina vuoteen 2010 saakka.

Aineistojen saavutettavuus paranee

Loppukesästä käynnistynyt pilotti avaa uusia mahdollisuuksia tekijänoikeuksien alaisen aineiston tutkimuskäyttöön. Aikaisemmin tekijänoikeuksien alaisia aineistoja on voinut joko lukea mikrofilmiltä tai selata Kansalliskirjaston vapaakappaletyöasemilta. Molemmat toimenpiteet on voinut tehdä vain Kansalliskirjaston lukusaleissa tai vapaakappalekirjastojen asiakaspäätteiltä, joten kyseessä on merkittävä parannus aineistojen saavutettavuuden kannalta. Nyt käyttäjä voi kirjautua Digiin omalta koneeltaan tai mobiililaitteeltaan käyttäen HAKA-tunnuksia.

Pilottiorganisaatioiden avulla lisää tietoa tutkimuskäytöstä

Kaikille HAKA-organisaatioille Digi ei ole avoinna tässä laajuudessa, vaan pilottiin on valikoitunut ennen kaikkea humanististen ja yhteiskuntatieteellisten oppialojen ryhmiä, mutta toisaalta myös koneoppimisen kehittäjiä ja digitaalisten ihmistieteiden tutkijoita. Kokeiluun osallistuvat ryhmät on muodostettu pilottiorganisaatioiden kanssa käytyjen keskustelujen pohjalta. Keskusteluissa pyrittiin huomioimaan sekä organisaatioiden tarpeet että tekniset valmiudet mahdollisimman hyvin. Mukaan valikoitui kuusi korkeakoulua. Pilottiorganisaatiot ovat

  • Helsingin yliopiston humanistinen tiedekunta (Tiedekunnan opiskelijat, tutkijat ja henkilökunta)
  • Helsingin yliopiston Ruralia-instituutti (Instituutin henkilökunta)
  • Jyväskylän yliopisto (yliopiston henkilökunta ja opiskelijat)
  • Oulun yliopisto (HIKUVIE-tutkinto-ohjelman henkilökunta)
  • Tampereen yliopisto (historian, viestinnän ja media sekä journalistiikan tutkijat ja opettajat)
  • Turun yliopisto (Kulttuurihistorian oppiaineen tutkimusryhmä)

Pilottiorganisaatiot solmivat Kansalliskirjaston kanssa sopimuksen, jossa ne sitoutuvat noudattamaan aineiston käyttöön liittyviä rajoituksia ja valvomaan, että palvelua käyttävät vain sopimuksessa määritellyt ryhmät. Kansalliskirjasto puolestaan on tehnyt Kopioston kanssa sopimuksen, jossa se saa valtuudet tarjota tekijänoikeudenalaiset aineistot sopimuksen solmineille pilottiorganisaatioille määräajaksi. Kaikki sopimustekstit ovat Kopioston tarkastamia ja hyväksymiä.

Osallistuvien organisaatioiden koko ja käyttötarpeet vaihtelevat. Tämä luo haasteen palautteen keräämiselle. Vastikään toteutetussa Digin käyttäjäkyselyssä joitain tarpeita on pystytty paikantamaan, mutta pilotoinnin aikana toivotaan saavutettavan aikaisempaa laajempaa käsitystä Digissä olevien sisältöjen tutkimuskäytöstä. Vaikuttavan palautteen keräämiseksi vuorovaikutus käyttäjäkunnan kanssa on erityisen tärkeää. Hankkeen aikana pyritään luomaan tiivis keskusteluyhteys käyttäjäryhmien ja Kansalliskirjaston välille mm. vierailemalla pilottiin osallistuvissa organisaatioissa ja esittelemällä palvelua eri yhteyksissä. Tarkoituksena on, että aineistojen tutkimuskäyttöä pystyttäisiin tarkastelemaan entistä laajemmin ja kohdentamaan kehitystyötä asiakkaiden toiveita silmällä pitäen.

Tähän mennessä saadun palautteen perusteella pilottiorganisaatioiden määrän kasvattamiselle olisi tarvetta. Uusien pilotoijien liittyminen vaatisi neuvotteluja Kansalliskirjaston, uuden käyttäjäorganisaation ja Kopioston välillä. Ottaen huomioon, että neuvottelut vaativat vähintään 1-2 kuukautta, ja hankkeen kesto on vain puolitoista vuotta, jäisi myöhemmin mukaan tulleiden organisaatioiden tutkijoille ja opiskelijoille hyvin vähän aikaa hyödyntää lehtiaineistoa.

Käyttäjän kirjautuminen, käyttöoikeudet ja velvollisuudet

Monille yliopistojen ja korkeakoulujen käyttäjille HAKA-tunnistautuminen on entuudestaan tuttu monista muista palveluista. Se mahdollistaa tunnistautumisen verkostoon kuuluviin palveluihin käyttäjän oman organisaation hallinnoimalla yhdellä tunnuksella ja salasanalla.

Digissä ensimmäisen tunnistautumisen yhteydessä pilottiin kuuluvalle käyttäjälle esitetään yhteenveto aineiston käyttöoikeuden keskeisimmistä rajoitteista. Jos käyttäjä tässä vaiheessa katsoo, että hänen käyttötarkoituksensa ei kuulu pilotissa sallittuihin, voi hän jättää ehdot hyväksymättä, jolloin pääsyä pilottiaineistoihin ei kyseiselle käyttäjälle avata.

Pilottiin osallistuvilta käyttäjiltä edellytetään myös vastaamista lyhyeen kyselyyn, jolla kerätään tietoa palvelun jatkokehitystä varten. Siinä pyydetään kertomaan muun muassa tutkimusala, tutkimuksen tyyppi ja arvioimaan kuinka pitkäksi ajaksi käyttäjä tarvitsee aineistoa ilmoittamaansa käyttötarkoitusta varten. Saatuja vastauksia hyödynnetään muun muassa tausta-aineistona neuvoteltaessa pilotoinnin jälkeisistä käyttöoikeuksista.

Kuva 1. HAKA-kirjautumisen vaiheita.

Sopimus mahdollistaa tiedonlouhinnan

Haka-pilotointia koskeva sopimus mahdollistaa myös tiedonlouhinnan, jossa määritelmänä käytetään yliopistojen ja Kopioston välistä kopiointiluvan muotoilua. Haka-sopimuksessa tiedonlouhinta on määritelty seuraavasti:

”Auktorisoitu käyttäjä saa analysoida aineistoa koneellisesti ja luoda aineistosta rikastettuja datasettejä, tallentaa ja asettaa uudelleen tutkimuskäyttöön näin luotuja datasettejä tutkimuksen verifiointia ja jälleenkäyttöä varten Tampereen yliopiston Tietoarkistoon Kopioston ja Tampereen yliopiston Tietoarkiston välisen sopimuksen mukaisesti.” [1]

Tutkija voi tällöin hyödyntää digitaalisia aineistoja omassa ympäristössään tehden analyysejä tekstikorpuksesta oman tutkimuskysymyksensä mukaan. Käyttäjien onkin hyvä huomata, että aineisto on pilotointisopimuksen nojalla käytettävissä vuoden 2019 loppuun saakka. Tämä aikarajaus kannattaa huomioida mm. aineistohallintasuunnitelmissa.

Kansalliskirjasto ohjeistaa tutkijoita lataamaan haluamiaan aineistojaan omatoimisesti ja ensimmäinen luonnosversio ohjeesta on valmisteilla. Myöhemmin annamme neuvoja kuinka käsitellä aineistomassaa ja poimia sieltä halutut aineistot tai kuinka päästä visualisoinneissa alkuun. Ohjeet löytyvät projektin verkkosivulta.

Kuva 2. Esimerkki verkkopalvelujen tarjoamista mahdollisuuksista tiedon visualisoinnissa.

Pilotoinnista pysyviin ratkaisuihin

Kansalliskirjasto toivoo, että hankkeen päätyttyä aineistojen käyttö tutkimustyössä on lisääntynyt ja aineistojen tutkijakäytöstä on saatu esimerkkejä, joiden avulla kehitystyötä voidaan jatkaa. Hankkeeseen liittyy paljon odotuksia, eikä ainoastaan Kansalliskirjaston näkökulmasta. Kyseessä on pilotti, jonka toivotaan antavan esimerkin tekijänoikeuksien alaisten aineistojen lisensoinnista tutkimuskäyttöön. Pilottihankkeen kokemukset ja tutkijoilta saatu palaute tulevat olemaan keskeisellä sijalla aineistojen jatkokäytöstä neuvoteltaessa. Tavoitteena on siis kehittää sopimusmalleja siten, että ne olisivat tutkimuskäytön kannalta tarkoituksenmukaisia ja edistäisivät digitaalisen tiedon avaamista, louhimista ja saatavuutta jatkossakin.

Yhteysosoite: [email protected]

Verkkosivu ja aineistolistaus: https://www.kansalliskirjasto.fi/fi/projektit/sanoma-ja-aikakauslehtiaineiston-tutkimus-ja-opetuskayton-edistaminen

Lähteet:

[1] Haka-sopimus Kopiosto-Kansalliskirjasto 3.5.2018. Vain sisäiseen käyttöön. Viitattu 17.9.2018.

Kirjoittajien yhteystiedot

Jussi-Pekka Hakkarainen, tietoasiantuntija
Kansalliskirjasto, tutkimuskirjasto
Unioninkatu 36, 00014 Helsingin yliopisto
jussi-pekka.hakkarainen [at] helsinki.fi

Tuula Pääkkönen, tietojärjestelmäasiantuntija
Kansalliskirjasto, tutkimuskirjasto
Saimaankatu 6, 50100 Mikkeli
tuula.paakkonen [at] helsinki.fi

Juha Rautiainen, tietojärjestelmäasiantuntija
Kansalliskirjasto, tutkimuskirjasto
Saimaankatu 6, 50100 Mikkeli
sähköposti: juha.rautiainen [at] helsinki.fi

2 Comments

  1. Antero Leitzinger

    Sanomalehtikirjasto on mahtava! Varsinkin näin korona-aikaan toivoisi kuitenkin, että muutkin kuin jonkin organisaation jäsenet voisivat saada tutkimuksiaan varten HAKA-tunnukset tai niihin verrattavan pääsyn jo 1940-luvun ja tuoreempiinkin lehtiin. Lisäksi olisi mielenkiintoista tietää, missä muissa maissa on vastaavia sähköisiä lehtikokoelmia, ja linkit niihin.

Leave a Reply

This site uses Akismet to reduce spam. Learn how your comment data is processed.