Avoin bibliografinen data – lisensiointi ja strategiat

ELAG 2011 työpajaraportti

elag2011logo

Laila Heinemann ja Nina Hyvönen
Kansalliskirjasto

Tämän artikkelin pysyvä osoite on http://urn.fi/URN:NBN:fi-fe201106081711

Työpaja otsikolla Open Bibliographic Data – Licensing. Activities. Strategies oli pieni, mutta sitäkin keskustelevampi. Sen vetäjänä toimi Adrian Pohl Saksan Nordrhein-Westfalenin osavaltion korkeakoulukirjastokeskuksesta. Hän halusi korostaa heti alkajaisiksi, että hän ei itse ole juristi. Lisäksi immateriaalioikeuksia koskeva lainsäädäntö vaihtelee maasta toiseen eikä kaikkia laintulkintoja ole vielä testattu oikeudessa. Niinpä työpajassa voitiin käsitellä vain yleisiä linjauksia, ei antaa selkeitä vastauksia konkreettisiin kysymyksiin.

Tässä kuitenkin päällimmäistä antia:

Avoin pääsy (open access) voidaan toteuttaa sen kummemmin lisensioimatta. Aineisto on avointa, jos se on tarjolla yleisessä verkossa ja siihen pääsee käsiksi kirjautumatta. Avoin data sen sijaan ei ole oikeasti avointa, ellei siihen ole liitetty lisenssiä, joka kertoo miten sitä voidaan uusiokäyttää.

Lisäksi on vielä erotettava toisistaan viitetiedot ja tietokannat. Eurooppalaisen lainsäädännön mukaan yksittäisiin viitteisiin ei kenelläkään voi olla tekijänoikeutta, mutta kokonaiseen tietokantaan (tai muuhun viitekokoelmaan) voi jollakulla olla omistusoikeus. Tällöin siitä ei saa ladata itselleen ”huomattavaa osaa”. Tähän perustuu esimerkiksi se, että tutkijat ja opiskelijat voivat selata vapaasti viitetietokantoja (vapaa pääsy) ja tallentaa niistä yksittäisiä viitteitä omiin viitteidenhallintajärjestelmiinsä, kuten esim. RefWorksiin.

Kokonaisen tietokannan kaikkien viitteiden – tai niistä huomattavan osan – tallentaminen omalle koneelle tai muuhun järjestelmään rikkoo usein jotain sopimusta. Kyseessä voi olla esimerkiksi tietokannan käyttösopimus, joka solmitaan sen tuottajaorganisaation kanssa, tai omistusoikeus, joka saattaa sisältyä yhteisluettelon tuottajan, ylläpitäjän tai järjestelmätoimittajan kanssa solmittuun sopimukseen. Viimeksi mainittu on sellainen, joka saattaa joskus tulla kirjastoille jopa yllätyksenä, koska tällaiseen pykälään ei ole huomattu kiinnittää huomiota silloin, kun on oltu solmimassa teknistä järjestelmäsopimusta. Kaikkein kimurantein kysymys on poimintaluetteloinnin kohdalla – milloin muualta poimittuja tai ostettuja tietueita on niin paljon, että niitä voidaan pitää ”huomattavana osana” ja muuttuuko niiden omistusoikeus silloin kun niitä muokataan omassa järjestelmässä? Yksinkertaista vastausta ei ikävä kyllä ole.

Datan avaamisen perusaskeleet ovat:

  • 1. Varmista omat oikeutesi dataan (tarkista kaikki siihen liittyvät sopimukset)
  • 2. Poimi data tietokannasta ja erota siitä pois mahdolliset sensitiiviset elementit (esim. henkilötiedot)
  • 3. Julkaise se
  • 4. Kuvaile se ja määrittele sen käyttölisenssi
  • 5. Ilmoita se relevantteihin datakatalogeihin (esim. CKAN, data.suomi.fi)
  • 6. Tiedota siitä kaikilla mahdollisilla kanavilla (tiedotuspalstat, postituslistat, blogit, twitter jne.)

Yksi olennainen askel dataa avattaessa on siis määritellä sen käyttölisenssi, eli kertoa selkeästi, mitä sillä saa tehdä ja miten. Yleisimmin käytössä olevat avoimet lisenssit ovat:

  • CC0, eli Creative Commons Zero Waiver, jolla luovutetaan kaikki oikeudet dataan
  • CC-BY, eli Creative Commons Attribution, jolla annetaan oikeus käyttää, kierrättää ja yhdistellä dataa vapaasti, kunhan sen alkuperäinen lähde mainitaan
  • CC-BY-SA, eli Creative Commons Share-Alike, jossa edellisen lisäksi edellytetään että uusiokäytetty data jaellaan edelleen vastaavalla lisenssillä eikä sitä siis saa rajoittaa tiukemmin

Creative Commons -lisenssejä ovat lisäksi NC (non-commercial) ja ND (no derivatives), mutta ne eivät ole avoimia sanan varsinaisessa merkityksessä.

Creative Commons -lisenssit on kehitetty Amerikassa, eivätkä ne sovellu täysin yksiselitteisesti eurooppalaiseen lainsäädäntöön, mistä syystä Euroopassa on mietitty erilaisia omia ratkaisuja. Mitään konkreettista vaihtoehtoa ei kuitenkaan vielä ole noussut esille. Creative Commons -lisenssien seuraavan sukupolven versioiden pitäisi olla valideja myös Euroopassa.

Menimme työpajaan suurin odotuksin kuulemaan muiden ratkaisuista, mutta saimmekin kuulla, että kaikilla on samanlaisia ongelmia. Mene ja tiedä sitten, onko se hyvä vai huono tulos. Ainakin se vakuuttaa, että yhteistyö ja vertaistuki kannattavat tässäkin asiassa.

Lisätietoja

Työpajan wiki on kaikille avoinna osoitteessa
http://wiki1.hbz-nrw.de/x/oJIj.
Sieltä löytyy myös lisää hyödyllisiä linkkejä.

Tsekin kansallisen teknillisen kirjaston asiakaspäätteitä. (Kuva: Laila Heinemann)

Tsekin kansallisen teknillisen kirjaston asiakaspäätteitä. (Kuva: Laila Heinemann)

Kirjoittajien yhteystiedot

Laila Heinemann, tietojärjestelmäasiantuntija
Nina Hyvönen, tietojärjestelmäpäällikkö

Kansalliskirjasto / Kirjastoverkkopalvelut
PL 26 (Teollisuuskatu 23)
00014 Helsingin yliopisto

sähköposti: etunimi.sukunimi [at] helsinki.fi