ELAG2015: Dataa ja e-vapaakappaleita

Lassi Lager
Kansalliskirjasto

Tämän artikkelin pysyvä osoite on: http://urn.fi/URN:NBN:fi-fe2015092113663

 

Avoin tiede, data ja tiedonlouhinta ovat olleet tänä vuonna pinnalla kirjastoalan konferensseissa. Tämän lehden toisessa kirjoituksessa käsitellään kesäkuussa Lontoossa pidetyn LIBER-konferenssin antia, mutta samat teemat olivat esillä myös hieman aikaisemmin Tukholmassa pidetyssä ELAGissa. ELAG eli European Library Automation Group Systems Seminar on perinteikäs erityisesti kirjastoteknologiaan keskittyvä konferenssi, joka on pariin otteeseen järjestetty myös Helsingissä, viimeksi vuonna 2010.

Dataa ja sen louhintaa

ELAGin pääteemana oli ytimekkäästi ”data”. Kirjastot joutuvat perinteisen bibliografisen metatiedon (datan) lisäksi käsittelemään myös muunlaista dataa ja toisaalta perinteistä kirjastodataa käsitellään myös kirjastojen ulkopuolella.

Magnus Bomanin ja Daniel Gillbladin keynote-esitys “Sometimes I feel sorry for the data” käsitteli tiedonlouhinnan mahdollisuuksia – ja ongelmia. Suurten aineistojen analysointimahdollisuudet ovat valtavat. Datamassoista tehdyt erilaiset visualisoinnit ovat näyttäviä ja tuovat uusia näkökulmia kerätyn datan käyttöön ja yhdistämiseen. Toisaalta big datan analysointi on vielä lapsenkengissä: analysointeja ja tulkintoja tehdään liian heppoisesti ja niistä esitetään helposti virheellisiä tilastollisia korrelaatioita.

sorry-for-the-data

Patrick Hochstenbachin kuvitettuja muistiinpanoja ELAGista (CC-BY, http://hochstenbach.wordpress.com)

Ennen kuin dataa päästään analysoimaan, esteenä ovat usein kuitenkin tekijänoikeussäädökset, joihin mm. Haagin julistuksen allekirjoittajat toivovat löyhennyksiä. Eri maiden vaihtelevat tekijänoikeussäädökset vaikuttavat tieteelliseen kilpailukykyyn ja tällä hetkellä Eurooppa on vaarassa jäädä jälkeen tiedonlouhinnan mahdollistamisessa. Euroopan maista Iso-Britannian lainsäädäntö on uudistunut vuonna 2014 mahdollistaen tiedonlouhinnan muuten tekijänoikeussuojatuista aineistoista. Suurimmassa osassa EU-maista tiedonlouhintaan liittyvä tekijänoikeussuoja on kuitenkin edelleen vahva.

E-vapaakappaleita Ruotsista ja Irlannista

Myös eri maissa kerätyt verkkoarkistot ja arkistoidut elektroniset vapaakappaleet tulisi saada paremmin tutkijakäyttöön – muullakin tavalla kuin vapaakappaletyöasemien ruudulta lukemalla. Mutta samalla täytyy toki huolehtia myös aineiston laadukkaasta keräyksestä.

Ruotsalaiset Daniel Jansson ja Stina Degerstedt pitivät esityksen e-vapaakappaleiden luovutuksesta ja käsittelyprosesseista Kungliga biblioteketissa. Ruotsissa laki on toden teolla laajentunut verkkojulkaisujen luovutukseen vasta tämän vuoden alusta. Verkkoharavointi on kuitenkin aloitettu jo vuonna 1997.

Tällä hetkellä e-vapaakappaleita voi luovuttaa Ruotsissa verkkolomakkeella, luovutusta varten räätälöidyn RSS-syötteen avulla, FTP-tiedostonsiirtona – tai fyysisinä tallenteina. Luovutusten edellytetään sisältävän myös kuvailevaa metadataa, minkä muodosta ja esimerkiksi useamman tiedoston sisältävien julkaisujen luovutuksesta on annettu tarkat ohjeet. Erityisesti teknistä metadataa myös rikastetaan automaattisesti ja RSS-syötteiden avulla huomioidaan myös julkaisujen myöhempi täydentäminen: esim. verkkolehden uutinen voi sisältää ensin vain tekstiä, mutta sitä täydennetään myöhemmin kuvilla ja tarkemmilla tiedoilla. Samasta uutisesta voidaan säilyttää eri versioita, mutta ne pyritään linkittämään toisiinsa tunnisteiden avulla. Luovutettujen julkaisujen metadata julkaistaan yhteisluettelo Libriksessä, jossa sitä tarvittaessa korjaillaan kirjastohenkilökunnan toimesta vasta jälkeenpäin. Ks. lisätietoa Ruotsin käytännöistä.

ELAGissa on perinteisesti pidetty myös lyhyiden esitysten lightning talk -sessioita, joissa kuullaan kerralla useita joskus spontaanejakin esityksiä teemoista, joita kussakin organisaatiossa on meneillään. Esityksissä ei ole aikaa jaaritteluun, mutta aiheista kiinnostuneet voivat toki kysyä esittäjiltä lisätietoa myöhemmin. Sessiot ovat osoittautuneet toimiviksi.

Patrick Hochstenbachin kuvitettuja muistiinpanoja ELAGista (CC-BY, http://hochstenbach.wordpress.com)

Patrick Hochstenbachin kuvitettuja muistiinpanoja ELAGista (CC-BY, http://hochstenbach.wordpress.com)

John McManus piti yhden tällaisen salamaesityksen e-vapaakappaleiden vastaanotosta Dublinin Trinity Collegen kirjastossa, joka on historiallisista syistä paitsi Irlannin, myös Yhdistyneiden kuningaskuntien vapaakappalekirjasto. Vuonna 2013 Yhdistyneiden kuningaskuntien vapaakappalelaki uudistui kattamaan elektroniset julkaisut, ja tämän kautta myös Trinity Collegen kirjasto on oikeutettu tarjoamaan vapaakappaletyöasemillaan pääsyn naapurimaan elektroniseen vapaakappaleaineistoon. Irlannin oma vapaakappalelaki ei kuitenkaan kata vielä verkkojulkaisuja ja muuta e-aineistoa. Uusi lainsäädäntö on kuitenkin tekeillä ja Irlanninkin vapaakappalelain uskotaan laajenevan lähivuosina muuhunkin kuin painettuun aineistoon. Lainmuutos voi tuoda helpotusta myös vapaakappaleiden luovuttajille: tällä hetkellä irlantilaisten julkaisijoiden luovutusvelvollisuus on 13 kopiota jokaisesta julkaisusta, mutta Yhdistyneissä kuningaskunnissa painettua versiota ei tarvitse luovuttaa lainkaan, kunhan luovuttaa saman julkaisun sähköisen version.

Uutta lakia odotellessa Trinity Collegen kirjasto on avannut kansallisen palvelun e-julkaisujen vapaaehtoista luovuttamista varten. Tämän palvelun kautta saatu aineisto on kaikkien käytössä vapaaehtoisten luovutusten avoimessa julkaisuarkistossa.

Myös Kansalliskirjastossa kehitetään elektronisten vapaakappaleiden luovutus- ja käyttöönasettamisprosesesseja ja mietitään verkkoarkiston saamista paremmin tutkijakäyttöön. Vastaavien asioiden kanssa painitaan myös muissa maissa – tietoa ja kokemuksia kannattaa jakaa.

ELAGin illanvietto järjestettiin Junibackenissa

ELAGin illanvietto järjestettiin Junibackenissa

 

Kirjoittajan yhteystiedot

Lassi Lager, tietojärjestelmäpäällikkö
Kansalliskirjasto / kirjastoverkkopalvelut
PL 26, 00014 HELSINGIN YLIOPISTO
sähköposti: lassi.lager [at] helsinki.fi