Avointa linkitettyä dataa maailmalla : Raportti SWIB11-konferenssista

Nina Hyvönen
Kansalliskirjasto

Tämän sivun pysyvä osoite on: http://urn.fi/URN:NBN:fi-fe201205305659

 

Parin viime vuoden aikana Suomen kirjastoissa ja kirjastojen toimintaan tavalla tai toisella liittyvien sidosryhmien keskuudessa semanttisen webin teknologiat ja avoin linkitetty data (LOD, linked open data) ovat alkaneet herättää kasvavaa kiinnostusta. Kirjastoissa on lähdetty rohkeasti kokeilemaan datan avaamista ja avointa dataa hyödyntävien sovellusten rakentamista.

Euroopassa mm. Saksasta ja Iso-Britanniasta löytyy tällä saralla paljon aktiivisia kirjastoja ja asiantuntijoita. Avoimesta linkitetystä datasta kiinnostuneet saksaa puhuvat asiantuntijat kokoontuivat yhteen jo kolmatta kertaa Semantic Web in Bibliotheken -konferenssiin, joka järjestettiin Hampurissa marraskuun lopussa 2011.

Konferenssin teemana oli tällä kertaa tieteellinen kommunikaatio ”Wissenschaftskommunikation im Web of Data”-otsikolla. Esitys- ja työskentelykielenä oli siis pääasiassa saksa, mutta aina välillä vaihdettiin sujuvasti englantiin, kuten jo konferenssin teemakin antaa ymmärtää. Suurin osa osallistujista tuli luonnollisesti Saksasta, mutta mukaan mahtui osallistujia myös muista maista.

RDF

Konferenssin ensimmäisenä päivänä osallistuin workshop-työskentelyyn, jonka aikana Felix Ostrowski (HU Berlin und hbz) ja Pascal Christoph (hbz) johdattelivat meidät avoimen linkitetyn datan salaisuuksiin käymällä läpi RDF- tietomallin perusteita, datan avaamisen periaatteita ja datan avaamiseen liittyviä erilaisia immateriaalioikeudellisia kysymyksiä.

RDF-tietomalli (Resource Description Framework) on ”de-facto”- standardi linkitetyn datan esittämiselle verkossa. Se mahdollistaa useisiin eri tietomalleihin perustuvan tiedon yhdistämisen ilman, että jo kertaalleen mallinnettua tietoa tarvitsee uudelleen muokata. ”Turtle” taas on yksi monista tavoista kuvata RDF- tietomallia luonnollisen kielen rakenteita (”subjekti-predikaatti-objekti”) hyödyntäen. Kuvailukielten avulla RDF- malliin voidaan vielä yhdistää erilaisia luokituksia ja ominaisuuksia (sanastoja).

Kuten Thomas Baker esityksessään totesi, kirjastoalan kuvailustandardeja (ISBD, FRAD, FRSAD ja RDA) ollaan parhaillaan kääntämässä linkitetyn datan kielelle. ”Triplatut” standardit tarjoavat rakennuspalikoita uudenlaiselle kuvailulle, joka ei enää perustu pelkästään staattisiin, paikasta toiseen siirreltäviin tietueisiin, vaan metatiedot luodaan ”lennosta” todelliseen tarpeeseen. Tämä ei tietenkään poista tarvetta tuottaa metatietoja keskitettyihin rekistereihin – tuotantojärjestelmiä siis tarvitaan jatkossakin.

Käytännön toteutuksia maailmalta

Konferenssin aikana kuultiin runsaasti mielenkiintoisia esityksiä, joissa esiteltiin lukemattomia erilaisia tapoja soveltaa linkitettyä dataa eri yhteyksissä, niin kirjastoissa kuin muuallakin.

Adrian Stevensonin esityksessä ”The High and Lows of Library Linked Data” esiteltiin ns. LOCAH-projektia (Linked Open Copac and Archives Hub). Tässä projektissa brittiläisten arkistojen Archives HUBin ja Copacin tietueita muutetaan linkitetyksi dataksi. Tavoitteena on rikastaa dataa ja tarjota jatkossa linkkejä myös muihin, kirjastoalan ulkopuolisiin datasetteihin. Copac on mm. British Libraryn ja muiden Iso-Britanniassa toimivien kansalliskirjastojen sekä lukuisten akateemisten ja erikoiskirjastojen (ks. http://copac.ac.uk/libraries/) muodostama virtuaalinen yhteisluettelo. Se on Mimasin eli Iso-Britanniassa toimivan kansallisen datapalveluorganisaation tuottama palvelu, jota rahoittavat myös JISC, RLUK, the RIN ja British Library ja joka on rakennettu ”in house”- tuotetulla ohjelmistolla.

Christopher Gutteridge Southamptonin yliopistosta esitteli hyvin pragmaattisen lähestymistavan avoimeen linkitettyyn dataan. Southamptonin yliopiston Open data service -projektissa organisaation sisäistä, aikaisemmin vain yliopiston hallinnolliseen käyttöön tarkoitettua dataa – esimerkiksi erilaisia kiinteistöihin, ravintola- ja kahvilapalveluihin sekä talouteen liittyviä tietoja – on muutettu avoimeksi linkitetyksi dataksi, jonka päälle on sitten rakennettu erilaisia verkkosivuja ja sovelluksia (ks. esim. yliopiston rakennusta ja sen tarjoamia palveluita esittelevä verkkosivu: http://data.southampton.ac.uk/building/36.html). Eri lähteistä tulevaa dataa on yhdistelty ennakkoluulottomasti ja saatu näin aikaan uudenlaisia verkkopalveluita.

Yksi kiinnostavimmista esityksistä käsitteli Münsterin yliopiston LODUM -projektia (Das Linked Open Data University of Münster), jonka tavoitteena on edistää sekä yliopiston näkyvyyttä että ennen kaikkea sen läpinäkyvyyttä semanttisen webin teknologioiden avulla. Projektissa pyritään parantamaan tutkimustulosten toistettavuutta ja läpinäkyvyyttä tuomalla esiin paitsi tutkimusjulkaisuja, niin myös julkaisuihin liittyvää tutkimusdataa, toimintamalleja, metodeja ja ohjelmistoja. Tämän ns. linked sciencen avulla pyritään levittämään tietoa ja uusia tutkimustuloksia entistä tehokkaammin myös yli perinteisten tieteenalarajojen.

Kaiken kaikkiaan konferenssi oli mielenkiintoinen ja ajatuksia herättävä ja pisti miettimään entistä tarkemmin avoimeen linkitettyyn dataan kätkeytyviä innovaatiomahdollisuuksia.

PS. SWIB12 järjestetään 26.11. – 28.11.2012 Kölnissä.

Linkkejä

Kirjoittajan yhteystiedot

Nina Hyvönen, tietojärjestelmäpäällikkö
Kansalliskirjasto / Kirjastoverkkopalvelut
PL 26 (Teollisuuskatu 23)
00014 Helsingin yliopisto
sähköposti: nina.hyvonen [at] helsinki.fi