Kirjaston vastaus informaatioympäristön muutokseen : Semanttinen web, ontologiat ja standardit osana kirjastojen tiedonhallinnan infrastruktuuria

Marjatta Autio-Tuuli
Marja-Liisa Seppälä
Kansalliskirjasto

Tämän artikkelin pysyvä osoite on http://urn.fi/URN:NBN:fi-fe201012143106

Artikkeli on tiivistelmä Informaatiotutkimuksen päivillä pidetystä esityksestä ja on julkaistu myös Informaatiotutkimus-lehden numerossa 3/2010.

Informaatioympäristön muuttuminen

Informaatioympäristön keskeisiä muutoksia aineiston kuvailutietojen näkökulmasta ovat informaation ja julkaisemisen uudet muodot. Sisältöjen muuttuessa yhä enemmän digitaaliseen muotoon informaation tallentaminen ja välittäminen on moninaistunut. Samalla julkaisemisen määrä ja tiedonsaannin mahdollisuudet ovat lisääntyneet. Tiedonsaannin helpottuessa käyttäjä etsii tietoa omatoimisesti ilman tiedonhaun ohjausta.

Digitaalinen toimintaympäristö merkitsee uusia vaatimuksia ja mahdollisuuksia metatietojen tallentamiselle, esittämiselle ja käytettävyydelle. Tiedonhakijalle voidaan tarjota mielekästä ja tarkoituksenmukaista linkittämiseen perustuvaa navigointiympäristöä. Erityyppisten metatiedontuottajien yhteistyöllä ja yhteensopivilla standardeilla edistetään metatiedon välittämistä ja rikastamista.

Uusi kuvailustandardi – uusi ajattelutapa

Uusi luettelointistandardi RDA [1] on vastaus informaatioympäristön muutokseen. Anglo-amerikkalaisiin luettelointisääntöihin AACR2:een (Anglo-American Cataloguing Rules) pohjautuva RDA ilmestyi kesäkuussa 2010. Keskeinen uusi asia luettelointisäännöissä on kuvailu- ja hakutieto-ohjeiden perustuminen tiedonmallinnuksen teoriaan. FRBR [2] ja sen johdannaiset FRAD [3] ja FRSAD [4] muodostavat RDA:n teoreettisen viitekehyksen. Ko. käsitemallit määrittelevät tiedonhakijan mielenkiinnon kohteet, entiteetit, ja näitä kuvailevat tiedot, attribuutit, sekä entiteettien keskinäiset suhteet.

Kaavio 1

Kaavio 1

FRBR-mallissa määritellyt tiedonhakijoiden tarpeet ohjaavat metatietojen muodostamista. Funktionaalisen kuvailun tulee auttaa tiedonhakijaa löytämään, tunnistamaan, valitsemaan ja saamaan käyttötarkoitukseensa sopivaa tietoa sekä navigoimaan entiteettien välille luotujen suhteiden avulla. Lisäksi FRAD-malli tukee tiedon löytymistä yhdistämällä entiteetin ensisijaisen nimimuodon ja sen varianttimuodot. Ensisijaisesta nimimuodosta ja muista kuvailutiedoista muodostettu hakutieto kokoaa toisiinsa funktionaalisessa suhteessa olevia entiteettejä. (Ks. kaavio 1)

RDA-ohjeita noudattava metatieto tallennetaan vastaamaan FRBR-mallissa määriteltyjä tiedonhakijan tarpeita. Keskeinen tavoite kuvailussa on sisällön nostaminen esiin teos/ekspressio-tason kautta. Tämä tukee sisältölähtöistä tiedonhakua moniulotteisessa digitaalisessa tietomassassa. Entiteettien linkittäminen toisiinsa tarjoaa tiedonhakijalle metatietokontekstin ja joustavan liikkumisen metatiedossa (ks. kaavio 2). Linkittäminen yhdessä funktionaalisen metatiedon palastelun (rakenteistamisen) kanssa mahdollistaa ekonomisen metatiedon tuottamisen: jokainen tietoelementti tallennetaan vain kerran.

Kaavio 2

Kaavio 2

Metatieto avoimeen verkkoon

Funktionaaliselle tiedonmallinnukselle pohjautuva RDA muodostaa ontologiarakenteisen, merkityksellisten (semanttisten) suhteiden verkoston. Koska RDA ei määrittele, miten metatiedot esitetään, mallinnetaan ne semanttiseen webiin esim. DCMI- [5], Indecs Metadata Framework – [6] ja RDF-viitekehysten [7] avulla. RDA:n entiteetit, elementit ja arvot vastaavat RDF-mallin luokkia (class) ja ominaisuus/arvo-pareja (property/value-pair) [8].

RDA_kaavio3_pieni

Kaavio 3: Esimerkki RDF-mallinnuksesta (Osa URI-tunnisteista kuvitteellisia)

Avoin linkitetty data [9] rakentuu kielineutraaleille luokkien, ominaisuuksien ja arvojen URI-tunnisteille, jotka mahdollistavat tietojen automaattisen linkittymisen yli organisaatiorajojen. Globaalit metadatarekisterit, kuten RDA-sanasto [10], määrittelevät arvojen ja ominaisuuksien termejä metatietojen laadun ja yhdenmukaisuuden parantamiseksi. Tietojärjestelmä, johon globaali metadatarekisteri on integroitu, auttaa tiedonhakijaa valitsemaan täsmällisempiä hakutermejä ja näin parantamaan hakutuloksia.

Kohti rikkaampaa metatietoa

Kirjastojen metatiedon avaaminen verkkoon korostaa luotettavan metatiedon keskeisyyttä. URI-tunnisteiden rekisteröityjen nimialueiden (namespace) avulla voidaan osoittaa metatiedon provenienssi. Entiteetti-relaatio-mallin (FRBR) eksplisiittisesti esitetyt suhteet antavat tiedonhakijalle jäsennellyn hakutuloksen ja mahdollisuuden tiedon kontekstualisointiin (esim. teosten suhteet), klusterointiin (esim. teos/manifestaatiot-suhde) ja skaalattavuuteen (esim. kokonaisuus/osa-suhde). Tiedonhakijat voivat osallistua tiedon organisointiin luomalla uusia näkökulmia käsitteiden välille esim. assosiatiivisin suhtein. RDA:n pohjautuminen teoreettiseen tietomalliin tekee kuvailusta joustavan: jokainen tietomalliin linkitetty uusi entiteetti perii ympärillä olevien entiteettien ominaisuudet.

Uusi metatiedon viitekehys osallistaa kirjaston semanttisen verkon kudontaan.

Lähdeluettelo

[1] RDA Toolkit Resource Description & Access. [Full Draft] (2008). [katsottu 23.6.2010].
http://www.rdatoolkit.org/constituencyreview

[2] IFLA Study Group on the Functional Requirements for Bibliographic Records. Functional Requirements for Bibliographic Records (1997). [katsottu 23.6.2010]
http://www.ifla.org/files/cataloguing/frbr/frbr_2008.pdf

[3] IFLA Working Group on Functional Requirements and Numbering of Authority Records (FRANAR). Functional Requirements for Authority Data. München: K.G. Saur, 2009.

[4] IFLA Working Group on Functional Requirements for Subject Authority Records (FRSAR). Functional Requirements for Subject Authority Data (FRSAD) (2009). [Draft]. [katsottu 23.6.2010]
http://nkos.slis.kent.edu/FRSAR/report090623.pdf

[5] Andy Powell, Mikael Nilsson, Ambjörn Naeve, Pete Johnston, and Thomas Baker. DCMI Abstract Model (4.6.2007).[katsottu 23.6.2010].
http://dublincore.org/documents/abstract-model/

[6] Godfrey Rust and Mark Bide, The Metadata Framework: Principles, Model and Data Dictionary (2000). [katsottu 23.6.2010].
http://www.doi.org/topics/indecs/indecs_framework_2000.pdf

[7] Klyne, Graham and Jeremy Carroll, editors. Resource Description Framework: Concepts and Abstract Syntax. W3C Recommendation (10.2.2004). [katsottu 23.6.2010]
http://www.w3.org/TR/2004/REC-rdf-concepts-20040210/

[8] Kiorgaard, Deirdre. RDA Element analysis (26.10.2008). [katsottu 23.6.2010]
http://www.rda-jsc.org/docs/5rda-elementanalysisrev2.pdf

[9] Berners-Lee, Tim. Linked Data (27.7.2006. Päivitetty 18.6.2009). [katsottu 23.6.2010]
http://www.w3.org/DesignIssues/LinkedData.html

[10] NSDL Registry. [katsottu 23.6.2010]
http://metadataregistry.org/rdabrowse.htm

Kirjoittajien yhteystiedot

Marjatta Autio-Tuuli, kirjastonhoitaja
sähköposti: marjatta.autio-tuuli (at) helsinki.fi

Marja-Liisa Seppälä, kirjastonhoitaja
sähköposti: marja-liisa.seppala (at) helsinki.fi

Kansalliskirjasto / Tutkimuskirjastopalvelut
PL 26, 00014 HELSINGIN YLIOPISTO