Research Data Alliance – se toinen RDA

Hakala J (2016). Research Data Alliance – se toinen RDA. Tietolinja, 2016(3). Pysyvä osoite: http://urn.fi/URN:NBN:fi-fe2016100724908

Research Data Alliance[1] eli RDA on kansainvälinen organisaatio, joka pyrkii edistämään tutkimusdatan vaihtoa ja käyttöä. Sillä oli syyskuussa 2016 yli 4300 henkilö- ja yhteisöjäsentä, jotka ovat etupäässä korkeakouluja, tutkimuskirjastoja sekä eri alojen tutkimuslaitoksia. Jäseneksi voi liittyä mikä tahansa organisaatio tai henkilö, joka haluaa edistää datan käyttöä tutkimuksessa ja hyväksyy RDA:n periaatteet. Niitä ovat avoimuus, konsensus, tasapainoisuus, harmonisointi, yhteisöllisyys sekä teknologiariippumattomuus.

RDA:n perustivat vuonna 2013 Euroopan komissio, amerikkalaiset National Science Foundation ja National Institute of Standards and Technology, sekä Department of Innovation Australiasta. Vain muutamassa vuodessa jäsenkunta on laajentunut 110 maahan, joten RDA:lla voi sanoa olevan vahva mandaatti saavuttaa tavoitteensa, joka on seuraava:

RDA is building the social and technical bridges that enable open sharing of data to achieve its vision of researchers and innovators openly sharing data across technologies, disciplines, and countries to address the grand challenges of society.

Tämän tavoitteen saavuttamiseksi RDA:n sateenvarjon alle on sovitettu esimerkiksi tutkimusdatan kuvailu, pitkäaikaissäilytys, dataan viittaaminen, sekä eri tieteenalojen tietoarkistojen best practices -suositusten laadinta. Voikin sanoa että mikään tutkimusdataan liittyvä ei ole RDA:lle vierasta. Toimialan laajuus näkyy hyvin kaksi kertaa vuodessa järjestettävissä Plenary-kokouksissa, joiden yhteydessä järjestetään suuri määrä erilaisia tapaamisia. Kahdeksas plenary pidettiin Denverissä 15.-17.9 2016, ja se oli tähän astisista kokouksista suurin. Samalla viikolla Denverissä oli kaksi muutakin data-aiheista kokousta, International Data Forum[2] sekä Scidatacon 2016[3]. Kaikkien kolmen tapahtuman yhdistelmä saikin kunnian olla ensimmäinen International Data Week[4].

Valtaosa kokouksissa pidetyistä esitelmistä on linkitetty kotisivuille.

RDA-organisaatio

RDA:n ylin hallintoelin on RDA Council, joka esim. hyväksyy työryhmien ja intressiryhmien perustamisen ja huolehtii siitä, että kaikki toiminta on hyväksyttyjen periaatteiden mukaista.

Sihteeristö (Secretariat) vastaa hallinnosta ja perustoiminnasta. RDA:n pääsihteeri Mark Parsons kuuluu sihteeristöön.

Technical Advisory Board (TAB) tukee työryhmiä ja intressiryhmiä sekä RDA Councilia teknisissä asioissa. Sen jäsenet pyritään valitsemaan siten, että ryhmä on maantieteellisesti ja tieteenalakohtaisesti mahdollisimman edustava.

RDA Organizational Advisory Board (OAB)

… represent the interests of RDA’s organisational members and ensure that their input and needs play a role in guiding the programs and activities of the RDA.

Yhteisöjäsenet maksavat organisaation koon mukaan määräytyvän vuosittaisen jäsenmaksun, ja kykenevät sen ansiosta halutessaan vaikuttamaan RDA:n toimintaan henkilöjäseniä vahvemmin. Yhteisöjäseninä on esimerkiksi korkeakouluja, tutkimuslaitoksia ja kirjastoja, mutta myös konsulttiyrityksiä.

Työryhmät

Käytännön työ tehdään vapaaehtoisten voimin työryhmissä (WG) ja intressiryhmissä (IG)[5]. Edelliset ovat määräaikaisia ja kestävät yleensä korkeintaan 18 kuukautta, kun taas intressiryhmät voivat olla pysyviä. Alun perin ryhmiä oli vain viisi, mutta niiden määrä on hurjasti kasvanut. Syyskuussa 2016 työryhmiä oli 27 ja intressiryhmiä 46, eli RDA-ryhmiä oli yhteensä 73. Näin laajalle levittäytyneen toiminnan seuranta on melkoinen haaste paitsi henkilöjäsenille, myös TAB:lle.

Plenary-kokoukseen osallistuvan on mahdollista seurata vain pientä osaa ryhmistä. Kokonaiskuvan saamista ja omalta kannalta kiinnostavien työkohteiden paikallistamista helpottaa, jos ryhmät jaotellaan niiden mielenkiinnon kohteen mukaisesti. Seuraava jaottelu perustuu RDA in a nutshell –esittelyyn[6], joka päivitetään kerran kuukaudessa ja joka antaa hyvän yleiskuvan organisaation tekemisistä.

Base infrastructure -ryhmiä on 17. Näitä ovat esimerkiksi Data Foundation and Terminology WG, Data Type Registries WG, Metadata IG, Persistent identifier IG sekä koko RDA:n kannalta oleellinen Data Fabric IG, jonka tavoite on

to identify so-called Common Components and define their characteristics and services that can be used across boundaries in such a way that they can be combined to solve a variety of data scenarios such as replicating data in federations, developing virtual research environments, etc[7].

Data stewardship and services -ryhmiä on 15. Monet keskittyvät pitkäaikaissäilytykseen (Long tail of research data IG, Preservation e-infrastructure IG, Data Rescue IG) mutta myös kirjastoille tärkeä Libraries for Research Data IG kuuluu tähän ryhmään.

Partnership-ryhmiä on perustettu viisi, sellaisille aloille joissa kehittämistyötä on järkevää tehdä läheisessä yhteistyössä jonkin kumppanin kanssa. Esimerkiksi tietosuoja-asioita pohtiva työryhmä on perustettu yhdessä ANSI/NISO:n kanssa.

Reference and sharing –ryhmissä pohditaan esimerkiksi dataan viittaamista, kansallisia datapalveluita sekä tietoturvakysymyksiä. Community needs –ryhmät, joita on seitsemän, käsittelevät esimerkiksi datan käsittelytaitojen hankinnassa tarvittavaa koulutusta sekä perinteisten arkistojen roolia tutkimusdatan suhteen.

Domain science -ryhmät, joita on toistaiseksi vasta 17, edellyttävät yleensä kyseisen tieteenalan tai toimialan syvällistä tuntemusta. Ryhmät voivat olla kapea- tai laaja-alaisia. Esimerkiksi Wheat Data Interoperability -työryhmän tavoitteet ja toimiaika on tarkkaan rajattu, kun taas Quality of Urban Life –intressiryhmä miettii kaikkea sitä dataa, jota älykkäät kaupungit tuottavat tai tulevat tuottamaan. Sen toiminta pohjautuu standardiin ISO 37120-2014 Sustainable development of communities — Indicators for city services and quality of life, joka on tulossa käyttöön myös Helsingissä[8].

Haasteita

Olen osallistunut muun muassa Data Fabric, Persistent Identifier, Metadata, Libraries for research data sekä Data foundations and terminology -ryhmien toimintaan. Kaikille niille on yhteistä melko vähäinen aktiivisuus, varsinkin kokousten välillä. Domain science –ryhmän passiivisuudesta kärsii vain kyseinen tieteenala, mutta Data Fabric –ryhmän saamattomuus on ongelma koko RDA:lle. Se ei ole saanut yhtään dokumenttia valmiiksi ja intressiryhmän White paper -dokumentin luonnosta ei ole päivitetty sitten joulukuun 2014[9].

Intressiryhmän ambitiotaso on korkea:

The framework we are aiming at is a new platform for data science that is easy enough to use by the scientific users yet flexible enough to cope with different interests and new emerging technologies.

White paper -luonnosta lukiessa tulee mieleen, miten helppoa tai hyödyllistä uuden paradigman kehittäminen ylipäätään on. RDA:n toimiala ei ole tabula rasa; esimerkiksi yhteiskuntatieteelliset tietoarkistot ovat toimineet jo pitkään – Suomessakin vuodesta 1999 – ja niillä on omat vakiintuneet käytäntönsä, kuten muillakin tieteenalakohtaisilla arkistoilla. White paper olettaa, että yhteisiä palveluja on löydettävissä:

… we assume that there are common and discipline-specific data services and that the number of common data services will be limited. We still need to sort out whether there are mandatory common services needed to create the open and accessible data domain which we are all looking for to make data more visible, accessible, reusable and interoperable

Mutta kokonaistilanne on vielä epäselvä, ja sen vuoksi:

A deeper understanding will be essential to get a more complete landscape of components/services and as in other RDA groups DFIG should also follow a bottom-up strategy and look at interesting and far-ranging use cases and do test demos.

Valitettavasti White paper –dokumentin use cases –osio on vielä hyvin keskeneräinen, eikä sen pohjalta voi vetää johtopäätöksiä sen suhteen, mitä yhteiset datapalvelut voisivat olla. Tästä syystä koko White paper –dokumentti näyttää toistaiseksi hampurilaiselta, josta puuttuu pihvi.

Data fabric –työryhmä on siis vielä toistaiseksi kaukana tavoitteestaan, ja enemmän kuin sen jäsenten kiireisestä aikataulusta, tämä johtuu asetetun tavoitteen vaikeudesta. Tätä kirjoitettaessa on vaikea sanoa, pääseekö ryhmä ylipäätään maaliin. Nykyisellä etenemistahdilla se voi kestää pitkään. Data fabric –sateenvarjon alla voidaan toki valmistella ja esitellä muita yleisiä asioita. Esimerkiksi Denverin plenary-kokouksessa esiteltiin tuloksia LIBERin kyselystä, jossa oli selvitetty eurooppalaisten kirjastojen tutkimusdata-aktiviteetteja.

Data fabric –ryhmän tilannetta on hankala arvioida, mutta RDA:lla on myös monia käytännönläheisempiä ryhmiä, joita on helpompi analysoida kuin Data Fabric -ryhmää. Käsittelen tässä vain yhtä esimerkkiä, Data Foundation and Terminology Interest Groupia.

Intressiryhmä ylläpitää sanastoa, jossa oli syyskuussa 2016 noin 250 termiä[10]. Sanasto sisältää termien määritelmät ja usein myös statuksen. Ehdokastermitkin ovat nähtävissä ja käytettävissä; ne erottaa helposti siitä että niiden status on In discussion.

Sanaston tavoite on kunnianhimoinen:

… support broader model and vocabulary agreements for and across RDA WGs and IGs along with their representative communities and stakeholders. This will help continue the synchronization of RDA conceptualization and enable better understanding within and between RDA groups

Minusta sanasto onnistuu tässä tehtävässään varsin hyvin. Huomattava osa sen termeistä on poimittu ISO 5127 -sanastostandardin tulevaan versioon, ja sanastoja on tarkoitus synkronoida tältä osin mahdollisuuksien mukaan jatkossakin. Mutta muutakin säätämistä tarvitaan. Sanastoissa voi olla sama termi, mutta niiden määritelmät eroavat; tässä esimerkkinä termien vocabulary, metadata ja identifier määritelmät:

ISO: dictionary (4.5.5.03) which contains designations (4.1.5.24) and definitions (4.1.5.59) from one or more specific subject fields (4.1.2.07)

RDA: vocabulary is a body of ”terms” used by a community for particular purposes

ISO: data (4.1.1.15) about other data, documents (4.1.1.38), or records (4.1.13.16) that describes their content, context (4.1.2.05), structure, data format (4.1.13.12), provenance (4.6.2.1.09), and/or rights attached to them.

RDA: metadata is data that plays the role (is used for) of documentation for data/resource discovery, description/documentation, contextualisation.

ISO: data (4.1.1.15) string (4.1.1.11) or pointer that establishes the identity of an item (1) (4.2.1.10), institution or person alone or in combination with other elements (4.1.1.10)

RDA: An identifier (ala digital identifier) is a bitstring that is used to provide Object Identity.

Jokainen voi itse tykönään miettiä, kumman sanaston määritelmät toimivat tässä paremmin. ISO-standardin tapauksessa arviointi on tosin sikäli hankalaa, että määritelmissä on useita termejä, jotka on määritelty muualla standardissa. Identifier-määritelmässä oleva item on poimittu FRBR:stä; se on ” single exemplar of a manifestation”. Ainakin tältä osin ISO-standardin määritelmä on ongelmallinen, koska standarditunnisteet identifioivat yleensä teoksen tai sen jonkin manifestaation, eivät yksittäistä nidettä (joskin niteiden kansainvälinen standarditunniste on rakenteilla). Pitäisi siis sanoa että tunniste ”establishes the identity of an item, manifestation, work, institution…”.

Vertailun kannalta määritelmien eroja isompi ongelma on eri termien käyttö samoista asioista. Esimerkkinä tästä ovat ISO-sanaston document ja RDA-sanaston digital object:

recorded information (4.1.8.26) or material object (4.1.1.01 A) which can be treated as a unit in a documentation (4.2.1.22) process

A digital object is composed of structured sequence of bits/bytes. As an object it is named. The bit sequence (see definition) realizing the object can be identified & accessed by a unique and persistent identifier or by use of referencing attributes describing its properties.

ISO-standardi ei määrittele termejä ”digital”, ”object”, ”digital object” eikä “bit sequence”. RDA-sanastossa ei puolestaan ole sanaa document, joka ISO-sanastossa on minun mielestäni digitaalisen objektin lähin vastine.

Itse harmittelen lähinnä sitä, että RDA-sanastoa laadittaessa ei ole otettu mallia ISO-standardista, vaan pyörä on keksitty uudestaan. Onneksi RDA-sanastosta on kuitenkin otettu ISO-sanastoon ne termit, mitkä on voitu tai katsottu järkeväksi ottaa. Sanastot ovat silti edelleen jossakin määrin yhteismitattomia, ja huonolla onnella tästä voi syntyä se ongelma, että kirjastot ja tutkimusdataan keskittyvät organisaatiot puhuvat toistensa ohi.

Saman ongelman voi havaita muutaman muunkin työryhmän tuotoksissa, ja siksi voimmekin lopuksi kysyä:

Tarvitseeko tutkimusdata omat standardinsa?

Hyödynnän arvioinnissa myös EUDAT-hanketta[11], joka pyrkii soveltamaan RDA:n periaatteita, sekä kansallista ATT-projektiamme.

Tietomallin ja kuvailun yleisten periaatteiden osalta kysymys on minusta auki. FRBR-malli voisi sopia tutkimusdatallekin, koska data-aineisto voidaan helposti mieltää teoksen manifestaatioksi. Data-aineistot voivat olla jatkuvia tai kertaluonteisia kuten julkaisutkin, ja dataakin pitää muuntaa sen pitkäaikaissäilytyksen takaamiseksi. Merkittävä ero syntyy siitä, että tutkimusparadigman vaihtuessa data-aineisto voidaan joutua muokkaamaan uuteen asuun jotta se olisi sopiva uudentyyppiselle tutkimusotteelle. Julkaisujen käsitteleminen tällä tavoin tuskin on jatkossakaan tarpeen.

Data-aineistojen kuvailuun on olemassa useita tähän tarkoitukseen kehitettyjä domain-kohtaisia formaatteja, kuten Data Documentation Initiativen[12] DDI Lifecycle and DDI Codebook[13], jotka on tarkoitettu yhteiskuntatieteellisen datan ja tilastotietojen kuvailuun. DDI on hyvin laaja standardi, ja käytännön kuvailutyön helpottamiseksi siitä on luotu sovellusprofiileja. Dublin Core – DDI –konversioiden yksinkertaistamiseksi on laadittu crosswalk[14], joka kattaa vain Dublin Coren 15 peruselementtiä.

DCAT[15] on W3C:n laatima formaatti tai tarkemmin ”Data Catalog Vocabulary”, joka on tarkoitettu kaikentyyppisten data-aineistojen kuvailuun. Se on paljon yksinkertaisempi väline kuin DDI, mutta DCAT:in tavoitteena ei ole niinkään yksityiskohtaisen vaan yhteismitallisen kuvailun mahdollistaminen.

Paras keino kuvailujen yhteismitallistamiseksi olisi tietenkin yleisesti käytössä olevat kuvailusäännöt. Tässä ollaan vielä retuperällä, esimerkiksi Resource Description and Access –säännöt eivät vielä kata data-aineistojen kuvailua. MARC 21 –formaatin osalta tilanne on parempi. Voidaan käyttää esimerkiksi kenttiä 580 (Huomautus linkitysten monitahoisuudesta) ja 787 (Linkkikenttä – Muu suhde), kun luodaan linkki julkaisun kuvailusta julkaisun pohjana olevaan data-aineistoon tai -aineistoihin. Vastaavasti, jos data-aineistolla on nimi, se voidaan kuvailla elektronisena aineistona siten, ja luoda kuvailusta linkki julkaisuun tai julkaisuihin, joita datan pohjalta on luotu.

Formaatissa on useita huomautuskenttiä, jotka on tarkoitettu tai jotka soveltuvat data-aineistojen kuvailuun. Näitä ovat esimerkiksi kenttä 514 (Huomautus datan laadusta), 522 (Huomautus maantieteellisestä kattavuudesta), 552 (Huomautus yksiköistä ja ominaisuuksista), 556 (Huomautus dokumentaatiotiedoista), 565 (Huomautus tapaustiedoston ominaisuuksista), 581 (Huomautus julkaisusta joka koskee kuvailtavaa aineistoa) sekä 584 (Huomautus kasvusta ja käytön määrästä). Tarvitaan kuitenkin kuvailusäännöt ja hyviä esimerkkejä, jotta näiden kenttien soveltamisesta tulisi helppoa ja metatiedoista riittävän yhteismitallisia. Tilannetta ei helpota että muutamat yllä mainituista kentistä on luotu ajatellen vain kartografista dataa, vaikka kentän sovellusalueen pitäisi olla paljon laajempi.

Hallinnollisen metadatan tuottaminen on helpompaa kuin kuvailevien metatietojen. Käyttöoikeuksien metatietojen osalta asiaa on jo tutkittukin, ja ATT-hankkeessa tehtyjen kokeilujen mukaan PREMIS näyttäisi soveltuvan myös data-aineistojen pitkäaikaissäilytyksen metatietojen kuvaamiseen. Teknisten metatietojen osalta ratkaisevaa on datan tiedostomuoto; teksti-, kuva- ja äänitiedostoille on jo omat metadataformaattinsa ja KDK-hanke on tehnyt niille soveltamisohjeet, mutta esimerkiksi tietokannoille ei vastaavaa teknistä perustaa ole.

Aineiston paketoinnin osalta mielipiteet menevät ristiin. ATT-hankkeessa on kokeiltu METS-standardia tutkimusdatojen siirtämiseen ja säilyttämiseen. Ongelmia ei ole ollut, joten KDK- ja ATT-hankkeen kokemuksella voidaan sanoa METS-paketoinnin sopivan niin asiakirjoille, julkaisuille, museoaineistoille kuin data-aineistoillekin. Yksittäisten pakettien rakenteessa voi toki olla paljonkin eroja, mutta METS sallii joustoa, tarvittaessa paljonkin.

EUDAT-hankkeessa on kuitenkin päädytty siihen, että METS ei data-aineistoille sovellu. Sen asemesta kokeillaan hankekohtaista paketointiratkaisua. En tiedä, miten laajaan testaukseen tulokset perustuivat, mutta jos EUDAT lähtee omille teilleen, data-aineistojen siirto esimerkiksi ATT:stä EUDAT:iin ja päinvastoin edellyttää lisätyötä joka tulee hankaloittamaan yhteistyötä ja vähentämään siitä saatavia etuja.

Data-aineistojen ja niihin pohjautuvien julkaisujen linkittäminen toisiinsa on periaatteessa helppoa MARC-formaatin tarjoamien kenttien avulla, mutta käytännössä haasteellista. Elektronisten julkaisujen migraatio on tarpeen yleensä vain silloin, kun tiedostoformaatti on vanhentunut. Data-aineistoa voidaan kuitenkin joutua muokkaamaan radikaalistikin siksi, että tutkimusparadigma vaihtuu, ja vanhoja data-aineistoja halutaan analysoida uusilla tavoilla. Tällöin pitää periaatteessa tapauskohtaisesti ratkaista, säilytetäänkö linkitys data-aineiston vanhaan versioon (jota ei todennäköisesti enää pidetä migraatioilla helposti käytettävänä), vai siirretäänkö se uuteen.

FRBR-termein voisi kysyä, onko uuden tutkimusotteen vaatimusten mukaan muokattu data-aineisto uusi teos, vaiko vain alkuperäisen teoksen ekspressio? Säännöt eivät tähän vastaa. Lisähaastetta luo se, että toisinaan voisi olla tarpeen luoda linkki koko aineiston sijasta vain sen osaan, mikä voi edellyttää teknisiä erityisratkaisuja, mikseipä myös osakohteiden kuvailua. Pysyvien tunnisteiden käyttö linkittämisessä on joka tapauksessa datan osalta vielä tärkeämpää kuin luotaessa linkkejä julkaisuihin. Kaikeksi onneksi data-aineistojen tunnistamisessa ja linkittämisessä käytetään yleisesti pysyviä tunnisteita.

Vastaus otsikossa esitettyyn kysymykseen on siis kyllä ja ei. RDA ja sen kanssa yhteistyössä olevat organisaatiot ja hankkeet tulevat luomaan data-aineistojen käsittelyssä tarvittavat periaatteet ja ratkaisut. Voimme vain toivoa, että tässä yhteydessä luodaan mahdollisimman vähän päällekkäisiä järjestelyjä kirjastosektorilla jo käytössä oleviin ratkaisuihin nähden. Kuvailusäännöt tulisi luoda mahdollisimman tiiviissä yhteistyössä, koska silloin kuvailutiedot ovat ainakin semanttisesti yhteensopivia, olipa kuvailuformaattiratkaisu mikä tahansa.

Kirjastojen kannalta data-aineistojen käsittelyä koskevat periaatelinjaukset ovat tärkeitä siksi, että mitä yhdenmukaisempia esimerkiksi kuvailuperiaatteet ovat, sitä helpompi esimerkiksi korkeakoulukirjastojen on ottaa aktiivinen rooli tutkimusaineistojen käsittelyssä. Dublin Core –pohjainen vaihtoformaatti mahdollistaisi ainakin periaatteessa sen, että muualla tehtyjä data-aineistojen kuvailuja voidaan siirtää kirjastojen järjestelmiin, ja kirjastojen kuvailuja voidaan poimia muualle. Käytännössä metatietojen vaihto edellyttää toki myös sitä, että kuvailussa on noudatettu samoja periaatteita.

Lopuksi

Kolmessa vuodessa RDA on päässyt ainakin alkuun itselleen asettamiensa tavoitteiden toteuttamisessa. Joillakin tärkeillä osa-alueilla ja etenkin Data Fabric -intressiryhmän tontilla edistys on ollut viimeisen vuoden aikana tuskastuttavankin hidasta. On myös erikoisaloja, joissa läheisempi yhteistyö muiden toimijoiden kanssa voisi hyödyttää myös RDA:ta itseään.

Vaikka RDA:n mandaatti ei ole kiveen hakattu, se on monissa asioissa ainoa auktorisoitu kansainvälinen toimija. Siksi sen toiminnassa kannattaa olla mukana, vaikka ei kaikista asioista aina samaa mieltä olisikaan. Ja kirjastoalan edustajien on hyvä muistaa, etteivät meidän toimintamallimme ja välineemme välttämättä sovellu data-aineistojen käsittelyyn. Ensin kannattaa testata, ja sitten voidaan edetä rahkeiden mukaan.

LIBER:in selvityksen mukaan jo noin kolme neljäsosaa eurooppalaisista tutkimuskirjastoista on ainakin jollakin lailla tekemisissä tutkimusaineistojen kanssa, ja varsin monet kirjastot ylläpitävät jo datapalvelujakin. On varmaa, että jatkossa sekä aktiivisten kirjastojen määrä että aktiviteettien määrä kasvavat. Sen vuoksi kirjastojen kannattaa olla mukana myös RDA:ssa, päättämässä yhdessä muiden kanssa siitä miten tutkimusaineistoja jatkossa käsitellään.

Viitteet

[1] https://rd-alliance.org/

[2] http://www.internationaldataweek.org/International-data-forum

[3] http://www.scidatacon.org/2016/

[4] http://www.internationaldataweek.org/

[5] https://rd-alliance.org/groups

[6] http://www.slideshare.net/ResearchDataAlliance/rda-in-a-nutshell-september-2016

[7] https://rd-alliance.org/group/data-fabric-ig.html

[8] http://www.hel.fi/hel2/tietokeskus/julkaisut/pdf/14_06_16_HSS_artikkeli_Jaakola.pdf

[9] https://rd-alliance.org/group/data-fabric-ig/wiki/data-fabric-ig-documents.html

[10]http://smw-rda.esc.rzg.mpg.de/index.php/Main_Page

[11] https://eudat.eu/

[12] http://www.ddialliance.org/

[13] http://www.ddialliance.org/explore-documentation

[14] http://www.ddialliance.org/resources/ddi-profiles/dc

[15] https://www.w3.org/TR/vocab-dcat/

Kirjoittajan yhteystiedot

Juha Hakala, erityisasiantuntija
Kansalliskirjastom kirjastoverkkopalvelut
PL 26 (Kaikukatu 4) 00014 HELSINGIN YLIOPISTO
sähköposti: juha.hakala [at] helsinki.fi

Leave a Reply

This site uses Akismet to reduce spam. Learn how your comment data is processed.