CRIS 2014 – tutkimustietojärjestelmiä Roomassa

Jyrki Ilva
Kansalliskirjasto

Tämän artikkelin pysyvä osoite on http://urn.fi/URN:NBN:fi-fe2014052625999

 

rooma-logo

Osallistuin toukokuun puolivälissä CRIS 2014 -konferenssiin (http://www.cris2014.org/), joka järjestettiin tällä kertaa Roomassa. Kyseessä oli kautta aikojen 12. CRIS-konferenssi, joka tosin minulle oli vasta ensimmäinen. Tapahtuma kokosi paikalle noin 160 osallistujaa eri puolilta Eurooppaa ja osin myös sen ulkopuolelta.

Suomesta ei ollut tänä vuonna mukana yhtään esitystä, mutta suomalaisia osallistujia oli kuitenkin paikalla yhteensä yhdeksän, eli maamme oli suhteessa varsin hyvin edustettu. Kirjastolaisten ohella paikalla oli myös tutkimushallinnon väkeä.

Tutkimustietojärjestelmä

Akronyymi CRIS konferenssin nimessä viittaa sanoihin Current Research Information System, jolle on vakiintumassa suomenkieliseksi käännökseksi ”tutkimustietojärjestelmä”. Perinteisesti meillä on puhuttu kapeammin esim. julkaisurekistereistä tai osaamistietokannoista, mutta CRIS-konsepti yhdistää nämä kaikki yhdeksi tietojärjestelmäksi, joka on suunniteltu palvelemaan etenkin tutkimushallinnon tarpeita.

Aihepiiri on Suomessa tällä hetkellä erittäin ajankohtainen, sillä monet yliopistot ovat juuri nyt hankkimassa tai ottamassa käyttöön uutta tutkimustietojärjestelmää.  Tämä liittyy tietysti läheisesti opetus- ja kulttuuriministeriön tiedonkeruuseen ja yliopistojen vuonna 2013 voimaan tulleeseen rahoitusmalliin, jossa etenkin julkaisutiedoilla on suuri painoarvo. Yliopistoilla riittää tästä johtuen yllin kyllin motivaatiota järjestelmiensä kehittämiseen.

 

EuroCRIS ja Cerif

rome-eurocros-logoCRIS-konferenssien taustalla on EuroCRIS-niminen järjestö (http://www.eurocris.org/), joka on jo pitkään pyrkinyt edistämään tutkimustietoon liittyvää yhteistyötä ja parhaiden käytäntöjen käyttöönottoa koko Euroopan tasolla. Erityisen merkittävä on ollut EuroCRIS:in rooli tutkimusta koskevien tietojen tallentamiseen tarkoitetun CERIF-tietomallin ja (nykyään xml-pohjaisen) tallennusformaatin ylläpitäjänä ja kehittäjänä.

CERIF (tulee sanoista Common European Research Information Format, http://www.eurocris.org/Index.php?page=CERIFintroduction&t=1)  on relaatiopohjainen ja hyvin yksityiskohtainen tietomalli ja -formaatti, joka kehitetty alun perin jo parikymmentä vuotta sitten. Sitä on sittemmin päivitetty ja kehitetty aktiivisesti, viime vuosina etenkin Britanniassa, jossa kansallisella tasolla toteutettu tutkimuksenarviointi on kannustanut yliopistoja omien tutkimustietojärjestelmiensä kehittämiseen. EuroCRIS-yhteisön sisällä tietomalliin uskotaan vankasti, ja sitä pidetään ainakin omalla erityisalallaan muita malleja ja formaatteja (mukaanluettuna kirjastolaisille tutut MARC ja Dublin Core) hienompana ja parempana.

Monien muiden ylikansallisten formaattien tavoin myös CERIF on tarkoitettu järjestelmien välisen tietojen vaihdon välineeksi. Käytännössä sen merkitys tietojen vaihdossa on kuitenkin edelleen odotettua vähäisempi – yhdessä konferenssin esityksistä jopa kyseenalaistettiin sen roolia kansallisen tason järjestelmistä tehdyn selvityksen pohjalta. Huomattavasti merkittävämpää sen sijaan on, että nykyiset kaupallisten toimijoiden tuottamat tutkimustietojärjestelmäohjelmistot (mm. Pure, Converis, Symplectic Elements) joko perustuvat siihen tai ovat ainakin hyvin pitkälle sen kanssa yhteensopivia.

 

Kaupalliset ohjelmat

Vaikka julkaisurekistereitä ja tutkimustietojärjestelmiä sinänsä on ollut jo hyvinkin pitkään, nykyinen kaupallisiin sovelluksiin perustuva, kokonaisvaltainen CERIF-pohjainen tutkimustietojärjestelmä on kuitenkin suhteellisen tuore ilmiö. Järjestelmien kaupallinen läpimurto on tapahtunut laajassa mitassa vasta viiden viime vuoden aikana. Merkillepantavaa on myös se, että järjestelmien suosio on toistaiseksi keskittynyt suurelta osin Eurooppaan, jossa valtiollinen rahoitus ja siihen liittyvät tutkimushallinnon seurantamekanismit ovat olleet erityisen vahvoja. Toisaalta esim. USA:ssa vastaavaa tarvetta ei ole ainakin toistaiseksi ollut, ja siellä CRIS-sovellusten markkinoijilla on vielä suuri työ edessään, jos järjestelmät halutaan laajaan käyttöön.

Toiminnan nopea ekspansio on ollut ohjelmistot rakentaneiden pienten yritysten kannalta melkoinen haaste, ja niinpä ei olekaan yllättävää, että ne ovat parin viime vuoden aikana päätyneet nopeasti suurempien yritysten omistukseen – Elsevier osti Puren tanskalaisen valmistajan (Atira) pari vuotta sitten, ja Converiksen saksalainen valmistaja (Avedas) päätyi viime syksynä Thomson Reutersin haltuun. Toisaalta ohjelmistojen päätyminen näiden tutkimusta koskevan tiedon markkinoita hallitsevien kansainvälisten suuryritysten ostoslistoille kertoo siitä, että järjestelmillä on selkeää kaupallista potentiaalia. Elsevierin ja Thomson Reutersin visioissa tämä potentiaali kytkeytyy luonnollisesti integraatioon yritysten tuoteperheiden muiden palasten (mm. Scopus- ja Web of Science -viittaustietokannat ja erilaiset niiden ympärille rakennetut palvelut) kanssa.

Thorsten Höllrigl (Thomson Reuters) kertoi ajankohtaisia Converis-uutisia.

Thorsten Höllrigl (Thomson Reuters) kertoi ajankohtaisia Converis-uutisia.

Tätä taustaa vasten oli hieman yllättävää havaita, ettei Purea ja Converista käsitelleissä esityksissä tullut esiin mitään kovin hätkähdyttävää uutta kerrottavaa. Elsevier esitteli toki näkyvästi julkaisudatan automaattiseen analyysiin pohjautuvaa fingerprinting-teknologiaansa (http://www.elsevier.com/online-tools/research-intelligence/products-and-services/elsevier-fingerprint-engine), jonka asiakkaalle tuottama konkreettinen hyöty jäi vielä jossain määrin ilmaan. Voi olla, että yritysten sisällä päähuomio on vielä fuusioiden jälkeisissä uudelleenjärjestelyissä. Etenkin Thomson Reutersilla tuntuu kuitenkin olevan ekspansiivinen vaihe päällä – EuroCRIS:n kantaviin voimiin kuulunut Brigitte Jörg kertoi konferenssissa siirtyvänsä Thomson Reutersin palvelukseen, ja vastaavia Thomson Reutersiin liittyviä rekrytointiuutisia on kuulunut muualtakin.

 

Tutkimustietojärjestelmät, julkaisuarkistot, data-arkistot?

Oma taustani on enemmän julkaisuarkistojen puolella, joten olin ensikertalaisena tietysti kiinnostunut kuulemaan millaisena CRIS-puolella nähdään näiden monin tavoin toisiinsa kytkeytyvien järjestelmien tulevaisuus. Useimmissa modernin tutkimustietojärjestelmän käyttöönottaneissa organisaatioissa kun on ollut jo ennestään käytössä jokin julkaisuarkistosovellus. Erilaisia CRIS-julkaisuarkistointegraatioita on viime vuosina tehty kiihtyvää tahtia eri puolilla, yleensä siten, että tutkimustietojärjestelmään syötettyjä viitetietoja ja tiedostoja siirtyy teknisen rajapinnan kautta julkaisuarkiston puolelle.

Ajoittain on kyseenalaistettu sitä, tarvitaanko samassa organisaatiossa kahta erillistä järjestelmää hoitamaan tutkimustietojärjestelmän ja julkaisuarkiston tehtäviä. Vastauksena tähän kysymykseen sekä Purea että Converista on laajennettu siten, että ne tarjoavat myös julkaisuarkistoa muistuttavia toiminnallisuuksia. Käytännössä sen paremmin Puren kuin Converiksen mainospuheenvuoroissa ei kuitenkaan nostettu tätä mahdollisuutta näkyvästi esiin, eli erilliset rinnakkaiset järjestelmät ja näiden väliset rajapinnat ovat edelleen kehityksen valtavirtaa. Tämä voi olla ainakin nykytilanteessa perusteltua, sillä tutkimustietojärjestelmillä ja julkaisuarkistoilla on molemmilla omat selkeät vahvuutensa, joita ei ole aivan triviaalia sovittaa yhteen.

Pablo De Castron, Kathleen Shearerin ja Friedrich Summannin esitys tarjosi hyvän, optimiseen sävyyn kirjoitetun yleiskatsauksen aihepiiriin. He pitivät todennäköisenä, että meillä on myös lähitulevaisuudessa näitä funktioita hoitamassa kolmenlaisia organisaatiotason järjestelmäkokonaisuuksia: julkaisuarkistosovelluksen varaan rakennettuja, julkaisuarkiston ja CRIS-sovelluksen integraatioon perustuvia ja kokonaan CRIS-sovelluksen varassa toimivia.

Esityksessä viitattiin myös tutkimusdatan tallennukseen ja data-arkistojen mukanaan tuomiin uusiin haasteisiin, jotka koskettavat sekä julkaisuarkistoja että CRIS-sovelluksia. Kuten monet muutkin tapahtumat nykyään, myös CRIS 2014 nosti tutkimusdataan liittyvät kysymykset näkyvästi esiin, ja niitä käsiteltiin erityisesti Kevin Ashleyn pitämässä erinomaisessa keynote-puheenvuorossa. Onnistuin valitettavasti tällä kertaa missaamaan aihepiiriä käsitelleet käytännölliset esitykset.

Kevin Ashley

Kevin Ashley

DSpace-CRIS

Kaupallisten tutkimustietojärjestelmien voittokulku ja niiden omistuksen keskittyminen perinteisten suurten toimijoiden käsiin on herättänyt ymmärrettävästi myös huolta. Kaupalliset järjestelmät ovat lähtöhinnaltaan käytännössä liian kalliita ja myös liian raskaita monille pienemmille organisaatioille. Lisäksi vaarana voi pitää sitä, että niiden kehittämisessä korostuvat jossain vaiheessa liiaksi Elsevierin ja Thomson Reutersin omat intressit asiakkaiden tarpeiden ja toiveiden sijasta.

Osin kenties tästä johtuen EuroCRIS on itse tehnyt avauksen toiseen suuntaan ja ottanut käyttöön italialaisen Cinecan kehittämään DSpace-CRIS-moduliin perustuvan julkaisuarkiston / tutkimustietojärjestelmän. Kyseessä on DSpace-julkaisuarkisto-ohjelmiston päälle rakennettu avoimen lähdekoodin järjestelmä (http://cineca.github.io/dspace-cris/), jonka Cineca oli alun perin kehittänyt Hong Kongin yliopistolle. Siinä missä DSpacen perustason tietueet on rakennettu kuvaamaan julkaisuja, DSpace-CRIS:issä näitä voi rakentaa myös muiden elementtien (esim. tekijät, hankkeet ja organisaatiot) ympärille, mikä mahdollistaa myös CERIF-tyyppisen tietomallin tukemisen. Vapaasti saatavilla oleva DSpace-CRIS on pohjimmiltaan karvalakkiversio, jota Cineca on räätälöinyt merkittävästi toisaalta Hong Kongin yliopiston tutkimustietojärjestelmän ja toisaalta tarjoamansa maksullisen Iris-tutkimustietojärjestelmän puitteissa.

Susanna Mornati ja Andrea Bollini (Cineca) esittelevät DSpace-CRIS:iä.

Susanna Mornati ja Andrea Bollini (Cineca) esittelevät DSpace-CRIS:iä.

Vaikka DSpace-CRIS kuulostaa hyvinkin kiinnostavalta, siihen liittyy kuitenkin myös haasteita. Se on rakennettu DSpacen JSPUI-käyttöliittymän tuoreimman (bootstap-pohjaisen) version ympärille. Kysyin tästä järjestelmää esitelleeltä Andrea Bollinilta, joka kertoi, ettei Cinecalla ole resursseja toteuttaa samoja toiminnallisuuksia DSpacen XMLUI-käyttöliittymään, mikä käytännössä sulkee pois noin puolet kaikista DSpace-käyttäjistä, ml. meidät suomalaiset. Toki DSpace-CRIS:in käyttöönotto olisi nykyisten julkaisuarkistojen näkökulmasta monin tavoin melkoinen hyppy tuntemattomaan, vaikka se periaatteessa pyrkii vastaamaan sellaisiin tarpeisiin, jotka ovat meillekin hyvin tuttuja.

 

Muuta mieleenjäänyttä

Konferenssin ohjelma jakautui pääosan aikaa kolmeen rinnakkaissessioon, eli kaiken ohjelman seuraaminen oli fyysinen mahdottomuus. Joissakin kohdissa täytyi tehdä vaikeita valintoja, kun tarjolla oli samaan aikaan monta mielenkiintoista esitystä. Niinpä minulta meni tutkimusdatan lisäksi ohi myös suurin osa tutkimuksen arviointiin liittyneistä esityksistä.

Omalta kannaltani erityisen mielenkiintoinen oli mm. Nina Karlstrømin ja Lars Wenaasin (CRIStin, http://www.cristin.no/) esitys Norjan kansallisen tutkimustietojärjestelmän uudesta käyttöliittymästä.  Viime syksynä Helsingissä pidettyyn esitykseen (http://urn.fi/URN:NBN:fi-fe201310166685) verrattuna uutta tietoa oli se, että Norjassakin oli päädytty Solr-pohjaiseen käyttöliittymään kotoisen Juulimme (http://www.juuli.fi) malliin – ilmeisesti aivan itsenäisesti ilman meiltä tulleita vaikutteita. Ja konferenssin aikana kuullut huhut kertoivat, että Tanskassa suunnitellaan kansallista Blacklight-pohjaista käyttöliittymää paikallisista järjestelmistä kerätyille tutkimustiedoille. Eli ehkä oma päätöksemme käyttää tähän tarkoitukseen niin ikään Solr-pohjaista VuFindia oli ilmeisempi kuin miltä se aikoinaan edes tuntui.

Lars Wenaas ja Nina Karlstrøm esittelevät CRIStiniä.

Lars Wenaas ja Nina Karlstrøm esittelevät CRIStiniä.

Kunnianhimoisin konferenssissa esitelty palvelu taisi kuitenkin tällä kertaa tulla Venäjältä. Vaikka Venäjältä on viime aikoina tullut enemmän toisenlaisia uutisia, Dmitry Semyachkinin, Eugene Kislyakin ja Mikhail Sergeevin esittelemä CyberLeninka-palvelu (http://cyberleninka.ru/) on kovaa vauhtia viemässä venäläisiä tiedelehtiä avoimen julkaisemisen maailmaan. Kuulemma palvelussa on jo mukana 350 yliopistojen julkaisemaa lehteä arviolta parista tuhannesta Venäjällä ja lähialueen maissa ilmestyvästä tiedejulkaisusta, ja palvelu on nopeasti löytänyt laajan yleisön Venäjän sisällä. Palvelulla on tällä hetkellä pari miljoonaa käyttäjää kuukaudessa, ja se on nousemassa nopeasti ylöspäin myös kansainvälisillä julkaisuarkistojen ranking-listoilla. Esityksen pitäjät korostivat Google-hakujen keskeistä merkitystä suurten käyttölukujen selittäjänä, mikä on tietysti tuttu ilmiö meillekin.

rome-cyberleninka-logoVaikken itse valitettavasti venäjää osaakaan, CyberLeninkasta oli vaikea olla vaikuttumatta. Palvelu on koodattu itsenäisesti, ts. se ei perustu mihinkään valmiista kansainvälisistä julkaisuarkistosovelluksista, mutta sen integraatio esim. erilaisiin sosiaalisen median palveluihin on toteutettu mallikelpoisesti. Ja palvelun brändäys on poikkeuksellisen lennokasta – sivuston sci-fi-henkisen grafiikan ja kyborgi-Lenin-logon lisäksi palvelun palauteosoite on tietysti skynet[at]cyberleninka.ru.

Loppuyhteenveto

Esitysten ja muun virallisen ohjelman lisäksi konferenssi tarjosi erinomaisen tilaisuuden jutella sekä tuttujen, puolituttujen että kokonaan uusien tuttavuuksien kanssa. Minulla ja useilla muillakin suomalaisilla oli tilaisuus keskustella useaan otteeseen ORCID-pomo Laure Haakin kanssa mm. Suomen ORCID-tilanteesta, ja myös pohjoismaisia verkostoja viriteltiin entistä laajemmalle. Kaiken kaikkiaan konferenssi oli oikein positiivinen kokemus, etenkin kun keitokseen oli lisätty mukaan Rooma (pitkästä aikaa!) ja sikäläinen Suomeen verrattuna oikein mukava toukokuun puolivälin sää.

Tekstissä mainitut ja muutkin konferenssissa pidetyt esitykset löytyvät EuroCRIS:in julkaisuarkistosta, http://dspacecris.eurocris.org/jspui/.

rome-smm

 

Kirjoittajan yhteystiedot

Jyrki Ilva, tietojärjestelmäasiantuntija
Kansalliskirjasto / Kirjastoverkkopalvelut
PL 26, 00014 HELSINGIN YLIOPISTO
sähköposti: jyrki.ilva[at]helsinki.fi

 

Leave a Reply

This site uses Akismet to reduce spam. Learn how your comment data is processed.