Verkkoarkiston koronakevät

Haukkala S (2020). Verkkoarkiston koronakevät. Tietolinja, 2020(1). Pysyvä osoite: http://urn.fi/URN:NBN:fi-fe2020050324715

Mona-Lisa hengityssuojaimeen verhoituneena

Kuva: Sumanley Xulx (Pixabay), 2020.

Maaliskuun alussa Suomeenkin lopulta levinnyt koronapandemia sekä siirsi suurimman osan Kansalliskirjaston työntekijöistä etätöihin että loi samalla myös uusia töitä verkkoarkistolle. Uudesta kulkutaudista tuli nopeasti verkkoarkiston teemakeräyksen aihe, kun viruksen läsnäolo uutisissa ja puheissa kasvoi myös Suomea koskevaksi merkittäväksi uhaksi.

Lakisääteinen tallennusvelvollisuus

Kansalliskirjaston lakisääteinen tallennusvelvollisuus verkossa rajoittuu kulttuuriaineistolain mukaan suomalaisiin ja suomalaiselle yleisölle tarkoitettuihin sisältöihin, joiden keräämistä ohjaa lakiin sisältyvä verkkoaineistojen keräyssuunnitelma. Suunnitelma mahdollistaa teemakeräysten järjestämisen, joissa kerättävät sisällöt valikoidaan tarkemmin joko oman henkilökunnan toimesta tai muiden asiantuntijoiden avustuksella.

Vuosittaisessa, niin kutsutussa Suomi-keräyksessä tallennetaan melko kattavasti (pakattuna noin 13TB vuonna 2019) kotimaisia .fi- ja .ax-päätteisiä sivustoja sekä kielentunnistuksella kotimaisiksi tunnistettuja sivustoja niiden liepeiltä. Tästä huolimatta monet kulttuurisesti tärkeät puheenaiheet sekä kokonaiset kotimaiset sivustot jäävät tallentumatta, koska ne sijaitsevat ulkomaisilla verkkosivustoilla. Suomi-keräys ei esimerkiksi tallenna oletuksena lainkaan tavanomaisesti ulkomaisilla sivustoilla sijaitsevia sosiaalisen median palveluja, vaikka niissä olisikin kotimaista aineistoa.

Teemakeräykset

Kansalliskirjaston teemakeräykset tarttuvat ajankohtaisiin aiheisiin, kuten erilaisiin julkisiin tai yhteiskunnallisiin tapahtumiin, ilmiöihin sekä muihin kotimaisiin teemoihin, joita ei todennäköisesti saisi perinteisellä vuosikeräyksellä talteen kovin hyvin. Lisäksi valmiit teemakeräykset ovat valmiina kuratoituina kokonaisuuksina helpommin tutkittavissa kuin naaraamalla yksittäisiä sisältöjä sana- tai sivuhaulla verkkoarkiston koko massasta.

Teemakeräyksissä keskitytään paitsi etsimään aineistokokonaisuuksia, joita ei välttämättä löydy pelkästään kotimaisilta verkkosivuilta, myös rakentamaan mukavammin tutkittavia kokonaisuuksia teemaan liittyvien kotimaisten verkkosivujen sisällöstä. Keräyksissä on yleensä hyvin edustettuna kotimaisten uutispalveluiden sekä virallisempien tahojen verkkosivuja, joista teemaan sopiva sisältö on valittu vuosikeräystä tiheämmällä kammalla.

Korona-verkkoaineiston keräys

Koronakeräys lähti liikkeelle jo helmikuun puolivälissä, kun International Internet Preservation Consortium (IIPC) pyysi lähettämään heille tallennusehdotuksia korona-aiheisista verkkosisällöistä. Tällöin ei vielä kukaan osannut arvioida, miten räjähdysmäiseksi ilmiöksi korona muutamassa päivässä maaliskuun alun jälkeen muuttuisi. Verkkoarkiston varsinainen teemakeräyksen kokoaminen alkoi maaliskuun puolivälissä ja pian tämän jälkeen keräystä päätettiin laajentaa yleisön ehdotuksilla täydennettäväksi. Kaikille avoimella keräyslomakkeella pyydetään etenkin ”kevyempää” aineistoa, koska esimerkiksi koronaan liittyvät uusimmat meemit, kuvat ja muut arki-ilmiöt eivät välttämättä tartu yleisimpiin hakusanoihin tai tunnisteisiin.

Tällä hetkellä suurin osa koronakeräyksen sisällöstä on suurimpien uutismedioiden linkkejä korona-aiheisiin uutisiin sekä aiheisiin, jotka ovat syntyneet koronan myötä; esimerkiksi etätöihin, Uudenmaan eristämiseen, kasvomaskeihin ja erilaisiin tempauksiin, kuten nallejahtiin tai yhteislauluihin parvekkeilla. Korona-aihe pelkkänä viruksena ja tautina on aika helppo kerätä sivustoilta ja sosiaalisesta mediasta, koska sillä on niin selviä hakusanoja. Moni hakusana tai aihetunniste (hashtag, #) on sattumalta myös kansainvälinen, joten kerättävää etsiessä kerättävälle aiheelle pitää tehdä mahdollisesti kieli- tai sijaintirajauksia keräystyökalujen tarjoamien mahdollisuuksien mukaan. Samoin keräyksessä otetaan huomioon myös muun kuin suomenkielinen aineisto.

Koronakeräyksen vastauslomakkeella keräysehdotuksia on tullut tähän mennessä toivotusti juuri koronasta ja vähän sen ympäriltä. Keräys on auki poikkeustilan loppuun 13.5.2020 asti. Teemakeräyksen kesto riippuu paljolti siitä, miten pitkäksi nykyinen pandemia venyy, mutta keräys on käytännössä silti jossain vaiheessa katkaistava tai vähintään jaettava useammaksi keräykseksi, vaikka puhetta ja uutisointia koronasta riittääkin vielä vuosiksi eteenpäin.

Valmistunut teemakeräys on lopulta yleisön tutkittavissa Kansalliskirjaston ja muiden vapaakappalekirjastojen vapaakappaletyöasemilla, kunhan keräys on saatu tallennettua ja käsiteltyä, ja kunhan Kansalliskirjasto saa taas avata ovensa asiakkaille.

Uutinen teemakeräyksestä sekä keräyslomake löytyvät Kansalliskirjaston verkkosivuilta: https://www.kansalliskirjasto.fi/fi/uutiset/kansalliskirjasto-keraa-korona-aiheisia-verkkoaineistoja

Kirjoittajan yhteystiedot

Sanna Haukkala, kirjastosihteeri
Kansalliskirjasto, tutkimuskirjasto
PL 15 (Unioninkatu 36), 00014 Helsingin yliopisto
sanna.haukkala [at] helsinki.fi

Leave a Reply

This site uses Akismet to reduce spam. Learn how your comment data is processed.

Theme by Anders Norén