Löydä historia sanomalehtien sivuilta – digitaalisesti

Esimerkki digitoidusta aineistosta: uutisleike, Hufvudstadsbladet, 7.11.1934

Kuva: Grundstenen till Åbo Akademis bibliotek nedlagd. Digi.kansalliskirjasto.fi, Hufvudstadsbladet, 7.11.1934, nr 301, s.7. Kansalliskirjaston digitaaliset aineistot.

Karppinen P & Linnovaara K (2021). Löydä historia sanomalehtien sivuilta – digitaalisesti. Tietolinja, 2021(1). Pysyvä osoite: https://urn.fi/URN:NBN:fi-fe2021061938983

Tänä vuonna Suomessa vietetään sanomalehdistön 250-vuotisjuhlavuotta. Tidningar Utgifne af et Sällskap i Åbo alkoi ilmestyä 15. tammikuuta 1771, eli 250 vuotta sitten. Sitä pidetään ensimmäisenä suomalaisena sanomalehtenä Ruotsin valtakunnassa ja ensimmäisenä nykyisen Suomen alueella julkaistuna sanomalehtenä. Lehti alkoi ilmestyä osana lehdistön nousua 1700-luvun aikana. Ensimmäinen suomenkielinen sanomalehti, Suomenkieliset Tieto-Sanomat, ilmestyi vuosina 1775–1776.

Vanhoissa sanomalehdissä on tutkimatonta tietoa

Suomessa on nykypäivään mennessä ilmestynyt sanomalehtiä yli 1000:lla eri lehtinimekkeellä. Historian eri aikoina lehtiä on lakkautettu, yhdistetty toisiinsa ja perustettu uusia. Nykyisin Suomessa ilmestyy noin 250 eri sanomalehteä. Sanomalehtinä tilastoidaan (Tilastokeskus, Kansalliskirjasto) lehdet, jotka ilmestyvät 1–7 kertaa viikossa ja jotka sisältävät valtakunnallista tai paikallista uutisaineistoa.  Sanomalehtien määrä Suomessa on korkea maan väkilukuun suhteutettuna. Jos verrataan asukasmäärää lehdistön kokonaislevikkiin, sijoittuu Suomi koko maailman tilastossa kolmanneksi.

Sanomalehdet ovat korvaamattoman runsas ja monipuolinen kulttuurihistoriallinen perintö ja arvokas lähdeaineisto. Päivän sanomalehdistä me suomalaiset olemme kautta aikojen lukeneet ajankohtaiset uutiset ja tapahtumat olivat ne sitten politiikkaa, urheilua, tiedettä, taloutta, kulttuuria tai taidetta. Henkilökuvaukset, merkkipäivät, yhdistysten omat palstat sekä syntymä- ja kuolinilmoitukset ovat myös historiaa tutkivien tärkeitä lähteitä. Sanomalehdet kertovat paikalliset, alueelliset, valtakunnan uutiset ja kansainväliset tapahtumat tärkeänä aikalaiskuvauksena tiiviisti ja selkeästi. Juuri siksi sanomalehtiaineistot ovat hyvin monipuolisesti käytettäviä ja rikkaita aineistoja.

Kansalliskirjaston strategisena tavoitteena on laajojen yhtenäisten aineistokokonaisuuksien digitointi, niiden mahdollisimman laajan käytön mahdollistaminen sekä avoimen tieteen tukeminen.

Digitaalisuus parantaa aineistojen saatavuutta ja käytettävyyttä

Vuoden 2021 alussa avattiin jo kaikki Suomessa ilmestyneet, suomen- ja ruotsinkieliset sanomalehdet aina vuoteen 1940 asti avoimeen yleisökäyttöön verkossa Digi.kansalliskirjasto.fi -palvelussa. Tässä aallossa avoimeen käyttöön avattiin aiemmin käyttöön avattujen lisäksi 1,4 miljoonaa sivua sanomalehtiä ja 1,8 miljoonaa sivua aikakauslehtiä.

Kuluvan vuoden, 2021, aikana aineisto lisääntyy: kaikki ruotsinkieliset Suomessa ennen vuotta 1950 julkaistut sanomalehdet asetetaan avoimesti kaikkien saataville Digi.kansalliskirjasto.fi -palvelussa.

Vuoden 2023 loppuun mennessä Kansalliskirjasto digitoi ja avaa käyttöön kaikki Suomessa julkaistut ruotsinkieliset sanomalehdet historiallisina jatkumoina lehden historian alusta aina tähän päivään asti.

Kaikki Kansalliskirjaston digitoimat aineistot, mukaan lukien sanoma- ja aikakauslehdet, ovat lakiin perustuen tutkijoiden ja kansalaisten käytettävissä maksutta vapaakappaleasemilla paikan päällä Kansalliskirjastossa, Eduskunnan kirjastossa sekä viidessä muussa Suomen vapaakappalekirjastossa, joista yksi on Åbo Akademin kirjasto.

Lisäksi digitoidut ruotsinkieliset sanomalehdet vuoden 2018 loppuun asti ovat käytettävissä Svenska litteraturssällskapetin tutkijasaleissa Helsingissä ja Vaasassa sekä Brages Pressarkivetissa Helsingissä ja Ålands landskapsarkivetissa Maarianhaminassa. Aineistojen käyttöoikeuksista vuoden 2026 loppuun asti on sovittu Kopioston kanssa.

Digi.kansalliskirjasto.fi -palvelussa on käytettävissä jo yli 20 miljoonaa sivua digitaalisia aineistoja, joista reilusti yli puolet on kotimaisia sanomalehtiä. Lisäksi on digitoitu mm. aikakauslehtiä, monografioita, nuottiaineistoja, karttoja ja pienpainatteita. Kansalliskirjaston digitoitujen aineistojen käyttö kasvoi 13,2 miljoonaan sisältösivulataukseen vuonna 2020. Joka kuukausi tehdään keskimäärin 1,1 miljoonaa aineistojen sisältösivulatausta, siis keskimäärin noin 36 000 latausta päivässä. Suurin osa aineistojen käytöstä kohdistuu sanomalehtiin (40 %) ja aikakauslehtiin (39 %). (Kansalliskirjasto, tilastot)

Digi-palvelussa on monipuoliset hakutoiminnot, joita kehitetään käyttäjien toiveiden mukaisesti. Tavoitteena on, että digitaaliset aineistot ovat mahdollisimman helposti ja nopeasti löydettävissä ja käytettävissä.

Ympyrädiagrammissa havainnollistetaan Tutkain-käyttölupalomakkeella ilmoittamien käyttötarkoitusten jakauma vuonna 2020. Tiedonhaun osuus ilmoituksista on suurin, 28 prosenttia.

Kuvio 1: Tutkain-käyttäjien käyttölupalomakkeella ilmoittamien käyttötarkoitusten jakauma vuonna 2020. Tutkain on vuoden 2022 loppuun kestävä projekti, joka tarjoaa mukana olevien yliopistojen ja korkeakoulujen tutkijoille mahdollisuuden käyttää kaikkia, vuoden 2018 loppuun asti, digitoituja lehtiaineistoja digi.kansalliskirjasto.fi –palvelussa Haka-tunnistautumisen kautta. Lähde: Kansalliskirjaston vuosiraportti 2020.

Merkittävä projektirahoitus mahdollistaa nopean digitoinnin

Kansalliskirjaston saama merkittävä projektirahoitus ruotsinkielisten sanomalehtien digitointiin mahdollistaa nopean kaikkien Suomessa julkaistujen ruotsinkielisten sanomalehtien digitoinnin ja saataville asettamisen vuodesta 1940 aina tähän päivään saakka. Kun projekti valmistuu vuonna 2023, tulee liki kuusi miljoonaa ruotsinkielistä sanomalehtisivua olemaan saatavilla digitaalisesti.

Kansalliskirjaston toteuttaman kolmevuotisen digitointiprojektin ovat mahdollistaneet kahdeksan säätiön ja rahaston myöntämä yhteensä 1,85 miljoonan euron rahoitus. Rahoitukseen osallistuvat Svenska kulturfonden, Svenska litteratursällskapet i Finland, Föreningen Konstsamfundet, Stiftelsen Tre Smeder, Stiftelsen Brita Maria Renlunds minne, Stiftelsen för Åbo Akademi, Svenska folkskolans vänner ja Harry Schaumans Stiftelse.

Digitoidut sanomalehdet ovat merkittävä ruotsinkielinen lähdeaineisto humanistiselle ja yhteiskuntatieteelliselle tutkimukselle ja opetukselle. Digitaalisessa muodossa olevat lehdet mahdollistavat myös uusien digitaalisten tutkimusmenetelmien käyttöönottoa ja tätä kautta aineisto avaa uusia tutkimuskysymyksiä ja -näkökulmia historiaan ja nykypäivään. Tutkimusta on tehty jo aikaisempaa digitoitua lehtiainestoa käyttäen. Nyt avautuu mahdollisuus ottaa käyttöön suuri ajallisesti yhtenäinen lehtiaineisto, joka ulottuu tähän päivään saakka ja joka kattaa erilaisia ruotsinkielisiä sanomalehtiä levikin, lehden eliniän ja paikallisuuden näkökulmasta.

Ruotsinkielisten sanomalehtien digitointi ja käyttöön asettaminen myös kolmen arkiston kautta parantaa lehtiaineiston saavuttavuutta asiakkaiden näkökulmasta. Maantieteellisesti arkistot täydentävät vapaakappalekirjastojen verkostoa, kun digitoitua sanomalehtiaineistoa saa myös käyttöönsä Vaasassa ja Ahvenanmaalla. Helsingissä, kivenheiton päästä Kansalliskirjastosta, voi digitoituja sanomalehtiä tutkia lisäksi Svenska litteratursällskapetin arkiston ja Brages pressarkivetin tiloissa.

Kirjoittajat

Pirjo Karppinen, yhteys- ja projektipäällikkö
Kansalliskirjasto
PL 15 (Unioninkatu 36), 00014 Helsingin yliopisto
pirjo.karppinen [at] helsinki.fi

Kristina Linnovaara, arkistonjohtaja
Svenska litteratursällskapet i Finland
PL 158, 00171 Helsinki
kristina.linnovaara[at]sls.fi

Lähteet:

Ahonen, Harri (2020). Kansalliskirjaston aineistopolitiikka uudistui. Tietolinja 2/2020. https://tietolinja.kansalliskirjasto.fi/2020-2/2002-aineistopolitiikka/

Kivimäki, Sanna & Johanna Vaattovaara (2020). Millä kielellä mennään? Tiedejulkaisemisen päivä, 8.10.2020. http://urn.fi/URN:NBN:fi-fe2020101684290

Vapaakappalekirjastot Suomessa: https://www.kansalliskirjasto.fi/fi/vapaakappaletoimisto

Uutismedian liitto ry https://www.uutismediat.fi/sanomalehtihaku/

Tilastokeskus https://www.stat.fi/meta/kas/sanomalehti.html

Kansalliskirjaston vuosiraportti 2020

Kansalliskirjasto, tilastot

Svenska litteratursällskapets årsberättelse 2020. Här digitaliserad 1,6 miljoner sidor  s. 6–9.

 

8 Comments

  1. Antti

    Hienoa että ruotsinkieliset säätiöt lähtivät näyttämään esimerkkiä sanomalehtien digitoimiseksi! Toivottavasti saataisiin pikkuhiljaa myös kaikki suomenkieliset sanomalehdet digitoitua. Ihme ettei poliitikoilta löydy mielenkiintoa tähän.

    Minkä arvoinen diili on euroissa tämä Kansalliskirjaston ja Kopioston välillä kun näitä vanhoja lehtiä pidetään esillä verkossa? Ja onko mitään raporttia olemassa miten rahoja tilitetään vai meneekö ne vain Kopioston jäsenten rahoiksi?

    • Comment by post author

      Riitta Koikkalainen

      Hei Antti,
      ja pahoittelut, kun jouduit odottamaan vastauksen alkua näin pitkään!
      1) Suomenkielisten sanomalehtien digitointi on valtava urakka, mutta ajan kanssa siitä itse työstä selvitään kyllä. Eri asia on, kuinka ja millä tahdilla digitoitu aineisto voidaan asettaa täysin vapaasti saataville. Tämä on tekijänoikeuskysymys.

      EDIT/RK: Palvelualuejohtaja Johanna Lilja täsmentää: ”…suomenkielisen lehdistön digitoinnista voi sanoa, että se etenee suunnilleen viiden vuoden tahtia vuodessa (siis viisi vuosikertaa kaikkia sanomalehtiä). Parhaillaan tehdään 1940-lukua. Lisätietoja löytyy digitointiohjelmasta https://www.doria.fi/handle/10024/180316

      2) Juuri nyt en muista tuota sopimuksen hintaa, enkä itse asiassa itse tiedä, voiko summaa julkistaakaan, välitän kysymyksesi eteenpäin asioista täsmälleen tietävälle palvelujohtajalle ja palaan asiaan.

      EDIT/RK: Palvelujohtaja Johanna Lilja kertoi, että Kopioston hinnoittelu perustuu tekijänoikeudenalaisen aineiston sivumäärään ja arvioituun käyttäjämäärään. Tällä hetkellä Kopioston kanssa on sovittu a) yleisölle avaamisesta 1920-1930-luvun lehdet, b) Tutkain 1940-2018 tutkijoille, c) 2000 kirjan lisenssi ja d) tästä vuodesta alkaen ruotsinkielisten lehtien 1940-luvun lisenssi.

      3) Rahojen tilitys: käsittääkseni rahat tilitetään könttänä Kopiostolle, joka sitten hoitaa jakamisen jäsenistölleen eri tavoin, mutta tarkistanpa myös tämän asian, että en tule antaneeksi erheellistä tietoa. -Riitta K.

      EDIT/RK: Kopiston omalta saitilta tästä enemmän tietoa: https://www.kopiosto.fi/kopiosto/tekijoille-ja-kustantajille/korvaukset-jasenjarjestoille/

  2. Ässä

    Jotkut lehdet ovat digitoineet itse omat lehtensä, olisiko mahdollista sellainen että lehtitalojen muualla digitoimat tiedostot saataisiin liitettyä osaksi Kansalliskirjaston digikokoelmaa?
    Esimerkiksi Karjalainen on omat lehtensä digitoinut Sveitsissä suoraan painetuista lehdistä eikä mikrofilmeistä, joten laatukin olisi parempaa. Luulen että lehtitalot voisivat olla kiinnostuneita kun tiedostot tulisi samalla varmuuskopioitua Kansalliskirjastoon.

    Myös ihmettelen miksei painotiedostoja/näköislehtiä voitaisi liittää osaksi digikokoelmaa, näin saataisiin suoraan lehdiltä pyytämällä lähes kaikki 2000-luvun (ja osa 1990-luvun lopusta) lehdet PDF-muotoisina. Voisihan niistä PDF:istä tehdä suoraan TIFF:it tai JPEG:it niin ei tarvitsisi skannerin läpi käyttää.

    Paras tapa mielestäni olisi sellainen että valtio tukisi kaikkien suomalaisten vanhojen lehtien digitointia ja lehtitalot sitten hoitaisivat omien vanhojen lehtiensä julkaisemisen omilla nettisivuillaan näköislehtinä. Tällä tavalla valtio tukisi sekä ahdingossa olevaa mediaa että kulttuuriperinnön säilyvyyttä.

    • Comment by post author

      Riitta Koikkalainen

      Onpa asiaa täynnä tämä kommentti! Koetan vastailla parhaani mukaan, ja etsin itseäni tietäväisempiä kommentoimaan lisää.

      Lehtien itsensä digitoimien aineistojen liittäminen osaksi Kansalliskirjaston kokoelmiin, sille ei varmaan esteitä olisi jos lehti itse on valmis aineistot luovuttamaan. Aineiston tekninen laatu ja yhteentoimivuus olisi varmistettava – siis se, että aineisto tosiaan saadaan saataville ja käyttöön. Kuvatiedostot, hmmmm, käyttäjän kannalta ne ovat vähän hankalia, niistä ei pysty tekemään esimerkiksi tekstihakuja. -Hieno ehdotus tuo viimeisessä kappaleessa esittämäsi ajatus. -Riitta K.

      • Ässä

        Tottakai jonkinlaiset laatuvaatimukset pitäisi lehtien itse digitoimien sivujen täyttää. Esimerkiksi Keskipohjanmaa -lehti on 1990-luvun lehtiään digitoinut valokuvaamalla sivuja joten laatu ei ole kovin hyvää. Hesarin Aikakoneessa tarkkuus taas on niin matalaa ettei tekstistä tahdo saada selvää.

        Noista vanhojen lehtien digitoinneista voisi olla jokin pitempikin juttu/kirjoitus paikallaan josta kävisi ilmi miten digitoinnit käytännössä hoidetaan; teknisiä tietoja, laitteistoa, formaateista, tiedostomuodoista, esimerkkikuvia, miten lehtiä säilytetään ja muusta sellaisesta.

        • Comment by post author

          Riitta Koikkalainen

          No niin, laitanpa tilauksen sisään tuonne Kansalliskirjaston digitoinnin porukoille, että artikkelia on toivottu. Jospa saataisiinkin jo seuraavaan numeroon!

    • Ässä

      Jos suoraan kulttuuriministeriöltä ei tukea sanomalehtien digitointiin heru niin kannattaisi harkita Suomen Akatemian / Veikkausvoittojen tuen hakua. Ajattelisi että Suomen Akatemia sponsoroisi vanhojen lehtien digitointia, kun vanhoissa lehdissä olisi paljon hyödyllistä materiaalia tutkimuksia varten. Tällä hetkellä moni historiantutkimus on jäissä/hidastunut kun ei päästä tutkimaan 1950-1990 lukujen lehtiä.

  3. SF

    Pari viikkoa sitten oli Journalisti -lehdessä erinomainen juttu kuinka vastuuttomasti lehtitalot säilyttävät omaa materiaaliaan omissa arkistoissaan:
    https://journalisti.fi/artikkelit/2021/10/suomalainen-media-kohtelee-arkistojaan-kaltoin-katoavatko-historia-ja-journalistien-elamantyo/

    Veikkaanpa että useimmissa lehdissä on jo kaikki vuosituhannen vaihteen digikuvat kadonneet ja ensimmäiset digitaaliset painotiedostot.

Leave a Reply

This site uses Akismet to reduce spam. Learn how your comment data is processed.