Ajankohtaista meiltä ja muualta

Ajankohtaista meiltä ja muualta. Tietolinja, 2020(2). Pysyvä osoite: Tietolinja, 2020(2). Pysyvä osoite: https://urn.fi/URN:NBN:fi-fe20201217101285

KANTO – kansalliset toimijat avoimena datana Fintossa

Kansalliskirjasto on avannut kansallisbibliografian toimijatiedot avoimena datana 20.11.2020. KANTO – Kansalliset toimijat löytyy nyt Finto-palvelusta osoitteesta: https://finto.fi/finaf/fi/.

Nimi KANTO kuvastaa tietovarannon luonnetta vakaana perustana, jonka varaan kirjastojen, arkistojen ja museoiden (KAM-sektorin) linkitettyjä tietoaineistoja on hyvä rakentaa. Tietovarannon juuret ulottuvat laajalle – Kansalliskirjastosta ja kirjastokentältä KAM-sektorin kautta koko yhteiskuntaan – ja ne kuvastavat sitä laajaa luovan alan toimijoiden verkostoa, joka ympärillämme elää ja vaikuttaa.

KANTO sisältää kansallisbibliografian kuvailun yhteydessä tuottamat ohjeelliset nimenmuodot Suomessa julkaistujen aineistojen tekijänä ja kohteena olevista toimijoista mukaan lukien musiikkiaineiston tekijät. Kotimaiseen julkaisutuotantoon liittyvien henkilöiden ja yhteisöjen kuvailujen lisäksi KANTO sisältää jonkin verran tietoja ulkomaalaisista henkilöistä ja yhteisöistä.

Tapio Rautavaaran tiedot KANTO-tietovarannossa

Kuva 1. Tapio Rautavaaraa koskevia tietoja KANTO-tietovarannossa.

Kuvailussa käytettävien nimenmuotojen lisäksi haettavissa ovat mm. tekijän käyttämät pseudonyymit ja tekijän nimen erikieliset versiot tai eri kirjoitusmuodot (ns. varianttinimet). Myös toimijaan liittyvät tunnukset (mm. ISNI, ORCID) ja toimijoihin liittyvät aineistot ovat nähtävissä. Tietoja tekijään liittyvistä aineistosta haetaan kansallisbibliografiasta Finnan kautta. Linkitykset musiikkiaineistoon ovat toistaiseksi puutteellisia.

Tietovarantoon sisältyvät nimenmuodot ja tunnukset sekä tekijään linkitetyt aineistot auttavat paitsi kuvailijaa myös tiedonhakijaa identifioimaan tekijöitä yksiselitteisesti. KANTO on julkaistu käyttöön CC0-lisenssillä, jotta tietoja tekijöistä voisi hyödyntää avoimena datana mahdollisimman laajasti KAM-sektorilla ja sen ulkopuolella.

Toimijanimien kuvailussa on noudatettu RDA:n kuvailusääntöjä ja suomalaisten kirjastojen tekemiä linjauksia vuodesta 2016 lähtien. Tätä vanhemmat kuvailut noudattavat Suomalaisia luettelointisääntöjä.

Fintossa aiemmin julkaistu Suomalaiset yhteisönimet sisältyy KANTOon ja siksi resurssin päivittäminen omana kokonaisuutenaan loppui.

Lisätietoja henkilöiden ja yhteisöjen nimenmuodoista, puutteellisten tai virheellisten tietojen korjauspyyntöjä ja muuta palautetta voi lähettää sähköpostitse osoitteeseen toimijakuvailu-posti (at) helsinki.fi.

Lisätietoa tietovarannosta löytyy Toimijakuvailupalvelun sivuilta.

ß löysi paikkansa – näppäimistökaavio on uudistunut

Kirjoittaja: Juha Hakala

Suomalais-ruotsalaisen näppäimistön määrittelee kansallinen standardi SFS 5966, Näppäimistökaavio. Se julkaistiin 2008 ja uudistettiin 2019.

SFS järjesti uudistetusta painoksesta webinaarin 17.  marraskuuta 2020. Tilaisuudessa kuultiin standardiin tehdyistä muutoksista ja tutustuttiin samalla merkkien tuottamisen keinoihin sekä kansallisen näppäimistöasettelun mahdollisuuksiin laajemminkin. Tilaisuuden esitelmät ovat katsottavissa osoitteessa https://sfs.fi/suomalais-ruotsalainen-monikielinen-nappaimistoasettelu-uudistunut/.

Uusittua näppäimistökaaviota esitellyt Erkki Kolehmainen kertoi, että se tukee kaikkia Suomen ja pohjoismaisia valta- ja vähemmistökieliä, joita Suomessa ovat suomen ja ruotsin lisäksi romanikieli sekä inarin-, pohjois- ja kolttasaame. Lisäksi se kattaa kaikkien EU:ssa viralliseen tai rajoitettuun käyttöön hyväksyttyjen kielten ja mm. turkin nykykäytössä olevat latinalaiset aakkoset. Merkittävimmät lisäykset olivat romanian alapilkulliset kirjaimet ja saksan ß.

Jukka Korpela korosti omassa esityksessään sitä, että SFS 5966 on tarkoitettu tekstin helppoon ja nopeaan kirjoittamiseen. Näppäimistökaavio pitää rajata tavallisimpiin merkkeihin, muiden merkkien tallentamiselle pitää tarjota toisenlaiset keinot, kuten Wordin Lisää merkki -toiminto, jonka avulla löytää esimerkiksi ≠-merkin melko nopeasti. Korpela korosti näppäimistökaavion ohjelmistoriippumattomuutta – se on aina käytettävissä sovellusohjelmistosta riippumatta, kunhan käyttöjärjestelmä tukee sitä. Tässä suhteessa on vielä tekemistä, toistaiseksi ainoa SFS 5966:n uudistettua versiota tukeva käyttöjärjestelmä on Linux. Muiden käyttöjärjestelmätoimittajien kanssa vasta neuvotellaan.

Korpelan mukaan näppäimistökaavion nykyinen version on jokseenkin stabiili. Uusille kokonaisuuksille ei ole tilaa, vain yksittäisiä lisäyksiä voisi harkita.

Esko Clarke Sario kertoi Unicoden merkityksistä. Ihmisillä on oikeus siihen, että heidän nimensä kirjoitusasu on oikea julkisissa rekistereissä. Siksi on tärkeää tukea esimerkiksi saamen kielten merkkejä. Mutta vaikka väestörekisteri tukisi kaikkia latinalaisia merkkejä se ei vielä riitä, koska maahanmuuttajien nimet voivat edellyttää muita merkistöjä. Myös yhteisöjen ja paikkojen nimet pitäisi kirjoittaa alkukielen mukaan tai translitteroituna.

Unicoden kaltaisen laajan merkkivalikoiman haasteena ovat harhauttavat merkit, eli merkit jotka ihminen tulkitsee ulkonäön perusteella väärin. Esimerkiksi kyrillinen pienaakkonen o näyttää vastaavalta latinalaiselta pienaakkoselta, mutta tietokoneelle se on eri merkki. Huijausten vähentämiseksi selaimet suhtautuvat epäillen sellaisiin verkko-osoitteisiin, joissa on kirjaimia eri merkistöistä.

Webinaarin päätteeksi Kotoistuksen puheenjohtaja Katrina Harjuhahto-Madetoja esitteli hankkeesta pysyväisluonteiseksi palveluksi muuttuneen Kotoistuksen toimintaa.

Melindan tekijät näkyville!

Metatietovaranto Melinda on käynnistänyt wiki-sivuillaan juttusarjan, jossa esitellään aineistojen kuvailutyötä tekeviä kirjastojen asiantuntijoita. Ilman heidän tekemäänsä ansiokasta työtä ei olisi Melindaakaan. Juttusarja pyrkii esittelemään tätä monipuolista ja monenkirjavaa joukkoa, joka toimii monilla eri kirjastosektoreilla. Sivuilla on tähän mennessä julkaistu viisi haastattelua:

Museoviraston kuvia vapaaseen käyttöön Finnan kautta

Muesovirasto on avannut kokoelmistaan yli 200.000 kuvaa vapaaseen käyttöön Finnan kautta. Suurin osa kuvista on ladattavissa painokelpoisina versioina, eikä kuvissa ole vesileimoja tai muita teknisiä rajoituksia.

Tapio Rautavaara kitaran kanssa vuonna 1954

Kuva 2. Tämä Tapio Rautavaarasta vuonna 1954 otettu kuva on yksi Museoviraston avaamista kuva-aarteista. Kuvaaja UA Saarinen. Kuvalähde: Museovirasto. Lisenssi: CC BY 4.0.

Kuvat on pääosin lisensioitu CC BY 4.0 -lisenssillä, joissakin tapauksissa käyttöoikeuksia on tosin rajattu enemmän. CC BY -lisenssillä merkittyjä kuvia voi ladata ja käyttää vapaasti ja maksutta moniin tarkoituksiin. Käytön yhteydessä on mainittava kuvaajan tai tekijän nimi sekä kokoelman omistaja eli Museovirasto tai Suomen kansallismuseo. Markkinointi- ja mainoskäyttöön tulee pyytää lupa kuvissa esiintyviltä, elossa olevilta henkilöiltä.

Museoviraston kokoelmia voi hakea ja selata uudessa museovirasto.finna.fi-verkkopalvelussa sekä kansallisessa Finna.fi-hakupalvelussa. Saatavilla on toistaiseksi vasta pieni otos Museoviraston kokoelmien kaikkiaan yli 18 miljoonasta kuvasta, mutta palveluun avataan lisää kuvia vuosittain.

Laajempi uutinen aiheesta on luettavissa Finna.fi-palvelun sivuilla. Myös Tietolinjan tämänkertainen kansikuva on peräisin Museoviraston kokoelmista.

Ruotsinkieliset sanomalehdet digitoituina verkkoon

Kansalliskirjasto julkaisi 15.12.2020 uutisen säätiorahoituksesta, joka mahdollistaa kaikkien Suomessa julkaistujen ruotsinkielisten sanomalehtien digitoinnin ja verkkojulkaisemisen vuosina 2021-2023.

Vuoden 2021 alussa tulevat vuoteen 1939 mennessä julkaistut ruotsinkieliset sanomalehdet avoimesti käytettäviksi verkkoon. Vuoden 2022 alussa saataville tulevat myös vuosina 1939-1949 julkaistut sanomalehdet. Vuonna 1949 tai sitä ennen julkaistut ruotsinkieliset lehdet ovat kaikkien kiinnostuneiden käytössä sekä Suomessa että kansainvälisesti osoitteessa digi.kansalliskirjasto.fi ainakin vuoden 2026 loppuun.

Wasa-posten lehden etusivua vuodelta 1929

Kuva 3. Wasa-Posten-lehden 11.6.1929 etusivu digi.kansalliskirjasto.fi-palvelussa.

Kaikki Kansalliskirjaston digitoimat sanomalehdet ovat lain mukaan saatavilla vapaakappaletyöasemilla Kansalliskirjastossa, Eduskunnan kirjastossa sekä viidessä muussa vapaakappalekirjastossa (ml. Åbo Akademin kirjasto). Vuoden 2018 loppuun mennessä ilmestyneet ruotsinkieliset sanomalehdet ovat lisäksi käytettävissä digitaalisina Svenska litteraturssällskapetin arkistossa Helsingissä ja Vaasassa sekä Brages Pressarkivetissa Helsingissä ja Ålands landskapsarkivetissa.

Lisätietoja Kansalliskirjaston verkkosivuilla: https://www.kansalliskirjasto.fi/fi/uutiset/kaikki-suomessa-julkaistut-ruotsinkieliset-sanomalehdet-digitoidaan-vuoteen-2024-mennessa

Käsinkirjoitettujen tekstien automaattinen tunnistaminen etenee

Kansallisarkisto avasi marraskuussa 2020 uuden digitoitujen tuomiokirjojen hakupalvelun, joka on vapaasti käytettävissä osoitteessa https://tuomiokirjat.narc.fi/. Palvelu sisältää 1800-luvun renovoituja tuomiokirjoja eri puolilta Suomea.

Palvelun suurin uutuus on mahdollisuus tehdä kokotekstihakuja käsinkirjoitetuista historiallisista aineistoista. Kaikki palvelussa olevat tekstit ovat tekoälyn lukemia, eikä tulosta ole korjattu jälkikäteen ihmisvoimin.

Kuva tuomiokirjojen hakupalvelusta, jossa on mahdollista tehdä hakuja käsinkirjoitettujen aineistojen sisällöstä

Kuva 4. Kuvankaappaus Kansallisarkiston uudesta tuomiokirjojen hakupalvelusta. Haettu sana ”bibliotek” on löytynyt mm. kuvassa olevasta dokumentista.

Vaikka tekstintunnistus ei ole virheetöntä, se riittää hakukäyttöön varsin hyvin jo nyt, ja hakutulosten voi olettaa paranevan palvelun toteutuksessa käytettyjen teknologioiden kehittyessä.

Tekstintunnistus perustuu Euroopan unionin rahoittamassa READ-hankkeessa (Recognition and Enrichment of Archival Documents) kehitettyihin ratkaisuihin. Lisätietoja uudesta palvelusta ja siinä käytetyistä teknisistä ratkaisuista on luettavissa Kansallisarkiston julkaisemasta uutisesta ”Tuomiokirjat avautuvat vapaaseen käyttöön uudessa verkkopalvelussa”.

Leave a Reply

This site uses Akismet to reduce spam. Learn how your comment data is processed.