Ajankohtaista meiltä ja muualta

Ajankohtaista meiltä ja muualta (2023). Tietolinja, 2023(2). Pysyvä osoite: https://urn.fi/URN:NBN:fi-fe20231218155450

Koonneet Harri Ahonen, Riitta Koikkalainen, Tuomas Palonen, Ulriikka Puura & Anna Vuolanto

Kuvakaappaus YSO:n näkymästä.

YSO:ssa otetaan huomioon myös kulttuurisensitiivisyys.

Avoin Avustaja kutsuu kouluttamaan suomenkielistä tekoälyä

TurkuNLP eli Turun yliopiston kieliteknologian tutkimusryhmä kehittää avoimen lähdekoodin kielimalleja. Nyt suomenkielistä kielimallia hienosäädetään joukkoistamalla mallin koulutusta tähän tarkoitukseen luodulla Avoin Avustaja -nimisellä alustalla.

Internetistä ladattujen tekstiaineistojen sijasta kouluttamiseen käytetään osallistujien tuottamia keskusteluaineistoja. Vapaaehtoinen kouluttaja toimii ikään kuin tekoälynä ja kirjoittaa luonnollisella kielellä esitettyihin kysymyksiin vastaukset siten kuin tekoäly voisi tehdä. Vastaavasti vapaaehtoisena kouluttajana voi esittää jatkokysymyksiä tekoälyn antamiin vastauksiin – tällöin kouluttaja toimii tekoälyä hyödyntävän ihmisen roolissa. Näitä kouluttajien tuottamia keskusteluvuoroja muut käyttäjät arvioivat ja parantavat siten vastausten laatua esimerkiksi kohteliaisuuden ja luotettavuuden näkökulmasta.

Kurkkaa Avoin Avustaja https://avoin-avustaja.fi ja osallistu paremman tekoälyn kehittämiseen!

Blogikirjoituksia suomalais-ugrilaisista aineistoista Kansalliskirjastossa

Kuluvana vuonna 2023 on vietetty Fenno-Ugrica-palvelun kymmenvuotisjuhlaa. Historialliset sanomalehdet ja muut digitoidut julkaisut Venäjän ja Neuvostoliiton alueilta ovat menneen vuosikymmenen kuluessa nousseet geopoliittisista syistä ennalta-arvaamattoman arvokkaiksi suomalais-ugrilaisten kielten ja kansojen tutkimukselle. Kaksiosaisen blogin ensimmäisessä osassa kerrotaan näiden aineistojen keruusta, käytöstä ja merkityksestä.
Osa 1: https://www.kansalliskirjasto.fi/fi/blogi/fenno-ugrica-10-vuotta-vahemmistokielten-asemaa-tukemassa-ja-niihin-kohdistuvaa-tutkimusta

Osa 2: https://www.kansalliskirjasto.fi/fi/blogi/fenno-ugrica-10-vuotta-vahemmistokielten-asemaa-tukemassa-ja-niihin-kohdistuvaa-tutkimusta-osa-kaksi

Karjalankielisiä aineistoja tarkasteltiin karjalan kielen päivää juhlistaneessa blogikirjoituksessa. Suomessa ja Venäjällä julkaistaan karjalankielistä kirjallisuutta sekä kehitetään karjalan kielimuotoja. Kansalliskirjastoon tallennetaan systemaattisesti Suomessa julkaistu karjalankielinen kirjallisuus. Kokoelmissa on kuitenkin myös Neuvostoliitossa ja Venäjällä ilmestyneitä karjalankielisiä julkaisuja muuallakin, kuin edellä mainitussa Fenno-Ugrica-kokoelmassa.  https://www.kansalliskirjasto.fi/fi/blogi/karjalankielista-kirjallisuutta-1800-luvulta-tahan-paivaan

Fenno-Ugrica täytti kymmenen vuotta

Kansalliskirjaston ylläpitämä uralilaisilla kielillä julkaistujen aineistojen verkkokokoelma Fenno-Ugrica täytti kesäkuun alussa kymmenen vuotta. Kokoelma sisältää entisen Neuvostoliiton alueella maailmansotien välisenä aikana julkaistuja monografioita ja kausijulkaisuja.

Uralilaisilla kielillä ilmestyneiden julkaisujen lisäksi kokoelmaan kuuluu erillisinä kokonaisuuksina saamelaiskielistä, romanikielistä, jiddišinkielistä, liivinkielistä ja kominkielistä aineistoa sekä Suomen Muinaismuistoyhdistyksen ja Suomalais-Ugrilaisen Seuran digitoituja julkaisuja.

Fenno-Ugrica on käytettävissä vapaasti osoitteessa: https://fennougrica.kansalliskirjasto.fi/

Kohti metatietovisiota

Yleisten kirjastojen Kohti metatietovisiota -projektin tulokset ja loppuraportti on julkaistu 26.4.2023. Projektissa selvitettiin linkitettyyn kirjastodataan siirtymisen vaikutuksia metatiedon ekosysteemiin sekä yleisissä kirjastoissa tehtävään kuvailutyöhön, tiedonhakuun ja kokoelmatiedon käyttöön. Turun kaupunginkirjaston toteuttaman projektin rahoitti Opetus- ja kulttuuriministeriö. Projektin loppuraporttiin voi tutustua metatietoryhmän sivuilla: https://www.kirjastot.fi/sites/default/files/content/ykn_kohti_metatietovisiota_loppuraportti2023.pdf

Opetus- ja kulttuuriministeriö on myöntänyt Turun kaupunginkirjastolle rahoituksen myös toukokuussa käynnistyneelle Kohti metatietovisiota -jatkoprojektille. Sen tavoitteena on täsmentää kuvailuyhteistyön tiekarttaa siten, että kirjastojen, järjestelmätoimittajien sekä metadatan tuottajien on mahdollista suunnitella lähivuosien toimintaansa paremmin.

Talvi- ja jatkosodan aikaiset rintamalehdet on digitoitu

Kansalliskirjasto on digitoinut yhteistyössä Maanpuolustuskorkeakoulun kirjaston kanssa talvi- ja jatkosodan aikana ilmestyneet rintamalehdet. Kyse on rintamaoloissa oleville sotilaille suunnatuista lehdistä.

Digitaalinen kokoelma käsittää yhteensä 144 rintamalehtinimekettä. Kokoelma löytyy osoitteesta: https://digi.kansalliskirjasto.fi/collections?id=841

Vuonna 1939 ilmestynyt aineisto on vapaasti käytettävissä, mutta tätä uudempi aineisto ainoastaan vapaakappalekirjastoissa.

Tulossa: Slaavilaisen kirjaston juhlavuosi

Vuonna 2024 juhlitaan Slaavilaista kirjastoa. Silloin tulee kuluneeksi 100 vuotta siitä, kun Helsingin yliopisto päätti säilyttää Venäjän keisarikunnasta saadut vapaakappaleet ja linjasi, että kokoelmaa kehitetään humanistisen tutkimuksen tueksi. Kokoelma oli ollut Venäjän kielen ja kirjallisuuden professorin alaisuudessa, mutta vuonna 1924 se siirrettiin osaksi silloista Helsingin yliopiston kirjastoa, nykyistä Kansalliskirjastoa.

Slaavilainen kirjasto https://www.kansalliskirjasto.fi/fi/kokoelmat/slaavilainen-kirjasto tarjoaa alkuperäislähteitä ja tutkimuskirjallisuutta Venäjän ja Itä-Euroopan tutkimuksen käyttöön. Kaikille avoin kirjasto palvelee tutkijoita, opiskelijoita ja muita slaavilaisista maista ja kulttuureista kiinnostuneita.

Juhlavuoden ohjelma käynnistyy Tieteiden yönä 25.1.2024 kirjaston Kupolisalissa, jossa kuullaan, millaisten vaiheiden kautta Slaavilaisen kirjaston kohtalo ratkaistiin vuosina 1921–1924. Vuoden aikana järjestetään yleisöluentoja ja tutustutaan aineistoihin muun muassa Slaavilaisen kirjaston näyttelyssä. Elokuussa järjestetään kansainvälinen konferenssi. Mukana juhlavuodessa ovat myös Venäjän ja Itä-Euroopan tutkimuksen seura ja Aleksanteri-instituutti. Tietoa tapahtumista on verkkosivulla https://www.kansalliskirjasto.fi/fi/slaavilaisen-kirjaston-juhlavuosi-2024. Tervetuloa osallistumaan!

YSO-ontologialle laadittu kulttuurisensitiivisyyslinjaus

Kulttuurialalla on niin Suomessa kuin maailmanlaajuisestikin puhuttu jo pitkään kulttuurisensitiivisyydestä kielenkäytössä, terminologiassa ja laajemminkin. Keskustelu on herättänyt reflektoimaan kulttuuriin sisäänrakennettuja valta-asetelmia, painotuksia ja syrjivää kieltä. Tätä myötä on alkanut syntyä uudenlaisia toimintatapoja, joissa kulttuurin ja väestön monimuotoisuus huomioidaan paremmin. Prosessi on kuitenkin jatkuvaisluonteinen eikä vielä olla sen suhteen erityisen pitkällä.

Ilahduttavasti keskustelu on saapunut myös yhtäältä kirjastoalalle ja toisaalta sanastoalalle. Esimerkiksi Kongressin kirjasto piti esityksen aiheesta kuluneen vuoden elokuun WLIC-konferenssin sateliittitapahtumassa ja Open Culture järjesti aiheesta webinaarin marraskuussa otsikolla ”Changing the Subject & Respectul Terminologies”. Finto-palvelu on seurannut keskustelua ja alkanut myös pohtia sanastotyötä tästä näkökulmasta. Palvelu on viime aikoina saanut myös palautetta erityisesti koskien Yleistä suomalaista ontologiaa YSOa ja sen termejä. Palautteen mukaan eräät termit ovat syrjiviä. Finto-palvelun lähtökohta on, että palaute otetaan aina vakavasti, asia tutkitaan ja tehdään tarvittaessa muokkauksia sanastoon.

Aiheesta on keskusteltu sekä sisäisesti YSOn ylläpitotiimin kesken että ulkoisesti YSO-kokouksissa ja Ontologiakehittäjien yhteistyöryhmässä. Keskustelun pohjalta on nyt laadittu linjaus, jossa tietyt YSOn termit varustetaan infoikonilla ja huomautuksella, jossa mainitaan termin ongelmallisuus ja syy, miksi se on säilytetty sanastossa. Linjaus on periaatteessa sovellettavissa muihinkin sanastoihin. Päätös säilyttää näitä termejä YSOssa liittyy käyttäjiin, jotka eivät välttämättä tunne modernimpaa termiä, ja aineistoihin, vanhempiin ja uudempiin, joissa ongelmallinen termi saattaa esiintyä. Säilytetty vanhentunut termi ohjaa käyttäjän uuden termin äärelle ja mahdollistaa näin tiedonhaun. On myös tapauksia, joissa termi tiedetään ongelmalliseksi, mutta tilalle ei ole vielä löytynyt tai yleistynyt uutta, parempaa termiä.

Huomautusteksteihin on sisäänleivottu ajatus siitä, että YSOn ylläpito ei ole ongelmallisten termien auktoriteetti, vaan termien ongelmallisuus on yleisesti tunnistettu. Keskeisin asiantuntijuus tulee kentältä ja niistä ryhmistä, joita termit kuvaavat.

YSOn ylläpitotiimi seuraa tilannetta aktiivisesti ja ottaa mielellään palautetta vastaan jatkossakin. Jo tehtyihin päätöksiin ja linjauksiin on myös mahdollista palata uudelleen. Tarvittaessa YSOn ylläpito voi myös konsultoida asiantuntijoita esimerkiksi järjestökentältä ja ihmisoikeuksiin erikoistuneista instituutioista. Laadittu linjaus on luettavissa täällä (ks. Termit ja kulttuurisensitiivisyys):
https://www.kiwi.fi/x/yIEkFg

Menovinkkejä

  • Supercomputing for NLP (in person: Life Science Center, Keilaranta 14, Espoo & online) 25.1.2024
  • Suomen tieteellisen kirjastoseuran webinaari, pohdinnassa tekoäly ja aineiston saatavuus (huom. saattaa olla maksullinen, webinaari) 1.2.2024
  • Metadata tiedekustantajille -webinaari 8.2.2024
  • Research data management and data documentation in long-term research projects (webinar) 8.2.2024
  • Knowledge first -seminar (in person, University of Helsinki, main building, small hall, Fabianinkatu 33) 14.3.2024
  • E-kirjasto avautuu 23.4.2024
  • 11th Creating knowledge conference (fee 300 e, in person, University of Helsinki main building, Fabianinkatu 33) 5.–7.6.2024
  • Pidfest (in person, National Library of Technology 160 80 Prague 6 – Dejvice. Czech Republic) 11.–13.6.2024

Kotoistuspalvelu kiittää

Keltaisia ja pinkkejä A5 kokoisia post-it -lappuja, joissa muistiinpanoja.

Kotoistuspalvelun emoji-työryhmän kokouksen 24.11.2023 työpäiväkirja. Kuva: Marko Oja.

Kotoistuspalvelun viimeisin ja uusin asiantuntijaryhmä kokoontui Lapset töihin -päivänä 24.11.2023. Tapaamisen tuloksena syntyi suomenkielisiä nimiä ja asiasanoja uusille emojille. Ne julkaistaan kansainvälisessä Unicoden CLDR-tietokannassa kesällä 2024. Kotoistuspalvelun kiitokset asiantuntijoille: Tomas, Alma Riski, Vilho Vuolanto,  Otso Puura, Vanamo Puura, Hertta Savolainen ja kaksi muuta eksperttiä, joiden nimiä Tietolinjan toimituksella ei ole lupa julkaista.

 

Leave a Reply

This site uses Akismet to reduce spam. Learn how your comment data is processed.