FINMARCista MARC 21:een eli formaattien lyhyt historia

Arne Hedman
Kansalliskirjasto

Tämän artikkelin pysyvä osoite on http://urn.fi/URN:NBN:fi-fe200905201528

 
Tiedontallennusformaatin avulla mitä tahansa aineistoa koskeva kuvailutieto eli metadata jäsennellään niin, että tietokoneohjelma pystyy käsittelemään sitä ja tuottamaan siitä erilaisia luetteloita. Kuvailutiedon jäsentely pieniin tietokonaisuuksiin on tärkeätä, koska samaa tietoa käytetään moneen eri tarkoitukseen, tietoelementtien laajuus ja esiintyminen vaihtelee suuresti ja kirjastojen ja yhä enemmän myös muiden muistiorganisaatioiden välinen yhteistyö edellyttää tiedon yhdenmukaista tallennustapaa. Formaatteja on sekä kuvailtavaa kohdetta koskevan tiedon tallentamiseen että myös varastotietojen ja auktorisoitujen nimien, yhteisöjen ja asiasanojen esittämiseen. Bibliografiset kuvailutiedot ovat kirjastotoiminnan keskiössä, sillä niihin liittyvät monet kirjaston toiminnot, mm. lainaus, tiedonhaku ja aineiston hankinta.

Formaatti on yksi luetteloijan työkaluista. Formaatin rakenteeseen vaikuttavat kansainväliset kuvailun periaatteet, kansainväliset kuvailustandardit (ISBD, RDA) ja kansalliset luettelointisäännöt. Formaatin soveltaminen erilaisissa yhteistyökuvioissa ja laiteympäristöissä vaatii usein myös konsortio- tai kirjastokohtaisia sovellusohjeita.

Nykyisin on käytössä monia erilaisia metadataformaatteja. Tässä artikkelissa keskitytään lähinnä MARC- (MAchine Readable Cataloging) pohjaisten formaattien historiaan suomalaisesta näkökulmasta.

MARCin alkuvuodet

MARC-maailma luotiin Kongressin kirjastossa USAssa 1960-luvulla. Oletettiin, että kaikki maat, joissa silloin oli käytössä anglo-amerikkalaiset luettelointisäännöt (AACR2), ottaisivat LCMARCin käyttöönsä. Näin ei kuitenkaan käynyt. Englannissa luotiin oma UKMARC, joka oli viritetty painettujen luetteloiden tuottamista varten, kun amerikkalainen formaatti oli ennen kaikkea tiedonhaun tarpeita varten strukturoitu. Kansallisia formaatteja sikisi eri puolilla, pohjoismaissakin jokaisella maalla oli omansa. Norjalaiset käyttivät pohjana LCMARCia, kun tanskalaiset ja ruotsalaiset formaatit pohjautuvat UKMARCiin. Kaikissa oli sama perusrakenne kolminumeroisine kenttineen, osakenttineen ja indikaattoreineen, mutta sisällöllisiä eroja oli melkoisesti. Datan siirto formaatista toiseen onnistui toki kohtuullisesti kutakin konversiota varten räätälöidyllä ohjelmalla.

Atk-luettelointi alkoi Suomen yliopistojen kirjastoissa 70-luvun keskivaiheella Tieteellisten kirjastojen atk-työryhmän (per. 1974) luomien suuntaviivojen mukaan. Luetteloiden tuotanto-ohjelma (Library Software Package) ostettiin British Librarylta, joten oli luontevaa, että Suomalainen FINMARC-formaatti oli mukaelma UKMARCista. Ensimmäinen painettu, uusiin suomalaisiin luettelointisääntöihin (1977) pohjautuva versio ilmestyi 1979. Se oli kirjojen, kausijulkaisujen ja karttojen luettelointiin tarkoitettu. Kansallisbibliografian ensimmäinen automatisoitu kuukausivihko oli tuotettu jo helmikuussa 1978.

FINMARCissa oli myös huomioitu vuonna 1977 valmistunut kansainvälinen vaihtoformaatti UNIMARC (IFLA), jonka avulla oli tarkoitus helpottaa eri maiden ja eri formaattien välistä bibliografisten tietueiden eli luettelointitietojen vaihtoa. UNIMARCin käyttö tähän tarkoitukseen on jäänyt vähäiseksi, sen sijaan sitä on käytetty paljon sekä Euroopassa että Aasiassa kansallisena formaattina. UNIMARC koki 1990-luvulla ’uuden tulemisen’, kun MARC-maailman ulkopuoliset Saksa ja Itävalta alkoivat vaatia poimintatietueita UNIMARC-muodossa. Saksan mielipiteellä oli tietenkin painoarvoa EU:n suurena rahoittajana. Toinen vaihtoformaatti, UNESCOssa kehitetty CCF (1984), joka oli tarkoitettu sillaksi kirjasto-ja tietopalvelumaailman (Unisist reference manual, 1974) välille, koki saman kohtalon. Käyttö vaihtoformaattina on ollut vähäistä, kansallisena formaattina sitä on käytetty etenkin Etelä-Amerikassa. Viro oli aikeissa ottaa CCF:n käyttöön 80-luvun lopulla. Suomalaisten varoitukset menivät perille ja Virossa luovuttiin ajatuksesta. Virossa on nykyään käytössä ainakin FINMARC ja MARC 21.

Atk-luetteloinnin piiri laajenee

FINMARCin kehitys 80-luvulla liittyi ajankohtaisiin luettelointihankkeisiin ja atk-luetteloinnin piirin laajentumiseen. Vuosikymmenen alussa käynnistettiin valtakunnallinen artikkeliluettelointiyhteistyö, jonka hedelmänä syntyi pian KATI-tietokanta. Artikkeleiden luettelointia varten tehtiin oma FINMARC(B) -formaatti, jolle ei löytynyt maailmalta varsinaisia esikuvia. Ns. ’bibliografiaformaatissa’ oli kolme aikaansa edellä ollutta piirrettä: se oli hyvin pelkistetty, se mahdollisti monen artikkelikirjoittajan merkitsemisen tasavertaiseksi tekijäksi ja sen avulla voitiin helposti tallentaa kaikenlaisia taidearvosteluja. Jyväskylässä alettiin 1984 luetteloida musiikkiaineistoa MUSA-tietokantaan, jolloin musiikkiaineistolle tarvittiin oma formaatti. Näin syntyi FINMARC(AV). FINMARCin toisesta painoksesta 1985 tehtiin FINMARC(M) kirjoille ja kartoille ja kausijulkaisuille tehtiin samana vuonna oma formaatti FINMARC(S). Sillä korvattiin kausijulkaisujen yhteisluettelon tuottamisessa käytetty FINUC(S)-formaatti.

Kohti yhtenäisformaattia

Kahdeksankymmentäluvun lopulla alkoi LCMARCista USMARCiksi muuttuneen formaatin ’kantaäidin’ kehitys kohti ns. yhtenäisformaattia (Integrated MARC). Kaikkien aineistojen kuvailuun tarvittavat kentät sisällytettiin yhteen formaattiin. Keskeinen tavoite oli, että kaikkia kenttiä voi käyttää soveltuvin osin kaikenlaisen aineiston luettelointiin. Epäjohdonmukaisuudet ja kentät, joita ei ole koskaan määritelty kunnolla tai jotka ovat tulleet tarpeettomiksi, piti poistaa. Työ vaati useita vuosia.

FINMARCin kehitykseen kaikkien aineistojen yhtenäisformaatiksi vaikutti USMARCin esimerkin lisäksi kirjasto-ohjelmistojen ja laitteistojen kehitys. LSP-luettelointiohjelmaan oli tietoa tallennettu päätelaitteilla, minitietokoneilla (Mikko 3) ja mikroilla (MikroMikko1 ja 2). Kaikki kirjaston toiminnat sisältävän integroidun kirjastojärjestelmän hankintaa oli Tieteellisten kirjastojen atk-yksikössä pohjustettu vuodesta 1984 ja neljä vuotta myöhemmin valittiin pitkällisen prosessin jälkeen yliopistokirjastojen järjestelmätoimittajaksi VTLS. Samana vuonna aloitetttin FINMARC-yhteinäisformaatin kehittäminen kaikille kirjastoille ja aineistolle soveltuvaksi tiedontallennusformaatiksi. Työ valmistui 1996, jolloin FINMARC soveltui kirjojen ja artikkeleiden, kausijulkaisujen, karttojen, visuaalista aineiston, musiikin, arkistoaineiston ja elektronisen aineiston luetteloinnin apuvälineeksi.

Yhden hengen työryhmällä oli formaatin kehittämistyössä apuna eri alojen asiantuntijoita lausunnon antajina ja eri aineistojen formaattioppaiden laadinnassa myös tukiryhmiä. UKMARC-pohjainen FINMARC sai uusia piirteitä myös USMARCista ja UNIMARCista. Niinpä kansainvälinen kirjastoalan lehti (ICSC vol.24, no 4, Oct./Dec 1995) nimitti FINMARCia artikkelissaan ’A Survey of the Use of MARC Formats in National Libraries’ ”UKMARC/USMARC hybridiksi”.

Uusia formaatteja ja konversioita

Vuosituhannen vaihteen lähestyessä oli edessä jälleen uuden kirjastojärjestelmän valinta. Kauppamiehet vakuuttelivat, että voimme edelleen käyttää FINMARCia tallennusformaattina amerikkalaisessa Voyager-järjestelmässä. Totuus paljastui viime hetkellä ja parissa kuukaudessa piti luoda uusi formaatti, jossa ei ollut ristiriitaisuuksia USMARCin kanssa ja kaikki rakkaat suomalaiset erikoisuudet oli säilytetty. Formaatti sai nimekseen MARC21-Fin. USMARC oli sulauttanut itseensä pitkään vastaan haranneen brittiläisen UKMARCin ja Kanadan CANMARCin ja vaihtanut nimensä uuden vuosisadan kunniaksi MARC 21:ksi.

Tietueiden muuntaminen FINMARCista MARC21-Finiin toteutettiin British Libraryssä tehdyllä Usemarcon-ohjelmalla, jota on huomattavasti kehitetty 2000-luvulla Kansalliskirjastossa. Ohjelma helpottaa valmiiden tietueiden poimintaa muiden maiden tiedostoista, eikä UNIMARCia enää tarvitse käyttää välittäjäformaattina. Tietuepoiminta MARC 21-muotoisista luetteloista, amerikkalaisten kirjasto-ohjelmistojen valta-asema markkinoilla ja Kongressin kirjaston suuret resurssit formaattityöhön ovat edesauttaneet MARC 21:n aseman vahvistamista. Useat maat ovat luopuneet kansallisista formaateista. Pohjoismaista Tanska on DANMARC-formaattiinsa kytkettyjen tekijänoikeustietojen takia ilmoittanut, ettei ainakaan toistaiseksi aio siirtyä MARC 21:een.

Formaattihajaannuksen aika

Suomessa oli 2000-luvun alussa käytössä kolme eri formaattia, FINMARC, MARC21-Fin yliopisto- ja ammattikorkeakoulukirjastoissa ja MARC 21 pääkaupunkiseudun yleisissä kirjastoissa ja muutamissa pienissä yleisissä kirjastoissa. Tilanne ei ollut hyvä.

Tästä ja monesta muustakin syystä Helsingin yliopiston kirjastossa alettiin 2004 pohtia siirtymistä MARC 21:een, ensin yliopistokirjastoissa ja myöhemmin mahdollisesti muillakin kirjastosektoreilla. Hallinnolliset päätökset eri kirjastosektoreilla tehtiin 2005-2006 ja joulukuussa 2008 siirryttiin yliopisto- ja ammattikorkeakoulukirjastoissa MARC 21:een konvertoimalla kirjastoissa parikymmentä miljoonaa tietuetta Kansalliskirjastossa tehtyjen määrittelyjen avulla. Yleisten kirjastojen järjestelmätoimittajat ovat ilmaisseet valmiutensa MARC 21:n käyttöön uusissa järjestelmäversioissa. Uuden version hankinta on kallis operaatio tänä kunnallistalouden vaikeana aikana, joten FINMARCista MARC 21:een siirtyminen vienee vuosia. Kansalliskirjasto tarjoaa MARC 21 – FINMARC konversiolla tuotettuja tietueita niin kauan kuin tarvetta on.

Miten MARCille käy?

Ympyrä on sulkeutumassa. LCMARCista alkanut kehitys johti kansallisten MARC-formaattien kirjoon. Nyt suunta on kohti yhdenmukaisuutta. Islanti ja Ruotsi ovat Suomen tavoin siirtymässä MARC 21:een. Saksakin on päättänyt ottaa käyttöön MARC 21:n maan sisäisenä vaihtoformaattina. Toisaalta lausetta ”MARC on kuollut” on hoettu jo parikymmentä vuotta. Tärkeimmät syyt tähän ennustukseen ovat MARCin vaihtomuodon (ISO 2709) vähäinen tunnettuus kirjastomaailman ulkopuolella ja MARCin melko huono soveltuvuus arkistoaineiston ja elektronisen aineiston luettelointiin. Vaihtomuotostandardin ongelmaa on helpottanut XML tietueiden siirtomuotona. Elektroniset aineistot vaativat kuvailutiedon lisäksi teknisiä ja hallinnollisia tietoja tiedon myöhemmän löytyvyyden ja käyttökelpoisuuden varmistamiseksi. Näitä tietoja ei voi tallentaa kattavasti MARC-formaatin avulla.

Vaikka MARC on tiettyyn rajaan asti hyvin joustava – esimerkiksi kaikki FINMARCista periytyneet ’suomalaisuudet’ on saatu pelastetuksi MARC 21:een – se on alun perin suunniteltu vain painetun materiaalin luettelointiin. Yli neljänkymmenen vuoden aikana luotujen satojen miljoonien MARC-tietueiden muunnos johonkin uuteen formaattiin ei kuitenkaan ole helppo toteuttaa. Nähtäväksi jää, mitä paineita MARCiin tuo uusi kansainvälinen luettelointisääntöstandardi (RDA), jonka käyttöönottoa esim. Ruotsi harkitsee. Standardi pohjautuu ns. funktionaalisen luetteloinnin periaatteille ja sisältää kohteen kuvailun lisäksi myös tiedonhaussa tarvittavat tietoelementit. (Ks. tarkemmin Marjatta Autio-Tuulin artikkeli tässä samassa Tietolinjassa)

Lisätietoa

Juha Hakala, MARC21 -Fin vai MARC21 – siinäpä kysymys (Tietolinja 2/2005)

Meneillään olevan formaattiuudistushankkeen tilanteesta: lue Ulla Ikäheimon toimittama uutinen

 

Kirjoittajan yhteystiedot

Arne Hedman, pääsuunnittelija
Kansalliskirjasto / Kirjastoverkkopalvelut
PL 26, 00014 HELSINGIN YLIOPISTO
Email: arne.hedman (at) helsinki.fi