ELEKTRONINEN JULKAISUPANKKI-TYÖRYHMÄN MUISTIO



ESIPUHE

Helsingin yliopiston kirjastotoimikunta asetti 2.6.1997 työryhmän valmistelemaan suunnitelmaa Helsingin yliopiston elektronisen julkaisupankin kehittämiseksi. Työryhmän puheenjohtajaksi kutsuttiin vararehtori Paul Fogelberg ja jäseniksi yo. Tommi Björklund (Helsingin yliopiston ylioppilaskunta), assistentti Olli Hallamaa (systemaattisen teologian laitos), professori Kimmo Koskenniemi (yleisen kielitieteen laitos), kirjastonhoitaja Sinikka Luokkanen (fysiikan laitos), vanhempi tutkija Tomi Mäkelä (kliinis-teoreettinen laitos) ja kehittämisjohtaja Inkeri Salonharju (Helsingin yliopiston kirjasto). Työryhmän sihteeriksi nimettiin suunnittelija Arto Halinen kehittämisosastolta. Yo. Björklund ei ole osallistunut työryhmän työskentelyyn.

Työryhmä on kokoontunut 7 kertaa. Asettamiskirjeeseen liittyi laajahko toimeksianto, josta toteuttamista koskeneella keskustelulla ryhmä käynnisti työnsä. Tämän jälkeen on kuultu ulkopuolisina asiantuntijoina suunnittelija Tuija Sonkkilaa (Teknillinen korkeakoulu), kirjapainon päällikkö Hannele Kaurannetta (Yliopistopaino) ja dosentti Rainer Oeschia (oikeustieteellinen tiedekunta). Työryhmän käsillä olevassa muistiossa otetaan kantaa toimeksiannossa mainittuihin kysymyksiin ja hahmotellaan sellaisia toimia, joiden avulla elektronista julkaisemista voidaan edistää Helsingin yliopistossa. Lisäksi työryhmä on laatinut yksityiskohtaisen hanke-esityksen opinnäytetöiden elektronisen julkaisemisen lisäämiseksi. Hanke-esitys oli esillä rehtorin ja yliopiston kirjaston marraskuussa 1997 käymissä tavoitekeskusteluissa ja hankkeen toteuttamiseen ryhdyttäneen vuoden 1998 aikana.

Saatuaan työnsä päätökseen työryhmä jättää kunnioittavasti muistionsa yliopiston kirjastotoimikunnalle.


Helsingissä 18.11.1997



Paul Fogelberg Olli Hallamaa



Kimmo Koskenniemi Sinikka Luokkanen



Tomi Mäkelä Inkeri Salonharju


Arto Halinen



SISÄLLYS

TIIVISTELMÄ

1 LÄHTÖKOHDAT

2 ELEKTRONISEN JULKAISUTOIMINNAN ORGANISOINTI

3 JULKAISUFORMAATIT

3.1 Alkuperäisen tekstin tallennusmuodot
3.2 Selattavat ja indeksoitavat tallennusmuodot
3.3 Tarkan paperikopion mahdollistavat tallennusmuodot

4 TEKIJÄNOIKEUSSOPIMUKSET

5 JULKAISUJEN JAKELU

6 JULKAISUJEN IDENTIFIOINTI JA REKISTERÖINTI

7 JULKAISUJEN ARKISTOINTI JA PITKÄAIKAISSÄILYTYS

8 KUSTANNUKSET

LIITE: Helsingin yliopiston elektroninen julkaisupankki (hanke-esitys)


TIIVISTELMÄ


Helsingin yliopiston kirjastotoimikunnan asettama työryhmä on lähtenyt siitä, että yliopiston oma julkaisutuotanto ja julkaisujen jakelu on tarkoituksenmukaista ja myös teknisesti mahdollista toteuttaa elektronisessa muodossa lähitulevaisuudessa. Ennen muuta opinnäytetöiden ja muun yliopiston laitosten sarjoissa julkaistavan tutkimusraportoinnin alueella voidaan työryhmän käsityksen mukaan edetä nopeastikin.

Työryhmä on keskittynyt käsittelemään Helsingin yliopiston oman tieteellisen julkaisutoiminnan siirtämistä elektroniseen muotoon. Tämä edellyttää työryhmän käsityksen mukaan ainakin seuraavia asioita:
1 julkaisutoimintaa koskevia täsmennyksiä;
2 ratkaisuja käytettävistä julkaisuformaateista;
3 tekijänoikeussopimuksia;
4 elektronisten julkaisujen jakelujärjestelmää ja tarvepainatusta;
5 julkaisujen pitkäaikaiseen säilytykseen liittyviä järjestelyjä.

Elektroniseen julkaisemiseen siirtyminen edellyttää hallinnollisia päätöksiä. Erityisesti nykyinen väitöskirjojen julkisesti nähtäväksi asettaminen on korvattava uudella käytännöllä ja nykymuotoinen julkaisuvaihto on lopetettava. Muita opinnäytetöitä ei toistaiseksi ole systemaattisesti julkaistu, vaan niistä on saatavilla vain arkistokappaleet tiedekuntien tai laitosten kirjastoissa. Elektronisesti julkaistuista lisensiaatintutkimuksista ja syventävien opintojen tutkielmista tulee julkaisuja.

Tutkielmien samoin kuin väitöskirjojen kirjoittajille tarvitaan julkaisuohjeet, jotka sisältävät suositukset käytettävistä ohjelmista ja tyylimääritykset dokumentin kirjoittamista varten. Yliopiston riittävä resurssointi julkaisutoiminnan infrastruktuuriin (laitteisiin ja ohjelmistopäivityksiin) sekä käyttäjäkoulutukseen on välttämätöntä.

Laitosten julkaisusarjojen korvaaminen vastaavilla elektronisilla sarjoilla on teknisesti helppoa, koska raportit voidaan jatkossakin tuottaa laitoksilla, joissa raportin laatijoita voidaan yksityiskohtaisesti ohjeistaa ja kouluttaa. Raporttien tuottaminen haluttuun elektroniseen formaattiin on suhteellisen helppoa. Tästä syystä on järkevää lähteä liikkeelle laitosten julkaisusarjoista.

Laitosten elektronisilta julkaisusarjoilta on työryhmän mielestä edellytettävä toimitusneuvostoa ja toimittajaa, jotka vastaavat sarjaan sisällytettävien julkaisujen laadusta. Vain tällaisen ennakkokontrollin läpikäyneet dokumentit voidaan ottaa mukaan yliopiston tukemaan julkaisujen tuottamis- ja jakeluverkostoon.

Siirtyminen laajamittaiseen elektroniseen julkaisutuotantoon edellyttää hajautettua ratkaisua, jossa julkaisun kirjoittajat tuottavat dokumenttinsa valmiiksi elektroniseen muotoon. Myös julkaisun bibliografisten ja sisällönkuvailutietojen sisällyttämiseen itse dokumenttiin tulee varautua. Dokumenttien jakelu ja arkistointi sitä vastoin voidaan toteuttaa joko hajautetusti tai keskitetysti.

Työryhmä esittää, että Helsingin yliopisto laatii elektronisen julkaisemisen tekijänoikeuksia varten mallisopimuksen. Sopimuksen tulee antaa tekijälle vapaus päättää esimerkiksi siitä, missä laajuudessa julkaisua voidaan levittää verkossa. Vain pieni osa yliopiston tieteellisestä julkaisutuotannosta on kuitenkaan kaupallisesti merkittävää, ja tästä syystä ainakin opinnäytetöiden tekijöille suositellaan mahdollisimman laajojen julkaisu- ja jakeluoikeuksien antamista töihinsä. Jos työn elektroniseen julkaisemiseen sisältyy kaupallisia rajoituksia, tekijälle suositellaan ELEKTRA-hankkeen (tai sen jatkohankkeiden) kautta tapahtuvaa julkaisemista. ELEKTRA-hankkeessa on luotu menettelytavat, joiden avulla voidaan huolehtia näiden rajoitusten kunnioittamisesta. Hankkeen kokemusten perusteella sopimuskäytäntöjä voidaan kehittää edelleen.

Jos tieteellisiä julkaisuja voidaan jakaa vapaasti, jakelupalvelun järjestäminen yliopiston sisällä on helppoa ja ongelmatonta. Julkaisujen jakelukanavana on internet, ja hakupalvelu voidaan toteuttaa useilla eri tavoilla tarpeista riippuen. Julkaisut voidaan panna avoimeen internet-jakeluun esimerkiksi yliopiston tai tiedekuntien omien kotisivujen kautta, tai niistä voidaan laatia tietokanta, jonka tiedot indeksoidaan valmiiden indeksointiohjelmien avulla hakuroboteilla tehtävää tiedonhakua varten. Elektronisten julkaisujen tiivistelmistä voidaan luoda Helsingin yliopiston sisällä HTML-sivut, jotka saadaan nykyistenkin hakurobottien avulla laajasti näkyville.

Elektronisen jakelun lisäksi tarvitaan ainakin toistaiseksi hyvät paperitulostusmahdollisuudet ja tarvepainatusta. Laajamittaisen elektronisen julkaisemisen oloissa tarvepainatuksen toteuttaminen edellyttää, että Yliopistopaino tai muu vastaava kirjapaino sitoutuu tarvittaessa tuottamaan muutaman (tai jopa yhden) kappaleen julkaisua kohtuulliseen hintaan.

Julkaisut voidaan arkistoida joko hajautetusti yliopiston eri palvelinkoneille tai arkistointi voidaan keskittää jollekin tietylle palvelimelle. Tietoturvasyistä tarvitaan mahdollisesti sekä käyttöarkisto että tallennearkisto pitkäaikaista säilytystä varten. Arkistointiratkaisu ei vaikuta julkaisujen jakelumahdollisuuksiin, vaan se voidaan toteuttaa taloudellisimmalla ja joustavimmalla tavalla.

Dokumenttien pitkäaikainen säilytys edellyttää ratkaisuja tallennusmuodoista ja siitä, onko tarpeen säilyttää vain dokumentin sisältö vai myös sen ulkoasu. Aikojen kuluessa dokumentteja joudutaan ilmeisesti konvertoimaan uusiin formaatteihin. Kattava arkistointi edellyttää kolmenlaisten dokumenttien huomioon ottamista: alkuperäisen tiedoston, verkkojakelua varten luodun HTML-dokumentin ja lisäksi tulostusta varten luodun PostScript-muotoisen dokumentin säilyttämistä.

Muistion liitteenä on työryhmän käsittelemä hanke-esitys, jolla pyritään saamaan käyntiin laajamittainen yliopiston opinnäytetöiden ja laitossarjojen sähköinen julkaiseminen vuosina 1998 ja 1999. Esitykseen sisältyy myös kustannusarvio. Vastuu hankkeen käytännön toteuttamisesta on Helsingin yliopiston kirjastolla.

1 LÄHTÖKOHDAT


Elektroninen julkaiseminen etenee tällä hetkellä eri puolilla maailmaa vauhdilla. Keväällä 1997 raporttinsa jättänyt Kansallinen elektroninen kirjasto -työryhmä totesi, että elektronisessa muodossa ilmestyvän tieteellisen tietoaineiston määrä on kasvanut nopeasti muutaman viime vuoden aikana. “Kasvu on ollut erityisen voimakasta luonnontieteiden, lääketieteiden ja tekniikan aloilla. - - Brittiläisen arvion mukaan (mainituilla) aloilla ilmestyvistä lehdistä puolet tulee olemaan saatavissa sähköisessä muodossa 4-5 vuoden kuluessa. Eräiden arvioiden mukaan perinteinen painettu tieteellinen lehti katoaa kokonaan ja korvautuu elektronisella vastineellaan 10-20 vuoden kuluessa.“ (Opetusministeriön työryhmien muistioita 19: 1997, s. 12/luku 1.2.2; työryhmän muistio on luettavissa verkko-osoitteessa http://www.minedu.fi/elkirjasto.)

Vaikka tulevaisuuden ennustaminen onkin vaikeaa, kehityssuunta on kuitenkin selvä: tutkimustulosten ja oppimateriaalien sähköinen julkaiseminen lisääntyy ja tulee yhä tärkeämmäksi osaksi kaikkea julkaisutoimintaa. Helsingin yliopiston on oltava mukana tässä kehityksessä.

Seuraavassa lainaus Kansallinen elektroninen kirjasto -raportista (s. 15-16; luku 2.1), jossa työryhmä luonnehtii varsin realistisesti yliopistojen oman julkaisutoiminnan nykytilaa ja toisaalta elektronisen julkaisemisen avaamia mahdollisuuksia.


Tämän perusteella Kansallinen elektroninen kirjasto -työryhmä esittää seuraavat suositukset. (1) Yliopistot julkaisevat julkaisusarjansa ja opinnäytteensä elektronisessa muodossa. Julkaisemisessa tulee pyrkiä mahdollisimman laajaan yhteistyöhön sekä avointen standardien käyttöön. (2) Yliopistojen käyttöön rakennetaan tarvepainatusjärjestelmä, jota luotaessa käytetään hyväksi olemassa olevia laitteisto-, ohjelmisto- ja henkilöresursseja. (3) Opetusministeriö julkaisee omat julkaisunsa jatkossa myös elektronisessa muodossa.

Helsingin yliopiston kirjastossa toteutetaan parhaillaan eräitä merkittäviä valtakunnallisia elektronisen julkaisemisen kehittämishankkeita. Sen sijaan yliopiston oman julkaisutoiminnan sähköiseen muotoon saattamisessa ei olla vielä yhtä pitkällä. Elektroninen julkaisupankki -työryhmä on lähtenyt siitä, että yliopiston oma julkaisutuotanto ja julkaisujen jakelu on tarkoituksenmukaista ja myös teknisesti mahdollista toteuttaa elektronisessa muodossa lähitulevaisuudessa. Ennen muuta opinnäytetöiden ja muun yliopiston laitosten sarjoissa julkaistavan tutkimusraportoinnin alueella voidaan työryhmän käsityksen mukaan edetä nopeastikin.

Seuraavassa luettelonomainen katsaus elektronisen julkaisemisen lainsäädännöllisten ja teknisten edellytysten kehitystilanteeseen.

· Vapaakappalelain uudistusta valmisteleva työryhmä (puheenjohtajana Matti Lähdeoja opetusministeriöstä) on asetettu, ja määräaika päättyy 28.2.1998. Yhtenä tavoitteena on sisällyttää elektroniset julkaisut vapaakappalelakiin ja samalla myös vapaakappalekirjastojen kokoelmiin.

· Elektronisen aineiston tekijänoikeusnormit ovat edelleen uudistettavina. Tekijänoikeusasetus on tarkoitus uudistaa kuluvan vuoden aikana.

· Elektronisten julkaisujen viittausstandardi ISO 690-2 Information and documentation, Bibliographic references, Electronic documents or parts thereof on viimeisellä lausuntokierroksella ja tulee voimaan vuoden loppuun mennessä. Vastaava kotimainen SFS-standardi on valmisteilla ja tulee voimaan ensi vuoden alkupuolella.

· Elektronisen aineiston luettelointi yliopistokirjastojen paikallisiin rekistereihin ja valtakunnallisiin yhteisrekistereihin on teknisesti mahdollista FINMARC-formaatin päivityksen ja soveltamisohjeiden laadinnan jälkeen. Dokumentteihin viitataan URL-osoitteen avulla.

· LINNEA-yhteisjärjestelmätietokannoissa on otettu käyttöön WWW-käyttöliittymä, joka mahdollistaa esimerkiksi HTML- ja PDF-dokumenttien lukemisen tiedonhaun yhteydessä.

· Elektronisten dokumenttien standardinumerointia kehitetään aktiivisesti. Uniikin dokumenttinimen (Universal Resource Name, URN) syntaksi hyväksyttiin keväällä ja käynnissä on kansallisten tunnusten kehittely.

· ELEKTRA on elektronisen julkaisemisen hanke, jota johtaa Helsingin yliopiston kirjasto. Hankkeessa kehitetään elektronista julkaisupalvelua ja sopimusmekanismeja tieteellistä julkaisemista varten. Kokeilukäytössä on palvelu, joka huolehtii koko tuotantoprosessista aina aineiston digitoinnista, verkkojakelusta ja tekijänoikeuksien hallinnoinnista arkistointiin. Mukana kokeilussa on lähes 50 tieteellistä aikakauslehteä sekä Helsingin ja Oulun yliopistojen väitöskirjoja.

· EVA on elektronisten verkkojulkaisujen hankintaan ja arkistointiin keskittynyt yhteistyöhanke. Sen tavoitteena on kehittää malli yliopistokirjastojen valtakunnallista ja paikallista arkistointia varten, kanavia ja työkaluja elektronisten verkkojulkaisujen hankintaan, rekisteröintiin ja strukturointiin jälleenhakua varten. Hanketta koordinoi Helsingin yliopiston kirjasto, ja mukana on myös muita kirjastoja, kustantajia ja teknisiä asiantuntijatahoja.

Elektronisen julkaisemisen laajentamisen kannalta ehkä vaikeimpia ongelmia ovat vielä eräin osin selkiytymättömät tekijänoikeuskysymykset. Suurimmassa osassa Helsingin yliopiston piirissä toteutettavaa tieteellistä julkaisutoimintaa näitä ongelmia ei kuitenkaan ole, koska suurin osa kirjoittajista on kiinnostunut vain julkaisujensa mahdollisimman laajasta leviämisestä. Tästä huolimatta tekijänoikeusmenettelyt tulee ratkaista keskitetysti koko yliopiston elektronista julkaisutuotantoa varten. Toinen suuri ongelma ovat julkaisujen tuotannossa käytettyjen ohjelmistojen jatkuva muutos- ja kehitystila. Yhteisten käytäntöjen luomiseksi tarvitaan yliopiston sisällä selkeitä hallinnollisia päätöksiä ja ohjeistusta.

Työryhmä on keskittynyt käsittelemään Helsingin yliopiston oman tieteellisen julkaisutoiminnan siirtämistä elektroniseen muotoon. Tämä edellyttää työryhmän käsityksen mukaan ainakin seuraavia asioita:
1 julkaisutoimintaa koskevia täsmennyksiä;
2 ratkaisuja käytettävistä julkaisuformaateista;
3 tekijänoikeussopimuksia;
4 elektronisten julkaisujen jakelujärjestelmää ja tarvepainatusta;
5 julkaisujen pitkäaikaiseen säilytykseen liittyviä järjestelyjä.

2 ELEKTRONISEN JULKAISUTOIMINNAN ORGANISOINTI


Elektroninen julkaiseminen ja julkaisujen verkkojakelu tekee yliopistoyhteisön kaikista jäsenistä potentiaalisia julkaisijoita. Tässä uudessa tilanteessa hallittu julkaisutuotanto edellyttää hyvää yhteistyötä koko yliopiston sisällä, riittäviä resursseja, kurinalaisuutta ja koulutusta uusien välineiden hallintaan. Työryhmä on kiinnittänyt huomiota niihin elektronisen tieteellisen julkaisemisen kysymyksiin, joilla on merkitystä yliopiston nimissä tapahtuvassa julkaisemisessa. Tämän toiminnan hallittuna pysymisen ehdoton edellytys on julkaisujen kunnollinen referee-järjestelmä. Tutkijoiden henkilökohtaisten kotisivujen käyttöön työryhmän ehdotuksilla ei ole tarkoitus puuttua.

Elektroniseen julkaisemiseen siirtyminen edellyttää hallinnollisia päätöksiä. Erityisesti nykyinen väitöskirjojen julkisesti nähtäväksi asettaminen on korvattava uudella käytännöllä ja nykymuotoinen julkaisuvaihto on lopetettava. Muita opinnäytetöitä ei toistaiseksi ole systemaattisesti julkaistu, vaan niistä on saatavilla vain arkistokappaleet tiedekuntien tai laitosten kirjastoissa. Elektronisesti julkaistuista lisensiaatintutkimuksista ja syventävien opintojen tutkielmista tulee julkaisuja.

Tutkielmien samoin kuin väitöskirjojen kirjoittajille tarvitaan julkaisuohjeet, jotka sisältävät suositukset käytettävistä ohjelmista ja tyylimääritykset dokumentin kirjoittamista varten. Yliopiston riittävä resurssointi julkaisutoiminnan infrastruktuuriin (laitteisiin ja ohjelmistopäivityksiin) sekä käyttäjäkoulutukseen on välttämätöntä.

Laitosten julkaisusarjojen korvaaminen vastaavilla elektronisilla sarjoilla on teknisesti helppoa, koska raportit voidaan jatkossakin tuottaa laitoksilla, joissa raportin laatijoita voidaan yksityiskohtaisesti ohjeistaa ja kouluttaa. Raporttien tuottaminen haluttuun elektroniseen formaattiin on suhteellisen helppoa. Tästä syystä on järkevää lähteä liikkeelle laitosten julkaisusarjoista.

Laitosten elektronisilta julkaisusarjoilta on työryhmän mielestä edellytettävä toimitusneuvostoa ja toimittajaa, jotka vastaavat sarjaan sisällytettävien julkaisujen laadusta. Vain tällaisen ennakkokontrollin läpikäyneet dokumentit voidaan ottaa mukaan yliopiston tukemaan julkaisujen tuottamis- ja jakeluverkostoon.

Siirtyminen laajamittaiseen elektroniseen julkaisutuotantoon edellyttää hajautettua ratkaisua, jossa julkaisun kirjoittajat tuottavat dokumenttinsa valmiiksi elektroniseen muotoon. Myös julkaisun bibliografisten ja sisällönkuvailutietojen sisällyttämiseen itse dokumenttiin tulee varautua. Dokumenttien jakelu ja arkistointi sitä vastoin voidaan toteuttaa joko hajautetusti tai keskitetysti.

Julkaisutoiminnan uudelleenorganisoinnin yhteydessä on tarpeen selvittää myös se, missä määrin nykyinen julkaisumuoto kannattaa siirtää uudelle välineelle sellaisenaan, ja mitä mahdollisuuksia uusi media tarjoaa. Multimedian käyttö lisääntynee ja osasta nykyisiä tekstimuotoisia julkaisuja kehittyy hajautettuja verkkojulkaisuja, jotka sisältävät aikaisempaa enemmän kuvia ja ääni- ja videonäytteitä sekä hypertekstilinkkejä muihin julkaisuihin. Multimedian suhteen työryhmä ei nyt ota kantaa. Jatkossa tulee varautua multimedian käytön lisääntymiseen.

Syventävien opintojen tutkielmien ja lisensiaatintutkimusten julkaisemiseen liittyy erityiskysymyksiä, kuten hyväksymismerkinnän tai arvosanalauselmien sisällyttäminen mukaan. Työryhmän käsityksen mukaan työn hyväksymispäivämäärän tulee olla mukana, mutta ei merkintää arvosanasta. Arvosanat ja sen perusteet (ohjaajien lausunnot) ovat nähtävissä tiedekuntien tai laitosten kirjastoissa. Opinnäytetöihin tulisi sisällyttää HTML-muotoinen tiivistelmälomake, jonka perusteella opinnäytetöihin voidaan kohdistaa WWW-hakuja. Työryhmän mielestä tekijälle tulee varata mahdollisuus päättää, julkaistaanko koko opinnäytetyö verkossa vai ei. Pääsäännön tulee kuitenkin olla, että koko työ on julkinen ellei sitä ole (tiedekunnan päätöksellä) julistettu määräajaksi salaiseksi.

Elektronisen julkaisemisen avulla on mahdollista nostaa yliopiston profiilia ja lisätä näkyvyyttä merkittävästi. Työryhmä esittää harkittavaksi myös yliopiston yhtenäisten elektronisten julkaisusarjojen perustamista.

3 JULKAISUFORMAATIT


Elektroniseen julkaisemiseen liittyy erilaisia tehtäviä ja toimintoja, minkä vuoksi voidaan erottaa kolme erilaista muotoa, joissa julkaisuja lienee syytä tallentaa:

· alkuperäinen, kuten TeX-, LaTeX- tai SGML-muodossa oleva taikka Microsoftin Wordin tai Corelin WordPerfectin omassa tiedostojen tallennusmuodossa oleva materiaali
· indeksoitavissa ja selattavissa oleva, esimerkiksi HTML 3.1 -muotoinen materiaali sekä
· elektroninen faksimile, kuten PostScript tai PDF, joita voidaan myös selata.

Alkuperäisen tekstin ja muun materiaalin tallentaminen palvelee ennen kaikkea pitkän aikavälin tarpeita varmistamalla mahdollisuuden siirtää materiaali myöhemmin muihinkin sovelluksiin, mutta samalla se mahdollistaa myös esimerkiksi itse teksteihin kohdistuvat tutkimukset. Indeksoitava ja selattava muoto on se, jossa vapaasti WWW:n kautta kaikkien saataville tarkoitettu materiaali annetaan selattavaksi ja erilaisten yleisten hakurobottien (kuten Alta Vistan) indeksoitaviksi. Siirrettäessä alkuperäinen materiaali ohjelmalla tällaisen muotoon voi osa tiedosta hävitä tai karkeistua.

Korkealaatuisen ja ulkoasultaan alkuperäisen paperikopion tai monitorilta selattavan veroisen kopion tuottamiseksi tarvitaan esimerkiksi julkaisun PostScript- tai PDF-muotoinen tiedosto. Järjestettävän palvelun laatu ja jakelun vapaus ja ilmaisuus tai vastaavasti maksullisuus määräävät sen, mitkä tallennusmuodot tulevat kyseeseen. Se, millaiset julkaisutavat ja jakelut tekijä sallii tekijänoikeutta koskevassa sopimuksessaan, vaikuttaa myös siihen, millaiset tiedostomuodot ovat soveliaita.

Helsingin yliopiston virallisen elektronisen julkaisun tukemiksi tallennusmuodoiksi tulee valita yleisimmin käytössä olevia ja helposti tuettavia formaatteja. Kaikkia yliopiston piirissä käytettyjä tiedostomuotoja ei ole tarkoituksenmukaista tukea, vaikka useita rinnakkaisia vaihtoehtoja tarvitaankin. Työryhmän mielestä tulee pyrkiä siihen, että keskitetysti suoritettaisiin enintään mekaanisia konversioita, jotka eivät vaadi mainittavaa käsityötä.

Multimedialle, äänelle ja videoaineistoille on omat tiedostomuotoja koskevat standardit, jotka jäänevät alkuvaiheessa Helsingin yliopiston virallisen elektronisen julkaisemisen ulkopuolelle. Näihin muotoihin ja normeihin tulee palata jatkossa.

3.1 Alkuperäisen tekstin tallennusmuodot


Erityisesti matemaattisten ja fysikaalisten tieteiden piirissä käytetään TeX- ja LaTeX-nimisiä tekstinkäsittelymuotoja, joilla on helppo kirjoittaa monimutkaisiakin matemaattisia kaavoja, ja jolla saadaan erittäin korkealuokkaista ladontajälkeä. Nämä muodot ovat pysyneet vakaina jo toistakymmentä vuotta, joten ne ovat hyviä pitkäaikaisen säilytyksen kannalta. Tarvittavat ohjelmat ovat ilmaisia ja vapaasti saatavilla. Konversiot eri muotoihin (dvi, HTML, PostScript) ovat myös laajalti ja vapaasti saatavilla.

Kaikkein varmimman ja pitkäaikaisimman tallennusmuodon tarjoaisi SGML, joka on kansainvälinen standardi (ISO 8879). SGML:n avulla kuvataan dokumentin sisällön muodollinen rakenne, ei sen ulkoasua. Dokumentin muuntaminen SGML-muodosta muihin muotoihin on täsmällisen määrittelyn vuoksi aina mahdollista automaattisesti (vaikka voi vaatia työkaluja ja ohjelmointia). SGML tai siitä johdettu XML eivät kuitenkaan ole vielä laajassa käytössä. Käytön edellyttämiä ohjelmia on kuitenkin saatavissa ilmaiseksikin, mutta kaupalliset ohjelmat ovat usein erittäin kalliita.

Yleisimmin käytettyjen tekstinkäsittelyohjelmien tallennusmuotoja pitänee ilman muuta tukea. Word-ohjelman ja WordPerfect-ohjelman tiedostoformaatit eivät ole kuitenkaan standardoituja, eivätkä edes julkisia. Tallennusmuodot muuttuvat aina uusien versioiden mukana.

3.2 Selattavat ja indeksoitavat tallennusmuodot

WWW:n käyttämä HTML-muoto on eräs yksinkertainen SGML:n mukainen sovellus, jolla ilmaistaan verkossa olevien hypertekstidokumenttien sisällön muodollinen rakenne. Yhteisesti sovittujen normien kuten HTML 2.0 ja HTML 3.1 lisäksi on paljolti käytössä kilpailevien selainvalmistajien omia epästandardeja laajennuksia. HTML-dokumentit ovat kuitenkin melko hyvin laitteista ja käyttöjärjestelmistä riippumattomia. HTML on varsin karkea ja puutteellinen ilmaisemaan julkaisun typografisesti vaativampia piirteitä. Esimerkiksi erikoismerkkejä ja matemaattisia kaavoja joudutaan usein muuntamaan rasterikuviksi HTML:ää varten, jolloin paljon yksityiskohtia hukkuu.

HTML ja pelkkä teksti ovat kuitenkin ne tallennusmuodot, joihin siirretty materiaali on verkossa parhaiten osoitettavissa ja saavutettavissa. Ympäri maailmaa ovat tutkijat ja muut voivat ilman eri toimenpiteitä löytää Helsingin yliopiston elektroniset julkaisut, jotka ovat HTML-muodossa verkossa, koska yleiset hakukoneet (Lycos, Alta Vista, Nordic Web Index, jne.) löytävät ne.

3.3 Tarkan paperikopion mahdollistavat tallennusmuodot


PostScript on laitteista ja niiden valmistajista, käyttöjärjestelmistä ja tekstinkäsittelyohjelmista riippumaton ja erittäin laajasti tuettu sivunkuvauskieli. Yksinkertaisin tapa tarjota julkaisu verkossa lukijoille siten, että he saavat siitä hyvälaatuisen paperikopion itselleen, on laittaa palvelimelle saataville julkaisun PostScript-tiedosto.

Tällä hetkellä yleisesti käytetyllä Adoben PDF-formaatilla voidaan yhdistää selattava ja julkaisun alkuperäisen ulkoasun säilyttävä, hyvänlaatuinen dokumentti. PDF-dokumentin lukemiseen tarvitaan erillinen (tällä hetkellä) ilmainen lukuohjelma, joka toimii tavallisimpien verkkoselainten kanssa tavallisimmissa käyttöjärjestelmissä. PDF-dokumentille voidaan määritellä erilaisia salausasteita (esimerkiksi salasana), tai estää dokumentin muokkaaminen tai tulostus. PDF-formaatti on kuitenkin yhden ohjelmistotuottajan tuote, jonka tulevaisuutta on vaikea ennustaa. PDF-dokumentteihin ei myöskään voida kohdistaa tiedonhakuja WWW-hakupalveluilla.

4 TEKIJÄNOIKEUSSOPIMUKSET


Elektroninen julkaiseminen, kuten perinteinenkin julkaiseminen, edellyttää sopimuskäytäntöjä. Tavallisesti julkaisusta tehdään kustannussopimus kustantajan tai julkaisijan kanssa. Sopimus voi olla kirjallinen, mutta tavallisimmin esimerkiksi artikkeleiden julkaisemisen yhteydessä se on niin sanottu hiljainen sopimus, joka antaa kertajulkaisuoikeuden. Tekijälle jää tässä tapauksessa oikeudet oman teoksensa mahdolliseen uudelleen julkaisemiseen. Kansainväliset kaupalliset kustantajat sitä vastoin hankkivat tavallisesti itselleen kaikki julkaisuun liittyvät oikeudet, jolloin heillä on yksinoikeus julkaista teosta eri medioilla ja kanavissa. Tekijälle ei jää useinkaan mitään taloudellisia oikeuksia omaan teokseensa.

Yliopiston julkaisutoiminnan yhteydessä tulee päättää, kuka on julkaisija. Julkaisijana voi olla esimerkiksi laitos, tiedekunta tai yliopiston kirjasto. Sopimuksella julkaisijan ja tekijän kesken määritellään ne oikeudet ja velvollisuudet, jotka siirtyvät julkaisijalle ja ne, jotka jäävät tekijälle itselleen. Julkaisija tarvitsee luvan ainakin kappaleen valmistamiseksi teoksesta tietokoneella luettavaan muotoon, teoksen tallentamiseksi elektroniseen arkistoon ja teoksen yleisön nähtäville saattamiseksi sekä tuottaakseen teoksesta tarvittavan määrän paperikappaleita pitkäaikaista säilytystä varten tai tarvepainatuksena lukijoiden käyttöön.

Työryhmä esittää, että Helsingin yliopisto laatii elektronista julkaisemista varten mallisopimuksen. Sopimuksen tulee antaa tekijälle vapaus päättää esimerkiksi siitä, missä laajuudessa julkaisua voidaan levittää verkossa. Vain pieni osa yliopiston tieteellisestä julkaisutuotannosta on kuitenkaan kaupallisesti merkittävää, ja tästä syystä ainakin opinnäytetöiden tekijöille suositellaan mahdollisimman laajojen julkaisu- ja jakeluoikeuksien antamista töihinsä. Jos työn elektroniseen julkaisemiseen sisältyy kaupallisia rajoituksia, tekijälle suositellaan ELEKTRA-hankkeen (tai sen jatkohankkeiden) kautta tapahtuvaa julkaisemista. ELEKTRA-hankkeessa on luotu menettelytavat, joiden avulla voidaan huolehtia näiden rajoitusten kunnioittamisesta. Hankkeen kokemusten perusteella sopimuskäytäntöjä voidaan kehittää edelleen.

Kaupallisesti kiinnostavien julkaisujen, kuten oppimateriaalin osalta tekijä voi myös määritellä tekijänoikeuskorvauksen. Tämän korvauksen keräämiseen ja tulouttamiseen tarvitaan lähitulevaisuudessa automaattinen laskutusjärjestelmä, jonka avulla käyttäjät maksavat teoksen käytöstä aiheutuvat maksut elektronisella rahalla, ja korvaukset tuloutetaan saman järjestelmän avulla tekijöille. Tekijänoikeuskorvaukset voidaan maksaa myös erillisten lisenssisopimusten kautta. Näiden kysymysten tarkempi käsittely jää kuitenkin tämän työryhmän työn ulkopuolelle.

5 JULKAISUJEN JAKELU


Jos tieteellisiä julkaisuja voidaan jakaa vapaasti, jakelupalvelun järjestäminen yliopiston sisällä on helppoa ja ongelmatonta. Julkaisujen jakelukanavana on internet, ja hakupalvelu voidaan toteuttaa useilla eri tavoilla tarpeista riippuen. Julkaisut voidaan panna avoimeen internet-jakeluun esimerkiksi yliopiston tai tiedekuntien omien kotisivujen kautta, tai niistä voidaan laatia tietokanta, jonka tiedot indeksoidaan valmiiden indeksointiohjelmien avulla hakuroboteilla tehtävää tiedonhakua varten. Elektronisten julkaisujen tiivistelmistä voidaan luoda Helsingin yliopiston sisällä HTML-sivut, jotka saadaan nykyistenkin hakurobottien avulla laajasti näkyville.

Julkaisujen jakelu voidaan toteuttaa myös suoraan yliopiston omien kirjasto- tai julkaisutietokantojen avulla. Hakumahdollisuudet ovat monipuoliset ja haun tarkkuus hyvä. WWW-käyttöliittymät mahdollistavat siirtymisen julkaisun kuvailusta itse dokumenttiin URL-osoitteeseen perustuvan hypertekstilinkin avulla. Tämä on käyttökelpoinen uusi kanava, joka ei edellytä uusia investointeja.

Nykyiset jakelukanavat eivät mahdollista julkaisujen kontrolloitua maksullista välitystä, vaan aineisto on joko vapaassa verkkolevityksessä tai sopimuskäyttäjien saatavilla. Mahdollisina uusina julkaisuvaihtoehtoina voitaisiin selvittää elektronisten julkaisujen tuottamiseen ja jakeluun tarkoitettuja erikoisohjelmistoja, kuten esimerkiksi ICL Interactin COMMands, IBM Digital Library ja Xerox XDOD/DocuWeb, jotka tarjoavat palvelut myös dokumenttien kaupalliseen välitykseen (erilaiset käyttöoikeudet ja rahastusmahdollisuudet), mikä voi olla tarpeen oppimateriaalituotannossa. Erikoisohjelmistot ovat kuitenkin vielä erittäin kalliita ja elektroninen raha on vasta kehitteillä (esimerkiksi SET).

Elektronisen jakelun lisäksi tarvitaan ainakin toistaiseksi hyvät paperitulostusmahdollisuudet ja tarvepainatusta. Dokumentin osien lukeminen suoraan näyttöruudulta onnistuu samoin kuin oheistulostus, mutta jos kyseessä on laajuudeltaan kirjaa vastaava dokumentti, tarvitaan painatusmahdollisuus. Paperitulostus on todennäköisesti tarkoituksenmukaista integroida nykyisiin valokopiointijärjestelmiin, jotka jo nyt sisältävät rahastuksen (samaan yhteyteen voisi liittää myös mahdollisen tekijänoikeusmaksun). Laajamittaisen elektronisen julkaisemisen oloissa tarvepainatuksen toteuttaminen edellyttää, että Yliopistopaino tai muu vastaava kirjapaino sitoutuu tarvittaessa tuottamaan muutaman (tai jopa yhden) kappaleen julkaisua kohtuulliseen hintaan.

6 JULKAISUJEN IDENTIFIOINTI JA REKISTERÖINTI


Dokumenttien identifiointi edellyttää yksiselitteistä tunnusta. Tähän saakka kirjan muotoisissa dokumenteissa on käytetty painetuille julkaisuille tarkoitettuja ISBN-numeroita. Elektroninen julkaisutuotanto ylittää kuitenkin ISBN-järjestelmän kapasiteetin ja uusi ehdokas tunnukseksi, URN, on kehitteillä. HYK selvittää parhaillaan mahdollisuutta rekisteröityä kansalliseksi URN-keskukseksi.

Dokumenttien bibliografiseen kuvailuun käytetään yleisesti MARC-formaatteja, ja kansalliseen FINMARC-formaattiin on sisällytetty kaikki elektronisten julkaisujen kuvailuun tarvittavat elementit. Myös sovellusohjeet luettelointia varten ovat valmiina. Koska kirjastot jo nyt luetteloivat yliopiston henkilökunnan julkaisut vapaasti käytettäviin tietokantoihin, myös elektronisten julkaisujen luetteloinnista olemassa oleviin tietokantoihin tulee huolehtia.

Nykyisessä käytännössä (elektroninenkin) dokumentti ja sen kuvailu ovat erillään. Elektronisten julkaisujen osalta näin ei enää tarvitse olla. Tästä syystä useita uusia elektronisten dokumenttien kuvailustandardeja on kehitteillä, lupaavimpana niistä Dublin Core -metadatastandardi, joka sisällyttää kuvailutiedot itse dokumenttiin. Tietojen tallennusta varten on laadittu valmiita lomakkeita, joilla dokumentin kirjoittaja voi itse kuvailla oman dokumenttinsa. HTML-dokumentteja varten on jo olemassa työkalut loppukäyttäjiä varten ja WWW-hakupalvelimet indeksoivat kuvailutiedot. Dokumenttien kuvailussa kirjoittajien ja kirjastojen yhteistyötä tulee tiivistää niin, että samaa työtä ei tehdä kahteen kertaan ja että kirjastojen ammattitaito ja apuvälineet (esimerkiksi asiasanastot) ovat kirjoittajien käytettävissä.

7 JULKAISUJEN ARKISTOINTI JA PITKÄAIKAISSÄILYTYS


Julkaisut voidaan arkistoida joko hajautetusti yliopiston eri palvelinkoneille tai arkistointi voidaan keskittää jollekin tietylle palvelimelle. Tietoturvasyistä tarvitaan mahdollisesti sekä käyttöarkisto että tallennearkisto pitkäaikaista säilytystä varten. Arkistointiratkaisu ei vaikuta julkaisujen jakelumahdollisuuksiin, vaan se voidaan toteuttaa taloudellisimmalla ja joustavimmalla tavalla.

Dokumenttien pitkäaikainen säilytys edellyttää ratkaisuja tallennusmuodoista ja siitä, onko tarpeen säilyttää vain dokumentin sisältö vai myös sen ulkoasu. Aikojen kuluessa dokumentteja joudutaan ilmeisesti konvertoimaan uusiin formaatteihin. Kattava arkistointi edellyttää kolmenlaisten dokumenttien huomioon ottamista: alkuperäisen tiedoston, verkkojakelua varten luodun HTML-dokumentin ja lisäksi tulostusta varten luodun PostScript-muotoisen dokumentin säilyttämistä.

Niiltä osin kuin yliopiston julkaisut sisältyvät vapaakappaleisiin, HYK:llä on velvollisuus niiden pitkäaikaiseen säilytykseen, eikä niitä ole tarpeen säilyttää useassa paikassa. Muiden dokumenttien osalta tulee sopia kattavista järjestelyistä.

8 KUSTANNUKSET


Tässä muistiossa hahmoteltu elektroninen julkaisupankki aiheuttaa aluksi lähinnä perustamis- ja käynnistämiskustannuksia. Toiminnasta aiheutuu ilmeisesti myös toisaalta koordinaatiokustannuksia yliopiston kirjastolle ja toisaalta varsinaisia julkaisujen toimituskustannuksia laitoksissa ja tiedekunnissa. Tässä vaiheessa kustannusten jakautumisesta on kuitenkin vaikea sanoa mitään varmaa. Käynnistettävän elektronisen julkaisuhankkeen kautta saadaan tarkempi arvio myös toiminnan kustannuksista. Myöhemmässä vaiheessa saadaan selviä säästöjä verrattuna nykyisten laitossarjojen painatuskustannuksiin. Kustannuksia vähentävänä tekijänä on myös mainittava väitöskirjojen nykyisenkaltaisen vaihdon lopettamisesta aiheutuvat säästöt. Kustannussäästöjä tärkeämpi tekijä on kuitenkin se, että laitosten julkaisujen ja opinnäytetöiden näkyvyys lisääntyy samalla huomattavasti.

Elektronisen julkaisupankin karttuessa säilytyskustannukset voivat kasvaa. Kustannuskehitystä ei tällä hetkellä pystytä tarkkaan arvioimaan. Väitöskirjojen osalta Helsingin yliopiston kirjasto tulee vastaamaan - nykyisten painettujen väitöskirjojen arkistointikustannusten tavoin - niiden säilymisen edellyttämistä konvertointi- ym. säilytyskustannuksista. Sen sijaan muiden elektronisten opinnäytetöiden ja muun aineiston arkistoinnin aiheuttamien kustannusten maksajasta on sovittava erikseen.

LIITE: Helsingin yliopiston elektroninen julkaisupankki (hanke-esitys)


Ohessa työryhmän käsittelemä hanke-esitys, jolla pyritään saamaan käyntiin laajamittainen yliopiston opinnäytetöiden ja laitossarjojen sähköinen julkaiseminen vuosina 1998 ja 1999. Esitykseen sisältyy myös kustannusarvio. Vastuu hankkeen käytännön toteuttamisesta on Helsingin yliopiston kirjastolla.


HANKKEEN NIMI
Helsingin yliopiston elektroninen julkaisupankki


TIIVISTELMÄ
Tavoite: Kehittää palvelu, jonka avulla Helsingin yliopiston väitöskirjoja ja laitossarjoja sekä lisensiaatintutkimuksia ja syventävien opintojen tutkielmia julkaistaan elektronisessa muodossa ja jaellaan verkon välityksellä.

Palvelu kattaa koko väitöskirjojen julkaisemis- ja jakeluprosessin, kuten tekijänoikeuksien hankinnan, dokumenttien teknisen toimittamisen, julkisesti nähtäväksi asettamisen, kontrolloidun jakelun, tarvepainatuksen ja arkistoinnin.

PILOTTI
· Pilottiin sisällytetään väitöskirjoja eri aloilta yhteensä n. 50-100 kappaletta.
· Muita opinnäytteitä kokeiluun otetaan mukaan syventävien opintojen tutkielmista lisensiaatintutkimuksiin, yhteensä n. 100.
· Kunkin tekijän kanssa solmitaan kirjallinen sopimus, joka määrittelee mitä oikeuksia ja velvollisuuksia kummallakin osapuolella on julkaisuun ja sen jakeluun.
· Tekijöitä varten laaditaan julkaisuohjeet, jotka sisältävät suositukset käytettävistä tekstinkäsittely- tai julkaisuohjelmista ja niiden versioista, tyylimääritykset dokumentin kirjoittamista varten sekä ohjeet dokumenttiin sisällytettäviä kuvailutietoja varten.
· Tekijät tuottavat dokumentit erikseen laadittavien ohjeiden mukaisessa muodossa elektronista julkaisemista varten. Kuva- ja muu ei-tekstimuotoinen aineisto tuotetaan soveltuvassa formaatissa. Tiedoston lisäksi aineisto toimitetaan myös paperikopiona.
· Projektia varten opinnäytteiden tekijöille hankitaan työasemia ja ne varustetaan tarvittavilla oheislaitteilla ja ohjelmilla.
· Pilotissa mukana oleville opinnäytetöiden tekijöille järjestetään koulutusta, joka tarjoaa elektronisen dokumentin tuottamiseen tarvittavat valmiudet.
· Dokumentit arkistoidaan jakelua varten HYK:in palvelimelle teknisesti sopivassa ja tekijänoikeuksien sallimassa muodossa. Aineiston pitkäaikaiseen säilytykseen liittyvät seikat selvitetään elektronisia vapaakappaleita koskevan erillisen selvitystyön yhteydessä.
· Väitöskirjat saatetaan sopivalla tavalla julkisesti nähtäville elektronisessa muodossa.
· Tarvepainatusta testataan ja solmitaan valitun tai valittujen kirjapainojen kanssa sopimus, joka varmistaa julkaisun saatavuuden tietyn ajan (esim. 2 vuotta).
· Julkaisujen verkkojakelu toteutetaan oikeuksien sallimassa muodossa, mikä ratkaisee myös julkaisukanavan tai -kanavat. Mikäli julkaisuun on rajoittamattomat levitysoikeudet, asetetaan se saatavaksi yliopiston ja kirjaston tietokantojen kautta sekä tiedekuntien ja laitosten omien WWW-hakemistojen kautta. Aineisto, johon on rajoitetut levitysoikeudet asetetaan käyttöön yliopiston kirjaston ELEKTRA-tietokannan kautta.
· Projektissa hyödynnetään yliopiston kirjastossa käynnissä olevien elektronisen aineiston kokeilu- ja tutkimushankkeiden ELEKTRA:n, EVA:n ja Nordic Metadatan kokemuksia ja tuloksia, ja syntyviä dokumentteja käytetään aineistona EVA-projektin arkistointikokeilussa.

OSALLISTUJAT
· HYK
· Atk-osasto (hallintovirastoon muodostettava yksikkö)
· Tiedekunnat
· Yliopistopaino




Henkilötyö sisältää kahden henkilön palkkauksen, josta 1998 käytetään 1 htv toimitustyöhön ja julkaisijakontakteihin ja 1 htv hankkeen tekniseen toteutukseen. Vuonna 1999 käytetään 0,5 htv toimitustyöhön ja 1,5 htv tekniseen toteutukseen. Laitteisto- ja ohjelmistokulut sisältävät vain hankkeen välittömään toteutukseen tarvittavat työasemat ja julkaisuohjelmistot, ei opinnäytteiden tekijöitä varten varustettavia työasemia eikä aineiston arkistoinnin edellyttämää arkistopalvelinta.

ORGANISAATIO
Hankkeen koordinoijana toimii HYK. Atk-teknistä ja verkkoasiantuntemusta tarjoaa atk-osasto. Yliopistopaino osallistuu hankkeeseen tarvepainatuksen osalta. Kokeiluun osallistuvat tiedekunnat tekevät projektin kanssa julkaisuprosessiin liittyvää yhteistyötä ja tarjoavat julkaistavaa aineistoa.

Projektille nimetään projektipäällikkö ja johtoryhmä, joka toimii yhteistyössä kirjastotoimikunnan ja tietohallintoryhmän kanssa. Hanketta varten laaditaan projektisuunnitelma.