Aineiston avaaminen, tutkimuksenjälkeinen säilytys ja hävittäminen

Aineistojen avaaminen Jyväskylän yliopistossa

Jyväskylän yliopisto pyrkii mahdollisimman laajaan tutkimusaineistojen ja niiden kuvailutietojen avoimuuteen. Samalla se tunnistaa, että aineiston luonteesta riippuen avoimuudessa on eri asteita:

  • Aineiston kuvailu- eli metatiedot ovat avoimesti saatavilla, kun ne siirretään tutkimustietojärjestelmä Converiksen Tutkimusaineistot-osiosta julkaistavaksi yliopiston JYX-julkaisuarkistossa, tai se julkaistaan muussa digitaalisessa arkistossa.
  • Aineisto tai soveltuvat osat siitä voidaan avata eli julkaista joko täysin avoimesti tai tutkijan määrittelemän rajoitetun käyttäjäkunnan saataville (esim. vain tutkimuskäyttöön) kuratoidussa digitaalisessa arkistossa, joka tarjoaa aineistolle pysyvän tunnisteen, lisenssin ja muut käytettävyyden työkalut.
  • Aineistojen julkaisemista ohjaa "Niin avointa kuin mahdollista, niin rajoitettua kuin tarpeen" -periaate. Sen mukaisesti tutkija on aineistonsa paras tuntija ja harkitsee, mitä osia aineistosta voidaan julkaista, mitä toimenpiteitä julkaiseminen vaatii, ja mitä muulle aineistolle tehdään (arkistointi, hävittäminen). Näin suunnitelma kattaa aineiston koko elinkaaren. Jollet voi perustellusta syystä (esim. tietosuoja, liikesalaisuus) julkaista aineistoa, dokumentoi perustelut aineistonhallintasuunnitelmaasi.
  • Valitse julkaistavaksi ne aineiston osat, jotka ovat relevantteja ja keskeisiä tutkimustulosten todentamista varten ja joilla on eniten uudelleenkäyttöarvoa. Vaikka osa aineistosta olisi arkaluonteista tai sisältäisi henkilötietoja, mukana voi kuitenkin olla arvokkaita osia, joiden julkaisemiselle ei ole estettä.
  • Kun suunnittelet aineistojen julkaisemisen alusta asti, vältyt turhalta ja vaivalloiselta työltä tutkimuksen edetessä ja saat aineistot julkaistua vaivatta. Julkaise aineistot kuvailtuina, järjestettyinä kokonaisuuksina luotettavissa, kuratoiduissa data-arkistoissa (ks. sopivan arkiston hakuohje edempänä sivulla). Näin takaat, että aineistosi on löydettävissä, saavutettavaa, teknisesti yhteentoimivaa ja uudelleenkäytettävää. Kerro julkaistavan aineiston kuvailutiedoissa aineistojen tekijätiedot, aineistoa koskevat sopimusehdot sekä käyttölisenssi. Näin varmistat, että muiden on mahdollista käyttää aineistoa uudelleen. Ilman selkeästi ilmoitettua käyttöehtolisenssiä aineisto on käyttökelvotonta.

Näin valmistelet aineistosi julkaisemisen

Aineiston avaamisen edellytyksenä on metatietojen ja aineiston dokumentaation ajantasaisuus. Julkaise aineistostasi aina peruskuvailutiedot eli metadata, vaikket voisi perustellusta syystä julkaista itse aineistoa. Tämä tapahtuu tutkimustietojärjestelmä Converiksen Tutkimusaineistot-osiossa. Sinne kirjataan aineiston perustietojen lisäksi tiedot siitä, missä julkaiset aineiston sekä mahdolliset julkaisemisen esteet. Näin yliopistolle jää arvokas tieto siitä, missä sen aineistoja säilytetään tai on julkaistu. Metadatan julkaiseminen kattaa myös useimpien merkittävien rahoittajien vaatimukset aineiston avoimuuden osalta tilanteessa, jossa aineiston avaamiselle on perusteltu este kuten arkaluonteisuus tai salassapitoveloite.

Varmistat aineiston laadun ja käyttöarvon tutkimushankkeen alusta asti, kun säilytät menetelmiä, aineiston rakennetta ja sisältöä sekä muuta tutkimuksen kannalta oleellista tietoa koskevan dokumentaation aineiston yhteydessä /DOCUMENTATION-nimisessä alakansiossa. Lue lisää dokumentaation hyvistä käytänteistä täältä. Aineiston yleisiä metatietoja ylläpidät yliopiston Converiksen Tutkimusaineistot-osiossa. 

Luo aineistoistasi metatietokuvailu Converikseen jo hankkeesi alkuvaiheessa, jolloin voit päivittää sitä työn edetessä. Tällöin sitä ei tarvitse vielä julkistaa, vaan säilytät kuvailun omana tai tutkimusryhmäsi tietona siihen asti, että haluat julkaista metatiedot sekä mahdollisesti itse aineiston muulle maailmalle. Tässä vaiheessa voit pyytää Converiksen kautta valmiiden metatietojen ja koko aineiston julkaisemista JYX-julkaisuarkistossa. Kohta kohdalta -ohjeen löydät täältä. 


Miten toimitan aineistoni julkaistavaksi JYXissä?

Vaihtoehto 1. Jos säilytät aineistoa Nextcloud-ryhmäkansiossa (JYU Groups, suositeltu vaihtoehto) tai henkilökohtaisessa Nextcloud-kansiossasi, toimi näin:

1. Varmista, että kaikki tarvittavat dokumentaatio- ja aineistotiedostot ja alakansiot ovat mukana kansiossa oikeassa järjestyksessä, ja että tiedostot on nimetty selkeästi. Dokumentaatiotiedosto kannattaa sijoittaa hakemiston juureen, mistä se on helppo avata ensimmäisenä.

2. Klikkaa ensin kansion oikealla puolella olevaa linkkikuvaketta.

" "

3. Klikkaa Share link -komennon vieressä olevaa +-kuvaketta, jolloin saat jakoasetukset näkyviin.

" "

4. Vaihda jakoasetukseksi Allow upload and editing (oletuksena Read only) ja deaktivoi klikkaamalla valikossa oletuksena aktiivisena oleva umpeutumispäivämäärä.

" "

5. Klikkaa Copy to clipboard -kuvaketta ja kopioi linkkiteksti Notepadille tai suoraan Converiksen kenttään.

" "

6. Tarkista, että metatiedot ovat Converiksessa "Täydennettävänä"-tilassa. Sijoita linkki Converis-lomakkeen ”Aineiston Nextcloud-jakolinkki julkaisua varten”-kenttään.

" "

Vaihtoehto 2. Jollet säilytä julkaistavaa aineistoa Nextcloudissa, toimi näin:

1. Järjestä julkaistava aineisto- ja dokumentaatiotiedostot ja -alakansiot selkeästi nimettyinä pääkansioon, jonka haluat julkaista.

2. Muuta kansio pakatuksi .zip-kansioksi: klikkaa julkaistavaa kansiota hiiren oikealla näppäimellä, valitse Send to ja Compressed (zipped) folder:

" "

3. Lähetä .zip-kansio Avoimen tiedon keskukseen, joka hoitaa aineiston linkityksen Converikseen JYXissä julkaistavaksi: researchsupport-osc@jyu.fi. Voit käyttää JYUn Funet File Sender -ohjelmaa, jotta sähköpostin liitetiedoston maksimikoko ei ylity. 


Miten toimin, kun tarvitsen aineistolleni kiireellisesti DOI-tunnisteen?

Jos tarvitset aineistollesi kiireellisellä aikataululla pysyvän tunnisteen viittausta varten, on se mahdollista julkaisemalla aineisto tai sen metatiedot JYUn JYX-julkaisuarkistossa. Toimi näin:

  • Jos aineistokokonaisuus on valmis julkaistavaksi ja haluat julkaista sen JYXissä, kirjaa aineiston kuvailutiedot Converis-tutkimustietojärjestelmään ohjeen mukaan. Valitse Converiksen aineisto-osion viimeiseltä välilehdeltä julkaisevasi aineisto metatietoineen ja liitä lomakkeen "Aineiston Nextcloud-jakolinkki julkaisua varten" -kenttään jakolinkki julkaisukelpoiseksi käsiteltyyn ja järjestettyyn aineistoon, jonka olet tallentanut yliopiston Nextcloud-tallennuspalveluun. Jos tarvitset neuvoja aineiston julkaisukuntoon saattamisessa tai apua aineiston siirtämisessä Nextcloudiin tai haluat toimittaa aineiston muulla tavalla, ota yhteyttä osoitteeseen researchsupport-osc@jyu.fi. Kirjoita lomakkeen "Muuta lisätietoa"-kenttään, millä aikataululla toivot julkaisemista. Tallenna tiedot sitten Tarkistettavana -tilaan (englanninkielisessä näkymässä For validation). Tällöin Avoimen tiedon keskuksen aineistoasiantuntija tarkistaa kuvailutiedot ja siirtää ne julkaistavaksi JYX-julkaisuarkistossa, joka tarjoaa aineistolle kaivatun pysyväistunnisteen, DOIn.
  • Jos aineistokokonaisuus on vielä keskeneräinen, mutta tarvitset pysyvän tunnisteen viitettä varten jo etukäteen, toimi kuten edellä, mutta valitse Converiksen aineisto-osion viimeiseltä välilehdeltä julkaisevasi pelkät aineiston metatiedot ja tallenna tiedot Tarkistettavana -tilaan. Huolehdi tätä ennen, että kaikki Converiksessa kysytyt kuvailutiedot ovat ajan tasalla. Nextcloud-linkki tai toisen data-arkiston linkki aineistoon voidaan tässä tapauksessa täydentää tietoihin siinä vaiheessa, kun ne ovat valmiit julkaistavaksi. Tee tällöin kuvailutietojen täydentämisestä erillinen pyyntö osoitteeseen researchsupport-osc@jyu.fi tai käyttämällä aineiston metatietojen viimeisen välilehden Muutospyynnöt OSC:lle -kenttää. 

Sopivan data-arkiston valinta

Hyviä käytäntöjä

  • Julkaise aineistosi ensisijaisesti tieteenala- tai tutkimusalakohtaisessa digitaalisessa tietoarkistossa (eng. repository). Alakohtaisessa arkistossa data päätyy varmimmin alasi tutkijoiden löydettäväksi.
  • Fairsharing- ja Re3data-portaaleissa voit selailla ja hakea sopivaa arkistoa.
  • Jos sopivaa alakohtaista tietoarkistoa ei ole saatavilla, julkaise datasi yliopiston JYX-julkaisuarkistossa. HUOM: JYXissä julkaistavien aineistojen tulee toistaiseksi olla tiedostokooltaan max. 3-4 GB. Tiedostoja voi kuitenkin julkaista suuriakin määriä, vain yksittäisen tiedoston maksimikoko on määritely. 
  • Käytä yleisiä data-arkistoja kuten Zenodoa ja figsharea vasta viimeisenä vaihtoehtona. Niiden sisällön sekalaisuus heikentää datan löydettävyyttä ja vaikeuttaa löydösten arviointia.
  • Pelkkä omilla tai hankkeen kotisivuilla julkaiseminen ei täytä rahoittajien vaatimuksia eikä yliopiston odotuksia aineiston löydettävyydestä ja saavutettavuudesta.


Näin tunnistat suositeltavan data-arkiston

  • Arkisto on alasi tutkijoiden laajalti käyttämä
  • Arkisto antaa aineistolle pysyvän tunnisteen, kuten DOI tai URN
  • Arkisto julkaisee koneluettavan metadatan ja käyttää tunnettua metadatastandardia
  • Arkistolla on toiminnan luotettavuutta osoittava sertifikaatti, esimerkiksi Core Trust Seal ja ISO 16363 –standardi
  • Arkisto antaa sinun valita käyttöehdot, joilla aineisto on jatkokäytettävissä.

 

Tietoarkisto

Tietoarkisto (FSD) on tutkimuksen ja opetuksen valtakunnallinen palveluinfrastruktuuri. Se arkistoi ja välittää sähköisiä tutkimusaineistoja tutkimukseen, opetukseen ja opiskeluun. Yksikkö toimii Tampereen yliopiston yhteydessä.

Tietoarkisto edistää tieteen avoimuutta, läpinäkyvyyttä, tiedon kumuloitumista ja olemassa olevan tiedon tehokasta tutkimuskäyttöä ja toteuttaa vastuullisesti FAIR-periaatteita. FAIR tarkoittaa, että palvelut ja aineistot ovat helposti löydettäviä, saavutettavia, yhteentoimivia ja jatkokäytettäviä. Toiminnan perusta on asiantunteva, nopea, tasapuolinen ja maksuton palvelu.

Tietoarkisto vastaanottaa digitaalisia tutkimusaineistoja, jotka sopivat esimerkiksi yhteiskuntatieteiden, humanististen alojen, kasvatustieteiden sekä terveystieteiden tutkimukseen, opetukseen ja opiskeluun. Aineistojen tulee olla teknisesti ja juridisesti arkistointikelpoisia. Tietoarkisto tarkistaa aineistot ja niiden dokumentaation.

Kielipankki


Kielipankki on vakiintunut tieteenalakohtainen tietoarkisto. Se on kieliaineistoja käyttävien tutkijoiden palvelukokonaisuus. Kielipankissa on laaja valikoima teksti-, video- ja puheaineistoja, joista voi tehdä monipuolisia hakuja. Voit tutkia ja käsitellä aineistoja virtuaalisessa työtilassa Kielipankin työkaluilla tai ladata niitä omalle koneellesi.

Monet aineistot ovat käytettävissä avoimesti, osa puolestaan oman yliopiston myöntämin tunnuksin. Suojattujen aineistojen käyttöoikeuksia voi hakea sähköisesti. Kielipankin peruskäyttö on tutkijoille ja opiskelijoille ilmaista.

Ohjeet Kielipankin sisällöntuottajille

JYX

JYX on Jyväskylän yliopiston julkaisualusta julkaisuille ja tutkimusaineistoille. JYX tarjoaa aineistoille pysyvät tunnisteet (DOI, URN). Palveluun syötettyjen datasettien metatiedot toimitetaan kansalliseen METAX-katalogiin, josta ne päätyvät JYXin lisäksi löydättäväksi kansallisesta ETSIN-palvelusta ja keskeisimmistä eurooppalaisista tutkimusaineistojen hakupalveluista.

Datan julkaiseminen JYXissä on yksinkertaista: syötä vain datan metatiedot tutkimustietojärjestelmä Converikseen ja pyydä sieltä aineiston julkaisemista. Ohjeet löydät täältä.


Aineiston säilytys tutkimuksen jälkeen ja hävittäminen

Mikäli et julkaise aineistoa mutta aiot säilyttää sitä tutkimuksen päättymisen jälkeen määräajan tulosten todentamista ja mahdollista omaa jatkotutkimustasi varten, suunnittele säilytysaika ja ilmoita se aineistonhallintasuunnitelmassa. Mainitse myös säilytyssijainti. Ei-sensitiivisille aineistoille suositeltavin säilytysratkaisu on Nextcloud-ryhmäkansio, jossa aineistot pysyvät käytettävissä myös yksittäisten kansiota hallinnoivien tutkijoiden poistuessa yliopistolta.

Hyviä käytäntöjä

  • Ennen hävittämistä tarkista omalta laitokseltasi, kuinka kauan tutkimusaineistoja tulee säilyttää oppiaineessasi.
  • Paperiset aineistot hävitetään luottamuksellisten paperien kierrätyslaatikkoon, josta ne päätyvät silppuriin. Useissa yliopiston rakennuksissa on tähän tarkoitukseen tummanharmaita lukollisia tietoturva-astioita.
  • Palautettavat tallennusvälineet (esim. nauhurit) tyhjennetään ylikirjoittamalla ennen palautusta. Ylikirjoittaminen tarkoittaa sitä, että tallennusväline täytetään useita kertoja satunnaisella datalla, jonka jälkeen ei pystytä enää saamaan esille alkuperäisiä tiedostoja. Avoimen lähdekoodin ylikirjoitusohjelmistoja ovat mm. Eraser ja WipeFile. Kysy tarvittaessa neuvoa yliopiston tietoturva-asiantuntijalta HelpJYU-portaalin kautta.
  • Hävitettävät tallennusvälineet tyhjennetään ylikirjoittamalla ja viedään lukittuun luottamuksellisen materiaalin kierrätyslaatikkoon. Näitä vihreitä lukollisia astioita löydät yliopiston eri rakennusten vahtimestaripisteistä.
  • Merkitse Converiksessa aineiston metatietoihin aineisto hävitetyksi.

Aineiston pitkäaikaissäilytys

Tutkimusaineiston pitkäaikaissäilytyksellä tarkoitetaan vähintään 25 vuoden säilytysaikaa. Kansallisesti arvokkaille aineistoille on tähän tarkoitukseen tarjolla CSC:n ylläpitämä Fairdata-PAS-palvelu, joka säilyttää aineistoja kymmenistä satoihin vuosiin. Tutkimusdatapolitiikkansa mukaisesti Jyväskylän yliopisto koordinoi keskitetysti aineistojensa pitkäaikaistallentamista siten, että merkittävimmät yliopiston aineistot tullaan pitkäaikaistallentamaan. Aineistojen valintakriteerit ja menettely tarkentuvat myöhemmin.