Aineiston avaaminen, tutkimuksenjälkeinen säilytys ja hävittäminen

Aineistojen avaaminen Jyväskylän yliopistossa

Videotutoriaali (2,5 min.): Näin julkaiset aineistosi JYXissä

Jyväskylän yliopisto pyrkii mahdollisimman laajaan tutkimusaineistojen ja niiden kuvailutietojen avoimuuteen. Samalla se tunnistaa, että aineiston luonteesta riippuen avoimuudessa on eri asteita. 

Metatietojen avoin saatavuus

Aineiston  saatavuus 

  • Aineisto tai soveltuvat osat siitä voidaan avata eli julkaista joko täysin avoimesti tai tutkijan määrittelemän rajoitetun käyttäjäkunnan saataville (esim. vain tutkimuskäyttöön) kuratoidussa, FAIR-kriteerit täyttävässä data-arkistossa, joka tarjoaa aineistolle pysyvän tunnisteen, lisenssin ja muut käytettävyyden työkalut.
  • Aineistojen julkaisemista ohjaa "Niin avointa kuin mahdollista, niin rajoitettua kuin tarpeen" -periaate. Sen mukaisesti tutkija on aineistonsa paras tuntija ja harkitsee, mitä osia aineistosta voidaan julkaista, mitä toimenpiteitä julkaiseminen vaatii, ja mitä muulle aineistolle tehdään (arkistointi, hävittäminen). Näin suunnitelma kattaa aineiston koko elinkaaren. Jollet voi perustellusta syystä (esim. tietosuoja, sensitiivinen lajitieto, liikesalaisuus jne.) julkaista aineistoa, dokumentoi perustelut aineistonhallintasuunnitelmaasi.
  • Valitse julkaistavaksi ne aineiston osat, jotka ovat relevantteja ja keskeisiä tutkimustulosten todentamista varten ja joilla on eniten uudelleenkäyttöarvoa. Vaikka osa aineistosta olisi arkaluonteista tai sisältäisi henkilötietoja, mukana voi kuitenkin olla arvokkaita osia, joiden julkaisemiselle ei ole estettä.
  • Kun suunnittelet aineistojen julkaisemisen alusta asti, vältyt turhalta ja vaivalloiselta työltä tutkimuksen edetessä ja saat aineistot julkaistua vaivatta. Julkaise aineistot kuvailtuina, järjestettyinä kokonaisuuksina luotettavissa, kuratoiduissa data-arkistoissa (ks. sopivan arkiston hakuohje edempänä sivulla). Näin takaat, että aineistosi on löydettävissä, saavutettavaa, teknisesti yhteentoimivaa ja uudelleenkäytettävää. Kerro julkaistavan aineiston kuvailutiedoissa aineistojen tekijätiedot, aineistoa koskevat sopimusehdot sekä käyttölisenssi. Näin varmistat, että muiden on mahdollista käyttää aineistoa uudelleen. Ilman selkeästi ilmoitettua käyttöehtolisenssiä aineisto on käyttökelvotonta.

Aineiston metatietojen julkaiseminen

Videotutoriaali (5,5 min.): Miten julkaisen aineistoni metatiedot?

1. Luo metatietokuvailu Converikseen heti tutkimuksesi alkuvaiheessa, viimeistään siinä vaiheessa, kun aloitat aineistonkeruun. Päivität metatietoja tutkimuksen edetessä. Ylläpidät metatietoja omana tai tutkimusryhmäsi tietona siihen asti, että haluat julkaista ne sekä mahdollisesti itse aineiston. Kun aineisto alkaa karttua, tallenna metatiedot lomakkeen oikean alakulman Tallenna ja valitse vaihe -valikosta Täydennettävänä-tilaan. Tässä tilassa saat Converiksen kaikki valinnat ja tietokentät käyttöösi. 

2. Kun haluat julkaista metatiedot, tarkista, että aineiston nimi on yksilöivä ja kuvaileva, ei esimerkiksi vain "X-tutkimusprojektin haastatteluaineisto". Tarkista myös, että aineiston kuvailu on niin selkeä ja yksityiskohtainen, että toinen saman alan tutkija osaa sen lukemalla arvioida, onko aineisto hänelle mahdollisesti hyödyllinen. Jos julkaiset vain metatiedot, valitse Aineiston saatavuus -valikosta saatavuudeksi "Pääsyä voi pyytää". Tällöin suljettuna säilytettävästä aineistosta kiinnostuneet osaavat tarvittaessa olla Converikseen merkittyihin yhteyshenkilöihin yhteydessä. 

3. Kun kaikki tiedot ovat valmiit, tallenna lomake oikean alakulman Tallenna ja valitse vaihe -valikosta Tarkistettavana-tilaan. Tämän jälkeen Avoimen tiedon keskus on sinuun tarvittaessa yhteydessä ja julkaisee metatiedot JYX-arkistossa. Kun DOI-linkki on aktivoitunut, Avoimen tiedon keskus lähettää sen sinulle sähköpostitse. 


Missä itse aineisto kannattaa julkaista?

Hyviä käytäntöjä

  • Julkaise aineistosi ensisijaisesti tieteenala- tai tutkimusalakohtaisessa digitaalisessa tietoarkistossa (eng. repository). Alakohtaisessa arkistossa data päätyy varmimmin alasi tutkijoiden löydettäväksi.
  • Fairsharing- ja Re3data-portaaleissa voit selailla ja hakea sopivaa arkistoa.
  • Jos sopivaa alakohtaista tietoarkistoa ei ole saatavilla, julkaise datasi yliopiston JYX-julkaisuarkistossa. HUOM: JYXissä julkaistavien aineistojen tulee toistaiseksi olla tiedostokooltaan max. 3-4 GB. Tiedostoja voi kuitenkin julkaista suuriakin määriä, vain yksittäisen tiedoston maksimikoko on määritely.
  • Käytä yleisiä data-arkistoja kuten Zenodoa ja figsharea vasta viimeisenä vaihtoehtona. Niiden sisällön sekalaisuus heikentää datan löydettävyyttä ja vaikeuttaa löydösten arviointia.
  • Pelkkä omilla tai hankkeen kotisivuilla julkaiseminen ei täytä rahoittajien vaatimuksia eikä yliopiston odotuksia aineiston löydettävyydestä ja saavutettavuudesta.


Näin tunnistat suositeltavan data-arkiston

  • Arkisto on alasi tutkijoiden laajalti käyttämä
  • Arkisto antaa aineistolle pysyvän tunnisteen, kuten DOI tai URN
  • Arkisto julkaisee koneluettavan metadatan ja käyttää tunnettua metadatastandardia
  • Arkistolla on toiminnan luotettavuutta osoittava sertifikaatti, esimerkiksi Core Trust Seal ja ISO 16363 –standardi
  • Arkisto antaa sinun valita käyttöehdot, joilla aineisto on jatkokäytettävissä.

 

Tietoarkisto

Tietoarkisto (FSD) on tutkimuksen ja opetuksen valtakunnallinen palveluinfrastruktuuri. Se arkistoi ja välittää sähköisiä tutkimusaineistoja tutkimukseen, opetukseen ja opiskeluun. Yksikkö toimii Tampereen yliopiston yhteydessä.

Tietoarkisto edistää tieteen avoimuutta, läpinäkyvyyttä, tiedon kumuloitumista ja olemassa olevan tiedon tehokasta tutkimuskäyttöä ja toteuttaa vastuullisesti FAIR-periaatteita. FAIR tarkoittaa, että palvelut ja aineistot ovat helposti löydettäviä, saavutettavia, yhteentoimivia ja jatkokäytettäviä. Toiminnan perusta on asiantunteva, nopea, tasapuolinen ja maksuton palvelu.

Tietoarkisto vastaanottaa digitaalisia tutkimusaineistoja, jotka sopivat esimerkiksi yhteiskuntatieteiden, humanististen alojen, kasvatustieteiden sekä terveystieteiden tutkimukseen, opetukseen ja opiskeluun. Aineistojen tulee olla teknisesti ja juridisesti arkistointikelpoisia. Tietoarkisto tarkistaa aineistot ja niiden dokumentaation.

Kielipankki


Kielipankki on vakiintunut tieteenalakohtainen tietoarkisto. Se on kieliaineistoja käyttävien tutkijoiden palvelukokonaisuus. Kielipankissa on laaja valikoima teksti-, video- ja puheaineistoja, joista voi tehdä monipuolisia hakuja. Voit tutkia ja käsitellä aineistoja virtuaalisessa työtilassa Kielipankin työkaluilla tai ladata niitä omalle koneellesi.

Monet aineistot ovat käytettävissä avoimesti, osa puolestaan oman yliopiston myöntämin tunnuksin. Suojattujen aineistojen käyttöoikeuksia voi hakea sähköisesti. Kielipankin peruskäyttö on tutkijoille ja opiskelijoille ilmaista.

Ohjeet Kielipankin sisällöntuottajille

JYX

JYX on Jyväskylän yliopiston julkaisualusta julkaisuille ja tutkimusaineistoille. JYX tarjoaa aineistoille pysyvät tunnisteet (DOI, URN). Palveluun syötettyjen datasettien metatiedot toimitetaan kansalliseen METAX-katalogiin, josta ne päätyvät JYXin lisäksi löydättäväksi kansallisesta ETSIN-palvelusta ja keskeisimmistä eurooppalaisista tutkimusaineistojen hakupalveluista.

Datan julkaiseminen JYXissä on yksinkertaista: syötä vain datan metatiedot tutkimustietojärjestelmä Converikseen ja pyydä sieltä aineiston julkaisemista. Ks. ohje alla. 


Aineiston julkaiseminen JYXissä

1. Metatietojen ja dokumentaation viimeistely. Laadi aineiston perusmetatietokuvailu Converiksen aineisto-osioon ja tallenna tiedot lomakkeen oikean alakulman Tallenna ja valitse vaihe -valikosta Täydennettävänä-tilaan. Tarkista, että aineiston tulkintaa ja käyttöä varten tarvittava dokumentaatio on järjestyksessä ja valmis julkaistavaksi aineiston mukana. Aineisto voidaan avata siinä vaiheessa, kun sen metatiedot ja dokumentaatio ovat ajan tasalla. 

2. Aineiston toimittaminen. 

Vaihtoehto 1. Jos säilytät aineistoa tutkimusprojektin Nextcloud-ryhmäkansiossa (JYU Groups), toimi näin:

1. Varmista, että kaikki tarvittavat dokumentaatio- ja aineistotiedostot ja alakansiot ovat mukana ryhmäkansiossa haluamassasi järjestyksessä, ja että tiedostot on nimetty selkeästi. Dokumentaatiotiedosto kannattaa sijoittaa hakemiston juureen, mistä se on helppo avata ensimmäisenä.

2. Klikkaa ensin kansion oikealla puolella olevaa linkkikuvaketta.

" "

3. Klikkaa Share link -komennon vieressä olevaa +-kuvaketta, jolloin saat jakoasetukset näkyviin.

" "

4. Vaihda jakoasetukseksi Allow upload and editing (oletuksena Read only) ja deaktivoi klikkaamalla valikossa oletuksena aktiivisena oleva umpeutumispäivämäärä.

" "

5. Klikkaa Copy to clipboard -kuvaketta ja kopioi linkkiteksti Notepadille tai suoraan Converiksen kenttään.

" "

6. Tarkista, että metatiedot ovat Converiksessa "Täydennettävänä"-tilassa. Sijoita linkki Converis-lomakkeen ”Aineiston Nextcloud-jakolinkki julkaisua varten”-kenttään.

" "

7. Kun olet tarkistanut, että muut metatiedot ovat kunnossa ja olet valinnut aineistolle Converiksen lisenssivalikosta haluamasi käyttölisenssin, tallenna tiedot lomakkeen Tallenna ja valitse vaihe - valikosta Tarkistettavana-tilaan. 

Vaihtoehto 2. Jollet säilytä julkaistavaa aineistoa tutkimusprojektin Nextcloud-ryhmäkansiossa, toimi näin:

1. Järjestä julkaistava aineisto- ja dokumentaatiotiedostot ja -alakansiot selkeästi nimettyinä pääkansioon, jonka haluat julkaista.

2. Muuta kansio pakatuksi .zip-kansioksi: klikkaa julkaistavaa kansiota hiiren oikealla näppäimellä, valitse Send to ja Compressed (zipped) folder:

" "

3. Lähetä .zip-kansio Avoimen tiedon keskukseen, joka hoitaa aineiston linkityksen Converikseen JYXissä julkaistavaksi: researchsupport-osc@jyu.fi. Voit käyttää JYUn Funet File Sender -ohjelmaa, jotta sähköpostin liitetiedoston maksimikoko ei ylity. 

4. Tallenna Converiksen aineisto-osioon laatimasi metatiedot lomakkeen oikean alakulman Tallenna ja valitse vaihe -valikosta Tarkistettavana-tilaan. Nyt Avoimen tiedon keskus tarkistaa tiedot, liittää aineistolinkin paikalleen ja julkaisee tiedot. 


Miten toimin, kun tarvitsen aineistolleni kiireellisesti DOI-tunnisteen?

Jos tarvitset aineistollesi kiireellisellä aikataululla pysyvän tunnisteen viittausta varten, on se mahdollista julkaisemalla aineisto tai sen metatiedot JYUn JYX-julkaisuarkistossa. Toimi näin:

  • Jos aineistokokonaisuus on valmis julkaistavaksi ja haluat julkaista sen JYXissä, kirjaa aineiston kuvailutiedot Converis-tutkimustietojärjestelmään ohjeen mukaan. Jos aineisto sijaitsee tutkimusprojektisi Nextcloud-ryhmäkansiossa (JYU Groups), valitse Converiksen aineisto-osion viimeiseltä välilehdeltä julkaisevasi aineisto metatietoineen. Liitä lomakkeen "Aineiston Nextcloud-jakolinkki julkaisua varten" -kenttään jakolinkki julkaisukelpoiseksi käsiteltyyn ja järjestettyyn aineistoon, jonka olet tallentanut Nextcloud-ryhmäkansioon. Jos tarvitset neuvoja aineiston julkaisukuntoon saattamisessa tai apua aineiston siirtämisessä Nextcloudiin tai haluat toimittaa aineiston muulla tavalla, ota yhteyttä osoitteeseen researchsupport-osc@jyu.fi. Kirjoita lomakkeen "Muuta lisätietoa"-kenttään, millä aikataululla toivot julkaisemista. Tallenna tiedot sitten Tarkistettavana -tilaan (englanninkielisessä näkymässä For validation). Tällöin Avoimen tiedon keskuksen aineistoasiantuntija tarkistaa kuvailutiedot ja siirtää ne julkaistavaksi JYX-julkaisuarkistossa, joka tarjoaa aineistolle kaivatun pysyväistunnisteen, DOIn.
  • Jos aineistokokonaisuus on valmis, mutta tutkimusprojektillasi ei ole käytössä Nextcloud-ryhmäkansiota, kirjaa metatiedot Converikseen kuten edellä. Lähetä itse aineisto Avoimen tiedon keskukselle sähköpostitse osoitteeseen researchsupport-osc@jyu.fi. Voit käyttää Funet File Sender -ohjelmaa kookkaille tiedostoille. 
  • Jos aineistokokonaisuus on vielä keskeneräinen, mutta tarvitset pysyvän tunnisteen viitettä varten jo etukäteen, toimi kuten edellä, mutta valitse Converiksen aineisto-osion viimeiseltä välilehdeltä julkaisevasi pelkät aineiston metatiedot ja tallenna tiedot Tarkistettavana -tilaan. Huolehdi tätä ennen, että kaikki Converiksessa kysytyt kuvailutiedot ovat ajan tasalla. Nextcloud-linkki tai toisen data-arkiston linkki aineistoon voidaan tässä tapauksessa täydentää tietoihin siinä vaiheessa, kun ne ovat valmiit julkaistavaksi. Tee tällöin kuvailutietojen täydentämisestä erillinen pyyntö osoitteeseen researchsupport-osc@jyu.fi tai käyttämällä aineiston metatietojen viimeisen välilehden Muutospyynnöt OSC:lle -kenttää. 

Aineiston säilytys tutkimuksen jälkeen

Ei-henkilötietoja sisältävät aineistot 

Tieteenalalla voi olla omia suosituksia niiden aineiston osien määräaikaiseen säilyttämiseen, joita ei ole tarkoitus sijoittaa data-arkistoon jatkokäyttöä varten. Oman alan käytäntöjä voi tiedustella omalta laitokselta tai yksiköstä. Määräaikaiseen säilyttämiseen soveltuvat yliopiston tallennusjärjestelmät niin kauan, kuin aineiston jollain tekijällä on kytkös JYUun. Jos kaikki tekijät lähtevät yliopistosta, on aika selvittää mahdollisuus siirtää säilytettävän aineiston hallinnointioikeus yliopistolle. Ole tässä tapauksessa yhteydessä Avoimen tiedon keskukseen: researchsupport-osc@jyu.fi

Henkilötietoja sisältävät aineistot

Pitkittäis- ja seurantatutkimuksissa on usein tarpeen säilyttää henkilötietoja sisältävää aineistoa tutkimussuunnitelman ja tietosuojaselosteessa kuvaillun henkilötietojen elinkaarisuunnitelman mukaisesti. Kun aiot säilyttää henkilötietoja alkututkimusvaiheen päätyttyä, perustele se tietosuojailmoituksessa ja DMP:ssäsi (tyypillisesti tarve ottaa tutkimukseen osallistuneisiin yhteyttä uudelleen jonkin ajan kuluttua; säilytys on tarpeen tutkimussuunnitelman mukaisia seurantatoimenpiteitä varten). Kun olet dokumentoinut perustelut, voit asettaa aikarajan ja nimetä vastuuhenkilöt arvioimaan tarvetta tunnisteellisten tietojen säilytyksen jatkamiselle alkuperäistä tutkimustarkoitusta varten (esim. 5-10 vuotta). Nextcloudin ryhmäkansiot ovat suositeltu säilytysratkaisu ei-arkaluonteisille tiedoille. Jos säilytettävä aineisto sisältää erityisiä henkilötietoja tai muutoin salassa pidettäviä tietoja, ota yhteyttä Avoimen tiedon keskukseen sopivan säilytyspaikan kartoittamiseksi: researchsupport-osc@jyu.fi.


Aineiston pitkäaikaissäilytys

Tutkimusaineiston pitkäaikaissäilytyksellä tarkoitetaan vähintään 25 vuoden säilytysaikaa. Kansallisesti arvokkaille aineistoille on tähän tarkoitukseen tarjolla CSC:n ylläpitämä Fairdata-PAS-palvelu, joka säilyttää aineistoja kymmenistä satoihin vuosiin. Tutkimusdatapolitiikkansa mukaisesti Jyväskylän yliopisto koordinoi keskitetysti aineistojensa pitkäaikaistallentamista siten, että merkittävimmät yliopiston aineistot tullaan pitkäaikaistallentamaan. Aineistojen valintakriteerit ja menettely tarkentuvat myöhemmin.