Aineiston avaaminen, arkistointi ja hävittäminen

Aineistojen avaaminen Jyväskylän yliopistossa

Oleellisia kysymyksiä: Mitä osia aineistosta julkaisen, ja missä? Arkistoinko aineistoni vai hävitänkö sen tai osan siitä, ja millä perusteella? Miten toimin?

Jyväskylän yliopisto pyrkii mahdollisimman laajaan tutkimusaineistojen ja niiden kuvailutietojen avoimuuteen. Samalla se tunnistaa, että aineiston luonteesta riippuen avoimuudessa on eri asteita:


Näin valmistelet aineistosi julkaisemisen

Aineiston avaamisen edellytyksenä on metatietojen ja aineiston dokumentaation ajantasaisuus. Julkaise aineistostasi aina peruskuvailutiedot eli metadata, vaikket voisi perustellusta syystä julkaista itse aineistoa. Tämä tapahtuu tutkimustietojärjestelmä Converiksen Tutkimusaineistot-osiossa. Sinne kirjataan aineiston perustietojen lisäksi tiedot siitä, missä julkaiset aineiston sekä mahdolliset julkaisemisen esteet. Näin yliopistolle jää arvokas tieto siitä, missä sen aineistoja säilytetään tai on julkaistu. Metadatan julkaiseminen kattaa myös useimpien merkittävien rahoittajien vaatimukset aineiston avoimuuden osalta tilanteessa, jossa aineiston avaamiselle on perusteltu este kuten arkaluonteisuus tai salassapitoveloite.

Varmistat aineiston laadun ja käyttöarvon tutkimushankkeen alusta asti, kun säilytät menetelmiä, aineiston rakennetta ja sisältöä sekä muuta tutkimuksen kannalta oleellista tietoa koskevan dokumentaation aineiston yhteydessä /DOCUMENTATION-nimisessä alakansiossa. Lue lisää dokumentaation hyvistä käytänteistä täältä. Aineiston yleisiä metatietoja ylläpidät yliopiston Converiksen Tutkimusaineistot-osiossa. 

Luo aineistoistasi metatietokuvailu Converikseen jo hankkeesi alkuvaiheessa, jolloin voit päivittää sitä työn edetessä. Tällöin sitä ei tarvitse vielä julkistaa, vaan säilytät kuvailun omana tai tutkimusryhmäsi tietona siihen asti, että haluat julkaista metatiedot sekä mahdollisesti itse aineiston muulle maailmalle. Tässä vaiheessa voit pyytää Converiksen kautta valmiiden metatietojen ja koko aineiston julkaisemista JYX-julkaisuarkistossa. Kohta kohdalta -ohjeen löydät täältä. 


Aineiston julkaiseminen

  • Aineistojen julkaisemista ohjaa "Niin avointa kuin mahdollista, niin rajoitettua kuin tarpeen" -periaate. Sen mukaisesti tutkija on aineistonsa paras tuntija ja harkitsee, mitä osia aineistosta voidaan julkaista, mitä toimenpiteitä julkaiseminen vaatii, ja mitä muulle aineistolle tehdään (arkistointi, hävittäminen). Näin suunnitelma kattaa aineiston koko elinkaaren. Jollet voi perustellusta syystä (esim. tietosuoja, liikesalaisuus) julkaista aineistoa, dokumentoi perustelut aineistonhallintasuunnitelmaasi. 
  • Valitse julkaistavaksi ne aineiston osat, jotka ovat relevantteja ja keskeisiä tutkimustulosten todentamista varten ja joilla on eniten uudelleenkäyttöarvoa. Vaikka osa aineistosta olisi arkaluonteista tai sisältäisi henkilötietoja, mukana voi kuitenkin olla arvokkaita osia, joiden julkaisemiselle ei ole estettä.   
  • Kun suunnittelet aineistojen julkaisemisen alusta asti, vältyt turhalta ja vaivalloiselta työltä tutkimuksen edetessä ja saat aineistot julkaistua vaivatta. Julkaise aineistot kuvailtuina, järjestettyinä kokonaisuuksina luotettavissa, kuratoiduissa data-arkistoissa (ks. sopivan arkiston hakuohje). Näin takaat, että aineistosi on löydettävissä, saavutettavaa, teknisesti yhteentoimivaa ja uudelleenkäytettävää. Kerro julkaistavan aineiston kuvailutiedoissa aineistojen tekijätiedot, aineistoa koskevat sopimusehdot sekä käyttölisenssi. Näin varmistat, että muiden on mahdollista käyttää aineistoa uudelleen. Ilman selkeästi ilmoitettua käyttöehtolisenssiä aineisto on käyttökelvotonta.

Näin hyödyt aineistosi julkaisemisesta

Tutkimusaineistosi avaaminen vastaa rahoittajien vaatimuksiin avoimesta tieteestä ja tekee maailmasta paremman paikan, mutta hyödyttää suoraan myös sinua itseäsi:

  • Tutkimustasi on helpompi arvioida ja se on aidosti toistettavissa tieteen perusvaatimusten mukaisesti.
  • Löydät itsekin aineistosi myöhemmin varmemmin ja nopeammin jatkokäyttöön, vuosienkin kuluttua, vaikka välissä olisi vaihtunut tietokone, yliopisto tai vaikka manner.
  • Onko joskus ollut hankala muistaa, mitä joitakin vuosia vanhan datatiedoston tuokin sarake oikein tarkoitti? Tai miettiä, kenet täytyisi reiluuden nimissä pyytää mukaan jatkotutkimuksen julkaisuun, ja kuka taas ei ollut aineistoa keräämässä tai analysoimassa? Tutkimustyösi on helpompaa ja laadukkaampaa kun nämäkin tiedot ovat alusta asti tallessa ja julkaistu.
  • Aineistoosi voidaan viitata, ja sinut löydetään helpommin. Saat uusia yhteistyökumppaneita, tunnettuutta ja enemmän mahdollisuuksia kiinnostavaan ja palkitsevaan tieteen tekemiseen.
  • Aineistollasi voidaan tehdä tiedettä tavoilla, joita et itse osannut edes kuvitella.
  • Julkaistut aineistot ovat jo nyt merkittävä kohta useiden rahoittajien CV-vaatimuksissa. Tämän ansioituneisuuden merkitys tulee varmuudella kasvamaan tulevaisuudessa. Ole ensimmäisten joukossa liikkeellä ja avaa kaikki mitä vain voit: saat etua kilpaillun rahoituksen hakemisessa ja muutenkin akateemisten ansioiden arvioinneissa. Vaikkapa hakiessasi professuuria 2020-luvulla!
  • Tärkeimpänä: tutkimustyösi tilaisuus vaikuttaa maailmaan kasvaa – paljon.

Miten toimin, kun tarvitsen aineistolleni kiireellisesti DOI-tunnisteen?

Jos tarvitset aineistollesi kiireellisellä aikataululla pysyvän tunnisteen viittausta varten, on se mahdollista julkaisemalla aineisto tai sen metatiedot JYUn JYX-julkaisuarkistossa. Toimi näin:

  • Jos aineistokokonaisuus on valmis julkaistavaksi ja haluat julkaista sen JYXissä, kirjaa aineiston kuvailutiedot Converis-tutkimustietojärjestelmään ohjeen mukaan. Valitse Converiksen aineisto-osion viimeiseltä välilehdeltä julkaisevasi aineisto metatietoineen ja liitä lomakkeen "Aineiston Nextcloud-jakolinkki julkaisua varten" -kenttään jakolinkki julkaisukelpoiseksi käsiteltyyn ja järjestettyyn aineistoon, jonka olet tallentanut yliopiston Nextcloud-tallennuspalveluun. Jos tarvitset neuvoja aineiston julkaisukuntoon saattamisessa tai apua aineiston siirtämisessä Nextcloudiin tai haluat toimittaa aineiston muulla tavalla, ota yhteyttä osoitteeseen researchsupport-osc@jyu.fi. Kirjoita lomakkeen "Muuta lisätietoa"-kenttään, millä aikataululla toivot julkaisemista. Tallenna tiedot sitten Tarkistettavana -tilaan (englanninkielisessä näkymässä For validation). Tällöin Avoimen tiedon keskuksen aineistoasiantuntija tarkistaa kuvailutiedot ja siirtää ne julkaistavaksi JYX-julkaisuarkistossa, joka tarjoaa aineistolle kaivatun pysyväistunnisteen, DOIn.
  • Jos aineistokokonaisuus on vielä keskeneräinen, mutta tarvitset pysyvän tunnisteen viitettä varten jo etukäteen, toimi kuten edellä, mutta valitse Converiksen aineisto-osion viimeiseltä välilehdeltä julkaisevasi pelkät aineiston metatiedot ja tallenna tiedot Tarkistettavana -tilaan. Huolehdi tätä ennen, että kaikki Converiksessa kysytyt kuvailutiedot ovat ajan tasalla. Nextcloud-linkki tai toisen data-arkiston linkki aineistoon voidaan tässä tapauksessa täydentää tietoihin siinä vaiheessa, kun ne ovat valmiit julkaistavaksi. Tee tällöin kuvailutietojen täydentämisestä erillinen pyyntö osoitteeseen researchsupport-osc@jyu.fi tai käyttämällä aineiston metatietojen viimeisen välilehden Muutospyynnöt OSC:lle -kenttää. 

Sopivan data-arkiston valinta

Hyviä käytäntöjä

  • Julkaise aineistosi ensisijaisesti tieteenala- tai tutkimusalakohtaisessa digitaalisessa tietoarkistossa (eng. repository). Alakohtaisessa arkistossa data päätyy varmimmin alasi tutkijoiden löydettäväksi.
  • Fairsharing- ja Re3data-portaaleissa voit selailla ja hakea sopivaa arkistoa.
  • Jos sopivaa alakohtaista tietoarkistoa ei ole saatavilla, julkaise datasi yliopiston JYX-julkaisuarkistossa. HUOM: JYXissä julkaistavien aineistojen tulee toistaiseksi olla tiedostokooltaan max. 3-4 GB. Tiedostoja voi kuitenkin julkaista suuriakin määriä, vain yksittäisen tiedoston maksimikoko on määritely. 
  • Käytä yleisiä data-arkistoja kuten Zenodoa ja figsharea vasta viimeisenä vaihtoehtona. Niiden sisällön sekalaisuus heikentää datan löydettävyyttä ja vaikeuttaa löydösten arviointia.
  • Pelkkä omilla tai hankkeen kotisivuilla julkaiseminen ei täytä rahoittajien vaatimuksia eikä yliopiston odotuksia aineiston löydettävyydestä ja saavutettavuudesta.


Näin tunnistat suositeltavan data-arkiston

  • Arkisto on alasi tutkijoiden laajalti käyttämä
  • Arkisto antaa aineistolle pysyvän tunnisteen, kuten DOI tai URN
  • Arkisto julkaisee koneluettavan metadatan ja käyttää tunnettua metadatastandardia
  • Arkistolla on toiminnan luotettavuutta osoittava sertifikaatti, esimerkiksi Core Trust Seal ja ISO 16363 –standardi
  • Arkisto antaa sinun valita käyttöehdot, joilla aineisto on jatkokäytettävissä.

 

Tietoarkisto

Tietoarkisto (FSD) on tutkimuksen ja opetuksen valtakunnallinen palveluinfrastruktuuri. Se arkistoi ja välittää sähköisiä tutkimusaineistoja tutkimukseen, opetukseen ja opiskeluun. Yksikkö toimii Tampereen yliopiston yhteydessä.

Tietoarkisto edistää tieteen avoimuutta, läpinäkyvyyttä, tiedon kumuloitumista ja olemassa olevan tiedon tehokasta tutkimuskäyttöä ja toteuttaa vastuullisesti FAIR-periaatteita. FAIR tarkoittaa, että palvelut ja aineistot ovat helposti löydettäviä, saavutettavia, yhteentoimivia ja jatkokäytettäviä. Toiminnan perusta on asiantunteva, nopea, tasapuolinen ja maksuton palvelu.

Tietoarkisto vastaanottaa digitaalisia tutkimusaineistoja, jotka sopivat esimerkiksi yhteiskuntatieteiden, humanististen alojen, kasvatustieteiden sekä terveystieteiden tutkimukseen, opetukseen ja opiskeluun. Aineistojen tulee olla teknisesti ja juridisesti arkistointikelpoisia. Tietoarkisto tarkistaa aineistot ja niiden dokumentaation.


Kielipankki


Kielipankki on vakiintunut tieteenalakohtainen tietoarkisto. Se on kieliaineistoja käyttävien tutkijoiden palvelukokonaisuus. Kielipankissa on laaja valikoima teksti-, video- ja puheaineistoja, joista voi tehdä monipuolisia hakuja. Voit tutkia ja käsitellä aineistoja virtuaalisessa työtilassa Kielipankin työkaluilla tai ladata niitä omalle koneellesi.

Monet aineistot ovat käytettävissä avoimesti, osa puolestaan oman yliopiston myöntämin tunnuksin. Suojattujen aineistojen käyttöoikeuksia voi hakea sähköisesti. Kielipankin peruskäyttö on tutkijoille ja opiskelijoille ilmaista.

Ohjeet Kielipankin sisällöntuottajille




JYX

JYX on Jyväskylän yliopiston julkaisualusta julkaisuille ja tutkimusaineistoille. JYX tarjoaa aineistoille pysyvät tunnisteet (DOI, URN). Palveluun syötettyjen datasettien metatiedot toimitetaan kansalliseen METAX-katalogiin, josta ne päätyvät JYXin lisäksi löydättäväksi kansallisesta ETSIN-palvelusta ja keskeisimmistä eurooppalaisista tutkimusaineistojen hakupalveluista.

Datan julkaiseminen JYXissä on yksinkertaista: syötä vain datan metatiedot tutkimustietojärjestelmä Converikseen ja pyydä sieltä aineiston julkaisemista. Ohjeet löydät täältä.


Aineiston arkistointi ja hävittäminen

Mikäli et julkaise aineistoa mutta haluat arkistoida sen, suunnittele säilytysaika ja ilmoita se aineistonhallintasuunnitelmassa. Mainitse myös arkistosijainti.Jyväskylän yliopiston arkistonmuodostussuunnitelman mukaan tutkimusaineistojen säilytysaika on pääsääntöisesti 1-5 vuotta tutkimuksen julkaisemisen jälkeen. Mikäli tutkimuksella on rahoittaja, tarkista säilytysajan osalta myös se,mitä rahoittajan kanssa on sovittu.

Hyviä käytäntöjä

  • Ennen hävittämistä tarkista omalta laitokseltasi, kuinka kauan tutkimusaineistoja tulee säilyttää oppiaineessasi.
  • Paperiset aineistot hävitetään luottamuksellisten paperien kierrätyslaatikkoon, josta ne päätyvät silppuriin. Useissa yliopiston rakennuksissa on tähän tarkoitukseen tummanharmaita lukollisia tietoturva-astioita.
  • Palautettavat tallennusvälineet (esim. nauhurit) tyhjennetään ylikirjoittamalla ennen palautusta. Ylikirjoittaminen tarkoittaa sitä, että tallennusväline täytetään useita kertoja satunnaisella datalla, jonka jälkeen ei pystytä enää saamaan esille alkuperäisiä tiedostoja. Avoimen lähdekoodin ylikirjoitusohjelmistoja ovat mm. Eraser ja WipeFile. Kysy tarvittaessa neuvoa yliopiston tietoturva-asiantuntijalta HelpJYU-portaalin kautta.
  • Hävitettävät tallennusvälineet tyhjennetään ylikirjoittamalla ja viedään lukittuun luottamuksellisen materiaalin kierrätyslaatikkoon. Näitä vihreitä lukollisia astioita löydät yliopiston eri rakennusten vahtimestaripisteistä.
  • Merkitse Converiksessa aineiston metatietoihin aineisto hävitetyksi.

Aineiston pitkäaikaissäilytys

Tutkimusaineiston pitkäaikaissäilytyksellä tarkoitetaan vähintään 25 vuoden säilytysaikaa. Kansallisesti arvokkaille aineistoille on tähän tarkoitukseen tarjolla CSC:n ylläpitämä Fairdata-PAS-palvelu, joka säilyttää aineistoja kymmenistä satoihin vuosiin. Tutkimusdatapolitiikkansa mukaisesti Jyväskylän yliopisto koordinoi keskitetysti aineistojensa pitkäaikaistallentamista siten, että merkittävimmät yliopiston aineistot tullaan pitkäaikaistallentamaan. Aineistojen valintakriteerit ja menettely tarkentuvat myöhemmin.