Aineiston avaaminen, arkistointi ja hävittäminen

Aineistojen avaaminen Jyväskylän yliopistossa

Oleellisia kysymyksiä: Mitä osia aineistosta julkaisen, ja missä? Arkistoinko aineistoni vai hävitänkö sen tai osan siitä, ja millä perusteella? Miten toimin?

Jyväskylän yliopisto pyrkii mahdollisimman laajaan tutkimusaineistojen ja niiden kuvailutietojen avoimuuteen. Samalla se tunnistaa, että aineiston luonteesta riippuen avoimuudessa on eri asteita:


Näin valmistelet aineistosi avaamisen

Aineiston avaamisen edellytyksenä on metatietojen ja aineiston dokumentaation ajantasaisuus. Julkaise aineistostasi aina peruskuvailutiedot eli metadata, vaikket voisi perustellusta syystä julkaista itse aineistoa. Tämä tapahtuu tutkimustietojärjestelmä Converiksen Tutkimusaineistot-osiossa. Sinne kirjataan aineiston perustietojen lisäksi tiedot siitä, missä julkaiset aineiston sekä mahdolliset julkaisemisen esteet. Näin yliopistolle jää arvokas tieto siitä, missä sen aineistoja säilytetään tai on julkaistu. Metadatan julkaiseminen kattaa myös useimpien merkittävien rahoittajien vaatimukset aineiston avoimuuden osalta tilanteessa, jossa aineiston avaamiselle on perusteltu este kuten arkaluonteisuus tai salassapitoveloite.

Hyvä tapa varmistaa tutkimushankkeen alusta asti on säilyttää menetelmiä, aineiston rakennetta, sisältöä ja muuta tutkimuksen kannalta oleellista tietoa koskeva dokumentaatio aineiston yhteydessä /DOCUMENTATION-nimisessä alakansiossa. Aineiston yleisiä metatietoja ylläpidät yliopiston Converiksen Tutkimusaineistot-osiossa. Aineistojen kuvailuun on olemassa myös kansallinen Qvain-työkalu, mutta suosittelemme ensisijaisesti käyttämään yliopiston omaa järjestelmää.

Luo aineistoistasi metatietokuvailu Converikseen jo hankkeesi alkuvaiheessa, jolloin voit päivittää sitä työn edetessä. Tällöin sitä ei tarvitse vielä julkistaa, vaan säilytät kuvailun omana tai tutkimusryhmäsi tietona siihen asti, että haluat julkaista metatiedot sekä mahdollisesti itse aineiston muulle maailmalle. Tässä vaiheessa voit pyytää Converiksen kautta valmiiden metatietojen ja koko aineiston julkaisemista JYX-julkaisuarkistossa. Kohta kohdalta -ohjeen löydät täältä. 


Aineiston avaaminen

  • Aineistojen julkaisemista ohjaa "Niin avointa kuin mahdollista, niin suljettua kuin tarpeen" -periaate. Sen mukaisesti tutkija on aineistonsa paras tuntija ja harkitsee, mitä osia aineistosta voidaan julkaista, mitä toimenpiteitä julkaiseminen vaatii, ja mitä muulle aineistolle tehdään (arkistointi, hävittäminen). Näin suunnitelma kattaa aineiston koko elinkaaren. Jos aineistoa ei perustellusta syystä voida julkaista, syyt dokumentoidaan aineistonhallintasuunnitelmaan. 
  • Valitse julkaistavaksi ne aineiston osat, jotka ovat relevantteja ja keskeisiä tutkimustulosten todentamista varten ja joilla on eniten uudelleenkäyttöarvoa. Vaikka osa aineistosta olisi arkaluonteista tai sisältäisi henkilötietoja, mukana voi kuitenkin olla arvokkaita osia, joiden julkaisemiselle ei ole estettä.   
  • Kun suunnittelet aineistojen julkaisemisen alusta asti, vältyt turhalta ja vaivalloiselta työltä tutkimuksen edetessä ja saat aineistot julkaistua vaivatta. Julkaise aineistot kuvailtuina, järjestettyinä kokonaisuuksina luotettavissa, kuratoiduissa data-arkistoissa (ks. ohje edempänä). Näin takaat, että aineistosi on löydettävissä, saavutettavaa, teknisesti yhteentoimivaa ja uudelleenkäytettävää. Kerro julkaistavan aineiston kuvailutiedoissa aineistojen tekijätiedot, aineistoa koskevat sopimusehdot sekä käyttölisenssi. Näin varmistat, että muiden on mahdollista käyttää aineistoa uudelleen. Ilman selkeästi ilmoitettua käyttöehtolisenssiä aineisto on käyttökelvotonta.

Näin hyödyt aineistosi avaamisesta

Tutkimusaineistosi avaaminen vastaa rahoittajien vaatimuksiin avoimesta tieteestä ja tekee maailmasta paremman paikan, mutta hyödyttää suoraan myös sinua itseäsi:

  • Tutkimustasi on helpompi arvioida ja se on aidosti toistettavissa tieteen perusvaatimusten mukaisesti.
  • Löydät itsekin aineistosi myöhemmin varmemmin ja nopeammin jatkokäyttöön, vuosienkin kuluttua, vaikka välissä olisi vaihtunut tietokone, yliopisto tai vaikka manner.
  • Onko joskus ollut hankala muistaa, mitä joitakin vuosia vanhan datatiedoston tuokin sarake oikein tarkoitti? Tai miettiä, kenet täytyisi reiluuden nimissä pyytää mukaan jatkotutkimuksen julkaisuun, ja kuka taas ei ollut aineistoa keräämässä tai analysoimassa? Tutkimustyösi on helpompaa ja laadukkaampaa kun nämäkin tiedot ovat alusta asti tallessa ja julkaistu.
  • Tutkimustyöhösi voidaan viitata tätäkin kautta, ja sinut löydetään helpommin = uusia yhteistyökumppaneita, tunnetumpi nimi, enemmän mahdollisuuksia kiinnostavaan ja palkitsevaan tieteen tekemiseen.
  • Aineistollasi voidaan tehdä tiedettä tavoilla, joita et itse osannut edes kuvitella.
  • Julkaistut aineistot ovat jo nyt merkittävä kohta useiden rahoittajien CV-vaatimuksissa. Tämän ansioituneisuuden merkitys tulee varmuudella kasvamaan tulevaisuudessa. Ole ensimmäisten joukossa liikkeellä ja avaa kaikki mitä vain voit: saat etua kilpaillun rahoituksen hakemisessa ja muutenkin akateemisten ansioiden arvioinneissa. Vaikkapa hakiessasi professuuria 2020-luvulla!
  • Tärkeimpänä: tutkimustyösi tilaisuus vaikuttaa maailmaan kasvaa – paljon.

Sopivan data-arkiston valinta

Hyviä käytäntöjä

  • Julkaise aineistosi ensisijaisesti tieteenala- tai tutkimusalakohtaisessa digitaalisessa tietoarkistossa (eng. repository). Alakohtaisessa arkistossa data päätyy varmimmin alasi tutkijoiden löydettäväksi.
  • Fairsharing- ja Re3data-portaaleissa voit selailla ja hakea sopivaa arkistoa.
  • Jos sopivaa alakohtaista tietoarkistoa ei ole saatavilla, julkaise datasi yliopiston JYX-julkaisuarkistossa.
  • Käytä yleisiä data-arkistoja kuten Zenodoa ja figsharea vasta viimeisenä vaihtoehtona. Niiden sisällön sekalaisuus heikentää datan löydettävyyttä ja vaikeuttaa löydösten arviointia.
  • Pelkkä omilla tai hankkeen kotisivuilla julkaiseminen ei täytä rahoittajien vaatimuksia eikä yliopiston odotuksia aineiston löydettävyydestä ja saavutettavuudesta.


Näin tunnistat suositeltavan data-arkiston

  • Arkisto on alasi tutkijoiden laajalti käyttämä
  • Arkisto antaa aineistolle pysyvän tunnisteen, kuten DOI tai URN
  • Arkisto julkaisee koneluettavan metadatan ja käyttää tunnettua metadatastandardia
  • Arkistolla on toiminnan luotettavuutta osoittava sertifikaatti, esimerkiksi Core Trust Seal ja ISO 16363 –standardi
  • Arkisto antaa sinun valita käyttöehdot, joilla aineisto on jatkokäytettävissä.

 

Tietoarkisto

Tietoarkisto (FSD) on tutkimuksen ja opetuksen valtakunnallinen palveluinfrastruktuuri. Se arkistoi ja välittää sähköisiä tutkimusaineistoja tutkimukseen, opetukseen ja opiskeluun. Yksikkö toimii Tampereen yliopiston yhteydessä.

Tietoarkisto edistää tieteen avoimuutta, läpinäkyvyyttä, tiedon kumuloitumista ja olemassa olevan tiedon tehokasta tutkimuskäyttöä ja toteuttaa vastuullisesti FAIR-periaatteita. FAIR tarkoittaa, että palvelut ja aineistot ovat helposti löydettäviä, saavutettavia, yhteentoimivia ja jatkokäytettäviä. Toiminnan perusta on asiantunteva, nopea, tasapuolinen ja maksuton palvelu.

Tietoarkisto vastaanottaa digitaalisia tutkimusaineistoja, jotka sopivat esimerkiksi yhteiskuntatieteiden, humanististen alojen, kasvatustieteiden sekä terveystieteiden tutkimukseen, opetukseen ja opiskeluun. Aineistojen tulee olla teknisesti ja juridisesti arkistointikelpoisia. Tietoarkisto tarkistaa aineistot ja niiden dokumentaation.


Kielipankki


Kielipankki on vakiintunut tieteenalakohtainen tietoarkisto. Se on kieliaineistoja käyttävien tutkijoiden palvelukokonaisuus. Kielipankissa on laaja valikoima teksti- ja puheaineistoja, joista voi tehdä monipuolisia hakuja. Voit tutkia ja käsitellä aineistoja virtuaalisessa työtilassa Kielipankin työkaluilla tai ladata niitä omalle koneellesi.

Monet aineistot ovat käytettävissä avoimesti, osa puolestaan oman yliopiston myöntämin tunnuksin. Suojattujen aineistojen käyttöoikeuksia voi hakea sähköisesti. Kielipankin peruskäyttö on tutkijoille ja opiskelijoille ilmaista.

Ohjeet Kielipankin sisällöntuottajille




JYX

JYX on Jyväskylän yliopiston julkaisualusta julkaisuille ja tutkimusaineistoille. JYX tarjoaa aineistoille pysyvät tunnisteet (DOI, URN). Palveluun syötettyjen datasettien metatiedot toimitetaan kansalliseen METAX-katalogiin, josta ne päätyvät JYXin lisäksi löydättäväksi kansallisesta ETSIN-palvelusta ja keskeisimmistä eurooppalaisista tutkimusaineistojen hakupalveluista.

Datan julkaiseminen JYXissä on yksinkertaista: syötä vain datan metatiedot tutkimustietojärjestelmä Converikseen ja pyydä sieltä aineiston julkaisemista. Ohjeet löydät täältä.

JYX-huoltokatko ke 6.11.2019 klo 15:30 — Digipalvelut


Aineiston arkistointi ja hävittäminen

Mikäli et julkaise aineistoa mutta haluat arkistoida sen, suunnittele säilytysaika ja ilmoita se aineistonhallintasuunnitelmassa. Mainitse myös arkistosijainti.Jyväskylän yliopiston arkistonmuodostussuunnitelman mukaan tutkimusaineistojen säilytysaika on pääsääntöisesti 1-5 vuotta tutkimuksen julkaisemisen jälkeen. Mikäli tutkimuksella on rahoittaja, tarkista säilytysajan osalta myös se,mitä rahoittajan kanssa on sovittu.

Hyviä käytäntöjä

  • Ennen hävittämistä tarkista omalta laitokseltasi, kuinka kauan tutkimusaineistoja tulee säilyttää oppiaineessasi.
  • Paperiset aineistot hävitetään luottamuksellisten paperien kierrätyslaatikkoon, josta ne päätyvät silppuriin. Useissa yliopiston rakennuksissa on tähän tarkoitukseen tummanharmaita lukollisia tietoturva-astioita.
  • Palautettavat tallennusvälineet (esim. nauhurit) tyhjennetään ylikirjoittamalla ennen palautusta. Ylikirjoittaminen tarkoittaa sitä, että tallennusväline täytetään useita kertoja satunnaisella datalla, jonka jälkeen ei pystytä enää saamaan esille alkuperäisiä tiedostoja. Avoimen lähdekoodin ylikirjoitusohjelmistoja ovat mm. Eraser ja WipeFile. Kysy tarvittaessa neuvoa yliopiston tietoturva-asiantuntijalta HelpJYU-portaalin kautta.
  • Hävitettävät tallennusvälineet tyhjennetään ylikirjoittamalla ja viedään lukittuun luottamuksellisen materiaalin kierrätyslaatikkoon. Näitä vihreitä lukollisia astioita löydät yliopiston eri rakennusten vahtimestaripisteistä.
  • Merkitse Converiksessa aineiston metatietoihin aineisto hävitetyksi.

Aineiston pitkäaikaissäilytys

Tutkimusaineiston pitkäaikaissäilytyksellä tarkoitetaan vähintään 25 vuoden säilytysaikaa. Kansallisesti arvokkaille aineistoille on tähän tarkoitukseen tarjolla CSC:n ylläpitämä Fairdata-PAS-palvelu, joka säilyttää aineistoja kymmenistä satoihin vuosiin. Tutkimusdatapolitiikkansa mukaisesti Jyväskylän yliopisto koordinoi keskitetysti aineistojensa pitkäaikaistallentamista siten, että merkittävimmät yliopiston aineistot tullaan pitkäaikaistallentamaan. Aineistojen valintakriteerit ja menettely tarkentuvat myöhemmin.