Tutkimusdata

Vastuullani on datan säilytys tutkimuksen aikana. Miten?

  • Nextcloud

    Tavallinen data (ei sensitiivisiä henkilötietoja, ei video-dataa) kannattaa säilyttää Jyväskylän yliopiston omassa Nextcloud -pilvipalvelussa. Nextcloudia voivat käyttää kaikki Jyväskylän yliopiston henkilökuntaan kuuluvat, ja apurahatutkijat ja tutkimusryhmät voivat tilata sen käyttöönsä HelpJYU –portaalista, Tutkijalle –osiosta.

  • Collabroom

    Jos data sisältää sensitiivistä tietoa, sitä ei saa säilyttää tai käsitellä tavallisissa pilvipalveluissa tai tavallisella sähköpostilla. Tilaa HelpJYU –portaalista tutkimusryhmällesi turvallinen Collabroom -työtila tähän tarkoitukseen. Jos dataa on välttämätöntä käsitellä sähköpostissa, käytä turvasähköpostia

  • Researchvideo

    Video-datan säilytykseen ja käsittelyyn tutkimusryhmän sisällä, tilaa kansio HelpJYU –portaalista

  • Kaikki yllä olevat palvelut mahdollistavat aineiston jakamisen tutkimusryhmälle tai tarvittaessa myös sen ulkopuolisille tahoille.

Mitä sopimuksia minun tulee tehdä liittyen tutkimusdatan hallintaan?

Tutkimukseen liittyvät sopimukset tulee sopia mahdollisimman aikaisessa vaiheessa. Tämä on tutkijoiden oman oikeusturvan, aineistojen käytön ja mahdollisen julkaisemisen kannalta välttämätöntä.

Jo tutkimuksen alkuvaiheessa kannattaa sopia erityisesti tutkimustuotosten tekijyydestä. Data on keskeinen tutkimustuotos ja myös sen tekijyydestä, käyttö- ja julkaisuoikeuksista on sovittava.

Jyväskylän yliopistolla on tarjolla useisiin tilanteisiin valmiiksi laadittuja sopimuspohjia

Metadatan julkaisu on pakollista. Mitä “metadata” tarkoittaa? Miten tallennan tai julkaisen sen?

Metadata tarkoittaa tietoja datasta: missä se on, kuka se teki, kuka sen omistaa, keneltä voi kysyä lisää, milloin se on tehty, miten sitä luetaan ja käytetään (esim. taulukkomuotoisen datan sarakkeiden nimien selitykset). Metatietojen avulla varmistetaan, että aineisto on löydettävissä, saavutettavissa, yhteentoimivaa ja uudelleenkäytettävää. Osa metatiedoista on määrämuotoisia ja koneluettavaksi tarkoitettua, osa on aineistosta riippuen kuvailevampaa. Erittäin suositeltavaa on liittää metadataan myös tieteellisen tarkka kuvaus menetelmistä, joilla data on tuotettu. Data on hyödytöntä ilman metadataa - ajan kuluessa usein myös sen keränneelle tutkijalle itselleen.

Jyväskylän yliopistossa metadata tallennetaan tutkimustietojärjestelmään (Converis) mahdollisimman varhaisessa vaiheessa.

Tutkimustietojärjestelmästä metadata voidaan suoraan helposti julkaista sellaisenaan tai aineiston kanssa Jyväskylän yliopiston julkaisuarkistossa JYXissä. Tämä täyttää rahoittajien vaatimuksen metadatan julkaisemiselle.

Miten saan datastani viittauskelpoisen? Miten saan sille DOIn?

Jotta data olisi viittauskelpoista, (meta)data täytyy olla julkaistu, ja (meta)datajulkaisulla on oltava digitaalinen tunniste, käytännössä standardiksi on vakiintunut DOI.

Jyväskylän yliopistossa saat DOI:n julkaisemalla metadatan JYXissä, vaikka et jostain syystä voisikaan avata varsinaista dataa julkiseksi. Ota yhteyttä researchsupport-osc@jyu.fi

Missä voin julkaista tutkimusdatani?

Tutkimuksesi alalla on todennäköisesti suuria, vakiintuneita, kansainvälisiä, juuri kyseiseen dataan erikoistuneita data-arkistoja, joita alasi tutkijat käyttävät ja joista datasi löytyy parhaiten. Julkaise ennenkaikkea niissä. Oxfordin yliopisto ylläpitää kattavaa FAIRsharing -hakukonetta data-arkistoista.

Hyvä vaihtoehto on myös julkaista data ns. data-artikkelina avoimessa julkaisusarjassa, joka on erikoistunut datan julkaisemiseen, kuten esim Gigascience.

Erityisesti suomalaiselle ihmistieteiden alojen datalle erinomaisia julkaisualustoja ovat kansalliset arkistot. Tällaisia ovat esimerkiksi:

Datan voi julkaista myös yleisessä data-arkistossa, sellaisia ovat esim. Zenodo tai Figshare. Näiden sisältö on kuitenkin erittäin heterogeenistä ja laatu vaihtelevaa, emmekä suosittele näiden käyttöä kuin viimeisenä vaihtoehtona.

Jos soveltuvaa alasi tutkijoille tuttua arkistoa ei ole, datan voi julkaista myös JYXissä metadatan julkaisun yhteydessä.

Huom! Jos julkaiset datan ulkopuolisessa arkistossa, julkaisun DOI-tunniste täytyy lisätä tutkijan itsensä toimesta metadataan, jonka olet tallentanut Jyväskylän yliopiston tutkimustietojärjestelmään, sekä metadata-julkaisuun JYXissä!

Entä jos en halua julkaista dataa vielä, vaan pitää sen vain oman tutkimuksen käytössä? Miten? Miten varmistan datan ensikäyttöoikeuden?

Julkaiset vain metadatan JYXissä, siten, että lisenssi määrää datan saatavuuden rajoitetuksi niin, että sen saa vain nimetyltä vastuutaholta. Yhden henkilön sijaan on mielekkäämpää nimetä jokin Jyväskylän yliopiston vastuutaho, esimerkiksi laitoksesi toimisto tai Avoimen tiedon keskus. Ota yhteyttä researchsupport-osc@jyu.fi

Julkaistuun metadataan on helppoa liittää varsinainen aineisto, kun sen julkaisu on ajankohtaista.

Mikä lisenssi minun pitäisi valita? Miten?

Lisenssi on yksinkertaisesti sopimusteksti jonka hyväksymisen sinä asetat ehdoksi datasi käytölle.

Voisit toki laatia sopimuksen tekstin joka kerta erikseen itse, mutta käytännössä on helpompaa ja myös mahdollisen sopimuksen valvonnan ja toimeenpanon kannalta järkevämpää käyttää vakiintuneita, lakiasiantuntijoiden valmiiksi mietittimiä lisenssitekstejä. Nämä ovat myös koneluettavia, jolloin hakukoneet ymmärtävät suoraan aineiston käyttömahdollisuudet.

Suositeltava, useimpien tunnistama ja vakiintunein lisenssi on CC-BY.

Mistä löytyy ohjeet aineistonhallintasuunnitelman tekemiseen?

Aineistonhallintasuunnitelma on ennen kaikkea apuväline sinulle itsellesi ja tutkimusryhmällesi, tutkimuksen tekemistä varten. Hyvin suunniteltu aineistonhallinta säästää merkittävästi aikaa ja vaivaa myöhemmissä vaiheissa. Tekemisessä auttaa Avoimen tiedon keskus, email: researchsupport-osc@jyu.fi

Usein myös tutkimuksen rahoittaja vaatii aineistonhallintasuunnitelman. Suomen Akatemian hankkeissa aineistonhallintasuunnitelma tulee toimittaa vasta sitten, jos hankehakemus hyväksytään. Hyväksytyille hankkeille järjestetään työpajoja aineistonhallintasuunnitelman tuottamiseen.

Ohjeita ja Jyväskylän yliopiston Avoimen tiedon keskuksen ehdottamia mallivastauksia kysymyksiin löytyy kirjautumalla omilla HAKA-tunnuksillasi DMPTuuli -palveluun.

Aineistonhallintasuunnitelmien parissa tehtävä työ ja niihin liittyvät standardit sekä vaatimukset kehittyvät jatkuvasti, joten ohjeistus kannattaa tarkastaa aika ajoin.

Vastuullani on tutkimusdataan sisältyvien henkilötietojen lainmukainen käsittely. Miten?

Henkilötiedoilla tarkoitetaan sellaisia tietoja, joilla luonnollinen henkilö voidaan tunnistaa suoraan tai epäsuorasti. Henkilö voidaan tunnistaa esimerkiksi nimen, puhelinnumeron tai jonkin hänelle tunnusomaiseen piirteen mukaan. Tietosuojan sivuilta löydät lisää tietoa henkilötiedoista.

Mitä seikkoja tulee ottaa huomioon henkilötietoja käsiteltäessä

Tutkimuksesi alussa jo aineistonhallinnansuunnitelmaa tehtäessä tulee ottaa huomioon tietosuojaan liittyvät seikat sekä lomakkeet, jotta tutkittavien oikeudet tulevat huomioiduksi. Henkilötietojen käsittelyyn on tietosuojaa koskevaa lainsäädäntö sekä asetukset. Näitä ovat Tietosuojalaki 1050/2018 ja GDPR eli EU:n tietosuoja-asetus.

Lisäksi tulee noudattaa Jyväskylän yliopiston tietosuojapolitiikan linjauksia. JYU:n tietosuojapolitiikka sisältää muun muassa tietoa henkilötietojen käsittelyssä noudatettavista periaatteista, henkilötietojen säilytysajan sekä tietoa henkilötietojen käsittelystä tieteellisessä tutkimuksessa ja osana opintoja.

Kuulostaako monimutkaiselta? Henkilötietoja käsittelevän tutkijan onkin käytävä siihen soveltuva koulutus. Jyväskylän yliopistossa on tarjolla Moodlessa oleva verkkokurssi henkilötietojen käsittelystä tieteellisessä tutkimuksessa.

Tietoarkisto ylläpitää aineistonhallinnan käsikirjaa, missä henkilötietojen käsittelystä on kerrottu kattavasti, katso

Tutkimusmateriaalini ei ole digitaalisessa muodossa, miten toimin?

Vaikka tutkimusmateriaali olisi analogisessa muodossa, täytyy metadata kuitenkin luoda, säilyttää ja julkaista aivan samoin kuin digitaalisesta datasta: luo ja säilytä tutkimustietojärjestelmässä (Converis), ja julkaise Jyväskylän yliopiston julkaisuarkistossa JYXissä, mistä saat myös DOI:n. Converiksessa kirjataan aineiston säilytyspaikaksi tiedostosijainnin sijaan analogisen aineiston säilytyspaikka.

Tutkimusaineisto kannattaa digitoida, jos se on mahdollista ja sille on odotettavissa jatkokäyttötarpeita. Kun tutkimusdata on digitaalisessa muodossa, ja mikäli se julkaistaan, on se myös helpommin saatavilla muiden tutkijoiden käyttöön. Myös tutkimuksesta tehtävät muistiinpanot voidaan lukea tutkimusaineistoiksi. Yliopistopaino digitoi paperilla olevia aineistoja maksullisena palveluna.

Fyysinen aineisto on mahdollista arkistoida Jyväskylän yliopiston päätearkistoon, mutta ainoastaan jos siitä on ensin tallennettu metadata Converis -järjestelmään. Asiasta lisätietoa Jyväskylän yliopiston Arkiston ohjeessa.

Kuinka pitkään tutkimusdata säilytetään?

Jyväskylän yliopisto säilyttää sen järjestelmiin tallennetun tutkimusdatan vähintään 20 vuoden ajan. Julkaistu tutkimusdata säilytetään pysyvästi.

Säilyttäminen ei vielä takaa sitä, että data on käyttökelpoinen myös tulevaisuudessa. Digitaaliset standardit muuttuvat, datan avaamiseen vaadittavia vanhoja ohjelmistoja ja laitteita voi olla vaikea löytää tai saada toimimaan tulevaisuudessa. Todellinen pitkäaikaistallennus edellyttää jatkuvaa ylläpitoa, ja se ei sisälly Jyväskylän yliopiston tavalliseen säilytyslupaukseen.

Pitäisikö datani pitäaikaistallentaa? Miten?

Jyväskylän yliopisto siirtää arvokkaimmat aineistot kansalliseen PAS-järjestelmään. Aineiston valintakriteerit ja menettely tarkentuvat myöhemmin.

Entä mahdollinen tutkimusdatan tuhoaminen?

Jyväskylän yliopiston arkistonmuodostussuunnitelman mukaan tutkimusdatan säilytysaika on pääsääntöisesti 1-5 vuotta tutkimuksen julkaisemisen jälkeen. Mikäli tutkimuksella on rahoittaja, tulee tutkimusdatan säilytysajassa ottaa huomioon myös se mitä rahoittajan kanssa on sovittu.

  • Ennen hävittämistä tarkista opinnäytteesi ohjaajalta, kuinka kauan oppiaineessasi tutkimusdata on säilytettävä, ettei opinnäyteprosessisi vaarannu.
  • Paperiset aineistot viedään luottamuksellisten paperien kierrätyslaatikkoon, josta ne päätyvät silppuriin. Ei siis koskaan tavalliseen paperinkeräyslaatikkoon tai roskikseen! Useissa yliopiston rakennuksissa on tähän tarkoitukseen tummanharmaita lukollisia Sulo-pönttöjä.
  • Palautettavat tallennusvälineet (esim. nauhurit) tyhjennetään ylikirjoittamalla ennen palautusta. Ylikirjoittaminen tarkoittaa sitä, että tallennusväline täytetään useita kertoja satunnaisella datalla, jonka jälkeen ei pystytä enää saamaan esille alkuperäisiä tiedostoja. Tähän on olemassa omia ohjelmia.
  • Hävitettävät tallennusvälineet tyhjennetään ylikirjoittamalla ja viedään lukittuun luottamuksellisen materiaalin kierrätyslaatikkoon. Näitä vihreitä lukollisia Sulo-pönttöjä löydät yliopiston eri rakennusten vahtimestaripisteistä.
  • Merkitse Converiksessa aineiston metatietoihin aineisto hävitetyksi.

Huomioi päätöstä tehdessäsi, että tutkimusdatan jatkokäytön mahdollistava datan avaaminen, julkaiseminen ja arkistointi ovat tieteellisen tutkimuksen keskeisiä arvoja ja yksi avoimen vastuullisen tieteen osa-alueista.

Katso myös Tietoarkiston ohjeet tutkimusaineiston hävittämiseen.

Vastuullani on hankkia aineistonhallinnan osaaminen. Miten?

Avoimen tiedon keskuksessa järjestetään aineistonhallintaan liittyvää koulutusta.

LIB1DATA Aineistonhallinnan perusteet -verkkokurssi järjestetään syksyllä ja keväällä ja sen kurssiaineisto on Moodlessa. Tätä verkkokurssia suositellaan etenkin kandi- tai graduvaiheessa suoritettavaksi.

Tutkijoille tarjolla olevista koulutuksista saat tietoa Avoimen tiedon keskuksen koulutussivulta.

Avoimen tiedon keskus järjestää myös tilauksesta koulutusta ja konsultaatiota laitoksille ja tutkimusryhmille. Ota yhteyttä researchsupport-osc@jyu.fi.

Mistä löydän avointa tutkimusdataa?

FAIRsharing- ja re3data-palveluista voi hakea tietokantoja lukuisilla eri hakukriteereillä, kaikkea ihmistieteistä avaruussäähän.

Etsin-hakupalvelusta löytyy suomalaisten tutkimusorganisaatioiden avoin tutkimusdata.

Tutkimusdataa voi myös hakea Google Dataset Search -työkalulla.