Opas tutkimusaineistojen hallintaan

1. Aineistonhallinnan suunnittelu

Miksi aineistonhallintaa?

"Aineistonhallinnalla tarkoitetaan käytänteitä, joita noudattamalla tutkimusdata ja niihin liittyvä kuvaileva tieto (metatieto, metadata) on luotu, tallennettu ja järjestetty siten, että tutkimusdata säilyy käyttökuntoisena ja luotettavana ja että tietosuoja ja tietoturva on varmistettu tutkimusdatan koko elinkaaren ajan." (Kuusniemi et al., Avoimen tieteen osalinjaus. Luonnos. URL: https://avointiede.fi/sites/default/files/2020-09/LUONNOS-tutkimusainestot-menetelmat--OSALINJAUS1.pdf, linkki tarkistettu 29.12.2020).

Tutkimusaineistot ovat 

  • digitaalisessa tai analogisessa muodossa olevia tieteellisen tutkimuksen perusaineistoja,
  • niistä edelleen jalostettuja aineistoja, mm.
  • muistiinpanoja sekä kenttätyö-/laboratoriopäiväkirjoja sekä
  • lähdekoodia ja ohjelmistoja, joihin tutkimuksen löydökset ja julkaistut tulokset perustuvat.

Tiedeyliopistossa tutkimusaineistojen hallinta, säilytys ja uudelleenkäyttö muodostavat tutkimusinfrastruktuurin keskeisen osan. Kotimaiset ja kansainväliset tutkimusrahoittajat sekä julkaisujen kustantajat arvostavat ja yhä useammin myös edellyttävät tutkimusaineistojen avoimuutta ja läpinäkyvyyttä. Aineistojen avoimuus on kuitenkin vain yksi hyvän aineistonhallinnan luoma mahdollisuus. Ennen kaikkea aineistonhallinta tuottaa hyvin järjestettyjä ja käyttökelpoisia aineistoja, jotka helpottavat ja edistävät tutkijan itsensä työtä tutkimuksen eri vaiheissa.

Hyvin suunnitellun aineistonhallinnan avulla

  • tutkimustyösi tehostuu
  • vältät aineiston katoamisen 
  • vastaat rahoittajien vaatimuksiin 
  • noudatat tietosuojalainsäädäntöä ja turvaat tutkittaviesi oikeudet
  • sinä ja yhteistyökumppanisi olette selvillä aineistoon liittyvistä sopimuksista ja oikeuksista
  • tiedät, miten, missä ja millä ehdoilla avaat aineistosi
  • muut voivat viitata dataasi ja sinä meritoidut 
  • varmistat, että hankkeellasi on käytössään tarvittavat resurssit – voit säästää ajan lisäksi rahaa.


Jyväskylän yliopisto tarjoaa tutkijoille erilaisia työkaluja aineistonhallinnan eri vaiheisiin sekä niihin liittyvää neuvontaa ja opastusta.

Tutkimusdatapolitiikka ja FAIR-periaatteet

Jyväskylän yliopisto kannustaa datapolitiikassaan kansainvälisten FAIR-periaatteiden mukaisesti tutkijoita huolehtimaan tutkimusaineistoistaan niin, että niiden kuvailutiedot ja mahdollisuuden mukaan myös datasetit ovat mahdollisimman sujuvasti ja kestävästi löydettäviä, saavutettavia, (yhteen)toimivia ja (uudelleen)käytettäviä (Findable, Accessible, Interoperable, Reusable). Valtaosa tutkimusrahoittajista, mukaan lukien Suomen Akatemia, edellyttävät rahoitusta saavilta hankkeilta, että niissä syntyvät aineistot ovat vähintään kuvailutietojen osalta avoimia. FAIR-periaatteiden käytännön toteuttamisen viisi perusaskelta ovat:

  • Arkistoi aineistosi tai vähintään sen kuvailutiedot laadukkaaseen digitaaliseen arkistoon
  • Valitse arkisto, joka tarjoaa aineistolle ja/tai kuvailutiedoille pysyvän tunnisteen kuten DOI tai URN
  • Käytä aineiston tallentamiseen ja säilyttämiseen avoimia tiedostoformaatteja, jotka takaavat tiedostojen avautumisen mahdollisimman monissa ohjelmistoissa ja takaavat pääsyn pidempään kuin suljetut kaupalliset formaatit
  • Dokumentoi aineistosi kokonaisuudessaan ja pidä sen kuvailutiedot eli metadata ajan tasalla tutkimuksen aikana
  • Anna aineistolle lisenssi, joka ilmaisee selkeästi aineiston käyttöehdot ja -luvat sekä tarvittavat rajoitukset aineiston jatkokäytölle. 

Aineistonhallintasuunnitelma

Aineistonhallinnan suunnittelu on keskeinen osa tutkimuksen suunnittelua. Aineistojen keruun, käytön, säilytyksen ja jatkokäytön suunnittelu selkeyttää tutkijan ja tutkimusryhmän omaa toimintaa. Sen avulla voidaan myös varmistaa tutkimusaineistojen jatkokäytettävyys. Aineistonhallintasuunnitelma on elävä dokumentti, jota on tarkoitus täydentää ja päivittää tutkimushankkeen aikana.

Jyväskylän yliopisto edellyttää datapolitiikassaan rahoittajien tapaan tutkijoilta aineistonhallintasuunnitelman (Data management plan, DMP) laatimista. Suunnitelma on yhä useammin myös rahoituksen ehto. DMP:ssä kuvaat,

1) mitä aineistoja tutkimuksessa käytät, keräät ja tuotat,
2) miten huomioit lainsäädännön, tutkimusta ohjaavat eettiset periaatteet sekä aineistoa koskevat oikeudet,
3) miten dokumentoit aineiston ja luot siitä metatiedot,
4) missä säilytät aineistoa tutkimuksen aikana ja miten takaat sen eheyden,
5) miten huolehdit aineistosta (arkistointi, julkaiseminen, hävittäminen) tutkimushankkeen päätteeksi sekä
6) millaisia rooleja aineiston hallintaan liittyy sekä mitä resursseja kuvaamasi toimenpiteet vaativat.

Aineistonhallintasuunnitelma täydentää tutkimussuunnitelmaa. Sen avulla varmistat, että hankkeen aikana syntyneet tutkimusaineistosi ovat korkealaatuisia ja FAIR-periaatteiden mukaisia eli sinun ja muiden löydettävissä ja saavutettavissa, teknisesti yhteentoimivia ja mahdollisimman uudelleenkäytettäviä. Suunnitelma kuvaa ja kattaa aineiston koko elinkaaren datan keruusta, tuottamisesta ja käsittelystä sen julkaisemiseen, arkistoimiseen tai hävittämiseen.

Käytä suunnitelman laatimiseen joko rahoittajasi aineistonhallintasuunnitelmapohjaa tai vaihtoehtoisesti yleistä suomalaista aineistonhallintasuunnitelmapohjaa (ladattavissa täältä). Voit kopioida rahoittajan pohjan ja laatia suunnitelman suoraan Wordilla tai millä tahansa muulla tekstinkäsittelyohjelmalla. Voit vaihtoehtoisesti käyttää DMPTuuli-templaattia, mutta huomaa, etteivät Jyväskylän yliopiston DMP-ohjeet ovat poistuneet DMPTuulista 1.1.2022 alkaen. Rahoittajat eivät edellytä DMPTuulin käyttöä. JYUn DMP-ohjeet löydät täältä:

Näin laadit aineistonhallintasuunnitelman: JYUn ohjeet ja esimerkit
Näin laadit aineistonhallintasuunnitelman: JYUn ohjeet ja esimerkit (ladattava versio)

Rahoittajien ladattavat DMP-pohjat ja -ohjeet DMPTuulissa:
Suomen Akatemia
Business Finland
FIRI Data management policy
Horizon Europe
NIH
Suomen Kulttuurirahasto
Valtioneuvoston viestintä- ja hyödyntämissuunnitelma / Tiedonhallintasuunnitelma

Tutustu myös aineistonhallinnan suunnittelun video-ohjeisiin (Tieteen tietotekniikan keskus CSC).

Tarvitsetko apua aineistonhallintasuunnitelman laatimisessa? Ota yhteyttä: researchsupport-osc@jyu.fi.

 

Tunne aineistosi

Ydinkysymyksiä: Millaista tutkimusaineistosi on? Käytätkö olemassa olevaa aineistoa uudelleen? Millaista aineistoa kerätään, tuotetaan tai käytetään uudelleen? Missä muodossa aineisto on? Kuinka paljon sitä on?

Aineistonhallintasuunnitelman laatiminen alkaa omien aineistojen inventaariosta ja kuvauksesta. Luokittele ja kuvaile lyhyesti aineistosi erilaisiin tyyppeihin (esim. valmis pohja-aineisto, jota käytät uudelleen, itse keräämäsi raakadata, siitä prosessoimasi analyysiaineisto). Voit käyttää taulukkoa tai luetteloa. Aineistotyypit kannattaa nimetä, jotta niihin voi helpommin viitata myöhemmin aineistonhallintasuunnitelmassa.

Esimerkkejä:

Aineistotyyppi Alkuperä Henkilötiedot / arkaluonteisuus Tiedostotyyppi (suositeltavia, avoimia formaatteja:) Arvioitu koko
Analysoitu DNA-näyte Itse tuotettu (raaka-aineistona DNA-näyte) Ei .xlsx, .csv 2 Gb
Tilastoaineisto X Valmis aineisto Tietoarkistosta Ei SPSS (.por, .sav)   
Kysely Kerätty tutkittavilta Kyllä, sisältää tietoa tutkittavien terveydentilasta .csv,  5 Mt 
Haastattelutallenne, video Kerätty tutkittavilta Kyllä .avi, .mp4  
Haastattelun transkriptio Tuotettu raaka-aineistosta Ei .csv, .txt, .xlsx >10 Mt
Kuva Tuotettua havaintoaineistoa Kyllä .tif, .jpeg, .gif, .raw  

Lähde: Fuchs, S. 2020. RDM : Research Data Management Basics, Meilahti. Helsingin yliopisto. CC BY 4.0. Viitattu 27.1.2021. 

Huomioi, että aineiston käsite on todella laaja. Se käsittää käytännössä kaiken materiaalin, josta tutkimustulokset johdetaan. Samassa tutkimuksessa voidaan käsitellä tutkimusta varten kerättävää aineistoa, tutkimusprosessin tuloksena syntyvää aineistoa (esim. dokumentaatio, analyysit, tietokannat), aiemmin kerättyä aineistoa (esim. Tilastokeskus, arkistot) ja vielä käsitellä sitä koodein, jotka tulee myös huomioida. Tutkimusdatasta puhutaan silloin, kun viitataan nimenomaan digitaaliseen tutkimusaineistoon.

Sopimukset, oikeudet ja lisenssin valinta

Miten sovit käyttämäsi, tuottamasi ja jakamasi aineiston oikeuksista? Kenellä on oikeus päättää aineiston käytöstä, nyt ja tulevaisuudessa? Kuka aineiston omistaa?

Yhteistä jokaiselle tutkimushankkeelle on, että aineiston käytöstä ja siihen liittyvistä oikeuksista tulee sopia kirjallisesti. Tämä varmistaa tutkijoiden oikeusturvan ja käyttöoikeuden aineistoon myös yllättävissä ongelmatilanteissa. Lisäksi useat rahoittajat vaativat sopimusta oleellisena osana rahoitusehtojaan. JYU linjaa datapolitiikassaan, että yliopistolla tehdyssä tutkimuksessa tuotettujen aineistojen oikeudet kuuluvat lähtökohtaisesti yliopistolle. Tästä huolimatta asiasta on sovittava kirjallisesti, jotta 1) varmistetaan tutkijoiden käyttöoikeudet ja 2) määritetään se taho, joka tekee aineistoon liittyvät päätökset ja joka voi mahdollisesti päättää aineiston julkaisemisesta. Myös aineiston tekijyydestä kannattaa sopia, jotta se aineistoa julkaistaessa ilmoitetaan oikein perustein.

Mikäli aineiston keruussa tai käytössä on mukana opiskelijoita, tulee näissä tapauksissa sopia aina aineiston oikeuksien luovuttamisesta hankkeelle sekä opiskelijoiden käyttöoikeuksista ja niiden rajoista.

Sopimukset tulee laatia mahdollisimman varhaisessa vaiheessa ja niitä tulee tarvittaessa päivittää henkilövaihdosten yhteydessä tai olosuhteiden muuttuessa. Hankkeen vastuullisen johtajan velvollisuutena on huolehtia siitä, että kaikki hankkeeseen osallistuvat siirtävät oikeutensa yliopistolle ennen hankesopimuksen allekirjoitusta tai viimeistään ennen sopimuksessa määritellyn työn aloittamista.

Oikeuksiensiirtosopimus on tehtävä aina seuraavissa hankkeissa:

  • Business Finlandin rahoittamat hankkeet
  • EU:n tutkimusohjelmat
  • tilaustutkimukset.

Mallipohja tekijyydestä ja käyttöehdoista sopimiseen

Lataa tästä kevyt mallipohja aineiston tekijyydestä, oikeuksista ja käyttöehdoista sopimiseen tutkijoiden kesken.

Yliopiston mallipohjat aineiston oikeuksista sopimiseen

Yliopiston lakipalvelut tarjoavat käyttöösi valmiita sopimusmalleja.

Sopimuksen laatimisessa huomioitavaa

  • Mitkä aineistot on tarkoitus luovuttaa jatkokäyttöön?
  • Mikäli yksi tai useampi tutkija on tuonut tutkimushankkeeseen mukaan aiempaa tutkimusaineistoa, sisällytetäänkö tämä jatkokäyttöön luovutettavaan aineistoon?
  • Milloin aineisto tai osat siitä voidaan luovuttaa jatkokäyttöön? (Esimerkiksi ennalta määrätty aikataulu tai julkaisujen valmistuminen)
  • Mihin käyttötarkoituksiin aineisto luovutetaan (pelkästään tutkimukseen vai lisäksi myös opetus- ja opiskelukäyttöön)?
  • Kenellä on oikeus tehdä arkistointisopimus tutkimusaineistosta?
  • Halutaanko jatkokäytölle asettaa ehtoja lisenssin avulla?
  • Mikäli jatkokäyttö halutaan tehdä luvanvaraiseksi, kuka päättää luvan myöntämisestä?

Lisätietoa ja neuvoja sopimusten laatimisesta saat yliopiston lakiasiantuntijoilta.

Lisenssi

Oikeuksiin liittyy myös julkaistavan aineiston lisenssistä päättäminen. Lisensoinnilla varmistat aineiston käytettävyyden selkeiden, sinun itse asettamiesi ehtojen mukaan. JYUssa käytetään kansainvälisten standardien mukaisia koneluettavia lisenssejä (esim. Creative Commons), joiden avulla aineisto on uudelleenkäytettävissä niin laajasti kuin mahdollista. Lisensointi on ehdoton edellytys aineiston avaamiselle tulevaisuudessa, sillä lisensoimatonta aineistoa on turvatonta jatkokäyttää.


Henkilötietojen käsittely ja tutkimuseettiset seikat

Tutkimuseettiset seikat ja tutkittavien laillinen oikeus heitä koskeviin tietoihin vaikuttavat siihen, miten keräät, säilytät ja käsittelet tutkimusaineistoja, siihen kuka saa käyttää aineistoa ja mihin tarkoitukseen, sekä aineiston arkistointiin. Aineistosi sisältämät henkilötiedot vaikuttavat siihen, miten käsittelet ja säilytät sitä. Aineiston tunnisteellisuus myös rajoittaa ja ohjaa sen arkistointimahdollisuuksia. Kun suunnittelet uusien henkilötietojen keruuta, tutustu hyvissä ajoin tietoon perustuvan suostumuksen pyytämisen eettiisiin periaatteisiin ja JYUn tietosuojakoulutustarjontaan.

Käsittelenkö tutkimuksessani henkilötietoja?

Jos tutkimukseesi liittyy minkään sellaisen tiedon käsittelyä, joka voidaan joko suoraan tai epäsuorasti yhdistää luonnolliseen, elossa olevaan henkilöön, käsittelet henkilötietoja. Tällöin tietosuojalainsäädäntö koskee tutkimustasi. Henkilötietoja kerätään joko suoraan tutkittavilta (haastattelut, kyselyt, mittaukset, havainnointi jne.) tai välillisesti rekistereistä ja arkistoista.

Suoria tunnisteita ovat tiedot, joista henkilö on välittömästi tunnistettavissa, mm. koko nimi, henkilötunnus, henkilökohtainen sähköpostiosoite, kasvokuva, äänen nauhoite, sormenjälki tai esimerkiksi aivokuva. Epäsuoria tunnisteita ovat sellaiset tiedot, joista yksittäinen henkilö ei ole suoraan tunnistettavissa, mutta jotka yhdistettyinä muuhun henkilöstä saatavilla olevaan tietoon voi johtaa tunnistamiseen. Näitä tietoja ovat mm. auton rekisterinumero, isovanhempien nimet, kotipaikkakunta, siviilisääty, ammatti, etninen tausta ja syntymäaika.

Erityiset henkilötietoryhmät ja arkaluonteiset tiedot

Erityisiä henkilötietoja ovat henkilön etninen alkuperä, poliittinen mielipide, uskonnollinen vakaumus, filosofinen maailmankatsomus, ammattiyhdistysliikkeen jäsenyys, geneettinen data, yksilöivä biometrinen data, terveystiedot sekä seksuaalinen käyttäytyminen tai suuntautuminen. Arkaluonteisia tietoja ovat lisäksi henkilötunnus, pankkitilitiedot sekä rikosrekisteritiedot.

Jos käsittelet erityisiä henkilötietoja, tutkimustasi koskevat erityiset säännökset liittyen henkilötietojen käsittelyn poikkeusperusteen määrittelyyn sekä aineiston säilytykseen ja käsittelyyn.

  • Määrittele arkaluonteisten tietojen käsittelylle tietosuoja-asetuksen edellyttämä poikkeusperuste. Ohjeen tähän löydät tutkijan tietosuojaohjeesta kohdasta Erityiset henkilötietoryhmät.
  • Kerro tutkittaville toimittamassasi informoinnissa sekä tietosuojaselosteessa, kuka hankkeessasi toimii tietojen rekisterinpitäjänä. Erittele myös, mitkä kaikki tahot tulevat käsittelemään henkilötietoja tutkimuksen aikana, sekä miksi.
  • Erittele tutkittaville toimittamassasi tietosuojaselosteessa ja aineistonhallintasuunnitelmassasi, miten huolehdit tietojen tietoturvallisesta ja luottamuksellisesta säilytyksestä ja käsittelystä tutkimuksen aikana.
  • Kuvaile samoin se, miten pseudonymisoit tai anonymisoit tunnisteelliset tiedot siinä vaiheessa, kun et enää tarvitse tunnisteita tutkimuksesi tarkoitusta varten. Miten arkistoit tai hävität tiedot hankkeen päättyessä?
  • Jos yhteistyökumppanisi tai rahoittajasi vaatii tietojen arkaluonteisuuteen perustuen eettisen ennakkoarvioinnin, löydät ohjeet täältä.
  • Pidä tutkimuksen aikana yllä ajantasaista dokumentaatiota siitä, miten käytännössä toteutat ja seuraat tietosuojaselosteessa kuvaamiasi tietosuojatoimenpiteitä.


Tutkijan tietosuojapolku

1. Suunnittele hyvissä ajoin. Kaikki lähtee siitä. Mitä henkilötietoja tarvitset tutkimuksesi toteuttamista varten? Onko tutkimuksesi kertaluonteinen vai seurantatutkimus? Kun laadit tietosuoja-asetuksen edellyttämän tietosuojailmoituksen, sinun on osattava eritellä siinä henkilötietojen käsittelylle selkeä elinkaari, jossa on alku ja loppu. Henkilötietojen säilytystä koskevat minimointi- ja rajoittamisperiaate. Minimointi tarkoittaa sitä, että henkilötietoja tulee kerätä vain välttämätön määrä tutkimussuunnitelmassa määriteltyyn tarkoitukseen nähden, ja että tarpeettomiksi käyvät tunnisteet tulee poistaa heti kun mahdollista. Rajoittamisperiaatteen mukaan henkilötietojen säilytykselle on hyvä pyrkiä määrittelemään ajallinen päätepiste. Huomioi, että tietosuojailmoituksen teksti sitoo sinua jatkossa juridisesti.

2. Anonymisointi, arkistointi ja jatkokäyttö. Henkilötietoja sisältävien eli tunnisteellisten tietojen elinkaaren keskivaihe ja loppu tulee suunnitella hyvissä ajoin, jotta osaat kuvata sen realistisesti tutkittaville toimittamassasi tiedotteessa ja tietosuojailmoituksessa.

3. Valitse tietojen käsittelylle tarkoituksenmukainen oikeusperuste. Suositeltu ensisijainen valittava peruste on yleisen edun mukainen tieteellinen tutkimus. Yleinen etu oikeusperusteena mm. helpottaa aineiston tulevaa mahdollista tutkimuksenjälkeistä säilytystä ja arkistointia. Erityisen painavasta syystä oikeusperusteeksi voidaan valita suostumus. Jos keräät erityisiä henkilötietoja ja käytät oikeusperusteena suostumusta, suostumuksen on lisäksi oltava nimenomainen. Ks. lisätietoja oikeusperusteen valinnasta. Kirjaa valittu peruste tietosuojailmoitukseen.

4. Määritä, kuka toimii tutkimuksessasi rekisterinpitäjänä. Jos toteutat tutkimuksen ulkoista rahoitusta saavassa hankkeessa tai työskentelet työsuhteessa yliopistolla, rekisterinpitäjänä toimii yliopisto. Pääsääntöisesti rekisterinpitäjinä toimivat sekä tutkija että kotiorganisaatio. Konsortiohankkeissa rekisterinpitäjyys on yleensä jaettu partneriorganisaatioiden välillä. Kirjaa rekisterinpitäjä tietosuojailmoitukseen.

5. Informoi tutkittavia ennen tutkimuksen alkua selkeästi siitä, miten ja kenen toimesta heidän henkilötietojaan tullaan käsittelemään ja hallinnoimaan tutkimuksen aikana. Kun keräät aineistoa suoraan tutkittavilta, tutustu tässä vaiheessa myös huolellisesti yliopiston eettisen toimikunnan ohjeisiin tietoon perustuvan suostumuksen pyytämisestä tutkittavilta. Näin varmistat, että toteutat sekä hyvää tutkimuseettistä käytäntöä että suojaat tutkittaviesi tiedot. JYUn tietosuojaohje tutkijoille neuvoo, miten käsittelet henkilötietoja tietoturvallisesti ja lainmukaisesti tutkimuksen eri vaiheissa. Jos tutkimusasetelmasi on luonteeltaan sellainen (esim. laaja rekisteriaineisto puutteellisin yhteystiedoin), ettei henkilökohtainen informointi ole mahdollista, tutustu yliopiston toimintaohjeisiin.

6. Tee henkilötietoja sisältävälle tutkimuksellesi aina vähintään suppea, vapaamuotoinen riskienarvointi, josta löydät lisätietoa täältä. Jos riski on suuri, tutkimukselle on tehtävä EU:n yleisen tietosuoja-asetuksen mukainen vaikutustenarviointi, Data Protection Impact Assessment (DPIA).
Erityisen suureksi riskiksi katsotaan

  • suuri määrä henkilöitä, joiden tietoja käsitellään
  • suuri määrä tietoa henkilöstä
  • sensitiivinen tieto
  • herkästi haavoittuvien henkilöiden (esim. lasten) tiedot
  • tietojen käyttö automatisoituun päätöksentekoon
  • systemaattinen seuranta.

Tarkemmat ohjeet löydät tutkijan tietosuojaohjeesta.

7. Kun keräät aineiston suoraan tutkittavilta, pyydä heiltä informoinnin yhteydessä lisäksi suostumus osallistua tutkimukseen. Suostumus tutkimukseen osallistumiseen pyydetään myös siinä tapauksessa, kun henkilötietojen käsittelyn oikeusperuste on yleinen etu. Tietoinen suostumus on tutkimuseettinen perusperiaate, ja siitä poikkeaminen edellyttää aina vaikutustenarvioinnin tekemistä.

8. Kun keräät henkilötietoja, pyri minimoimaan tiedot eli välttämään tutkimuskysymyksesi kannalta tarpeettomien henkilötietojen keräämistä. Huomioi kenttätutkimuksessa tallennuslaitteiden suojaus. Siirrä aineisto yliopiston Nextcloudiin, S:-aseman projektikansioon tai U:-aseman kansioon mahdollisimman pian tallennuksen jälkeen.

9. Kun käsittelet henkilötietoja, huolehdi toimenpiteiden tietoturvasta. Valvo, että pääsy tunnisteellisiin tietoihin on vain aineistonhallintasuunnitelmassa ja tietosuojailmoituksessa kuvaamillasi henkilöillä tai tahoilla. Dokumentoi, miten toteutat tutkittaville lupaamasi suojaustoimet ja miten valvot pääsyä tunnisteelliseen aineistoon. Muista, että henkilötietoja saa käsitellä vain siten ja sitä tarkoitusta varten kuin tutkittavia on informoitu tietosuojailmoituksessa ennen tutkimuksen aloittamista. Jos aineiston käsittelyssä tulee esiin tarve poiketa tietosuojailmoituksessa määritellystä, informoi tutkittavia siitä heti ja päivitä tietosuojailmoitus sekä muut tarvittavat dokumentit.

10. Kun tutkimus päättyy, huolehdi aineiston tunnisteellisista osista tutkittaville toimittamasi informoinnin mukaisesti. Mitä osia aineistosta hävität? Mitä mahdollisesti anonymisoit? Mitä säilytät tunnisteellisena, esimerkiksi pseudonyyminä, tulosten verifiointia tai alkuperäiseen tutkimukseesi mahdollisesti sisältyviä jatkotoimia varten? Mitä arkistoit, minne, ja millä käyttörajoituksilla?

Varmista, että henkilötietojen käsittely on kuvattu yhdenmukaisesti aineistonhallintasuunnitelmassasi sekä tutkittaville toimittamassasi tiedotteessa ja tietosuojailmoituksessa.

Jos sinulla herää kysyttävää aineistosi käsittelystä tutkimuksesi päättyessä, ota yhteyttä Avoimen tiedon keskukseen: researchsupport-osc@jyu.fi.

Tarvitsetko apua tietosuojakysymyksissä? Ota yhteyttä yliopiston tietosuojavastaavaan: tietosuoja@jyu.fi.

Eettinen ennakkoarviointi ihmistieteissä

Saatat tarvita tutkimuksellesi ennakkoarvioinnin yliopiston Ihmistieteiden eettiseltä toimikunnalta tai Keski-Suomen sairaanhoitopiirin eettiseltä toimikunnalta, jos tutkimusasetelmasi täyttää jonkin Tutkimuseettisen neuvottelukunnan määrittelemästä kuudesta kriteeristä:

1) Tutkimukseen osallistumisessa poiketaan tietoon perustuvan suostumuksen periaatteesta,
2) tutkimuksessa puututaan tutkittavien fyysiseen koskemattomuuteen,
3) tutkimus kohdistuu alle 15-vuotiaisiin ilman huoltajan erillistä suostumusta tai informointia, jonka perusteella huoltajalla olisi mahdollisuus kieltää lasta osallistumasta tutkimukseen,
4) tutkimuksessa tutkittaville esitetään poikkeuksellisen voimakkaita ärsykkeitä,
5) tutkimuksessa on riski aiheuttaa tutkittaville tai heidän läheisilleen normaalin arkielämän rajat ylittävää henkistä haittaa tai
6) tutkimuksen toteuttaminen voi merkitä turvallisuusuhkaa tutkittaville tai tutkijalle tai heidän läheisilleen.

Huom! Aineistonhallintasuunnitelmassa ei tarvitse toistaa arviota tutkimuksen eettisyydestä, jonka toimitat eettiselle toimikunnalle arviointipyynnön liitteessä 3 'Arvio tutkimuksen eettisyydestä'. Siinä ei siis tarvitse kuvailla lupaprosessia tai muita suostumuksen varmistamiseen liittyviä toimia. Aineistonhallintasuunnitelmassa kuvailet käytännön tietoturvatoimenpiteet, joilla huolehdit siitä, että pidät keräämäsi henkilötiedot suojattuina tutkimuksen ajan.

Ota tarvittaessa yhteyttä yliopiston Ihmistieteiden eettiseen toimikuntaan hyvissä ajoin ennen kuin aloitat tutkimuksen. Ennakkoarviointia ei voi pyytää enää tutkimuksen käynnistymisen jälkeen. Täältä löydät lisätietoa ennakkoarvioinnista ja tilanteista, joissa sitä ei tarvita.


2. Aineiston keruu ja analyysi

Haastatteluaineistojen keruu



Haastattelut Zoomilla ja Teamsilla


Käytä haastatteluaineistojen keruussa Zoomia tai MS Teamsia, sillä yliopisto tarjoaa niiden käyttöön tukea, ja niiden asetukset on säädetty vastaamaan yliopiston vaatimuksia. Vaihtoehtoisesti voit käyttää yliopiston suojattua laitetta, jota voit tiedustella yksiköstäsi tai Digipalveluista.

Käytä aina Zoomia tai vaihtoehtoisesti yliopiston laitteella (nauhuri, puhelin tai kannettava tietokone), kun keräät haastattelussa erityisiin henkilötietoryhmiin kuuluvia henkilötietoja ja muutoin arkaluonteisia tai salassa pidettäviä tietoja. Ohjeet Zoomin käytöstä haastattelujen tietoturvalliseen tallentamiseen, siirtoon ja säilytykseen löydät intranet Unosta. Yliopiston laitteita käytettäessä huolehdi siitä, että nauhuri salaa tallennettavan sisällön, salaat erikseen puhelimen muistikortin puhelimen asetuksista, ja että käyttämäsi kannettavan tietokoneen tallennustila on salattu. Lisätietoa näistä löydät Intranet Unosta.

Ns. tavallisia, ei-arkaluonteisia henkilötietoja sisältävän haastatteluaineiston voit kerätä MS Teamsilla.

Haastattelut älypuhelimella

Älypuhelimen ominaisuudet kuten datan siirtyminen palveluntarjoajan pilvitallennustilaan vaarantavat salassa pidettävän aineiston turvallisuuden. Huomioi nämä, kun tallennat älypuhelimella haastatteluja, jotka sisältävät henkilötietoja ja/tai salassa pidettävää tietoa:

  • Poista puhelimesta synkronointi valmistajan tai Googlen pilvipalveluihin.
  • Siirrä tallenteet turvalliseen talletuspaikkaan (CollabRoom) ja poista ne puhelimesta.
  • Käytä puhelimen lukitsemiseen salasanaohjeen mukaista, vähintään 6 merkin pituista PIN koodia.
  • Aseta näytön aikakatkaisu on 30 sekuntiin.
  • Ilmoita laitteen katoamisesta viipymättä Digipalveluiden palvelupisteeseen: palvelupiste@jyu.fi, puhelin 041 260 3600.
  • Jos haastattelut sisältävät arkaluonteisia henkilötietoja tai käsiteltävä tieto on yliopiston ohjeen mukaista salaista tietoa, käytä lisäksi puhelimen lukitsemiseen 14 merkin mittaista salasanaa.

Dokumentaatio tutkimuksen aikana

Oleelliset kysymykset: Miten dokumentoin aineistoni siten, että se on sekä minun että muiden löydettävissä, saavutettavissa ja käytettävissä myös huomenna, viikon kuluttua ja vielä vuosien päästä? Jos täysin tuntematon tutkija löytäisi aineistoni, hahmottaisiko hän, mistä siinä on kyse? Mitä minun tulee tehdä, jotta hän ymmärtäisi ja pystyisi käyttämään aineistoani?

Dokumentaatio on aineiston menetelmien, kokoamisen ja käsittelyn dokumentoimista ja mm. tiedostojärjestelmän (kansiot ja alakansiot, nimeämiskäytännöt jne.) tutkimuksenaikaista kuvailua. Suurin osa dokumentaatiosta on yksinkertaisesti hyvää tieteellistä käytäntöä, jota toteutat jo nyt päivittäin tutkimuksen arjessa. Dokumentaatiota on muun muassa

  • muuttujien ja keskeisen sanaston sekä mittayksiköiden kirjallinen kuvailu 
  • taulukkomuotoinen inventaario haastattelujen perustiedoista, asetelmasta ja toteutuksesta
  • koodikirjat, kenttä- ja laboratoriopäiväkirjat
  • teknisten laitteiden tuottama tekninen metatieto kuten kalibraatiot. 

Dokumentaatiota on erittäin tärkeää pitää jatkuvasti ajan tasalla. Yhtä aikaa aineistotyön kanssa tehtynä se on pieni vaiva, mutta jälkikäteen käytännössä mahdotonta.

Tutkimuksen perusaineistoja kerätään kyselylomakkeilla, haastatteluilla, videoimalla sekä erilaisilla laitteilla ja antureilla. Erilaiset mittaus- ja tiedonkeruutavat tuottavat erilaisia metatieto- ja tiedostoformaatteja. Aineiston analyysivaiheessa raaka-aineistosta tuotetaan empiirisen tutkimuksen varsinaiset tulokset. Kun raaka-aineistoa käsitellään, yhdistellään ja analysoidaan, syntyy erilaisia työstö- ja tulosaineistoja. Tutkimuksen sujuvuuden ja toistettavuuden kannalta on tärkeää, että käsittelet ja kuvailet syntyviä aineistoja suunnitelmallisesti ja yhteistyökumppaniesi kanssa etukäteen sovitulla tavalla. 

Tieteenalakohtaisia ohjeita [täydentyy kevään 2021 aikana]

Hyviä käytäntöjä

  • Säilytä kuvailutieto erillisissä tiedostoissa (esim. Readme-tiedostot, inventaarioexcelit) aineiston yhteydessä alakansiossa, jolle annat nimen /DOCUMENTATION. Tämä on tärkeää, jotta dokumentoivat tiedostot löytää sellainenkin henkilö, joka ei tunne aineiston rakennetta tarkemmin.
  • Suunnittele, millaista dokumentaatiota tuotat ja mistä sen löytää, jollet käytä /DOCUMENTATION-alakansiota. Mikäli mahdollista, käytä dokumentaatiossa oman alasi metadatastandardeja.
  • Sovi tutkimusryhmän kesken jo tutkimuksen suunnitteluvaiheessa yhtenäinen käytäntö tiedostojen ja kansioiden nimeämiselle.
  • Sovi yhtenäinen tapa, jolla tallennatte tiedostot kansioihin ja alakansioihin. Looginen kansiorakenne tehostaa työtä ja vähentää katoamisriskiä.
  • Käytä avoimia tiedostoformaatteja kaupallisten formaattien sijaan. Avoimet, standardimuotoiset tiedostoformaatit takaavat parhaiten tietojen saavutettavuuden vielä useiden vuosien kuluttua. Esimerkkejä löydät esim. UK Data Servicen formaattivertailutaulukosta.

Metatietojen laatiminen ja päivittäminen

Metatiedot eli tutkimustason metadata (study-level metadata) on yleistä bibliografista kuvailutietoa tutkimusaineistosta (esim. nimi, omistaja, tekijät, jakelija, aikaväli, lyhyt kuvaus, sijainti, lisenssitiedot jne.) Se on kuin aineiston käyntikortti, jolla kuvaat toisille, mistä aineistossasi on kyse. Ajantasaiset metatiedot ovat avain aineiston löydettävyyteen ja saavutettavuuteen. JYU sekä useimmat rahoittajat edellyttävät vähintään metatietojen julkaisemista, vaikkei itse aineistoa voitaisi perustellusta syystä julkaista. Tutkimuksen edetessä metatiedot on hyvä pitää jatkuvasti ajan tasalla. Tällöin ne pysyvät hallittavissasi eivätkä tuota merkittävästi lisätyötä.

Jyväskylän yliopistossa metatietoja ylläpidetään tutkimustietojärjestelmä Converiksen Tutkimusaineisto-osiossa. Jokaisesta tutkimusaineistosta on hyvä laatia Converikseen kuvailutiedot sisältävä kirjaus. Kun kuvailet aineistoja, jaottele ne sellaisiksi kokonaisuuksiksi, että voit kuvailla kunkin datasetin yksiselitteisesti. Tarkemmin kuvailtuja aineistoja voit niputtaa Converiksessa suuremmiksi kokonaisuuksiksi laajemman emoaineiston alle. Kun kirjaat aineistosi metatiedot Converikseen, voit samalla tilata Converiksen kautta tukea aineistonhallinnan kysymyksiisi yliopiston aineistoasiantuntijoilta. Yksityiskohtaiset ohjeet metatietojen kirjaamiseksi tutkimuksesi eri vaiheissa löydät metatietojen kirjausohjeista (Intranet Unossa). 

Aineiston laatu ja eheys  

Aineiston yhtenäisyydestä ja laadusta huolehtiminen on tärkeä osa aineistonhallintaa. Suunnittele ja kuvaa aineistonhallintasuunnitelmassasi laadunvarmistusta koskevat vaatimukset sekä toimenpiteet, joilla turvaat sen, ettei aineisto katoa tai korruptoidu sen käsittelyn ja säilytyksen aikana. Aineistotyypistä, laitteistosta ja menetelmistä riippuen eheyttä ja laatua voidaan varmistaa esimerkiksi 

  • kalibroimalla mittausvälineitä havaintotarkkuuden ja -skaalan monitoroimiseksi
  • tarkistuttamalla litteroitu haastatteluaineisto ulkopuolisella asiantuntijalla 
  • käyttämällä alan standardoituja menetelmiä, laitteita ja ohjelmistoja
  • tekemällä kyselyaineiston puuttuvista arvoista katoanalyysi
  • ottamalla datasta tarkistussumma puuttuvien tai poikkeavien arvojen havaitsemiseksi. 

Versionhallinta

Versionhallinta on keskeinen osa aineiston dokumentaatiota ja sen eheyden varmistamista. Yksinkertaisin manuaalinen keino versionhallintaan on tiedostojen nimeäminen siten, että version numero merkitään nimen loppuun. Monet ohjelmistot myös tuottavat automaattista versiolokia, joten on hyvä tutustua käytetyn järjestelmän asetuksiin. Sovi tutkimusryhmän kanssa yhtenäinen käytäntö versioiden nimeämiseen ja versioiden synkronointiin sekä siihen, montako versiota aineistosta tuotetaan ja säilytetään. Jyväskylän yliopisto tarjoaa GitLab-palvelua koodin versionhallintaan. 

Pseudonymisointi ja anonymisointi

Kun käsittelet tutkimuksessasi henkilötietoja, huolehdi niiden pseudonymisoinnista ja mikäli mahdollista, anonymisoinnista.

Milloin aineistoni on pseudonyymiä?

Pseudonymisointi tarkoittaa sitä, että suorat tunnisteet on korvattu koodilla tai peitenimillä. Koodiavainta säilytetään erillään analyysiaineistosta. Aineiston arkaluonteisuuden asteesta riippuen pseudonymisointi saattaa riittää suojauskeinoksi tutkimushankkeen aikana, kunhan koodiavainta säilytetään arkaluonteiselle aineistolle soveltuvassa paikassa ja sen pääsyoikeudet ja käsittelytavat on selkeästi sovittu ja määritelty.

Suorat tunnisteet (nimi, hetu, osallistujan sähköpostiosoite, kasvokuva, ääni) kannattaa pyrkiä hävittämään heti siinä vaiheessa, kun niitä ei enää tarvita tutkimuksen tarkoitusta varten.

Niin kauan kuin tiedot on mahdollista palauttaa tunnistettaviksi koodiavaimen tai muiden tietojen avulla, ne ovat pseudonyymejä, eivät anonyymejä, ja eurooppalainen tietosuoja-asetus sekä kotimainen tietosuojalaki koskevat tutkimustasi. Lue lisää pseudonymisoinnin ja anonymisoinnin eroista täältä.

Milloin aineistoni on anonyymiä?

Anonymisointi tarkoittaa sitä, että aineiston tietoja ei voida enää kohtuullisin ponnistuksin yhdistää yksittäiseen elossa olevaan luonnolliseen henkilöön, eli kaikki tunnisteelliset tiedot on poistettu. Tällöin tietoja ei voida enää kohtuullisin ponnistuksin palauttaa tunnistettaviksi. Yksittäisiä henkilöitä ei tällöin voi tunnistaa kasvokuvasta tai äänitallenteesta, tai tekstiaineiston yksittäistä henkilöä koskevat tiedot on luokiteltu ja karkeistettu niin, että yksittäisen henkilön tunnistaminen ei käytännössä ole mahdollista.

Anonymisoituun aineistoon ei myöskään voi enää yhdistää uusia henkilötietoja.

Aineiston koosta ja laadusta riippuen anonymisointi vaatii huomattavasti aikaa ja muita resursseja, joten toimenpiteet on hyvä suunnitella mahdollisimman varhaisessa vaiheessa ja kirjata aineistonhallintasuunnitelmaan. Tietoarkiston Aineistonhallinnan käsikirjassa on seikkaperäiset ohjeet määrällisten ja laadullisten aineistojen anonymisoinnin suunnitteluun ja toteuttamiseen.

Anonymisointisuunnitelma

Tietoarkistolla on tarjolla suunnitelmapohja kvantitatiivisten ja kvalitatiivisten aineistojen tunnisteiden poistamiseen eli anonymisoimiseen.


3. Tallentaminen, jakaminen ja pääsynhallinta 

Oleellisia kysymyksiä: Minne tallennat aineistosi? Miten se varmuuskopioidaan? Miten jaat aineistoa tarvittaessa tietosuojan huomioiden? Miten valvot pääsyä aineistoon? Siirrätkö aineistoa EU:n ja ETA-alueen ulkopuolelle?

Tallennuspaikan valinta 

Oleellisia kysymyksiä: Minne tallennat aineistosi? Miten se varmuuskopioidaan? Miten jaat aineistoa tarvittaessa tietosuojan huomioiden? Miten valvot pääsyä aineistoon? Siirrätkö aineistoa EU:n ja ETA-alueen ulkopuolelle?

Aineistolle valittava, tarkoituksenmukaisin tallennusratkaisu riippuu riippuu aineiston ominaisuuksista: koosta, tyypistä sekä mahdollisten henkilötietojen arkaluonteisuudesta. Lähtökohtaisesti kaikki JYUssa tuotettu ja käytetty tutkimusaineisto tallennetaan yliopiston tai CSC:n järjestelmiin. Omien laitteiden tai ulkoisten tallennusvälineiden käyttöä tulee välttää.

Ei-sensitiivisille aineistoille yliopistolla on tarjolla:

  1. Nextcloud: yliopiston ensisijainen tallennusjärjestelmä. Pilvitallennuspalvelu, jolla saat Dropboxin ja OneDriven hyvät puolet tietäen, että aineistosi pysyy yliopiston palvelimilla ja hallussasi. Nextcloudiin saa henkilökohtaisen tilan lisäksi ryhmätyökansioita (vrt. S:-asema), jotka säilyvät, vaikka yksittäinen tutkija poistuisikin yliopiston palveluiden piiristä. Soveltuu kaikille ei-sensitiivisille aineistoille. Soveltuu hyvin tavallisille, ei-erityisiin henkilötietoryhmiin kuuluville henkilötiedoille.
  2. Researchvideo.jyu.fi: palvelu ääni- ja videotiedostojen tallentamiseen, jakamiseen ja toistamiseen. Soveltuu ei-sensitiivisille AV-aineistoille
  3. JYU GitLab koodin säilytykseen ja jakamiseen
  4. Jyväskylän yliopiston kiintiö CSC:n IDA-palvelussa.

Sensitiivisille ja salassa pidettäville aineistoille (mm. erityiset henkilötietoryhmät) on tarjolla:

  1. Pienille, enintään 50 MB /tiedosto sensitiivisille ja salassa pidettäville aineistoille CollabRoom-pilvipalvelu. Soveltuu pienten sensitiivisten aineistojen säilytykseen ja jakamiseen yliopiston ulkopuolisten yhteistyökumppanien kanssa.
  2. CSC:n kansalliset Sensitive Data -palvelut: SD Connect -tallennus- ja jakopalvelu. sekä SD Desktop -toisto- ja analyysityöpöytä. Edellyttävät maksuttoman CSC-käyttäjätilin luomista, kirjautuminen palveluihin sen jälkeen JYU Haka -tunnistautumisen avulla. Huomaa palvelujen rajoitukset: SD Connect ei toistaiseksi sovellu toisiolain alaiselle sotedatalle, sen Findata-auditointi on meneillään (05/2022). Vuoden 2022 aikana SD Desktopissa on mahdollista analysoida aineistoa vain avoimen lähdekoodin ohjelmistoilla (LibreOffice, Python, R + R, ks. päivitetty listaus). 
  3. Verkkolevyt (U:- ja S:-asemat). Tietoturvallisia ja toimintavarmoja, mutta etäkäyttö edellyttää VPN:n käyttöönottoa. Digipalvelut suosittelee sensitiivisten ja salassa pidettävien tiedostojen kryptaamista. Sensitiivisen aineiston jakaminen tapahtuu turvasähköpostin avulla. Soveltuvat kaikille aineistotyypeille ja sekä sensitiivisille että ei-sensitiivisille aineistoille.

Nextcloudin ja CollabRoomin tilaat HelpJYUsta. Nextcloud, SD Connect, CollabRoom ja Researchvideo.jyu.fi mahdollistavat aineiston jakamisen tutkimusryhmälle tai tarvittaessa myös sen ulkopuolisille yhteistyökumppaneille.

Varmuuskopiointi

Yliopiston järjestelmät ottavat automaattisesti säännöllisiä varmuuskopioita. Sinun tulee kuitenkin suunnitella ja toteuttaa varmuuskopioiden ottaminen siinä vaiheessa, kun teet aineistoon merkittäviä muokkauksia. Säilytä alkuperäiset tiedostot eli ns. masterfilet erillään analyysitiedostoista ja tee kaikki muokkaukset analyysitiedostoihin. Näin aineisto ei katoa, jos datan prosessoinnissa tapahtuu jokin virhe. 

Pääsynhallinta

  • Nimeä ja dokumentoi vastuuhenkilö, joka valvoo pääsynhallintaa aineistoihin.
  • Pidä yllä tietoja siitä, kuka aineistoon on päässyt käsiksi ja kenellä on pääsyoikeus mihinkin osaan aineistosta.
  • Määrittele, kenellä on aineistoon katselu-, muokkaus- ja poisto-oikeudet.
  • Jos käsittelet henkilötietoja tai muutoin luottamuksellisia tai arkaluonteisia tietoja, määrittele erikseen, kenellä on pääsy niihin. 
  • Millä perusteella kukin käyttöoikeus (muokkaus, katselu, poisto) on myönnetty?
  • Miten valvonta toteutuu käytännössä (esim. salasanalla suojatut käyttöoikeudet, muutoslokin seuranta, kryptaus, fyysisten tilojen valvonta, lukitut säilytyskaapit)? 
  • Jos käsittelet erityisiä henkilötietoja, huolehdi siitä, että noudatat tutkittaville antamaasi kuvausta.  

Kuvaa ratkaisusi aineistonhallintasuunnitelmassasi.

Henkilötietoja sisältävän ja sensitiivisen aineiston tallennus ja siirto

Käsittele henkilötietoja sisältävää aineistoa alkuperäisessä tietojärjestelmässä aina, kun se on mahdollista. Henkilötietoja ei lähtökohtaisesti kannata siirtää ulos alkuperäistä järjestelmästä, esimerkiksi Excel-taulukkoon. Alkuperäisessä tietojärjestelmässä pystyt pitämään yllä lokitietoja siitä, kenellä on ollut pääsy aineistoon. Tämä on erityisen tärkeää, kun aineisto on arkaluonteista tai luottamuksellista. 

Jos siirrät henkilötietoja sisältävää aineistoa, huolehdi, että siirto tapahtuu tietoturvallisesti ja luottamuksellisesti. JYUn tallennuspalvelu CollabRoom soveltuu myös tietojen jakamiseen yhteistyökumppaneille yliopiston ulkopuolella. Jos joudut siirtämään tietoja sähköpostitse, käytä turvasähköpostia tai lähetä aineisto salattuna liitetiedostona. Varmista, että vain nimetyillä vastaanottajilla on pääsy aineistoon. Sovi vastaanottajan kanssa tietojen käsittelyn ehdoista.

Huolehdi, että siirrät aineistoa vain siten kuin olet kuvaillut tutkittaville antamassasi tietosuojailmoituksessa tai informoinnissa, jonka olet antanut tutkittaville esimerkiksi kyselyn tai haastattelun yhteydessä.   

Kansainvälisessä yhteistutkimuksessa voi syntyä tarve siirtää henkilötietoja sisältävää aineistoa joko muihin EU:n ja Euroopan talousalueen maihin tai niiden ulkopuolelle kolmansiin maihin. Syynä voi olla esimerkiksi se, että analyysiin tarvittava laitteisto on saatavilla vain jossain tietyssä maassa. Huomioi tällaisessa tilanteessa seuraava: 

  • Saat siirtää henkilötietoja EU:n ja ETA-alueen jäsenmaihin samoilla perusteilla kuin Suomen sisällä. Tietosuoja-asetuksessa on kuitenkin kansallista liikkumavaraa, joten säädösten yksityiskohdat voivat vaihdella maittain. Selvitä siksi hyvissä ajoin kansainvälisten yhteistyökumppaneiden kanssa kunkin maan erityissäädökset henkilötietojen tutkimustarkoituksessa tapahtuvan käsittelyn osalta. Dokumentoikaa ne tietosuojailmoitusta varten. 
  • Jos henkilötietoja on tarpeen siirtää EU- ja ETA-alueen ulkopuolelle, tietojen siirrolle on oltava Suomessa laillinen peruste, joka rekisterinpitäjänä toimivan tahon (tutkija, tutkimusryhmä tai yliopisto) tulee varmistaa. Lisäksi siirrossa tulee noudattaa tietosuoja-asetuksessa määriteltyjä erityisperiaatteita. Jos siirrät hankkeessasi henkilötietoja EU:n ja ETA-alueen ulkopuolelle, ole ensin yhteydessä yliopiston tietosuojavastaavaan: tietosuoja@jyu.fi

4. Aineiston avaaminen, tutkimuksenjälkeinen säilytys ja hävittäminen

Aineistojen avaaminen Jyväskylän yliopistossa

Jyväskylän yliopisto pyrkii mahdollisimman laajaan tutkimusaineistojen ja niiden kuvailutietojen avoimuuteen. Samalla se tunnistaa, että aineiston luonteesta riippuen avoimuudessa on eri asteita:

  • Aineiston kuvailu- eli metatiedot ovat avoimesti saatavilla, kun ne siirretään tutkimustietojärjestelmä Converiksen Tutkimusaineistot-osiosta julkaistavaksi yliopiston JYX-julkaisuarkistossa, tai ne julkaistaan muussa digitaalisessa FAIR-kriteerit täyttävässä metatietokatalogissa. Julkaise aineistostasi aina peruskuvailutiedot eli metadata, vaikket voisi perustellusta syystä julkaista itse aineistoa. Tämä tapahtuu tutkimustietojärjestelmä Converiksen tutkimusaineisto-osion avulla. Sinne kirjataan aineiston perustietojen lisäksi tiedot siitä, missä julkaiset aineiston tai vaihtoehtoisesti julkaisemisen esteet. Näin yliopistolle jää arvokas tieto siitä, missä sen aineistoja säilytetään tai on julkaistu. Metatietojen julkaiseminen kattaa myös rahoittajien vaatimukset aineiston avoimuuden osalta tilanteessa, jossa itse aineiston avaamiselle on perusteltu este.
  • Aineisto tai soveltuvat osat siitä voidaan avata eli julkaista joko täysin avoimesti tai tutkijan määrittelemän rajoitetun käyttäjäkunnan saataville (esim. vain tutkimuskäyttöön) kuratoidussa, FAIR-kriteerit täyttävässä data-arkistossa, joka tarjoaa aineistolle pysyvän tunnisteen, lisenssin ja muut käytettävyyden työkalut.
  • Aineistojen julkaisemista ohjaa "Niin avointa kuin mahdollista, niin rajoitettua kuin tarpeen" -periaate. Sen mukaisesti tutkija on aineistonsa paras tuntija ja harkitsee, mitä osia aineistosta voidaan julkaista, mitä toimenpiteitä julkaiseminen vaatii, ja mitä muulle aineistolle tehdään (arkistointi, hävittäminen). Näin suunnitelma kattaa aineiston koko elinkaaren. Jollet voi perustellusta syystä (esim. tietosuoja, sensitiivinen lajitieto, liikesalaisuus jne.) julkaista aineistoa, dokumentoi perustelut aineistonhallintasuunnitelmaasi.
  • Valitse julkaistavaksi ne aineiston osat, jotka ovat relevantteja ja keskeisiä tutkimustulosten todentamista varten ja joilla on eniten uudelleenkäyttöarvoa. Vaikka osa aineistosta olisi arkaluonteista tai sisältäisi henkilötietoja, mukana voi kuitenkin olla arvokkaita osia, joiden julkaisemiselle ei ole estettä.
  • Kun suunnittelet aineistojen julkaisemisen alusta asti, vältyt turhalta ja vaivalloiselta työltä tutkimuksen edetessä ja saat aineistot julkaistua vaivatta. Julkaise aineistot kuvailtuina, järjestettyinä kokonaisuuksina luotettavissa, kuratoiduissa data-arkistoissa (ks. sopivan arkiston hakuohje edempänä sivulla). Näin takaat, että aineistosi on löydettävissä, saavutettavaa, teknisesti yhteentoimivaa ja uudelleenkäytettävää. Kerro julkaistavan aineiston kuvailutiedoissa aineistojen tekijätiedot, aineistoa koskevat sopimusehdot sekä käyttölisenssi. Näin varmistat, että muiden on mahdollista käyttää aineistoa uudelleen. Ilman selkeästi ilmoitettua käyttöehtolisenssiä aineisto on käyttökelvotonta.

Aineiston metatietojen julkaiseminen

1. Luo metatietokuvailu Converikseen heti tutkimuksesi alkuvaiheessa, viimeistään siinä vaiheessa, kun aloitat aineistonkeruun. Päivität metatietoja tutkimuksen edetessä. Ylläpidät metatietoja omana tai tutkimusryhmäsi tietona siihen asti, että haluat julkaista ne sekä mahdollisesti itse aineiston. Kun aineisto alkaa karttua, tallenna metatiedot lomakkeen oikean alakulman Tallenna ja valitse vaihe -valikosta Täydennettävänä-tilaan. Tässä tilassa saat Converiksen kaikki valinnat ja tietokentät käyttöösi.

2. Kun haluat julkaista metatiedot, tarkista, että aineiston nimi on yksilöivä ja kuvaileva, ei esimerkiksi vain "X-tutkimusprojektin haastatteluaineisto". Tarkista myös, että aineiston kuvailu on niin selkeä ja yksityiskohtainen, että toinen saman alan tutkija osaa sen lukemalla arvioida, onko aineisto hänelle mahdollisesti hyödyllinen. Jos julkaiset vain metatiedot, valitse Aineiston saatavuus -valikosta saatavuudeksi "Pääsyä voi pyytää". Tällöin suljettuna säilytettävästä aineistosta kiinnostuneet osaavat tarvittaessa olla Converikseen merkittyihin yhteyshenkilöihin yhteydessä.

3. Kun kaikki tiedot ovat valmiit, tallenna lomake oikean alakulman Tallenna ja valitse vaihe -valikosta Tarkistettavana-tilaan. Tämän jälkeen Avoimen tiedon keskus on sinuun tarvittaessa yhteydessä ja julkaisee metatiedot JYX-arkistossa. Kun DOI-linkki on aktivoitunut, Avoimen tiedon keskus lähettää sen sinulle sähköpostitse.


Missä itse aineisto kannattaa julkaista?

Hyviä käytäntöjä

  • Julkaise aineistosi ensisijaisesti tieteenala- tai tutkimusalakohtaisessa digitaalisessa tietoarkistossa (eng. repository). Alakohtaisessa arkistossa data päätyy varmimmin alasi tutkijoiden löydettäväksi.
  • Fairsharing- ja Re3data-portaaleissa voit selailla ja hakea sopivaa arkistoa.
  • Jos sopivaa alakohtaista tietoarkistoa ei ole saatavilla, julkaise datasi yliopiston JYX-julkaisuarkistossa. HUOM: JYXissä julkaistavien aineistojen tulee toistaiseksi olla tiedostokooltaan max. 3-4 GB. Tiedostoja voi kuitenkin julkaista suuriakin määriä, vain yksittäisen tiedoston maksimikoko on määritely.
  • Käytä yleisiä data-arkistoja kuten Zenodoa ja figsharea vasta viimeisenä vaihtoehtona. Niiden sisällön sekalaisuus heikentää datan löydettävyyttä ja vaikeuttaa löydösten arviointia.
  • Pelkkä omilla tai hankkeen kotisivuilla julkaiseminen ei täytä rahoittajien vaatimuksia eikä yliopiston odotuksia aineiston löydettävyydestä ja saavutettavuudesta.


Näin tunnistat suositeltavan data-arkiston

  • Arkisto on alasi tutkijoiden laajalti käyttämä
  • Arkisto antaa aineistolle pysyvän tunnisteen, kuten DOI tai URN
  • Arkisto julkaisee koneluettavan metadatan ja käyttää tunnettua metadatastandardia
  • Arkistolla on toiminnan luotettavuutta osoittava sertifikaatti, esimerkiksi Core Trust Seal ja ISO 16363 –standardi
  • Arkisto antaa sinun valita käyttöehdot, joilla aineisto on jatkokäytettävissä.

 

Tietoarkisto

Tietoarkisto (FSD) on tutkimuksen ja opetuksen valtakunnallinen palveluinfrastruktuuri. Se arkistoi ja välittää sähköisiä tutkimusaineistoja tutkimukseen, opetukseen ja opiskeluun. Yksikkö toimii Tampereen yliopiston yhteydessä.

Tietoarkisto edistää tieteen avoimuutta, läpinäkyvyyttä, tiedon kumuloitumista ja olemassa olevan tiedon tehokasta tutkimuskäyttöä ja toteuttaa vastuullisesti FAIR-periaatteita. FAIR tarkoittaa, että palvelut ja aineistot ovat helposti löydettäviä, saavutettavia, yhteentoimivia ja jatkokäytettäviä. Toiminnan perusta on asiantunteva, nopea, tasapuolinen ja maksuton palvelu.

Tietoarkisto vastaanottaa digitaalisia tutkimusaineistoja, jotka sopivat esimerkiksi yhteiskuntatieteiden, humanististen alojen, kasvatustieteiden sekä terveystieteiden tutkimukseen, opetukseen ja opiskeluun. Aineistojen tulee olla teknisesti ja juridisesti arkistointikelpoisia. Tietoarkisto tarkistaa aineistot ja niiden dokumentaation.

Kielipankki


Kielipankki on vakiintunut tieteenalakohtainen tietoarkisto. Se on kieliaineistoja käyttävien tutkijoiden palvelukokonaisuus. Kielipankissa on laaja valikoima teksti-, video- ja puheaineistoja, joista voi tehdä monipuolisia hakuja. Voit tutkia ja käsitellä aineistoja virtuaalisessa työtilassa Kielipankin työkaluilla tai ladata niitä omalle koneellesi.

Monet aineistot ovat käytettävissä avoimesti, osa puolestaan oman yliopiston myöntämin tunnuksin. Suojattujen aineistojen käyttöoikeuksia voi hakea sähköisesti. Kielipankin peruskäyttö on tutkijoille ja opiskelijoille ilmaista.

Ohjeet Kielipankin sisällöntuottajille

JYX

JYX on Jyväskylän yliopiston julkaisualusta julkaisuille ja tutkimusaineistoille. JYX tarjoaa aineistoille pysyvät tunnisteet (DOI, URN). Palveluun syötettyjen datasettien metatiedot toimitetaan kansalliseen METAX-katalogiin, josta ne päätyvät JYXin lisäksi löydättäväksi kansallisesta ETSIN-palvelusta ja keskeisimmistä eurooppalaisista tutkimusaineistojen hakupalveluista.

Datan julkaiseminen JYXissä on yksinkertaista: syötä vain datan metatiedot tutkimustietojärjestelmä Converikseen ja pyydä sieltä aineiston julkaisemista. Ks. ohje alla.


Miten toimitan aineistoni julkaistavaksi JYXissä?

1. Metatietojen ja dokumentaation viimeistely. Laadi aineiston perusmetatietokuvailu Converiksen aineisto-osioon ja tallenna tiedot lomakkeen oikean alakulman Tallenna ja valitse vaihe -valikosta Täydennettävänä-tilaan. Tarkista, että aineiston tulkintaa ja käyttöä varten tarvittava dokumentaatio on järjestyksessä ja valmis julkaistavaksi aineiston mukana. Aineisto voidaan avata siinä vaiheessa, kun sen metatiedot ja dokumentaatio ovat ajan tasalla.

2. Aineiston toimittaminen.

Vaihtoehto 1. Jos säilytät aineistoa Nextcloud-ryhmäkansiossa (JYU Groups, suositeltu vaihtoehto) tai henkilökohtaisessa Nextcloud-kansiossasi, toimi näin:

1. Varmista, että kaikki tarvittavat dokumentaatio- ja aineistotiedostot ja alakansiot ovat mukana kansiossa haluamassasi järjestyksessä, ja että tiedostot on nimetty selkeästi. Dokumentaatiotiedosto kannattaa sijoittaa hakemiston juureen, mistä se on helppo avata ensimmäisenä.

2. Klikkaa ensin kansion oikealla puolella olevaa linkkikuvaketta.

" "

3. Klikkaa Share link -komennon vieressä olevaa +-kuvaketta, jolloin saat jakoasetukset näkyviin.

" "

4. Vaihda jakoasetukseksi Allow upload and editing (oletuksena Read only) ja deaktivoi klikkaamalla valikossa oletuksena aktiivisena oleva umpeutumispäivämäärä.

" "

5. Klikkaa Copy to clipboard -kuvaketta ja kopioi linkkiteksti Notepadille tai suoraan Converiksen kenttään.

" "

6. Tarkista, että metatiedot ovat Converiksessa "Täydennettävänä"-tilassa. Sijoita linkki Converis-lomakkeen ”Aineiston Nextcloud-jakolinkki julkaisua varten”-kenttään.

" "

7. Kun olet tarkistanut, että muut metatiedot ovat kunnossa ja olet valinnut aineistolle Converiksen lisenssivalikosta haluamasi käyttölisenssin, tallenna tiedot lomakkeen Tallenna ja valitse vaihe - valikosta Tarkistettavana-tilaan.

Vaihtoehto 2. Jollet säilytä julkaistavaa aineistoa Nextcloudissa, toimi näin:

1. Järjestä julkaistava aineisto- ja dokumentaatiotiedostot ja -alakansiot selkeästi nimettyinä pääkansioon, jonka haluat julkaista.

2. Muuta kansio pakatuksi .zip-kansioksi: klikkaa julkaistavaa kansiota hiiren oikealla näppäimellä, valitse Send to ja Compressed (zipped) folder:

" "

3. Lähetä .zip-kansio Avoimen tiedon keskukseen, joka hoitaa aineiston linkityksen Converikseen JYXissä julkaistavaksi: researchsupport-osc@jyu.fi. Voit käyttää JYUn Funet File Sender -ohjelmaa, jotta sähköpostin liitetiedoston maksimikoko ei ylity.

4. Tallenna Converiksen aineisto-osioon laatimasi metatiedot lomakkeen oikean alakulman Tallenna ja valitse vaihe -valikosta Tarkistettavana-tilaan. Nyt Avoimen tiedon keskus tarkistaa tiedot, liittää aineistolinkin paikalleen ja julkaisee tiedot.


Miten toimin, kun tarvitsen aineistolleni kiireellisesti DOI-tunnisteen?

Jos tarvitset aineistollesi kiireellisellä aikataululla pysyvän tunnisteen viittausta varten, on se mahdollista julkaisemalla aineisto tai sen metatiedot JYUn JYX-julkaisuarkistossa. Toimi näin:

  • Jos aineistokokonaisuus on valmis julkaistavaksi ja haluat julkaista sen JYXissä, kirjaa aineiston kuvailutiedot Converis-tutkimustietojärjestelmään ohjeen mukaan. Valitse Converiksen aineisto-osion viimeiseltä välilehdeltä julkaisevasi aineisto metatietoineen ja liitä lomakkeen "Aineiston Nextcloud-jakolinkki julkaisua varten" -kenttään jakolinkki julkaisukelpoiseksi käsiteltyyn ja järjestettyyn aineistoon, jonka olet tallentanut yliopiston Nextcloud-tallennuspalveluun. Jos tarvitset neuvoja aineiston julkaisukuntoon saattamisessa tai apua aineiston siirtämisessä Nextcloudiin tai haluat toimittaa aineiston muulla tavalla, ota yhteyttä osoitteeseen researchsupport-osc@jyu.fi. Kirjoita lomakkeen "Muuta lisätietoa"-kenttään, millä aikataululla toivot julkaisemista. Tallenna tiedot sitten Tarkistettavana -tilaan (englanninkielisessä näkymässä For validation). Tällöin Avoimen tiedon keskuksen aineistoasiantuntija tarkistaa kuvailutiedot ja siirtää ne julkaistavaksi JYX-julkaisuarkistossa, joka tarjoaa aineistolle kaivatun pysyväistunnisteen, DOIn.
  • Jos aineistokokonaisuus on vielä keskeneräinen, mutta tarvitset pysyvän tunnisteen viitettä varten jo etukäteen, toimi kuten edellä, mutta valitse Converiksen aineisto-osion viimeiseltä välilehdeltä julkaisevasi pelkät aineiston metatiedot ja tallenna tiedot Tarkistettavana -tilaan. Huolehdi tätä ennen, että kaikki Converiksessa kysytyt kuvailutiedot ovat ajan tasalla. Nextcloud-linkki tai toisen data-arkiston linkki aineistoon voidaan tässä tapauksessa täydentää tietoihin siinä vaiheessa, kun ne ovat valmiit julkaistavaksi. Tee tällöin kuvailutietojen täydentämisestä erillinen pyyntö osoitteeseen researchsupport-osc@jyu.fi tai käyttämällä aineiston metatietojen viimeisen välilehden Muutospyynnöt OSC:lle -kenttää.

Aineiston säilytys tutkimuksen jälkeen 

Pitkittäis- ja seurantatutkimuksissa on usein tarpeen säilyttää henkilötietoja sisältävää aineistoa tutkimussuunnitelman ja tietosuojaselosteessa kuvaillun henkilötietojen elinkaarisuunnitelman mukaisesti. Kun aiot säilyttää henkilötietoja alkututkimusvaiheen päätyttyä, perustele se tietosuojailmoituksessa ja DMP:ssäsi (tyypillisesti tarve ottaa tutkimukseen osallistuneisiin yhteyttä uudelleen jonkin ajan kuluttua; säilytys on tarpeen tutkimussuunnitelman mukaisia seurantatoimenpiteitä varten). Kun olet dokumentoinut perustelut, voit asettaa aikarajan ja nimetä vastuuhenkilöt arvioimaan tarvetta tunnisteellisten tietojen säilytyksen jatkamiselle alkuperäistä tutkimustarkoitusta varten (esim. 5-10 vuotta). Nextcloudin ryhmäkansiot ovat suositeltu säilytysratkaisu ei-arkaluonteisille tiedoille. Jos säilytettävä aineisto sisältää erityisiä henkilötietoja tai muutoin salassa pidettäviä tietoja, ota yhteyttä Avoimen tiedon keskukseen sopivan säilytyspaikan kartoittamiseksi: researchsupport-osc@jyu.fi.


Aineiston pitkäaikaissäilytys

Tutkimusaineiston pitkäaikaissäilytyksellä tarkoitetaan vähintään 25 vuoden säilytysaikaa. Kansallisesti arvokkaille aineistoille on tähän tarkoitukseen tarjolla CSC:n ylläpitämä Fairdata-PAS-palvelu, joka säilyttää aineistoja kymmenistä satoihin vuosiin. Tutkimusdatapolitiikkansa mukaisesti Jyväskylän yliopisto koordinoi keskitetysti aineistojensa pitkäaikaistallentamista siten, että merkittävimmät yliopiston aineistot tullaan pitkäaikaistallentamaan. Aineistojen valintakriteerit ja menettely tarkentuvat myöhemmin.

 


Kaikissa aineistojen hallintaan ja julkaisemiseen liittyvissä kysymyksissä sinua auttaa Avoimen tiedon keskus: researchsupport-osc@jyu.fi.

Ohjeiden laatimisessa on käytetty lähteinä Helsingin yliopiston Aineistonhallinta-sivustoa (CC BY 4.0), viitattu 28.2.2021, Helsingin yliopiston Making a research project understandable - A guide to data documentation -opasta (CC BY 4.0) ja Tampereen yliopiston Tutkimusaineistojen hallinta -opasta (CC BY 4.0, viitattu 1.3.2021).