Aineistonhallinnan suunnittelu

Miksi aineistonhallintaa?

"Aineistonhallinnalla tarkoitetaan käytänteitä, joita noudattamalla tutkimusdata ja niihin liittyvä kuvaileva tieto (metatieto, metadata) on luotu, tallennettu ja järjestetty siten, että tutkimusdata säilyy käyttökuntoisena ja luotettavana ja että tietosuoja ja tietoturva on varmistettu tutkimusdatan koko elinkaaren ajan." (Kuusniemi et al., Avoimen tieteen osalinjaus. Luonnos. URL: https://avointiede.fi/sites/default/files/2020-09/LUONNOS-tutkimusainestot-menetelmat--OSALINJAUS1.pdf, linkki tarkistettu 29.12.2020).

Tutkimusaineistot ovat

  • digitaalisessa tai analogisessa muodossa olevia tieteellisen tutkimuksen perusaineistoja,
  • niistä edelleen jalostettuja aineistoja, mm.
  • muistiinpanoja sekä kenttätyö-/laboratoriopäiväkirjoja sekä
  • lähdekoodia ja ohjelmistoja, joihin tutkimuksen löydökset ja julkaistut tulokset perustuvat.

Tiedeyliopistossa tutkimusaineistojen hallinta, säilytys ja uudelleenkäyttö muodostavat tutkimusinfrastruktuurin keskeisen osan. Kotimaiset ja kansainväliset tutkimusrahoittajat sekä julkaisujen kustantajat arvostavat ja yhä useammin myös edellyttävät tutkimusaineistojen avoimuutta ja läpinäkyvyyttä. Aineistojen avoimuus on kuitenkin vain yksi hyvän aineistonhallinnan luoma mahdollisuus. Ennen kaikkea aineistonhallinta tuottaa hyvin järjestettyjä ja käyttökelpoisia aineistoja, jotka helpottavat ja edistävät tutkijan itsensä työtä tutkimuksen eri vaiheissa.

Hyvin suunnitellun aineistonhallinnan avulla

  • tutkimustyösi tehostuu
  • vältät aineiston katoamisen
  • vastaat rahoittajien vaatimuksiin
  • noudatat tietosuojalainsäädäntöä ja turvaat tutkittaviesi oikeudet
  • sinä ja yhteistyökumppanisi olette selvillä aineistoon liittyvistä sopimuksista ja oikeuksista
  • tiedät, miten, missä ja millä ehdoilla avaat aineistosi
  • muut voivat viitata dataasi ja sinä meritoidut
  • varmistat, että hankkeellasi on käytössään tarvittavat resurssit – voit säästää ajan lisäksi rahaa.


JYU tarjoaa tutkijoille erilaisia työkaluja aineistonhallinnan eri vaiheisiin sekä niihin liittyvää neuvontaa ja opastusta.


Aineistonhallintasuunnitelma

Jyväskylän yliopisto edellyttää datapolitiikassaan useimpien rahoittajien tapaan tutkijoilta aineistonhallintasuunnitelman (Data management plan, DMP) tekemistä. Siinä kuvaat,

1) mitä aineistoja tutkimuksessa käsittelet,
2) miten huomioit lainsäädännön, tutkimusta ohjaavat eettiset periaatteet sekä aineistoa koskevat oikeudet
3) miten dokumentoit aineiston ja tallennat sen metatiedot,
4) missä säilytät aineistoa tutkimuksen aikana ja miten takaat sen eheyden,
5) miten huolehdit siitä (arkistointi, julkaiseminen, hävittäminen) tutkimushankkeen päätteeksi sekä
6) millaisia rooleja aineiston hallintaan liittyy sekä mitä resursseja kuvaamasi toimenpiteet vaativat.

Aineistonhallintasuunnitelma täydentää tutkimussuunnitelmaa. Se toimii tutkijan apuvälineenä läpi tutkimusprosessin. Se on elävä dokumentti, jota päivitetään tutkimushankkeen edetessä. Suunnitelma auttaa varmistamaan, että hankkeen aikana syntyneet tutkimusaineistot ovat korkealaatuisia ja FAIR-periaatteiden mukaisia eli sinun ja muiden löydettävissä ja saavutettavissa, teknisesti yhteentoimivia ja uudelleenkäytettäviä. Suunnitelma kuvaa ja kattaa aineiston koko elinkaaren datan keruusta, tuottamisesta ja käsittelystä sen julkaisemiseen tai arkistoimiseen jatkokäyttöä varten.

Voit käyttää suunnitelman laatimisessa apuna sähköistä DMPTuuli-työkalua. DMPTuulissa voit

  • laatia ja tallentaa suunnitelman ohjatusti sekä päivittää sitä
  • jakaa suunnitelman tutkimusryhmän sisällä ja yhteistyökumppaneille
  • halutessasi julkaista suunnitelmasi ja saada työllesi näkyvyyttä.

Ohjeet tunnusten luomiseen ja DMPTuulin käyttöön löydät täältä.

Tutustu myös aineistonhallinnan suunnittelun video-ohjeisiin (Tieteen tietotekniikan keskus CSC).

Tarvitsetko apua aineistonhallintasuunnitelman laatimiseen? Ota yhteyttä Avoimen tiedon keskukseen: researchsupport-osc@jyu.fi. 


Tunne aineistosi

Ydinkysymyksiä: Millaista tutkimusaineistosi on? Käytätkö olemassa olevaa aineistoa uudelleen? Millaista aineistoa kerätään, tuotetaan tai käytetään uudelleen? Missä muodossa aineisto on? Kuinka paljon sitä on?

Luokittele ja kuvaile lyhyesti aineistosi erilaisiin tyyppeihin (esim. valmis pohja-aineisto, jota käytät uudelleen, itse keräämäsi raakadata, siitä prosessoimasi analyysiaineisto). Voit käyttää taulukkoa tai luetteloa. Aineistotyypit kannattaa nimetä, jotta niihin voi helpommin viitata myöhemmin aineistonhallintasuunnitelmassa.

Esimerkkejä:

Aineistotyyppi Alkuperä Henkilötiedot / arkaluonteisuus Tiedostotyyppi (suositeltavia, avoimia formaatteja:) Arvioitu koko
Analysoitu DNA-näyte Itse tuotettu (raaka-aineistona DNA-näyte) Ei .xlsx, .csv 2 Gb
Tilastoaineisto X Valmis aineisto Tietoarkistosta Ei SPSS (.por, .sav)  
Kysely Kerätty tutkittavilta Kyllä, sisältää tietoa tutkittavien terveydentilasta .csv, 5 Mt
Haastattelutallenne, video Kerätty tutkittavilta Kyllä .avi, .mp4  
Haastattelun transkriptio Tuotettu raaka-aineistosta Ei .csv, .txt, .xlsx >10 Mt
Kuva Tuotettua havaintoaineistoa Kyllä .tif, .jpeg, .gif, .raw  

Lähde: Fuchs, S. 2020. RDM : Research Data Management Basics, Meilahti. Helsingin yliopisto. CC BY 4.0. Viitattu 27.1.2021.

Muista, että aineiston käsite on todella laaja. Se käsittää käytännössä kaiken materiaalin, josta tutkimustulokset johdetaan. Samassa tutkimuksessa voidaan käsitellä tutkimusta varten kerättävää aineistoa, tutkimusprosessin tuloksena syntyvää aineistoa (esim. dokumentaatio, analyysit, tietokannat), aiemmin kerättyä aineistoa (esim. Tilastokeskus, arkistot) ja vielä käsitellä sitä koodein, jotka tulee myös huomioida. Tutkimusdatasta puhutaan silloin, kun viitataan nimenomaan digitaaliseen tutkimusaineistoon.

tutkimusaineisto.png

Aineiston keruun ja käsittelyn aikana on tärkeää huolehtia siitä, että data säilyy eheänä ja korruptoitumattomana. Suunnittele ja kuvaa aineistonhallintasuunnitelmassasi mahdolliset laadunvarmistusta koskevat vaatimukset sekä toimenpiteet, joilla turvaat aineistosi yhtenäisyyden ja laadun. Laadunvarmistusta voi tutkimuksen tyypistä riippuen olla esimerkiksi laitteiden kalibrointi, standardinmukaisten laitteiden ja menetelmien käyttö, mittauksen tai näytteen toistaminen tai tarkistussumman ottaminen analyysitiedostosta virheiden ja puuttuvien arvojen havaitsemiseksi.


Sopimukset, oikeudet ja lisenssin valinta

Miten sovit käyttämäsi, tuottamasi ja jakamasi aineiston oikeuksista? Kenellä on oikeus päättää aineiston käytöstä, nyt ja tulevaisuudessa? Kuka aineiston omistaa?
Sovi näistä sekä aineiston tekijyydestä osapuolten kanssa kirjallisesti hankkeen alkaessa. Täydennä sopimuksia niiden mahdollisesti muuttuessa. Yliopiston lakipalvelut tarjoavat käyttöösi sopimusmalleja.

Yhteistä jokaiselle tutkimushankkeelle on, että aineiston käytöstä ja siihen liittyvistä oikeuksista tulee sopia kirjallisesti. Tämä varmistaa tutkijoiden oikeusturvan ja käyttöoikeuden aineistoon myös yllättävissä ongelmatilanteissa. Lisäksi useat rahoittajat vaativat sopimusta oleellisena osana rahoitusehtojaan. JYU linjaa datapolitiikassaan, että yliopistolla tehdyssä tutkimuksessa tuotettujen aineistojen oikeudet kuuluvat lähtökohtaisesti yliopistolle. Tästä huolimatta asiasta on sovittava kirjallisesti, jotta 1) varmistetaan tutkijoiden käyttöoikeudet ja 2) määritetään se taho, joka tekee aineistoon liittyvät päätökset ja joka voi mahdollisesti päättää aineiston julkaisemisesta. Myös aineiston tekijyydestä kannattaa sopia, jotta se aineistoa julkaistaessa ilmoitetaan oikein perustein.

Mikäli aineiston keruussa tai käytössä on mukana opiskelijoita, tulee näissä tapauksissa sopia aina aineiston oikeuksien luovuttamisesta hankkeelle sekä opiskelijoiden käyttöoikeuksista ja niiden rajoista.

Sopimukset tulee laatia mahdollisimman varhaisessa vaiheessa ja niitä tulee tarvittaessa henkilövaihdosten yhteydessä tai olosuhteiden muuttuessa päivittää. Yliopisto tarjoaa mallipohjia sopimiseen. Hankkeen vastuullisen johtajan velvollisuutena on huolehtia siitä, että kaikki hankkeeseen osallistuvat siirtävät oikeutensa yliopistolle ennen hankesopimuksen allekirjoitusta tai viimeistään ennen sopimuksessa määritellyn työn aloittamista.

Huomaa, että oikeuksiensiirtosopimukset on tehtävä aina seuraavissa hankkeissa:

  • Business Finlandin rahoittamat hankkeet
  • EU:n tutkimusohjelmat
  • tilaustutkimukset.

Lisätietoa ja neuvoja saat yliopiston lakiasiantuntijoilta.

Oikeuksiin liittyy myös julkaistavan aineiston lisensseistä päättäminen. Lisensoinnilla varmistat aineiston käytettävyyden selkeiden, sinun itse asettamiesi ehtojen mukaan. JYUssa käytetään kansainvälisten standardien mukaisia koneluettavia lisenssejä (esim. Creative Commons), joiden avulla aineisto on uudelleenkäytettävissä niin laajasti kuin mahdollista. Lisensointi on ehdoton edellytys aineiston avaamiselle tulevaisuudessa, sillä lisensoimatonta aineistoa on turvatonta jatkokäyttää.

Sopimuksen laatimisessa huomioitavaa

  • Mitkä aineistot on tarkoitus luovuttaa jatkokäyttöön?
  • Mikäli yksi tai useampi tutkija on tuonut tutkimushankkeeseen mukaan aiempaa tutkimusaineistoa, sisällytetäänkö tämä jatkokäyttöön luovutettavaan aineistoon?
  • Milloin aineisto tai osat siitä voidaan luovuttaa jatkokäyttöön? (Esimerkiksi ennalta määrätty aikataulu tai julkaisujen valmistuminen)
  • Mihin käyttötarkoituksiin aineisto luovutetaan (pelkästään tutkimukseen vai lisäksi myös opetus- ja opiskelukäyttöön)?
  • Kenellä on oikeus tehdä arkistointisopimus tutkimusaineistosta?
  • Halutaanko jatkokäytölle asettaa ehtoja lisenssin avulla?
  • Mikäli jatkokäyttö halutaan tehdä luvanvaraiseksi, kuka päättää luvan myöntämisestä?

Eettiset seikat ja henkilötietojen käsittely

Tutkimuseettiset seikat sekä varsinkin tutkittavien laillinen oikeus yksityisyyden suojaan voivat vaikuttaa siihen miten keräät, säilytät ja käsittelet tutkimusaineistoja, siihen kuka saa käyttää aineistoa ja mihin tarkoitukseen, sekä aineiston arkistointiin.

Henkilötietojen käsittely on yleisin eettinen toimenpiteitä aiheuttava syy. Henkilötiedot vaikuttavat aineiston käsittelyyn ja säilyttämiseen. Ne saattavat myös rajoittaa sen julkaisemista ja arkistointia.

Jos tutkimukseesi liittyy minkään sellaisen tiedon käsittelyä, joka voidaan joko suoraan tai epäsuorasti yhdistää henkilöön, tietosuojalainsäädäntö koskee tutkimustasi. Informoi tutkittavia ennen tutkimuksen alkua selkeästi siitä, miten ja kenen toimesta heidän henkilötietojaan tullaan käsittelemään ja hallinnoimaan halki tutkimushankkeen elinkaaren. JYUn tietosuojaohje tutkijoille neuvoo, miten käsittelet henkilötietoja tietoturvallisesti ja lainsäädännön edellytysten mukaisesti tutkimuksen eri vaiheissa.

Erityiset henkilötietoryhmät ja arkaluonteiset tiedot

Erityisiä henkilötietoja ovat henkilön etninen alkuperä, poliittinen mielipide, uskonnollinen tai maailmankatsomuksellinen vakaumus, ammattiyhdistysliikkeen jäsenyys, geneettinen data, yksilöivä biometrinen data, terveystiedot sekä seksuaalinen käyttäytyminen tai suuntautuminen. Arkaluonteisia tietoja ovat lisäksi henkilötunnus, pankkitilitiedot sekä rikosrekisteritiedot.

Jos käsittelet erityisiä henkilötietoja, tutkimustasi koskevat erityiset säännökset liittyen henkilötietojen käsittelyn poikkeusperusteen määrittelyyn sekä aineiston säilytykseen ja käsittelyyn.

  • Määrittele arkaluonteisten tietojen käsittelylle tietosuoja-asetuksen edellyttämä poikkeusperuste. Ohjeen tähän löydät tutkijan tietosuojaohjeesta kohdasta Erityiset henkilötietoryhmät.
  • Kerro tutkittaville toimittamassasi informoinnissa sekä tietosuojaselosteessa, kuka hankkeessasi toimii tietojen rekisterinpitäjänä. Erittele myös, mitkä kaikki tahot tulevat käsittelemään henkilötietoja tutkimuksen aikana, sekä miksi.
  • Erittele tutkittaville toimittamassasi tietosuojaselosteessa ja aineistonhallintasuunnitelmassasi, miten huolehdit tietojen tietoturvallisesta ja luottamuksellisesta säilytyksestä ja käsittelystä tutkimuksen aikana.
  • Kuvaile samoin se, miten pseudonymisoit tai anonymisoit tunnisteelliset tiedot siinä vaiheessa, kun et enää tarvitse tunnisteita tutkimuksesi tarkoitusta varten. Miten arkistoit tai hävität tiedot hankkeen päättyessä?
  • Jos yhteistyökumppanisi tai rahoittajasi vaatii tietojen arkaluonteisuuteen perustuen eettisen ennakkoarvioinnin, löydät ohjeet täältä.
  • Pidä tutkimuksen aikana yllä ajantasaista dokumentaatiota siitä, miten käytännössä toteutat ja seuraat tietosuojaselosteessa kuvaamiasi tietosuojatoimenpiteitä.

Vaikutustenarviointi

Tee henkilötietoja käsittelevälle tutkimuksellesi aina vähintään suppea, vapaamuotoinen riskienarvointi, josta löydät lisätietoa täältä. Jos riski on suuri, tutkimukselle on tehtävä EU:n yleisen tietosuoja-asetuksen mukainen vaikutustenarviointi, Data Protection Impact Assessment (DPIA).
Erityisen suureksi riskiksi katsotaan

  • suuri määrä henkilöitä, joiden tietoja käsitellään
  • suuri määrä tietoa henkilöstä
  • sensitiivinen tieto
  • herkästi haavoittuvien henkilöiden (esim. lasten) tiedot
  • tietojen käyttö automatisoituun päätöksentekoon
  • systemaattinen seuranta.

Tarkemmat ohjeet löydät tutkijan tietosuojaohjeesta.

Eettinen ennakkoarviointi ihmistieteissä

Saatat tarvita tutkimuksellesi ennakkoarvioinnin yliopiston Ihmistieteiden eettiseltä toimikunnalta tai Keski-Suomen sairaanhoitopiirin eettiseltä toimikunnalta, jos tutkimusasetelmasi täyttää Tutkimuseettisen neuvottelukunnan määrittelemät erityiset kriteerit:

1) Tutkimukseen osallistumisessa poiketaan tietoon perustuvan suostumuksen periaatteesta,
2) tutkimuksessa puututaan tutkittavien fyysiseen koskemattomuuteen,
3) tutkimus kohdistuu alle 15-vuotiaisiin ilman huoltajan erillistä suostumusta tai informointia, jonka perusteella huoltajalla olisi mahdollisuus kieltää lasta osallistumasta tutkimukseen,
4) tutkimuksessa tutkittaville esitetään poikkeuksellisen voimakkaita ärsykkeitä,
5) tutkimuksessa on riski aiheuttaa tutkittaville tai heidän läheisilleen normaalin arkielämän rajat ylittävää henkistä haittaa tai
6) tutkimuksen toteuttaminen voi merkitä turvallisuusuhkaa tutkittaville tai tutkijalle tai heidän läheisilleen.

Ota tarvittaessa yhteyttä yliopiston Ihmistieteiden eettiseen toimikuntaan hyvissä ajoin ennen kuin aloitat tutkimuksen. Ennakkoarviointia ei voi pyytää enää tutkimuksen käynnistymisen jälkeen. Täältä löydät lisätietoa ennakkoarvioinnista ja tilanteista, joissa sitä ei tarvita.

Henkilötietojen käsittelijän muistilista

  • Tutustu JYUn tietosuojapolitiikkaan ja tutkijan tietosuojaohjeisiin.
  • Perustele, että sinulla on tietosuoja-asetuksen mukainen oikeus kerätä, käsitellä ja säilyttää aineistoa. Tarkista henkilötietojen käsittelyperusteet. Huolehdi, että eettinen ennakkoarviointi on tarvittaessa tehty ennen tutkimuksen aloittamista.
  • Kerro, mitkä tahot käsittelevät tietoja ja millä perusteella, sekä kuka tai ketkä ovat aineiston rekisterinpitäjiä. Huom! Ota tässä huomioon myös käyttämäsi palveluntarjoajat. Jos teet kyselytutkimuksen käyttäen vaikkapa Webropol-palvelua, sillä on teknisesti mahdollisuus päästä näkemään sisältö.
  • Kuvaile, mitä henkilöihin liittyviä tietoja tarvitset ja miksi.
  • Määritä käsittelyn lainmukainen peruste: onko se 1) suostumus vai 2) yleisen edun mukainen, tieteellinen tutkimus?
  • Arvioi, mitä riskejä henkilötietojen käsittelystä voi aiheutua tutkittaville.
  • Selvitä, vaatiiko projektisi vaikutustenarviointia, ja tee se tarvittaessa.
  • Kerro, miten suojaat käsiteltävät tiedot ja tutkittavien yksityisyyden sekä tarvittaessa anonymisoit tai pseudonymisoit aineiston.
  • Miten hävität tarpeettomiksi käyneet henkilötiedot niin, etteivät ne ole enää palautettavissa?
  • Mitä teet aineistolle, kun tutkimus päättyy?
  • Muista, että henkilötietoja saa käsitellä vain siten kuin tutkittavia on informoitu tietosuojailmoituksessa ennen tutkimuksen aloittamista. Jos aineiston käsittelyssä tulee esiin tarve poiketa tietosuojailmoituksessa määritellystä, informoi tutkittavia siitä heti ja päivitä tietosuojailmoitus sekä muut tarvittavat dokumentit.

Varmista, että henkilötietojen käsittely on kuvattu yhdenmukaisesti tutkimus- ja aineistonhallintasuunnitelmassasi sekä tietosuojailmoituksessa.

Tarvitsetko apua tietosuojakysymyksissä? Ota yhteyttä yliopiston tietosuojavastaavaan: tietosuoja@jyu.fi .