Opas tutkimusaineistojen hallintaan

1. Aineistonhallinnan suunnittelu

Miksi aineistonhallintaa?

"Aineistonhallinnalla tarkoitetaan käytänteitä, joita noudattamalla tutkimusdata ja niihin liittyvä kuvaileva tieto (metatieto, metadata) on luotu, tallennettu ja järjestetty siten, että tutkimusdata säilyy käyttökuntoisena ja luotettavana ja että tietosuoja ja tietoturva on varmistettu tutkimusdatan koko elinkaaren ajan." (Kuusniemi et al., Avoimen tieteen osalinjaus. Luonnos. URL: https://avointiede.fi/sites/default/files/2020-09/LUONNOS-tutkimusainestot-menetelmat--OSALINJAUS1.pdf, linkki tarkistettu 29.12.2020).

Tutkimusaineistot ovat 

  • digitaalisessa tai analogisessa muodossa olevia tieteellisen tutkimuksen perusaineistoja,
  • niistä edelleen jalostettuja aineistoja, mm.
  • muistiinpanoja sekä kenttätyö-/laboratoriopäiväkirjoja sekä
  • lähdekoodia ja ohjelmistoja, joihin tutkimuksen löydökset ja julkaistut tulokset perustuvat.

Tiedeyliopistossa tutkimusaineistojen hallinta, säilytys ja uudelleenkäyttö muodostavat tutkimusinfrastruktuurin keskeisen osan. Kotimaiset ja kansainväliset tutkimusrahoittajat sekä julkaisujen kustantajat arvostavat ja yhä useammin myös edellyttävät tutkimusaineistojen avoimuutta ja läpinäkyvyyttä. Aineistojen avoimuus on kuitenkin vain yksi hyvän aineistonhallinnan luoma mahdollisuus. Ennen kaikkea aineistonhallinta tuottaa hyvin järjestettyjä ja käyttökelpoisia aineistoja, jotka helpottavat ja edistävät tutkijan itsensä työtä tutkimuksen eri vaiheissa.

Hyvin suunnitellun aineistonhallinnan avulla

  • tutkimustyösi tehostuu
  • vältät aineiston katoamisen 
  • vastaat rahoittajien vaatimuksiin 
  • noudatat tietosuojalainsäädäntöä ja turvaat tutkittaviesi oikeudet
  • sinä ja yhteistyökumppanisi olette selvillä aineistoon liittyvistä sopimuksista ja oikeuksista
  • tiedät, miten, missä ja millä ehdoilla avaat aineistosi
  • muut voivat viitata dataasi ja sinä meritoidut 
  • varmistat, että hankkeellasi on käytössään tarvittavat resurssit – voit säästää ajan lisäksi rahaa.


Jyväskylän yliopisto tarjoaa tutkijoille erilaisia työkaluja aineistonhallinnan eri vaiheisiin sekä niihin liittyvää neuvontaa ja opastusta.

Tutkimusdatapolitiikka ja FAIR-periaatteet

Jyväskylän yliopisto kannustaa datapolitiikassaan kansainvälisten FAIR-periaatteiden mukaisesti tutkijoita huolehtimaan tutkimusaineistoistaan niin, että niiden kuvailutiedot ja mahdollisuuden mukaan myös datasetit ovat mahdollisimman sujuvasti ja kestävästi löydettäviä, saavutettavia, (yhteen)toimivia ja (uudelleen)käytettäviä (Findable, Accessible, Interoperable, Reusable). Valtaosa tutkimusrahoittajista, mukaan lukien Suomen Akatemia, edellyttävät rahoitusta saavilta hankkeilta, että niissä syntyvät aineistot ovat vähintään kuvailutietojen osalta avoimia. FAIR-periaatteiden käytännön toteuttamisen viisi perusaskelta ovat:

  • Arkistoi aineistosi tai vähintään sen kuvailutiedot laadukkaaseen digitaaliseen arkistoon
  • Valitse arkisto, joka tarjoaa aineistolle ja/tai kuvailutiedoille pysyvän tunnisteen kuten DOI tai URN
  • Käytä aineiston tallentamiseen ja säilyttämiseen avoimia tiedostoformaatteja, jotka takaavat tiedostojen avautumisen mahdollisimman monissa ohjelmistoissa ja takaavat pääsyn pidempään kuin suljetut kaupalliset formaatit
  • Dokumentoi aineistosi kokonaisuudessaan ja pidä sen kuvailutiedot eli metadata ajan tasalla tutkimuksen aikana
  • Anna aineistolle lisenssi, joka ilmaisee selkeästi aineiston käyttöehdot ja -luvat sekä tarvittavat rajoitukset aineiston jatkokäytölle. 

Aineistonhallintasuunnitelma

Jyväskylän yliopisto edellyttää datapolitiikassaan useimpien rahoittajien tapaan tutkijoilta aineistonhallintasuunnitelman (Data management plan, DMP) tekemistä. Siinä kuvaat, 

1) mitä aineistoja tutkimuksessa käsittelet,
2) miten huomioit lainsäädännön, tutkimusta ohjaavat eettiset periaatteet sekä aineistoa koskevat oikeudet
3) miten dokumentoit aineiston ja tallennat sen metatiedot,
4) missä säilytät aineistoa tutkimuksen aikana ja miten takaat sen eheyden, 
5) miten huolehdit siitä (arkistointi, julkaiseminen, hävittäminen) tutkimushankkeen päätteeksi sekä 
6) millaisia rooleja aineiston hallintaan liittyy sekä mitä resursseja kuvaamasi toimenpiteet vaativat. 

Aineistonhallintasuunnitelma täydentää tutkimussuunnitelmaa. Se toimii tutkijan apuvälineenä läpi tutkimusprosessin. Se on elävä dokumentti, jota päivitetään tutkimushankkeen edetessä. Suunnitelma auttaa varmistamaan, että hankkeen aikana syntyneet tutkimusaineistot ovat korkealaatuisia ja FAIR-periaatteiden mukaisia eli sinun ja muiden löydettävissä ja saavutettavissa, teknisesti yhteentoimivia ja uudelleenkäytettäviä. Suunnitelma kuvaa ja kattaa aineiston koko elinkaaren datan keruusta, tuottamisesta ja käsittelystä sen julkaisemiseen tai arkistoimiseen jatkokäyttöä varten. 

Voit käyttää suunnitelman laatimisessa apuna sähköistä DMPTuuli-työkalua. DMPTuulissa voit 

  • laatia ja tallentaa suunnitelman ohjatusti sekä päivittää sitä
  • jakaa suunnitelman tutkimusryhmän sisällä ja yhteistyökumppaneille
  • halutessasi julkaista suunnitelmasi ja saada työllesi näkyvyyttä. 

Ohjeet tunnusten luomiseen ja DMPTuulin käyttöön löydät täältä.

Tutustu myös aineistonhallinnan suunnittelun video-ohjeisiin (Tieteen tietotekniikan keskus CSC). 

Tunne aineistosi

Ydinkysymyksiä: Millaista tutkimusaineistosi on? Käytätkö olemassa olevaa aineistoa uudelleen? Millaista aineistoa kerätään, tuotetaan tai käytetään uudelleen? Missä muodossa aineisto on? Kuinka paljon sitä on?

Aineistonhallintasuunnitelman laatiminen alkaa omien aineistojen inventaariosta ja kuvauksesta. Luokittele ja kuvaile lyhyesti aineistosi erilaisiin tyyppeihin (esim. valmis pohja-aineisto, jota käytät uudelleen, itse keräämäsi raakadata, siitä prosessoimasi analyysiaineisto). Voit käyttää taulukkoa tai luetteloa. Aineistotyypit kannattaa nimetä, jotta niihin voi helpommin viitata myöhemmin aineistonhallintasuunnitelmassa.

Esimerkkejä:

Aineistotyyppi Alkuperä Henkilötiedot / arkaluonteisuus Tiedostotyyppi (suositeltavia, avoimia formaatteja:) Arvioitu koko
Analysoitu DNA-näyte Itse tuotettu (raaka-aineistona DNA-näyte) Ei .xlsx, .csv 2 Gb
Tilastoaineisto X Valmis aineisto Tietoarkistosta Ei SPSS (.por, .sav)   
Kysely Kerätty tutkittavilta Kyllä, sisältää tietoa tutkittavien terveydentilasta .csv,  5 Mt 
Haastattelutallenne, video Kerätty tutkittavilta Kyllä .avi, .mp4  
Haastattelun transkriptio Tuotettu raaka-aineistosta Ei .csv, .txt, .xlsx >10 Mt
Kuva Tuotettua havaintoaineistoa Kyllä .tif, .jpeg, .gif, .raw  

Lähde: Fuchs, S. 2020. RDM : Research Data Management Basics, Meilahti. Helsingin yliopisto. CC BY 4.0. Viitattu 27.1.2021. 

Huomioi, että aineiston käsite on todella laaja. Se käsittää käytännössä kaiken materiaalin, josta tutkimustulokset johdetaan. Samassa tutkimuksessa voidaan käsitellä tutkimusta varten kerättävää aineistoa, tutkimusprosessin tuloksena syntyvää aineistoa (esim. dokumentaatio, analyysit, tietokannat), aiemmin kerättyä aineistoa (esim. Tilastokeskus, arkistot) ja vielä käsitellä sitä koodein, jotka tulee myös huomioida. Tutkimusdatasta puhutaan silloin, kun viitataan nimenomaan digitaaliseen tutkimusaineistoon.

Sopimukset, oikeudet ja lisensointi

Miten sovit käyttämäsi, tuottamasi ja jakamasi aineiston oikeuksista? Kenellä on oikeus päättää aineiston käytöstä, nyt ja tulevaisuudessa? Kuka aineiston omistaa?

Sovi näistä sekä aineiston tekijyydestä osapuolten kanssa kirjallisesti hankkeen alkaessa. Täydennä sopimuksia niiden mahdollisesti muuttuessa. Yliopiston lakipalvelut tarjoavat käyttöösi sopimusmalleja.

Yhteistä jokaiselle tutkimushankkeelle on, että aineiston käytöstä ja siihen liittyvistä oikeuksista tulee sopia kirjallisesti. Tämä varmistaa tutkijoiden oikeusturvan ja käyttöoikeuden aineistoon myös yllättävissä ongelmatilanteissa. Lisäksi useat rahoittajat vaativat sopimusta oleellisena osana rahoitusehtojaan. JYU linjaa datapolitiikassaan, että yliopistolla tehdyssä tutkimuksessa tuotettujen aineistojen oikeudet kuuluvat lähtökohtaisesti yliopistolle. Tästä huolimatta asiasta on sovittava kirjallisesti, jotta 1) varmistetaan tutkijoiden käyttöoikeudet ja 2) määritetään se taho, joka tekee aineistoon liittyvät päätökset ja joka voi mahdollisesti päättää aineiston julkaisemisesta. Myös aineiston tekijyydestä kannattaa sopia, jotta se aineistoa julkaistaessa ilmoitetaan oikein perustein. 

Mikäli aineiston keruussa tai käytössä on mukana opiskelijoita, tulee näissä tapauksissa sopia aina aineiston oikeuksien luovuttamisesta hankkeelle sekä opiskelijoiden käyttöoikeuksista ja niiden rajoista.

Sopimukset tulee laatia mahdollisimman varhaisessa vaiheessa ja niitä tulee tarvittaessa henkilövaihdosten yhteydessä tai olosuhteiden muuttuessa päivittää. Yliopisto tarjoaa mallipohjia sopimiseen. Hankkeen vastuullisen johtajan velvollisuutena on huolehtia siitä, että kaikki hankkeeseen osallistuvat siirtävät oikeutensa yliopistolle ennen hankesopimuksen allekirjoitusta tai viimeistään ennen sopimuksessa määritellyn työn aloittamista.

Huomaa, että oikeuksiensiirtosopimukset on tehtävä aina seuraavissa hankkeissa:

  • Business Finlandin rahoittamat hankkeet
  • EU:n tutkimusohjelmat
  • tilaustutkimukset.

Lisätietoa ja neuvoja saat yliopiston lakiasiantuntijoilta

Oikeuksiin liittyy myös julkaistavan aineiston lisensseistä päättäminen. Lisensoinnilla varmistat aineiston käytettävyyden selkeiden, sinun itse asettamiesi ehtojen mukaan. Jyväskylän yliopistossa käytetään kansainvälisten standardien mukaisia koneluettavia lisenssejä (erit. Creative Commons tai Open Data Commons), joiden avulla aineisto on uudelleenkäytettävissä  niin laajasti kuin mahdollista. Voit valita aineistollesi sopivan lisenssin esimerkiksi Creative Commonsin valintatyökalullaLisensointi on ehdoton edellytys aineiston jatkokäytölle, sillä lisensoimatonta aineistoa on turvatonta jatkokäyttää. 

Sopimuksen laatimisessa huomioitavaa

  • Mitkä aineistot on tarkoitus luovuttaa jatkokäyttöön?
  • Mikäli yksi tai useampi tutkija on tuonut tutkimushankkeeseen mukaan aiempaa tutkimusaineistoa, sisällytetäänkö tämä jatkokäyttöön luovutettavaan aineistoon?
  • Milloin aineisto tai osat siitä voidaan luovuttaa jatkokäyttöön? (Esimerkiksi ennalta määrätty aikataulu tai julkaisujen valmistuminen)
  • Mihin käyttötarkoituksiin aineisto luovutetaan (pelkästään tutkimukseen vai lisäksi myös opetus- ja opiskelukäyttöön)?
  • Kenellä on oikeus tehdä arkistointisopimus tutkimusaineistosta?
  • Halutaanko jatkokäytölle asettaa ehtoja lisenssin avulla?
  • Mikäli jatkokäyttö halutaan tehdä luvanvaraiseksi, kuka päättää luvan myöntämisestä?

Henkilötietojen käsittely ja tutkimuseettiset seikat

Tutkimuseettiset seikat ja tutkittavien laillinen oikeus heitä koskeviin tietoihin vaikuttavat siihen, miten keräät, säilytät ja käsittelet tutkimusaineistoja, siihen kuka saa käyttää aineistoa ja mihin tarkoitukseen, sekä aineiston arkistointiin. Aineistosi sisältämät henkilötiedot vaikuttavat siihen, miten käsittelet ja säilytät sitä. Aineiston tunnisteellisuus myös rajoittaa ja ohjaa sen arkistointimahdollisuuksia. Kun suunnittelet uusien henkilötietojen keruuta, tutustu hyvissä ajoin JYUn tietosuojakoulutustarjontaan

Käsittelenkö tutkimuksessani henkilötietoja?

Jos tutkimukseesi liittyy minkään sellaisen tiedon käsittelyä, joka voidaan joko suoraan tai epäsuorasti yhdistää luonnolliseen, elossa olevaan henkilöön, käsittelet henkilötietoja. Tällöin tietosuojalainsäädäntö koskee tutkimustasi. Henkilötietoja kerätään joko suoraan tutkittavilta (haastattelut, kyselyt, mittaukset, havainnointi jne.) tai välillisesti rekistereistä ja arkistoista.

Suoria tunnisteita ovat tiedot, joista henkilö on välittömästi tunnistettavissa, mm. koko nimi, henkilötunnus, henkilökohtainen sähköpostiosoite, kasvokuva, äänen nauhoite, sormenjälki tai esimerkiksi aivokuva. Epäsuoria tunnisteita ovat sellaiset tiedot, joista yksittäinen henkilö ei ole suoraan tunnistettavissa, mutta jotka yhdistettyinä muuhun henkilöstä saatavilla olevaan tietoon voi johtaa tunnistamiseen. Näitä tietoja ovat mm. auton rekisterinumero, isovanhempien nimet, kotipaikkakunta, siviilisääty, ammatti, etninen tausta ja syntymäaika.

Erityiset henkilötietoryhmät ja arkaluonteiset tiedot

Erityisiä henkilötietoja ovat henkilön etninen alkuperä, poliittinen mielipide, uskonnollinen vakaumus, filosofinen maailmankatsomus, ammattiyhdistysliikkeen jäsenyys, geneettinen data, yksilöivä biometrinen data, terveystiedot sekä seksuaalinen käyttäytyminen tai suuntautuminen. Arkaluonteisia tietoja ovat lisäksi henkilötunnus, pankkitilitiedot sekä rikosrekisteritiedot.

Jos käsittelet erityisiä henkilötietoja, tutkimustasi koskevat erityiset säännökset liittyen henkilötietojen käsittelyn poikkeusperusteen määrittelyyn sekä aineiston säilytykseen ja käsittelyyn.

  • Määrittele arkaluonteisten tietojen käsittelylle tietosuoja-asetuksen edellyttämä poikkeusperuste. Ohjeen tähän löydät tutkijan tietosuojaohjeesta kohdasta Erityiset henkilötietoryhmät.
  • Kerro tutkittaville toimittamassasi informoinnissa sekä tietosuojaselosteessa, kuka hankkeessasi toimii tietojen rekisterinpitäjänä. Erittele myös, mitkä kaikki tahot tulevat käsittelemään henkilötietoja tutkimuksen aikana, sekä miksi.
  • Erittele tutkittaville toimittamassasi tietosuojaselosteessa ja aineistonhallintasuunnitelmassasi, miten huolehdit tietojen tietoturvallisesta ja luottamuksellisesta säilytyksestä ja käsittelystä tutkimuksen aikana.
  • Kuvaile samoin se, miten pseudonymisoit tai anonymisoit tunnisteelliset tiedot siinä vaiheessa, kun et enää tarvitse tunnisteita tutkimuksesi tarkoitusta varten. Miten arkistoit tai hävität tiedot hankkeen päättyessä?
  • Jos yhteistyökumppanisi tai rahoittajasi vaatii tietojen arkaluonteisuuteen perustuen eettisen ennakkoarvioinnin, löydät ohjeet täältä.
  • Pidä tutkimuksen aikana yllä ajantasaista dokumentaatiota siitä, miten käytännössä toteutat ja seuraat tietosuojaselosteessa kuvaamiasi tietosuojatoimenpiteitä.


Tutkijan tietosuojapolku

1. Suunnittele hyvissä ajoin. Kaikki lähtee siitä. Mitä henkilötietoja tarvitset tutkimuksesi toteuttamista varten? Onko tutkimuksesi kertaluonteinen vai seurantatutkimus? Kun laadit tietosuoja-asetuksen edellyttämän tietosuojailmoituksen, sinun on osattava eritellä siinä henkilötietojen käsittelylle selkeä elinkaari, jossa on alku ja loppu. Henkilötietojen säilytystä koskevat minimointi- ja rajoittamisperiaate. Minimointi tarkoittaa sitä, että henkilötietoja tulee kerätä vain välttämätön määrä tutkimussuunnitelmassa määriteltyyn tarkoitukseen nähden, ja että tarpeettomiksi käyvät tunnisteet tulee poistaa heti kun mahdollista. Rajoittamisperiaatteen mukaan henkilötietojen säilytykselle on hyvä pyrkiä määrittelemään ajallinen päätepiste. Huomioi, että tietosuojailmoituksen teksti sitoo sinua jatkossa juridisesti.

2. Anonymisointi, arkistointi ja jatkokäyttö. Henkilötietoja sisältävien eli tunnisteellisten tietojen elinkaaren keskivaihe ja loppu tulee suunnitella hyvissä ajoin, jotta osaat kuvata sen realistisesti tutkittaville toimittamassasi tiedotteessa ja tietosuojailmoituksessa.

3. Valitse tietojen käsittelylle tarkoituksenmukainen oikeusperuste. Suositeltu ensisijainen valittava peruste on yleisen edun mukainen tieteellinen tutkimus. Yleinen etu oikeusperusteena mm. helpottaa aineiston tulevaa mahdollista tutkimuksenjälkeistä säilytystä ja arkistointia. Erityisen painavasta syystä oikeusperusteeksi voidaan valita suostumus. Jos keräät erityisiä henkilötietoja ja käytät oikeusperusteena suostumusta, suostumuksen on lisäksi oltava nimenomainen. Ks. lisätietoja oikeusperusteen valinnasta. Kirjaa valittu peruste tietosuojailmoitukseen.

4. Määritä, kuka toimii tutkimuksessasi rekisterinpitäjänä. Jos toteutat tutkimuksen ulkoista rahoitusta saavassa hankkeessa tai työskentelet työsuhteessa yliopistolla, rekisterinpitäjänä toimii yliopisto. Pääsääntöisesti rekisterinpitäjinä toimivat sekä tutkija että kotiorganisaatio. Konsortiohankkeissa rekisterinpitäjyys on yleensä jaettu partneriorganisaatioiden välillä. Kirjaa rekisterinpitäjä tietosuojailmoitukseen.

5. Informoi tutkittavia ennen tutkimuksen alkua selkeästi siitä, miten ja kenen toimesta heidän henkilötietojaan tullaan käsittelemään ja hallinnoimaan tutkimuksen aikana. JYUn tietosuojaohje tutkijoille neuvoo, miten käsittelet henkilötietoja tietoturvallisesti ja lainmukaisesti tutkimuksen eri vaiheissa. Jos tutkimusasetelmasi on luonteeltaan sellainen (esim. laaja rekisteriaineisto puutteellisin yhteystiedoin), ettei henkilökohtainen informointi ole mahdollista, tutustu yliopiston toimintaohjeisiin.

6. Tee henkilötietoja sisältävälle tutkimuksellesi aina vähintään suppea, vapaamuotoinen riskienarvointi, josta löydät lisätietoa täältä. Jos riski on suuri, tutkimukselle on tehtävä EU:n yleisen tietosuoja-asetuksen mukainen vaikutustenarviointi, Data Protection Impact Assessment (DPIA).
Erityisen suureksi riskiksi katsotaan

  • suuri määrä henkilöitä, joiden tietoja käsitellään
  • suuri määrä tietoa henkilöstä
  • sensitiivinen tieto
  • herkästi haavoittuvien henkilöiden (esim. lasten) tiedot
  • tietojen käyttö automatisoituun päätöksentekoon
  • systemaattinen seuranta.

Tarkemmat ohjeet löydät tutkijan tietosuojaohjeesta.

7. Kun keräät aineiston suoraan tutkittavilta, pyydä heiltä informoinnin yhteydessä lisäksi suostumus osallistua tutkimukseen. Suostumus tutkimukseen osallistumiseen pyydetään myös siinä tapauksessa, kun henkilötietojen käsittelyn oikeusperuste on yleinen etu. Tietoinen suostumus on tutkimuseettinen perusperiaate, ja siitä poikkeaminen edellyttää aina vaikutustenarvioinnin tekemistä.

8. Kun keräät henkilötietoja, pyri minimoimaan tiedot eli välttämään tutkimuskysymyksesi kannalta tarpeettomien henkilötietojen keräämistä. Huomioi kenttätutkimuksessa tallennuslaitteiden suojaus. Siirrä aineisto yliopiston Nextcloudiin, S:-aseman projektikansioon tai U:-aseman kansioon mahdollisimman pian tallennuksen jälkeen.

9. Kun käsittelet henkilötietoja, huolehdi toimenpiteiden tietoturvasta. Valvo, että pääsy tunnisteellisiin tietoihin on vain aineistonhallintasuunnitelmassa ja tietosuojailmoituksessa kuvaamillasi henkilöillä tai tahoilla. Dokumentoi, miten toteutat tutkittaville lupaamasi suojaustoimet ja miten valvot pääsyä tunnisteelliseen aineistoon. Muista, että henkilötietoja saa käsitellä vain siten ja sitä tarkoitusta varten kuin tutkittavia on informoitu tietosuojailmoituksessa ennen tutkimuksen aloittamista. Jos aineiston käsittelyssä tulee esiin tarve poiketa tietosuojailmoituksessa määritellystä, informoi tutkittavia siitä heti ja päivitä tietosuojailmoitus sekä muut tarvittavat dokumentit.

10. Kun tutkimus päättyy, huolehdi aineiston tunnisteellisista osista tutkittaville toimittamasi informoinnin mukaisesti. Mitä osia aineistosta hävität? Mitä mahdollisesti anonymisoit? Mitä säilytät tunnisteellisena, esimerkiksi pseudonyyminä, tulosten verifiointia tai alkuperäiseen tutkimukseesi mahdollisesti sisältyviä jatkotoimia varten? Mitä arkistoit, minne, ja millä käyttörajoituksilla?

Varmista, että henkilötietojen käsittely on kuvattu yhdenmukaisesti aineistonhallintasuunnitelmassasi sekä tutkittaville toimittamassasi tiedotteessa ja tietosuojailmoituksessa.

Jos sinulla herää kysyttävää aineistosi käsittelystä tutkimuksesi päättyessä, ota yhteyttä Avoimen tiedon keskukseen: researchsupport-osc@jyu.fi.

Tarvitsetko apua tietosuojakysymyksissä? Ota yhteyttä yliopiston tietosuojavastaavaan: tietosuoja@jyu.fi.

Eettinen ennakkoarviointi ihmistieteissä

Saatat tarvita tutkimuksellesi ennakkoarvioinnin yliopiston Ihmistieteiden eettiseltä toimikunnalta tai Keski-Suomen sairaanhoitopiirin eettiseltä toimikunnalta, jos tutkimusasetelmasi täyttää jonkin Tutkimuseettisen neuvottelukunnan määrittelemstä kuudesta kriteeristä:

1) Tutkimukseen osallistumisessa poiketaan tietoon perustuvan suostumuksen periaatteesta,
2) tutkimuksessa puututaan tutkittavien fyysiseen koskemattomuuteen,
3) tutkimus kohdistuu alle 15-vuotiaisiin ilman huoltajan erillistä suostumusta tai informointia, jonka perusteella huoltajalla olisi mahdollisuus kieltää lasta osallistumasta tutkimukseen,
4) tutkimuksessa tutkittaville esitetään poikkeuksellisen voimakkaita ärsykkeitä,
5) tutkimuksessa on riski aiheuttaa tutkittaville tai heidän läheisilleen normaalin arkielämän rajat ylittävää henkistä haittaa tai
6) tutkimuksen toteuttaminen voi merkitä turvallisuusuhkaa tutkittaville tai tutkijalle tai heidän läheisilleen.

Ota tarvittaessa yhteyttä yliopiston Ihmistieteiden eettiseen toimikuntaan hyvissä ajoin ennen kuin aloitat tutkimuksen. Ennakkoarviointia ei voi pyytää enää tutkimuksen käynnistymisen jälkeen. Täältä löydät lisätietoa ennakkoarvioinnista ja tilanteista, joissa sitä ei tarvita.


2. Aineiston keruu ja analyysi

Haastatteluaineistojen keruu



Haastattelut Zoomilla ja Teamsilla


Käytä haastatteluaineistojen keruussa Zoomia tai MS Teamsia, sillä yliopisto tarjoaa niiden käyttöön tukea, ja niiden asetukset on säädetty vastaamaan yliopiston vaatimuksia. Vaihtoehtoisesti voit käyttää yliopiston suojattua laitetta, jota voit tiedustella yksiköstäsi tai Digipalveluista.

Käytä aina Zoomia tai vaihtoehtoisesti yliopiston laitteella (nauhuri, puhelin tai kannettava tietokone), kun keräät haastattelussa erityisiin henkilötietoryhmiin kuuluvia henkilötietoja ja muutoin arkaluonteisia tai salassa pidettäviä tietoja. Ohjeet Zoomin käytöstä haastattelujen tietoturvalliseen tallentamiseen, siirtoon ja säilytykseen löydät intranet Unosta. Yliopiston laitteita käytettäessä huolehdi siitä, että nauhuri salaa tallennettavan sisällön, salaat erikseen puhelimen muistikortin puhelimen asetuksista, ja että käyttämäsi kannettavan tietokoneen tallennustila on salattu. Lisätietoa näistä löydät Intranet Unosta.

Ns. tavallisia, ei-arkaluonteisia henkilötietoja sisältävän haastatteluaineiston voit kerätä MS Teamsilla.

Haastattelut älypuhelimella

Älypuhelimen ominaisuudet kuten datan siirtyminen palveluntarjoajan pilvitallennustilaan vaarantavat salassa pidettävän aineiston turvallisuuden. Huomioi nämä, kun tallennat älypuhelimella haastatteluja, jotka sisältävät henkilötietoja ja/tai salassa pidettävää tietoa:

  • Poista puhelimesta synkronointi valmistajan tai Googlen pilvipalveluihin.
  • Siirrä tallenteet turvalliseen talletuspaikkaan (CollabRoom) ja poista ne puhelimesta.
  • Käytä puhelimen lukitsemiseen salasanaohjeen mukaista, vähintään 6 merkin pituista PIN koodia.
  • Aseta näytön aikakatkaisu on 30 sekuntiin.
  • Ilmoita laitteen katoamisesta viipymättä Digipalveluiden palvelupisteeseen: palvelupiste@jyu.fi, puhelin 041 260 3600.
  • Jos haastattelut sisältävät arkaluonteisia henkilötietoja tai käsiteltävä tieto on yliopiston ohjeen mukaista salaista tietoa, käytä lisäksi puhelimen lukitsemiseen 14 merkin mittaista salasanaa.

Dokumentaatio tutkimuksen aikana

Oleelliset kysymykset: Miten dokumentoin aineistoni siten, että se on sekä minun että muiden löydettävissä, saavutettavissa ja käytettävissä myös huomenna, viikon kuluttua ja vielä vuosien päästä? Jos täysin tuntematon tutkija löytäisi aineistoni, hahmottaisiko hän, mistä siinä on kyse? Mitä minun tulee tehdä, jotta hän ymmärtäisi ja pystyisi käyttämään aineistoani?

Dokumentaatio on aineiston menetelmien, kokoamisen ja käsittelyn dokumentoimista ja mm. tiedostojärjestelmän (kansiot ja alakansiot, nimeämiskäytännöt jne.) tutkimuksenaikaista kuvailua. Suurin osa dokumentaatiosta on yksinkertaisesti hyvää tieteellistä käytäntöä, jota toteutat jo nyt päivittäin tutkimuksen arjessa. Dokumentaatiota on muun muassa

  • muuttujien ja keskeisen sanaston sekä mittayksiköiden kirjallinen kuvailu 
  • taulukkomuotoinen inventaario haastattelujen perustiedoista, asetelmasta ja toteutuksesta
  • koodikirjat, kenttä- ja laboratoriopäiväkirjat
  • teknisten laitteiden tuottama tekninen metatieto kuten kalibraatiot. 

Dokumentaatiota on erittäin tärkeää pitää jatkuvasti ajan tasalla. Yhtä aikaa aineistotyön kanssa tehtynä se on pieni vaiva, mutta jälkikäteen käytännössä mahdotonta.

Tutkimuksen perusaineistoja kerätään kyselylomakkeilla, haastatteluilla, videoimalla sekä erilaisilla laitteilla ja antureilla. Erilaiset mittaus- ja tiedonkeruutavat tuottavat erilaisia metatieto- ja tiedostoformaatteja. Aineiston analyysivaiheessa raaka-aineistosta tuotetaan empiirisen tutkimuksen varsinaiset tulokset. Kun raaka-aineistoa käsitellään, yhdistellään ja analysoidaan, syntyy erilaisia työstö- ja tulosaineistoja. Tutkimuksen sujuvuuden ja toistettavuuden kannalta on tärkeää, että käsittelet ja kuvailet syntyviä aineistoja suunnitelmallisesti ja yhteistyökumppaniesi kanssa etukäteen sovitulla tavalla. 

Tieteenalakohtaisia ohjeita [täydentyy kevään 2021 aikana]

Hyviä käytäntöjä

  • Säilytä kuvailutieto erillisissä tiedostoissa (esim. Readme-tiedostot, inventaarioexcelit) aineiston yhteydessä alakansiossa, jolle annat nimen /DOCUMENTATION. Tämä on tärkeää, jotta dokumentoivat tiedostot löytää sellainenkin henkilö, joka ei tunne aineiston rakennetta tarkemmin.
  • Suunnittele, millaista dokumentaatiota tuotat ja mistä sen löytää, jollet käytä /DOCUMENTATION-alakansiota. Mikäli mahdollista, käytä dokumentaatiossa oman alasi metadatastandardeja.
  • Sovi tutkimusryhmän kesken jo tutkimuksen suunnitteluvaiheessa yhtenäinen käytäntö tiedostojen ja kansioiden nimeämiselle.
  • Sovi yhtenäinen tapa, jolla tallennatte tiedostot kansioihin ja alakansioihin. Looginen kansiorakenne tehostaa työtä ja vähentää katoamisriskiä.
  • Käytä avoimia tiedostoformaatteja kaupallisten formaattien sijaan. Avoimet, standardimuotoiset tiedostoformaatit takaavat parhaiten tietojen saavutettavuuden vielä useiden vuosien kuluttua. Esimerkkejä löydät esim. UK Data Servicen formaattivertailutaulukosta.

Metadatan laatiminen ja päivittäminen

Metadata on yleistä bibliografista kuvailutietoa tutkimusaineistosta (esim. nimi, omistaja, tekijät, jakelija, aikaväli, lyhyt kuvaus, sijainti, lisenssitiedot jne.) Se on kuin aineiston käyntikortti, jolla kuvaat toisille, mistä aineistossasi on kyse. Ajantasainen metadata on avain aineiston löydettävyyteen ja saavutettavuuteen. JYU sekä useimmat rahoittajat edellyttävät vähintään metadatan julkaisemista, vaikkei itse aineistoa voitaisi perustellusta syystä julkaista. Tutkimuksen edetessä metatiedot on hyvä pitää jatkuvasti ajan tasalla. Tällöin ne pysyvät hallittavissasi eivätkä tuota merkittävästi lisätyötä.

Jyväskylän yliopistossa metadataa ylläpidetään tutkimustietojärjestelmä Converiksen Tutkimusaineisto-osiossa. Jokaisesta tutkimusaineistosta on hyvä laatia Converikseen kuvailutiedot sisältävä kirjaus. Kun kuvailet aineistoja, jaottele ne sellaisiksi kokonaisuuksiksi, että voit kuvailla kunkin datasetin yksiselitteisesti. Tarkemmin kuvailtuja aineistoja voit niputtaa Converiksessa suuremmiksi kokonaisuuksiksi laajemman emoaineiston alle. Kun kirjaat aineistosi metatiedot Converikseen, voit samalla tilata Converiksen kautta tukea aineistonhallinnan kysymyksiisi yliopiston aineistoasiantuntijoilta. Yksityiskohtaiset ohjeet metadatan kirjaamiseksi tutkimuksesi eri vaiheissa löydät metadatan kirjausohjeista (Intranet Unossa). 

Aineiston laatu ja eheys  

Aineiston yhtenäisyydestä ja laadusta huolehtiminen on tärkeä osa aineistonhallintaa. Suunnittele ja kuvaa aineistonhallintasuunnitelmassasi laadunvarmistusta koskevat vaatimukset sekä toimenpiteet, joilla turvaat sen, ettei aineisto katoa tai korruptoidu sen käsittelyn ja säilytyksen aikana. Aineistotyypistä, laitteistosta ja menetelmistä riippuen eheyttä ja laatua voidaan varmistaa esimerkiksi 

  • kalibroimalla mittausvälineitä havaintotarkkuuden ja -skaalan monitoroimiseksi
  • tarkistuttamalla litteroitu haastatteluaineisto ulkopuolisella asiantuntijalla 
  • käyttämällä alan standardoituja menetelmiä, laitteita ja ohjelmistoja
  • tekemällä kyselyaineiston puuttuvista arvoista katoanalyysi
  • ottamalla datasta tarkistussumma puuttuvien tai poikkeavien arvojen havaitsemiseksi. 

Versionhallinta

Versionhallinta on keskeinen osa aineiston dokumentaatiota ja sen eheyden varmistamista. Yksinkertaisin manuaalinen keino versionhallintaan on tiedostojen nimeäminen siten, että version numero merkitään nimen loppuun. Monet ohjelmistot myös tuottavat automaattista versiolokia, joten on hyvä tutustua käytetyn järjestelmän asetuksiin. Sovi tutkimusryhmän kanssa yhtenäinen käytäntö versioiden nimeämiseen ja versioiden synkronointiin sekä siihen, montako versiota aineistosta tuotetaan ja säilytetään. Jyväskylän yliopisto tarjoaa GitLab-palvelua koodin versionhallintaan. 

Pseudonymisointi ja anonymisointi

Kun käsittelet tutkimuksessasi henkilötietoja, huolehdi niiden pseudonymisoinnista tai mahdollisuuksien mukaan anonymisoinnista.

Pseudonymisointi tarkoittaa sitä, että suorat tunnisteet on korvattu koodilla tai peitenimillä, ja koodiavainta säilytetään erillään analyysiaineistosta. Aineiston arkaluonteisuuden asteesta riippuen pseudonymisointi saattaa riittää suojauskeinoksi tutkimushankkeen aikana, kunhan koodiavainta säilytetään arkaluonteiselle aineistolle soveltuvassa paikassa ja sen pääsyoikeudet ja käsittelytavat on selkeästi sovittu ja määritelty. Tietosuojalainsäädännössä suositellaan suorien tunnisteiden hävittämistä heti siinä vaiheessa, kun niitä ei enää tarvita tutkimuksen tarkoitusta varten.

Muista: Niin kauan kuin tiedot on mahdollista palauttaa tunnistettaviksi koodiavaimen tai muiden tietojen avulla, ne ovat pseudonyymejä, eivät anonyymejä, ja eurooppalainen tietosuoja-asetus sekä kotimainen tietosuojalaki koskevat tutkimustasi. Lue lisää pseudonymisoinnin ja anonymisoinnin eroista täältä

Anonymisointi tarkoittaa sitä, että aineiston tietoja ei voida kohtuullisin ponnistuksin yhdistää yksittäiseen luonnolliseen henkilöön, eli kaikki tunnisteelliset tiedot on poistettu. Tällöin tietoja ei voida enää kohtuullisin ponnistuksin palauttaa tunnistettaviksi, Anonymisoituun aineistoon ei myöskään voi enää yhdistää uusia henkilötietoja. Aineiston koosta ja laadusta riippuen anonymisointi vaatii huomattavasti aikaa ja muita resursseja, joten toimenpiteet on hyvä suunnitella mahdollisimman varhaisessa vaiheessa ja kirjata aineistonhallintasuunnitelmaan. Tietoarkiston Aineistonhallinnan käsikirjassa on seikkaperäiset ohjeet määrällisten ja laadullisten aineistojen anonymisoinnin suunnitteluun ja toteuttamiseen.


3. Tallentaminen, jakaminen ja pääsynhallinta 

Oleellisia kysymyksiä: Minne tallennat aineistosi? Miten se varmuuskopioidaan? Miten jaat aineistoa tarvittaessa tietosuojan huomioiden? Miten valvot pääsyä aineistoon? Siirrätkö aineistoa EU:n ja ETA-alueen ulkopuolelle?

Tallennuspaikan valinta 

Aineistolle valittava, tarkoituksenmukaisin tallennusratkaisu riippuu riippuu aineiston ominaisuuksista: koosta, tyypistä sekä mahdollisten henkilötietojen arkaluonteisuudesta. Lähtökohtaisesti kaikki JYUssa tuotettu ja käytetty tutkimusaineisto tallennetaan yliopiston tai CSC:n järjestelmiin. Omien laitteiden tai ulkoisten tallennusvälineiden käyttöä tulee välttää.

Yliopiston tarjoamia tallennuspaikkoja ovat

  1. Nextcloud: pilvitallennuspalvelu, jolla saat Dropboxin ja OneDriven hyvät puolet tietäen, että aineistosi pysyy yliopiston palvelimilla ja hallussasi. Nextcloudiin saa henkilökohtaisen tilan lisäksi ryhmätyökansioita (vrt. S:-asema), jotka säilyvät, vaikka yksittäinen tutkija poistuisikin yliopiston palveluiden piiristä. HUOM: Nextcloud ei sovellu videoaineistolle. Lisätietoa ohjeista.
  2. Verkkolevyt (U:- ja S:-asemat). Ne ovat nopeita, tietoturvallisia ja toimintavarmoja, mutta niiden etäkäyttö ja tietojen jakaminen on vaikeaa.
  3. Tutkimusmoniviestin: verkkoselaimella toimiva palvelu ääni- ja videotiedostojen tallentamiseen ja käyttämiseen suoratoistolla (HUOM: ei sensitiiviselle aineistolle).
  4. Arkaluonteiselle ja salassa pidettävälle aineistolle CollabRoom-pilvipalvelu, jossa säilytät ja jolla jaat aineistoa tietoturvallisesti myös yliopiston ulkopuolisille partnereille. 
  5. Jyväskylän yliopiston kiintiö CSC:n IDA-palvelussa

Nextcloudin ja CollabRoomin tilaat HelpJYUsta.

Varmuuskopiointi

Yliopiston järjestelmät ottavat automaattisesti säännöllisiä varmuuskopioita. Sinun tulee kuitenkin suunnitella ja toteuttaa varmuuskopioiden ottaminen siinä vaiheessa, kun teet aineistoon merkittäviä muokkauksia. Säilytä alkuperäiset tiedostot eli ns. masterfilet erillään analyysitiedostoista ja tee kaikki muokkaukset analyysitiedostoihin. Näin aineisto ei katoa, jos datan prosessoinnissa tapahtuu jokin virhe. 

Pääsynhallinta

  • Nimeä ja dokumentoi vastuuhenkilö, joka valvoo pääsynhallintaa aineistoihin.
  • Pidä yllä tietoja siitä, kuka aineistoon on päässyt käsiksi ja kenellä on pääsyoikeus mihinkin osaan aineistosta.
  • Määrittele, kenellä on aineistoon katselu-, muokkaus- ja poisto-oikeudet.
  • Jos käsittelet henkilötietoja tai muutoin luottamuksellisia tai arkaluonteisia tietoja, määrittele erikseen, kenellä on pääsy niihin. 
  • Millä perusteella kukin käyttöoikeus (muokkaus, katselu, poisto) on myönnetty?
  • Miten valvonta toteutuu käytännössä (esim. salasanalla suojatut käyttöoikeudet, muutoslokin seuranta, kryptaus, fyysisten tilojen valvonta, lukitut säilytyskaapit)? 
  • Jos käsittelet erityisiä henkilötietoja, huolehdi siitä, että noudatat tutkittaville antamaasi kuvausta.  

Kuvaa ratkaisusi aineistonhallintasuunnitelmassasi.

Henkilötietoja sisältävän ja sensitiivisen aineiston tallennus ja siirto

Käsittele henkilötietoja sisältävää aineistoa alkuperäisessä tietojärjestelmässä aina, kun se on mahdollista. Henkilötietoja ei lähtökohtaisesti kannata siirtää ulos alkuperäistä järjestelmästä, esimerkiksi Excel-taulukkoon. Alkuperäisessä tietojärjestelmässä pystyt pitämään yllä lokitietoja siitä, kenellä on ollut pääsy aineistoon. Tämä on erityisen tärkeää, kun aineisto on arkaluonteista tai luottamuksellista. 

Jos siirrät henkilötietoja sisältävää aineistoa, huolehdi, että siirto tapahtuu tietoturvallisesti ja luottamuksellisesti. JYUn tallennuspalvelu CollabRoom soveltuu myös tietojen jakamiseen yhteistyökumppaneille yliopiston ulkopuolella. Jos joudut siirtämään tietoja sähköpostitse, käytä turvasähköpostia tai lähetä aineisto salattuna liitetiedostona. Varmista, että vain nimetyillä vastaanottajilla on pääsy aineistoon. Sovi vastaanottajan kanssa tietojen käsittelyn ehdoista.

Huolehdi, että siirrät aineistoa vain siten kuin olet kuvaillut tutkittaville antamassasi tietosuojailmoituksessa tai informoinnissa, jonka olet antanut tutkittaville esimerkiksi kyselyn tai haastattelun yhteydessä.   

Kansainvälisessä yhteistutkimuksessa voi syntyä tarve siirtää henkilötietoja sisältävää aineistoa joko muihin EU:n ja Euroopan talousalueen maihin tai niiden ulkopuolelle kolmansiin maihin. Syynä voi olla esimerkiksi se, että analyysiin tarvittava laitteisto on saatavilla vain jossain tietyssä maassa. Huomioi tällaisessa tilanteessa seuraava: 

  • Saat siirtää henkilötietoja EU:n ja ETA-alueen jäsenmaihin samoilla perusteilla kuin Suomen sisällä. Tietosuoja-asetuksessa on kuitenkin kansallista liikkumavaraa, joten säädösten yksityiskohdat voivat vaihdella maittain. Selvitä siksi hyvissä ajoin kansainvälisten yhteistyökumppaneiden kanssa kunkin maan erityissäädökset henkilötietojen tutkimustarkoituksessa tapahtuvan käsittelyn osalta. Dokumentoikaa ne tietosuojailmoitusta varten. 
  • Jos henkilötietoja on tarpeen siirtää EU- ja ETA-alueen ulkopuolelle, tietojen siirrolle on oltava Suomessa laillinen peruste, joka rekisterinpitäjänä toimivan tahon (tutkija, tutkimusryhmä tai yliopisto) tulee varmistaa. Lisäksi siirrossa tulee noudattaa tietosuoja-asetuksessa määriteltyjä erityisperiaatteita. Jos siirrät hankkeessasi henkilötietoja EU:n ja ETA-alueen ulkopuolelle, ole ensin yhteydessä yliopiston tietosuojavastaavaan: tietosuoja@jyu.fi

4. Aineiston avaaminen, tutkimuksenjälkeinen säilytys ja hävittäminen

Aineistojen avaaminen Jyväskylän yliopistossa

Jyväskylän yliopisto pyrkii mahdollisimman laajaan tutkimusaineistojen ja niiden kuvailutietojen avoimuuteen. Samalla se tunnistaa, että aineiston luonteesta riippuen avoimuudessa on eri asteita:

  • Aineiston kuvailu- eli metatiedot ovat avoimesti saatavilla, kun ne siirretään tutkimustietojärjestelmä Converiksen Tutkimusaineistot-osiosta julkaistavaksi yliopiston JYX-julkaisuarkistossa, tai se julkaistaan muussa digitaalisessa arkistossa.
  • Aineisto tai soveltuvat osat siitä voidaan avata eli julkaista joko täysin avoimesti tai tutkijan määrittelemän rajoitetun käyttäjäkunnan saataville (esim. vain tutkimuskäyttöön) kuratoidussa digitaalisessa arkistossa, joka tarjoaa aineistolle pysyvän tunnisteen, lisenssin ja muut käytettävyyden työkalut.
  • Aineistojen julkaisemista ohjaa "Niin avointa kuin mahdollista, niin rajoitettua kuin tarpeen" -periaate. Sen mukaisesti tutkija on aineistonsa paras tuntija ja harkitsee, mitä osia aineistosta voidaan julkaista, mitä toimenpiteitä julkaiseminen vaatii, ja mitä muulle aineistolle tehdään (arkistointi, hävittäminen). Näin suunnitelma kattaa aineiston koko elinkaaren. Jollet voi perustellusta syystä (esim. tietosuoja, liikesalaisuus) julkaista aineistoa, dokumentoi perustelut aineistonhallintasuunnitelmaasi.
  • Valitse julkaistavaksi ne aineiston osat, jotka ovat relevantteja ja keskeisiä tutkimustulosten todentamista varten ja joilla on eniten uudelleenkäyttöarvoa. Vaikka osa aineistosta olisi arkaluonteista tai sisältäisi henkilötietoja, mukana voi kuitenkin olla arvokkaita osia, joiden julkaisemiselle ei ole estettä.
  • Kun suunnittelet aineistojen julkaisemisen alusta asti, vältyt turhalta ja vaivalloiselta työltä tutkimuksen edetessä ja saat aineistot julkaistua vaivatta. Julkaise aineistot kuvailtuina, järjestettyinä kokonaisuuksina luotettavissa, kuratoiduissa data-arkistoissa (ks. sopivan arkiston hakuohje edempänä sivulla). Näin takaat, että aineistosi on löydettävissä, saavutettavaa, teknisesti yhteentoimivaa ja uudelleenkäytettävää. Kerro julkaistavan aineiston kuvailutiedoissa aineistojen tekijätiedot, aineistoa koskevat sopimusehdot sekä käyttölisenssi. Näin varmistat, että muiden on mahdollista käyttää aineistoa uudelleen. Ilman selkeästi ilmoitettua käyttöehtolisenssiä aineisto on käyttökelvotonta.

Näin valmistelet aineistosi julkaisemisen

Aineiston avaamisen edellytyksenä on metatietojen ja aineiston dokumentaation ajantasaisuus. Julkaise aineistostasi aina peruskuvailutiedot eli metadata, vaikket voisi perustellusta syystä julkaista itse aineistoa. Tämä tapahtuu tutkimustietojärjestelmä Converiksen Tutkimusaineistot-osiossa. Sinne kirjataan aineiston perustietojen lisäksi tiedot siitä, missä julkaiset aineiston sekä mahdolliset julkaisemisen esteet. Näin yliopistolle jää arvokas tieto siitä, missä sen aineistoja säilytetään tai on julkaistu. Metadatan julkaiseminen kattaa myös useimpien merkittävien rahoittajien vaatimukset aineiston avoimuuden osalta tilanteessa, jossa aineiston avaamiselle on perusteltu este kuten arkaluonteisuus tai salassapitoveloite.

Varmistat aineiston laadun ja käyttöarvon tutkimushankkeen alusta asti, kun säilytät menetelmiä, aineiston rakennetta ja sisältöä sekä muuta tutkimuksen kannalta oleellista tietoa koskevan dokumentaation aineiston yhteydessä /DOCUMENTATION-nimisessä alakansiossa. Lue lisää dokumentaation hyvistä käytänteistä täältä. Aineiston yleisiä metatietoja ylläpidät yliopiston Converiksen Tutkimusaineistot-osiossa.

Luo aineistoistasi metatietokuvailu Converikseen jo hankkeesi alkuvaiheessa, jolloin voit päivittää sitä työn edetessä. Tällöin sitä ei tarvitse vielä julkistaa, vaan säilytät kuvailun omana tai tutkimusryhmäsi tietona siihen asti, että haluat julkaista metatiedot sekä mahdollisesti itse aineiston muulle maailmalle. Tässä vaiheessa voit pyytää Converiksen kautta valmiiden metatietojen ja koko aineiston julkaisemista JYX-julkaisuarkistossa. Kohta kohdalta -ohjeen löydät täältä.


Miten toimitan aineistoni julkaistavaksi JYXissä?

Vaihtoehto 1. Jos säilytät aineistoa Nextcloud-ryhmäkansiossa (JYU Groups, suositeltu vaihtoehto) tai henkilökohtaisessa Nextcloud-kansiossasi, toimi näin:

1. Varmista, että kaikki tarvittavat dokumentaatio- ja aineistotiedostot ja alakansiot ovat mukana kansiossa oikeassa järjestyksessä, ja että tiedostot on nimetty selkeästi. Dokumentaatiotiedosto kannattaa sijoittaa hakemiston juureen, mistä se on helppo avata ensimmäisenä.

2. Klikkaa ensin kansion oikealla puolella olevaa linkkikuvaketta.

" "

3. Klikkaa Share link -komennon vieressä olevaa +-kuvaketta, jolloin saat jakoasetukset näkyviin.

" "

4. Vaihda jakoasetukseksi Allow upload and editing (oletuksena Read only) ja deaktivoi klikkaamalla valikossa oletuksena aktiivisena oleva umpeutumispäivämäärä.

" "

5. Klikkaa Copy to clipboard -kuvaketta ja kopioi linkkiteksti Notepadille tai suoraan Converiksen kenttään.

" "

6. Tarkista, että metatiedot ovat Converiksessa "Täydennettävänä"-tilassa. Sijoita linkki Converis-lomakkeen ”Aineiston Nextcloud-jakolinkki julkaisua varten”-kenttään.

" "

Vaihtoehto 2. Jollet säilytä julkaistavaa aineistoa Nextcloudissa, toimi näin:

1. Järjestä julkaistava aineisto- ja dokumentaatiotiedostot ja -alakansiot selkeästi nimettyinä pääkansioon, jonka haluat julkaista.

2. Muuta kansio pakatuksi .zip-kansioksi: klikkaa julkaistavaa kansiota hiiren oikealla näppäimellä, valitse Send to ja Compressed (zipped) folder:

" "

3. Lähetä .zip-kansio Avoimen tiedon keskukseen, joka hoitaa aineiston linkityksen Converikseen JYXissä julkaistavaksi: researchsupport-osc@jyu.fi. Voit käyttää JYUn Funet File Sender -ohjelmaa, jotta sähköpostin liitetiedoston maksimikoko ei ylity.


Miten toimin, kun tarvitsen aineistolleni kiireellisesti DOI-tunnisteen?

Jos tarvitset aineistollesi kiireellisellä aikataululla pysyvän tunnisteen viittausta varten, on se mahdollista julkaisemalla aineisto tai sen metatiedot JYUn JYX-julkaisuarkistossa. Toimi näin:

  • Jos aineistokokonaisuus on valmis julkaistavaksi ja haluat julkaista sen JYXissä, kirjaa aineiston kuvailutiedot Converis-tutkimustietojärjestelmään ohjeen mukaan. Valitse Converiksen aineisto-osion viimeiseltä välilehdeltä julkaisevasi aineisto metatietoineen ja liitä lomakkeen "Aineiston Nextcloud-jakolinkki julkaisua varten" -kenttään jakolinkki julkaisukelpoiseksi käsiteltyyn ja järjestettyyn aineistoon, jonka olet tallentanut yliopiston Nextcloud-tallennuspalveluun. Jos tarvitset neuvoja aineiston julkaisukuntoon saattamisessa tai apua aineiston siirtämisessä Nextcloudiin tai haluat toimittaa aineiston muulla tavalla, ota yhteyttä osoitteeseen researchsupport-osc@jyu.fi. Kirjoita lomakkeen "Muuta lisätietoa"-kenttään, millä aikataululla toivot julkaisemista. Tallenna tiedot sitten Tarkistettavana -tilaan (englanninkielisessä näkymässä For validation). Tällöin Avoimen tiedon keskuksen aineistoasiantuntija tarkistaa kuvailutiedot ja siirtää ne julkaistavaksi JYX-julkaisuarkistossa, joka tarjoaa aineistolle kaivatun pysyväistunnisteen, DOIn.
  • Jos aineistokokonaisuus on vielä keskeneräinen, mutta tarvitset pysyvän tunnisteen viitettä varten jo etukäteen, toimi kuten edellä, mutta valitse Converiksen aineisto-osion viimeiseltä välilehdeltä julkaisevasi pelkät aineiston metatiedot ja tallenna tiedot Tarkistettavana -tilaan. Huolehdi tätä ennen, että kaikki Converiksessa kysytyt kuvailutiedot ovat ajan tasalla. Nextcloud-linkki tai toisen data-arkiston linkki aineistoon voidaan tässä tapauksessa täydentää tietoihin siinä vaiheessa, kun ne ovat valmiit julkaistavaksi. Tee tällöin kuvailutietojen täydentämisestä erillinen pyyntö osoitteeseen researchsupport-osc@jyu.fi tai käyttämällä aineiston metatietojen viimeisen välilehden Muutospyynnöt OSC:lle -kenttää.

Sopivan data-arkiston valinta

Hyviä käytäntöjä

  • Julkaise aineistosi ensisijaisesti tieteenala- tai tutkimusalakohtaisessa digitaalisessa tietoarkistossa (eng. repository). Alakohtaisessa arkistossa data päätyy varmimmin alasi tutkijoiden löydettäväksi.
  • Fairsharing- ja Re3data-portaaleissa voit selailla ja hakea sopivaa arkistoa.
  • Jos sopivaa alakohtaista tietoarkistoa ei ole saatavilla, julkaise datasi yliopiston JYX-julkaisuarkistossa. HUOM: JYXissä julkaistavien aineistojen tulee toistaiseksi olla tiedostokooltaan max. 3-4 GB. Tiedostoja voi kuitenkin julkaista suuriakin määriä, vain yksittäisen tiedoston maksimikoko on määritely.
  • Käytä yleisiä data-arkistoja kuten Zenodoa ja figsharea vasta viimeisenä vaihtoehtona. Niiden sisällön sekalaisuus heikentää datan löydettävyyttä ja vaikeuttaa löydösten arviointia.
  • Pelkkä omilla tai hankkeen kotisivuilla julkaiseminen ei täytä rahoittajien vaatimuksia eikä yliopiston odotuksia aineiston löydettävyydestä ja saavutettavuudesta.


Näin tunnistat suositeltavan data-arkiston

  • Arkisto on alasi tutkijoiden laajalti käyttämä
  • Arkisto antaa aineistolle pysyvän tunnisteen, kuten DOI tai URN
  • Arkisto julkaisee koneluettavan metadatan ja käyttää tunnettua metadatastandardia
  • Arkistolla on toiminnan luotettavuutta osoittava sertifikaatti, esimerkiksi Core Trust Seal ja ISO 16363 –standardi
  • Arkisto antaa sinun valita käyttöehdot, joilla aineisto on jatkokäytettävissä.

 

Tietoarkisto

Tietoarkisto (FSD) on tutkimuksen ja opetuksen valtakunnallinen palveluinfrastruktuuri. Se arkistoi ja välittää sähköisiä tutkimusaineistoja tutkimukseen, opetukseen ja opiskeluun. Yksikkö toimii Tampereen yliopiston yhteydessä.

Tietoarkisto edistää tieteen avoimuutta, läpinäkyvyyttä, tiedon kumuloitumista ja olemassa olevan tiedon tehokasta tutkimuskäyttöä ja toteuttaa vastuullisesti FAIR-periaatteita. FAIR tarkoittaa, että palvelut ja aineistot ovat helposti löydettäviä, saavutettavia, yhteentoimivia ja jatkokäytettäviä. Toiminnan perusta on asiantunteva, nopea, tasapuolinen ja maksuton palvelu.

Tietoarkisto vastaanottaa digitaalisia tutkimusaineistoja, jotka sopivat esimerkiksi yhteiskuntatieteiden, humanististen alojen, kasvatustieteiden sekä terveystieteiden tutkimukseen, opetukseen ja opiskeluun. Aineistojen tulee olla teknisesti ja juridisesti arkistointikelpoisia. Tietoarkisto tarkistaa aineistot ja niiden dokumentaation.

Kielipankki


Kielipankki on vakiintunut tieteenalakohtainen tietoarkisto. Se on kieliaineistoja käyttävien tutkijoiden palvelukokonaisuus. Kielipankissa on laaja valikoima teksti-, video- ja puheaineistoja, joista voi tehdä monipuolisia hakuja. Voit tutkia ja käsitellä aineistoja virtuaalisessa työtilassa Kielipankin työkaluilla tai ladata niitä omalle koneellesi.

Monet aineistot ovat käytettävissä avoimesti, osa puolestaan oman yliopiston myöntämin tunnuksin. Suojattujen aineistojen käyttöoikeuksia voi hakea sähköisesti. Kielipankin peruskäyttö on tutkijoille ja opiskelijoille ilmaista.

Ohjeet Kielipankin sisällöntuottajille

JYX

JYX on Jyväskylän yliopiston julkaisualusta julkaisuille ja tutkimusaineistoille. JYX tarjoaa aineistoille pysyvät tunnisteet (DOI, URN). Palveluun syötettyjen datasettien metatiedot toimitetaan kansalliseen METAX-katalogiin, josta ne päätyvät JYXin lisäksi löydättäväksi kansallisesta ETSIN-palvelusta ja keskeisimmistä eurooppalaisista tutkimusaineistojen hakupalveluista.

Datan julkaiseminen JYXissä on yksinkertaista: syötä vain datan metatiedot tutkimustietojärjestelmä Converikseen ja pyydä sieltä aineiston julkaisemista. Ohjeet löydät täältä.


Aineiston säilytys tutkimuksen jälkeen ja hävittäminen

Mikäli et julkaise aineistoa mutta aiot säilyttää sitä tutkimuksen päättymisen jälkeen määräajan tulosten todentamista ja mahdollista omaa jatkotutkimustasi varten, suunnittele säilytysaika ja ilmoita se aineistonhallintasuunnitelmassa. Mainitse myös säilytyssijainti. Ei-sensitiivisille aineistoille suositeltavin säilytysratkaisu on Nextcloud-ryhmäkansio, jossa aineistot pysyvät käytettävissä myös yksittäisten kansiota hallinnoivien tutkijoiden poistuessa yliopistolta.

Hyviä käytäntöjä

  • Ennen hävittämistä tarkista omalta laitokseltasi, kuinka kauan tutkimusaineistoja tulee säilyttää oppiaineessasi.
  • Paperiset aineistot hävitetään luottamuksellisten paperien kierrätyslaatikkoon, josta ne päätyvät silppuriin. Useissa yliopiston rakennuksissa on tähän tarkoitukseen tummanharmaita lukollisia tietoturva-astioita.
  • Palautettavat tallennusvälineet (esim. nauhurit) tyhjennetään ylikirjoittamalla ennen palautusta. Ylikirjoittaminen tarkoittaa sitä, että tallennusväline täytetään useita kertoja satunnaisella datalla, jonka jälkeen ei pystytä enää saamaan esille alkuperäisiä tiedostoja. Avoimen lähdekoodin ylikirjoitusohjelmistoja ovat mm. Eraser ja WipeFile. Kysy tarvittaessa neuvoa yliopiston tietoturva-asiantuntijalta HelpJYU-portaalin kautta.
  • Hävitettävät tallennusvälineet tyhjennetään ylikirjoittamalla ja viedään lukittuun luottamuksellisen materiaalin kierrätyslaatikkoon. Näitä vihreitä lukollisia astioita löydät yliopiston eri rakennusten vahtimestaripisteistä.
  • Merkitse Converiksessa aineiston metatietoihin aineisto hävitetyksi.

Aineiston pitkäaikaissäilytys

Tutkimusaineiston pitkäaikaissäilytyksellä tarkoitetaan vähintään 25 vuoden säilytysaikaa. Kansallisesti arvokkaille aineistoille on tähän tarkoitukseen tarjolla CSC:n ylläpitämä Fairdata-PAS-palvelu, joka säilyttää aineistoja kymmenistä satoihin vuosiin. Tutkimusdatapolitiikkansa mukaisesti Jyväskylän yliopisto koordinoi keskitetysti aineistojensa pitkäaikaistallentamista siten, että merkittävimmät yliopiston aineistot tullaan pitkäaikaistallentamaan. Aineistojen valintakriteerit ja menettely tarkentuvat myöhemmin.

 


Kaikissa aineistojen hallintaan ja julkaisemiseen liittyvissä kysymyksissä sinua auttaa Avoimen tiedon keskus: researchsupport-osc@jyu.fi.

Ohjeiden laatimisessa on käytetty lähteinä Helsingin yliopiston Aineistonhallinta-sivustoa (CC BY 4.0), viitattu 28.2.2021, Helsingin yliopiston Making a research project understandable - A guide to data documentation -opasta (CC BY 4.0) ja Tampereen yliopiston Tutkimusaineistojen hallinta -opasta (CC BY 4.0, viitattu 1.3.2021).