Ohjeita tutkimusaineistojen hallintaan

1. Aineistonhallinnan suunnittelu

Miksi aineistonhallintaa?

"Aineistonhallinnalla tarkoitetaan käytänteitä, joita noudattamalla tutkimusdata ja niihin liittyvä kuvaileva tieto (metatieto, metadata) on luotu, tallennettu ja järjestetty siten, että tutkimusdata säilyy käyttökuntoisena ja luotettavana ja että tietosuoja ja tietoturva on varmistettu tutkimusdatan koko elinkaaren ajan."​ (Kuusniemi et al., Avoimen tieteen osalinjaus. Luonnos. URL: https://avointiede.fi/sites/default/files/2020-09/LUONNOS-tutkimusainestot-menetelmat--OSALINJAUS1.pdf, linkki tarkistettu 29.12.2020).

Tutkimusaineistot ovat 

  • digitaalisessa tai analogisessa muodossa olevia tieteellisen tutkimuksen perusaineistoja,
  • niistä edelleen jalostettuja aineistoja, mm.
  • muistiinpanoja sekä kenttätyö-/laboratoriopäiväkirjoja sekä
  • lähdekoodia ja ohjelmistoja, joihin tutkimuksen löydökset ja julkaistut tulokset perustuvat.

Tiedeyliopistossa tutkimusaineistojen hallinta, säilytys ja uudelleenkäyttö muodostavat tutkimusinfrastruktuurin keskeisen osan. Kotimaiset ja kansainväliset tutkimusrahoittajat sekä julkaisujen kustantajat arvostavat ja yhä useammin myös edellyttävät tutkimusaineistojen avoimuutta ja läpinäkyvyyttä. Aineistojen avoimuus on kuitenkin vain yksi hyvän aineistonhallinnan luoma mahdollisuus. Ennen kaikkea aineistonhallinta tuottaa hyvin järjestettyjä ja käyttökelpoisia aineistoja, jotka helpottavat ja edistävät tutkijan itsensä työtä tutkimuksen eri vaiheissa.

Hyvin suunnitellun aineistonhallinnan avulla

  • tutkimustyösi tehostuu
  • vältät aineiston katoamisen 
  • vastaat rahoittajien vaatimuksiin 
  • noudatat tietosuojalainsäädäntöä ja turvaat tutkittaviesi oikeudet
  • sinä ja yhteistyökumppanisi olette selvillä aineistoon liittyvistä sopimuksista ja oikeuksista
  • tiedät, miten, missä ja millä ehdoilla avaat aineistosi
  • muut voivat viitata dataasi ja sinä meritoidut 
  • varmistat, että hankkeellasi on käytössään tarvittavat resurssit – voit säästää ajan lisäksi rahaa.


JYU tarjoaa tutkijoille erilaisia työkaluja aineistonhallinnan eri vaiheisiin sekä niihin liittyvää neuvontaa ja opastusta.

Näissä ohjeissa esitellään aineistonhallinnan suunnittelun periaatteet ja tutkimuksen eri vaiheissa tarvittavat toimenpiteet. Ohjeiden sisältöä ja rakennetta päivitetään parhaillaan [2.3.2021]. 

Jyväskylän yliopisto edellyttää datapolitiikassaan useimpien rahoittajien tapaan tutkijoilta aineistonhallintasuunnitelman (Data management plan, DMP) tekemistä. Siinä kuvaat, 

  • mitä aineistoja tutkimuksessa käsittelet
  • miten huomioit lainsäädännön, tutkimusta ohjaavat eettiset periaatteet sekä aineistoa koskevat oikeudet
  • miten dokumentoit aineiston ja tallennat sen metatiedot
  • missä säilytät aineistoa tutkimuksen aikana ja miten takaat sen eheyden sekä 
  • miten huolehdit siitä (arkistointi, julkaiseminen, hävittäminen) tutkimushankkeen päätyttyä. 

Aineistonhallintasuunnitelma toimii tutkijan apuvälineenä läpi tutkimusprosessin. Se on elävä dokumentti, jota päivitetään tutkimushankkeen edetessä. Suunnitelma auttaa varmistamaan, että hankkeen aikana syntyneet tutkimusaineistot ovat korkealaatuisia ja FAIR-periaatteiden mukaisia eli sinun ja muiden löydettävissä ja saavutettavissa, teknisesti yhteentoimivia ja uudelleenkäytettäviä. Suunnitelma kuvaa ja kattaa aineistonhallinnan koko elinkaaren datan keruusta, tuottamisesta ja käsittelystä sen julkaisemiseen tai arkistoimiseen. 

Aineistonhallintasuunnitelmien työkalut ja ohjeet päivittyvät jatkuvasti, joten ajanmukaisimmat ohjeet kannattaa käydä läpi aina ennen suunnitelman laatimista.

Tunnista aineistosi

Ydinkysymyksiä: Millaista tutkimusaineistosi on? Käytätkö olemassa olevaa aineistoa uudelleen? Millaista aineistoa kerätään, tuotetaan tai käytetään uudelleen? Missä muodossa aineisto on? Kuinka paljon sitä on?

Luokittele ja kuvaile lyhyesti aineistosi erilaisiin tyyppeihin (esim. valmis pohja-aineisto, jota käytät uudelleen, itse keräämäsi raakadata, siitä prosessoimasi analyysiaineisto). Voit käyttää taulukkoa tai luetteloa. Aineistotyypit kannattaa nimetä, jotta niihin voi helpommin viitata myöhemmin aineistonhallintasuunnitelmassa.

Esimerkkejä:

Aineistotyyppi Alkuperä Henkilötiedot / arkaluonteisuus Tiedostotyyppi (suositeltavia, avoimia formaatteja:) Arvioitu koko
Analysoitu DNA-näyte Itse tuotettu (raaka-aineistona DNA-näyte) Ei .xlsx, .csv 2 Gb
Tilastoaineisto X Valmis aineisto Tietoarkistosta Ei SPSS (.por, .sav)   
Kysely Kerätty tutkittavilta Kyllä, sisältää tietoa tutkittavien terveydentilasta .csv,  5 Mt 
Haastattelutallenne, video Kerätty tutkittavilta Kyllä .avi, .mp4  
Haastattelun transkriptio Tuotettu raaka-aineistosta Ei .csv, .txt, .xlsx >10 Mt
Kuva Tuotettua havaintoaineistoa   .tif, .jpeg, .gif, .raw  

Lähde: Fuchs, S. 2020. RDM : Research Data Management Basics, Meilahti. Helsingin yliopisto. CC BY 4.0. Viitattu 27.1.2021. 

Muista, että aineiston käsite on todella laaja. Se käsittää käytännössä kaiken materiaalin, josta tutkimustulokset johdetaan. Samassa tutkimuksessa voidaan käsitellä tutkimusta varten kerättävää aineistoa, tutkimusprosessin tuloksena syntyvää aineistoa (esim. dokumentaatio, analyysit, tietokannat), aiemmin kerättyä aineistoa (esim. Tilastokeskus, arkistot) ja vielä käsitellä sitä koodein, jotka tulee myös huomioida. Tutkimusdatasta puhutaan silloin, kun viitataan nimenomaan digitaaliseen tutkimusaineistoon. 

tutkimusaineisto.png

Aineiston keruun ja käsittelyn aikana on tärkeää huolehtia siitä, että data säilyy eheänä ja korruptoitumattomana. Suunnittele ja kuvaa aineistonhallintasuunnitelmassasi mahdolliset laadunvarmistusta koskevat vaatimukset sekä toimenpiteet, joilla turvaat aineistosi yhtenäisyyden ja laadun. Laadunvarmistusta voi tutkimuksen tyypistä riippuen olla esimerkiksi laitteiden kalibrointi, standardinmukaisten laitteiden ja menetelmien käyttö, mittauksen tai näytteen toistaminen tai tarkistussumman ottaminen analyysitiedostosta virheiden ja puuttuvien arvojen havaitsemiseksi.

Sopimukset, oikeudet ja lisensointi

Miten sovit käyttämäsi, tuottamasi ja jakamasi aineiston oikeuksista? Kenellä on oikeus päättää aineiston käytöstä, nyt ja tulevaisuudessa? Kuka aineiston omistaa?
Sovi näistä sekä aineiston tekijyydestä osapuolten kanssa kirjallisesti hankkeen alkaessa. Täydennä sopimuksia niiden mahdollisesti muuttuessa. Yliopiston lakipalvelut tarjoavat käyttöösi sopimusmalleja.

Yhteistä jokaiselle tutkimushankkeelle on, että aineiston käytöstä ja siihen liittyvistä oikeuksista tulee sopia kirjallisesti. Tämä varmistaa tutkijoiden oikeusturvan ja käyttöoikeuden aineistoon myös yllättävissä ongelmatilanteissa. Lisäksi useat rahoittajat vaativat sopimusta oleellisena osana rahoitusehtojaan. JYU linjaa datapolitiikassaan, että yliopistolla tehdyssä tutkimuksessa tuotettujen aineistojen oikeudet kuuluvat lähtökohtaisesti yliopistolle. Tästä huolimatta asiasta on sovittava kirjallisesti, jotta 1) varmistetaan tutkijoiden käyttöoikeudet ja 2) määritetään se taho, joka tekee aineistoon liittyvät päätökset ja joka voi mahdollisesti päättää aineiston julkaisemisesta. Myös aineiston tekijyydestä kannattaa sopia, jotta se aineistoa julkaistaessa ilmoitetaan oikein perustein. 

Mikäli aineiston keruussa tai käytössä on mukana opiskelijoita, tulee näissä tapauksissa sopia aina aineiston oikeuksien luovuttamisesta hankkeelle sekä opiskelijoiden käyttöoikeuksista ja niiden rajoista.

Sopimukset tulee laatia mahdollisimman varhaisessa vaiheessa ja niitä tulee tarvittaessa henkilövaihdosten yhteydessä tai olosuhteiden muuttuessa päivittää. Yliopisto tarjoaa mallipohjia sopimiseen. Hankkeen vastuullisen johtajan velvollisuutena on huolehtia siitä, että kaikki hankkeeseen osallistuvat siirtävät oikeutensa yliopistolle ennen hankesopimuksen allekirjoitusta tai viimeistään ennen sopimuksessa määritellyn työn aloittamista.

Huomaa, että oikeuksiensiirtosopimukset on tehtävä aina seuraavissa hankkeissa:

  • Business Finlandin rahoittamat hankkeet
  • EU:n tutkimusohjelmat
  • tilaustutkimukset.

Lisätietoa ja neuvoja saat yliopiston lakiasiantuntijoilta

Oikeuksiin liittyy myös julkaistavan aineiston lisensseistä päättäminen. Lisensoinnilla varmistat aineiston käytettävyyden selkeiden, sinun itse asettamiesi ehtojen mukaan. JYUssa käytetään kansainvälisten standardien mukaisia koneluettavia lisenssejä (esim. Creative Commons), joiden avulla aineisto on uudelleenkäytettävissä  niin laajasti kuin mahdollista. Lisensointi on ehdoton edellytys aineiston avaamiselle tulevaisuudessa, sillä lisensoimatonta aineistoa on turvatonta jatkokäyttää. 

Sopimuksen laatimisessa huomioitavaa

  • Mitkä aineistot on tarkoitus luovuttaa jatkokäyttöön?
  • Mikäli yksi tai useampi tutkija on tuonut tutkimushankkeeseen mukaan aiempaa tutkimusaineistoa, sisällytetäänkö tämä jatkokäyttöön luovutettavaan aineistoon?
  • Milloin aineisto tai osat siitä voidaan luovuttaa jatkokäyttöön? (Esimerkiksi ennalta määrätty aikataulu tai julkaisujen valmistuminen)
  • Mihin käyttötarkoituksiin aineisto luovutetaan (pelkästään tutkimukseen vai lisäksi myös opetus- ja opiskelukäyttöön)?
  • Kenellä on oikeus tehdä arkistointisopimus tutkimusaineistosta?
  • Halutaanko jatkokäytölle asettaa ehtoja lisenssin avulla?
  • Mikäli jatkokäyttö halutaan tehdä luvanvaraiseksi, kuka päättää luvan myöntämisestä?

Eettiset seikat ja henkilötietojen käsittely

Tutkimuseettiset seikat sekä varsinkin tutkittavien laillinen oikeus yksityisyyden suojaan voivat vaikuttaa siihen miten keräät, säilytät ja käsittelet tutkimusaineistoja, siihen kuka saa käyttää aineistoa ja mihin tarkoitukseen, sekä aineiston arkistointiin.

Henkilötietojen käsittely on yleisin eettinen toimenpiteitä aiheuttava syy. Henkilötiedot vaikuttavat aineiston käsittelyyn ja säilyttämiseen. Ne saattavat myös rajoittaa sen julkaisemista ja arkistointia.

Jos tutkimukseesi liittyy minkään sellaisen tiedon käsittelyä, joka voidaan joko suoraan tai epäsuorasti yhdistää henkilöön, tietosuojalainsäädäntö koskee tutkimustasi. Informoi tutkittavia ennen tutkimuksen alkua selkeästi siitä, miten ja kenen toimesta heidän henkilötietojaan tullaan käsittelemään ja hallinnoimaan halki tutkimushankkeen elinkaaren. JYUn tietosuojaohje tutkijoille neuvoo, miten käsittelet henkilötietoja tietoturvallisesti ja lainsäädännön edellytysten mukaisesti tutkimuksen eri vaiheissa. 

Erityiset henkilötietoryhmät ja arkaluonteiset tiedot

Erityisiä henkilötietoja ovat henkilön etninen alkuperä, poliittinen mielipide, uskonnollinen tai maailmankatsomuksellinen vakaumus, ammattiyhdistysliikkeen jäsenyys, geneettinen data, yksilöivä biometrinen data, terveystiedot sekä seksuaalinen käyttäytyminen tai suuntautuminen. Arkaluonteisia tietoja ovat lisäksi henkilötunnus, pankkitilitiedot sekä rikosrekisteritiedot. 

Jos käsittelet erityisiä henkilötietoja, tutkimustasi koskevat erityiset säännökset liittyen henkilötietojen käsittelyn poikkeusperusteen määrittelyyn sekä aineiston säilytykseen ja käsittelyyn. 

  • Määrittele arkaluonteisten tietojen käsittelylle tietosuoja-asetuksen edellyttämä poikkeusperuste. Ohjeen löydät tutkijan tietosuojaohjeesta kohdasta Erityiset henkilötietoryhmät.
  • Kerro tutkittaville toimittamassasi informoinnissa sekä tietosuojaselosteessa, kuka hankkeessasi toimii tietojen rekisterinpitäjänä. Erittele myös, mitkä kaikki tahot tulevat käsittelemään henkilötietoja tutkimuksen aikana. 
  • Erittele tutkittaville toimittamassasi tietosuojaselosteessa ja aineistonhallintasuunnitelmassasi, miten huolehdit tietojen tietoturvallisesta ja luottamuksellisesta säilytyksestä ja käsittelystä tutkimuksen aikana. 
  • Kuvaile samoin se, miten pseudonymisoit tai anonymisoit tunnisteelliset tiedot siinä vaiheessa, kun et enää tarvitse tunnisteita tutkimuksesi tarkoitusta varten. Miten arkistoit tai hävität tiedot hankkeen päättyessä?
  • Jos yhteistyökumppanisi tai rahoittajasi vaatii tietojen arkaluonteisuuteen perustuen eettisen ennakkoarvioinnin, löydät ohjeet täältä
  • Pidä tutkimuksen aikana yllä ajantasaista dokumentaatiota siitä, miten käytännössä toteutat ja seuraat tietosuojaselosteessa kuvaamiasi tietosuojatoimenpiteitä. 

Vaikutustenarviointi

Tee henkilötietoja käsittelevälle tutkimuksellesi aina vähintään suppea, vapaamuotoinen riskienarvointi, josta löydät lisätietoa täältä. Jos riski on suuri, tutkimukselle on tehtävä EU:n yleisen tietosuoja-asetuksen mukainen vaikutustenarviointi, Data Protection Impact Assessment (DPIA).
Erityisen suureksi riskiksi katsotaan

  • suuri määrä henkilöitä, joiden tietoja käsitellään
  • suuri määrä tietoa henkilöstä
  • sensitiivinen tieto
  • herkästi haavoittuvien henkilöiden (esim. lasten) tiedot
  • tietojen käyttö automatisoituun päätöksentekoon
  • systemaattinen seuranta.

Tarkemmat ohjeet löydät tutkijan tietosuojaohjeesta

Eettinen ennakkoarviointi ihmistieteissä

Saatat tarvita tutkimuksellesi ennakkoarvioinnin yliopiston Ihmistieteiden eettiseltä toimikunnalta tai Keski-Suomen sairaanhoitopiirin eettiseltä toimikunnalta, jos tutkimusasetelmasi täyttää Tutkimuseettisen neuvottelukunnan määrittelemät erityiset kriteerit:

1) Tutkimukseen osallistumisessa poiketaan tietoon perustuvan suostumuksen periaatteesta,
2) tutkimuksessa puututaan tutkittavien fyysiseen koskemattomuuteen,
3) tutkimus kohdistuu alle 15-vuotiaisiin ilman huoltajan erillistä suostumusta tai informointia, jonka perusteella huoltajalla olisi mahdollisuus kieltää lasta osallistumasta tutkimukseen,
4) tutkimuksessa tutkittaville esitetään poikkeuksellisen voimakkaita ärsykkeitä,
5) tutkimuksessa on riski aiheuttaa tutkittaville tai heidän läheisilleen normaalin arkielämän rajat ylittävää henkistä haittaa tai
6) tutkimuksen toteuttaminen voi merkitä turvallisuusuhkaa tutkittaville tai tutkijalle tai heidän läheisilleen.

Ota tarvittaessa yhteyttä yliopiston Ihmistieteiden eettiseen toimikuntaan hyvissä ajoin ennen kuin aloitat tutkimuksen. Ennakkoarviointia ei voi pyytää enää tutkimuksen käynnistymisen jälkeen. Täältä löydät lisätietoa ennakkoarvioinnista ja tilanteista, joissa sitä ei tarvita. 

Henkilötietojen käsittelijän muistilista

  • Perustele, että sinulla on tietosuoja-asetuksen mukainen oikeus kerätä, käsitellä ja säilyttää aineistoa. Tarkista henkilötietojen käsittelyperusteet. Huolehdi, että eettinen ennakkoarviointi on tarvittaessa tehty ennen tutkimuksen aloittamista. 
  • Kerro, mitkä tahot käsittelevät tietoja ja kuka tai ketkä ovat aineiston rekisterinpitäjiä. HUOM! Ota tässä huomioon myös käyttämäsi palveluntarjoajat. Jos teet kyselytutkimuksen käyttäen vaikkapa Webropol-palvelua, sillä on teknisesti mahdollisuus päästä näkemään sisältö.
  • Kuvaile, mitä henkilöihin liittyviä tietoja tarvitset ja miksi.
  • Määritä käsittelyn lainmukainen peruste (suostumus, yleisen edun mukainen, tieteellinen tutkimus).
  • Arvioi, mitä riskejä henkilötietojen käsittelystä voi aiheutua tutkittaville.
  • Selvitä, vaatiiko projektisi vaikutustenarviointia, ja tee se tarvittaessa.
  • Kerro, miten suojaat käsiteltävät tiedot ja tutkittavien yksityisyyden sekä tarvittaessa anonymisoit tai pseudonymisoit aineiston.
  • Miten poistat tarpeettomiksi käyneet henkilötiedot?
  • Mitä teet aineistolle, kun tutkimus päättyy?
  • Muista, että henkilötietoja saa käsitellä vain siten kuin tutkittavia on informoitu tietosuojailmoituksessa ennen tutkimuksen aloittamista. Jos aineiston käsittelyssä tulee esiin tarve poiketa tietosuojailmoituksessa määritellystä, informoi tutkittavia siitä heti ja päivitä tietosuojailmoitus sekä muut tarvittavat dokumentit.

Varmista, että henkilötietojen käsittely on kuvattu yhdenmukaisesti tutkimus- ja aineistonhallintasuunnitelmassasi sekä tietosuojailmoituksessa.


2. Aineiston keruu ja analyysi

Dokumentaatio  tutkimuksen aikana

Oleelliset kysymykset: Miten dokumentoin aineistoni siten, että se on sekä minun että muiden löydettävissä, saavutettavissa ja käytettävissä myös huomenna, viikon kuluttua ja vielä vuosien päästä? Jos täysin tuntematon tutkija löytäisi aineistoni, hahmottaisiko hän, mistä siinä on kyse? Mitä minun tulee tehdä, jotta hän ymmärtäisi ja pystyisi käyttämään aineistoani?

Dokumentaatio on aineiston menetelmien, kokoamisen ja käsittelyn dokumentoimista ja mm. tiedostojärjestelmän (kansiot ja alakansiot, nimeämiskäytännöt jne.) tutkimuksenaikaista kuvailua. Se voi tarkoittaa esimerkiksi muuttujien ja keskeisen sanaston sekä mittayksiköiden kuvaamista tai taulukkomuotoista inventaariota haastattelujen perustiedoista, asetelmasta ja toteutuksesta. Koodikirjat, kenttä- ja laboratoriopäiväkirjat sekä teknisten laitteiden tuottama tekninen metatieto kuten kalibraatiot ovat nekin tärkeää dokumentaatiota. Dokumentaatiota on erittäin tärkeää pitää jatkuvasti ajan tasalla. Yhtä aikaa aineistotyön kanssa tehtynä se on pieni vaiva, mutta jälkikäteen käytännössä mahdotonta.

Tutkimuksen perusaineistoja kerätään kyselylomakkeilla, haastatteluilla, videoimalla sekä erilaisilla laitteilla ja antureilla. Erilaiset mittaus- ja tiedonkeruutavat tuottavat erilaisia metatieto- ja tiedostoformaatteja.  Aineiston analyysivaiheessa raaka-aineistosta tuotetaan empiirisen tutkimuksen varsinaiset tulokset. Kun raaka-aineistoa käsitellään, yhdistellään ja analysoidaan, syntyy erilaisia työstö- ja tulosaineistoja. Tutkimuksen sujuvuuden ja toistettavuuden kannalta on tärkeää, että syntyviä aineistoja käsitellään ja kuvaillaan hallitusti ja yhteistyökumppanien etukäteen sopimalla tavalla. 

Hyviä käytäntöjä:

  • Säilytä kuvailutieto erillisissä tiedostoissa (esim. Readme-tiedostot, inventaarioexcelit) aineiston yhteydessä alakansiossa, jolle annat nimen /DOCUMENTATION. Tämä on tärkeää, jotta dokumentoivat tiedostot löytää sellainenkin henkilö, joka ei tunne aineiston rakennetta tarkemmin.
  • Suunnittele, millaista dokumentaatiota tuotat ja mistä sen löytää, jollet käytä /DOCUMENTATION-alakansiota. Mikäli mahdollista, käytä dokumentaatiossa oman alasi metadatastandardeja.
  • Sovi tutkimusryhmän kesken jo tutkimuksen suunnitteluvaiheessa yhtenäinen käytäntö tiedostojen ja kansioiden nimeämiselle.
  • Sovi yhtenäinen tapa, jolla tallennatte tiedostot kansioihin ja alakansioihin. Looginen kansiorakenne tehostaa työtä ja vähentää katoamisriskiä.
  • Käytä avoimia tiedostoformaatteja kaupallisten formaattien sijaan. Avoimet, standardimuotoiset tiedostoformaatit takaavat parhaiten tietojen saavutettavuuden vielä useiden vuosien kuluttua. Esimerkkejä löydät esim. UK Data Servicen formaattivertailutaulukosta.

Metadatan laatiminen ja ylläpito tutkimuksen aikana

Metadata on yleistä bibliografista kuvailutietoa tutkimusaineistosta (esim. nimi, omistaja, tekijät, jakelija, aikaväli, lyhyt kuvaus, sijainti, lisenssitiedot jne.) Se on kuin aineiston käyntikortti, jolla kuvaat toisille, mistä aineistossasi on kyse. Ajantasainen metadata on avain aineiston löydettävyyteen ja saavutettavuuteen. JYU sekä useimmat rahoittajat edellyttävät vähintään metadatan julkaisemista, vaikkei itse aineistoa voitaisi perustellusta syystä julkaista. Tutkimuksen edetessä metatiedot on hyvä pitää jatkuvasti ajan tasalla. Tällöin ne pysyvät hallittavissasi eivätkä tuota merkittävästi lisätyötä.

Jyväskylän yliopistossa metadataa ylläpidetään tutkimustietojärjestelmä Converiksen Tutkimusaineisto-osiossa. Jokaisesta tutkimusaineistosta on hyvä laatia Converikseen kuvailutiedot sisältävä kirjaus. Kun kuvailet aineistoja, jaottele ne sellaisiksi kokonaisuuksiksi, että voit kuvailla kunkin datasetin yksiselitteisesti. Tarkemmin kuvailtuja aineistoja voit niputtaa Converiksessa suuremmiksi kokonaisuuksiksi laajemman emoaineiston alle. Kun kirjaat aineistosi metatiedot Converikseen, voit samalla tilata Converiksen kautta tukea aineistonhallinnan kysymyksiisi yliopiston aineistoasiantuntijoilta. Yksityiskohtaiset ohjeet metadatan kirjaamiseksi tutkimuksesi eri vaiheissa löydät metadatan kirjausohjeista (Intranet Unossa). 

Laadun varmistaminen 

Aineiston yhtenäisyydestä ja laadusta huolehtiminen on tärkeä osa aineistonhallintaa. Huolellinen aineistonkeruun toteutuksen dokumentointi on ensisijainen toimenpide aineiston eheyden ja  laadun varmistamiseksi. Aineistotyypistä, laitteistosta ja menetelmistä riippuen eheyttä ja laatua voidaan varmistaa esimerkiksi 

  • kalibroimalla mittausvälineitä havaintotarkkuuden ja -skaalan monitoroimiseksi
  • tarkistuttamalla litteroitu haastatteluaineisto ulkopuolisella asiantuntijalla 
  • käyttämällä alan standardoituja menetelmiä, laitteita ja ohjelmistoja. 


3. Tallentaminen, jakaminen ja pääsynhallinta 

Oleellisia kysymyksiä: Minne tallennat aineistosi? Miten se varmuuskopioidaan? Miten jaat aineistoa tarvittaessa tietosuojan huomioiden? Miten valvot pääsyä aineistoon? Siirrätkö aineistoa EU:n ja ETA-alueen ulkopuolelle?

Tallennuspaikan valinta 

Aineistolle valittava, tarkoituksenmukaisin tallennusratkaisu riippuu riippuu aineiston ominaisuuksista: koosta, tyypistä sekä mahdollisten henkilötietojen arkaluonteisuudesta. Lähtökohtaisesti kaikki JYUssa tuotettu ja käytetty tutkimusaineisto tallennetaan yliopiston tai CSC:n järjestelmiin. Omien laitteiden tai ulkoisten tallennusvälineiden käyttöä tulee välttää.

Yliopistolla on tarjolla:

  1. Verkkolevyt (U:- ja S:-asemat). Ne ovat nopeita, tietoturvallisia ja toimintavarmoja, mutta niiden etäkäyttö ja tietojen jakaminen on vaikeaa.
  2. Nextcloud: pilvitallennuspalvelu, jolla saat Dropboxin ja OneDriven hyvät puolet tietäen, että aineistosi pysyy yliopiston palvelimilla ja hallussasi. Nextcloudiin saa henkilökohtaisen tilan lisäksi ryhmätyökansioita (vrt. S:-asema), jotka säilyvät, vaikka yksittäinen tutkija poistuisikin yliopiston palveluiden piiristä. HUOM: Nextcloud ei sovellu videoaineistolle. Lisätietoa ohjeista.
  3. Tutkimusmoniviestin: verkkoselaimella toimiva palvelu ääni- ja videotiedostojen tallentamiseen ja käyttämiseen suoratoistolla.
  4. Arkaluonteiselle ja salassa pidettävälle aineistolle CollabRoom-pilvipalvelu, jossa säilytät ja jolla jaat aineistoa tietoturvallisesti myös yliopiston ulkopuolisille partnereille. 
  5. Jyväskylän yliopiston kiintiö CSC:n IDA-palvelussa

Nextcloudin ja CollabRoomin tilaat HelpJYUsta.

Varmuuskopiointi

Yliopiston järjestelmät ottavat automaattisesti säännöllisiä varmuuskopioita. Sinun tulee kuitenkin suunnitella ja toteuttaa varmuuskopioiden ottaminen siinä vaiheessa, kun teet aineistoon merkittäviä muokkauksia. Säilytä alkuperäiset tiedostot eli ns. masterfilet erillään analyysitiedostoista siltä varalta, että datan prosessoinnissa menee jokin pieleen. 

Pääsynhallinta

  • Nimeä ja dokumentoi vastuuhenkilö, joka valvoo pääsynhallintaa aineistoihin.
  • Pidä yllä tietoja siitä, kuka aineistoon on päässyt käsiksi ja kenellä on pääsyoikeus mihinkin osaan aineistosta.
  • Määrittele, kenellä on aineistoon katselu-, muokkaus- ja poisto-oikeudet.
  • Jos käsittelet henkilötietoja tai muutoin luottamuksellisia tai arkaluonteisia tietoja, määrittele erikseen, kenellä on pääsy niihin. 
  • Millä perusteella kukin käyttöoikeus (muokkaus, katselu, poisto) on myönnetty?
  • Miten valvonta toteutuu käytännössä (esim. salasanalla suojatut käyttöoikeudet, muutoslokin seuranta, kryptaus, fyysisten tilojen valvonta, lukitut säilytyskaapit)? 
  • Jos käsittelet erityisiä henkilötietoja, huolehdi siitä, että noudatat tutkittaville antamaasi kuvausta.  

Kuvaa ratkaisusi aineistonhallintasuunnitelmassasi.

Henkilötietoja sisältävän aineiston tallennus ja siirto

Käsittele henkilötietoja sisältävää aineistoa alkuperäisessä tietojärjestelmässä aina, kun se on mahdollista. Henkilötietoja ei lähtökohtaisesti kannata siirtää ulos alkuperäistä järjestelmästä, esimerkiksi Excel-taulukkoon. Alkuperäisessä tietojärjestelmässä pystyt pitämään yllä lokitietoja siitä, kenellä on ollut pääsy aineistoon. Tämä on erityisen tärkeää, kun aineisto on arkaluonteista tai luottamuksellista. 

Jos siirrät henkilötietoja sisältävää aineistoa, huolehdi, että siirto tapahtuu tietoturvallisesti ja luottamuksellisesti. JYUn tallennuspalvelu CollabRoom soveltuu myös tietojen jakamiseen yhteistyökumppaneille yliopiston ulkopuolella. Jos joudut siirtämään tietoja sähköpostitse, käytä turvasähköpostia tai lähetä aineisto salattuna liitetiedostona. Varmista, että vain nimetyillä vastaanottajilla on pääsy aineistoon. Sovi vastaanottajan kanssa tietojen käsittelyn ehdoista.

Huolehdi, että siirrät aineistoa vain siten kuin olet kuvaillut tutkittaville antamassasi tietosuojailmoituksessa tai informoinnissa, jonka olet antanut tutkittaville esimerkiksi kyselyn tai haastattelun yhteydessä.   

Kansainvälisessä yhteistutkimuksessa voi syntyä tarve siirtää henkilötietoja sisältävää aineistoa joko muihin EU:n ja Euroopan talousalueen maihin tai niiden ulkopuolelle kolmansiin maihin. Syynä voi olla esimerkiksi se, että analyysiin tarvittava laitteisto on saatavilla vain jossain tietyssä maassa. Huomioi tällaisessa tilanteessa seuraava: 

  • Saat siirtää henkilötietoja EU:n ja ETA-alueen jäsenmaihin samoilla perusteilla kuin Suomen sisällä. Tietosuoja-asetuksessa on kuitenkin kansallista liikkumavaraa, joten säädösten yksityiskohdat voivat vaihdella maittain. Selvitä siksi hyvissä ajoin kansainvälisten yhteistyökumppaneiden kanssa kunkin maan erityissäädökset henkilötietojen tutkimustarkoituksessa tapahtuvan käsittelyn osalta. Dokumentoikaa ne tietosuojailmoitusta varten. 
  • Jos henkilötietoja on tarpeen siirtää EU- ja ETA-alueen ulkopuolelle, tietojen siirrolle on oltava Suomessa laillinen peruste, joka rekisterinpitäjänä toimivan tahon (tutkija, tutkimusryhmä tai yliopisto) tulee varmistaa. Lisäksi siirrossa tulee noudattaa tietosuoja-asetuksessa määriteltyjä erityisperiaatteita. Jos siirrät hankkeessasi henkilötietoja EU:n ja ETA-alueen ulkopuolelle, ole ensin yhteydessä yliopiston tietosuojavastaavaan: tietosuoja@jyu.fi

4. Aineiston avaaminen, arkistointi ja hävittäminen

Oleellisia kysymyksiä: Mitä osia aineistosta julkaisen, ja missä? Arkistoinko aineistoni vai hävitänkö sen tai osan siitä, ja millä perusteella? Miten toimin?

Aineistojen avaaminen Jyväskylän yliopistossa

Jyväskylän yliopisto pyrkii mahdollisimman laajaan tutkimusaineistojen ja niiden kuvailutietojen avoimuuteen. Samalla se tunnistaa, että aineiston luonteesta riippuen avoimuudessa on eri asteita:

  • Aineiston kuvailutiedot eli metadata on avointa kun se julkaistaan tutkimustietojärjestelmä Converiksen Tutkimusaineistot-osiossa (ks. edempänä) ja/tai muussa digitaalisessa arkistossa. 
  • Aineisto tai soveltuvat osat siitä voidaan avata eli julkaista joko kenen tahansa tai tutkijan määrittelemän rajoitetun käyttäjäkunnan saataville (esim. vain tutkimuskäyttöön).

Aineistojen julkaisemista ohjaa "Niin avointa kuin mahdollista, niin suljettua kuin tarpeen" -periaate. Sen mukaisesti tutkijat aineistojensa parhaina asiantuntijoina arvioivat yhdessä Avoimen tiedon keskuksen aineistoasiantuntijoiden kanssa jo aineistonhallintaa suunnitellessa, mitkä osat aineistosta on mahdollista julkaista. Oletusarvoisesti tutkimusaineistot tulee avata, ja suljettuna pitäminen tai hävittäminen on perusteltava aineistonhallintasuunnitelmassa. Harkitse jo tutkimusta suunnitellessasi, mitä osia aineistosta voit julkaista, mitä toimenpiteitä julkaiseminen vaatii, ja mitä teet muulle aineistolle (arkistointi, hävittäminen). Näin suunnitelmasi kattaa aineiston koko elinkaaren. 

Julkaise aineistostasi aina peruskuvailutiedot eli metadata, vaikket voisi perustellusta syystä julkaista itse aineistoa. Tämä tapahtuu tutkimustietojärjestelmä Converiksen Tutkimusaineistot-osiossa. Sinne kirjataan aineiston perustietojen lisäksi tiedot siitä, missä julkaiset aineiston sekä mahdolliset julkaisemisen esteet. Näin yliopistolle jää arvokas tieto siitä, missä sen aineistoja säilytetään tai on julkaistu. Metadatan julkaiseminen kattaa myös useimpien merkittävien rahoittajien vaatimukset aineiston avoimuuden osalta. 

Kun suunnittelet aineistojen julkaisemisen alusta asti, vältyt turhalta ja vaivalloiselta työltä tutkimuksen edetessä ja saat aineistot julkaistua vaivatta. Julkaise aineistot kuvailtuina, järjestettyinä kokonaisuuksina luotettavissa, kuratoiduissa data-arkistoissa (ks. ohje edempänä). Näin takaat, että aineistosi on löydettävissä, saavutettavaa, teknisesti yhteentoimivaa ja uudelleenkäytettävää. Kerro julkaistavan aineiston kuvailutiedoissa aineistojen tekijätiedot, aineistoa koskevat sopimusehdot sekä käyttölisenssi. Näin varmistat, että muiden on mahdollista käyttää aineistoa uudelleen. Ilman selkeästi ilmoitettua käyttöehtolisenssiä aineisto on käyttökelvotonta. 

Mikäli et julkaise aineistoa mutta haluat arkistoida sen, suunnittele säilytysaika ja ilmoita se aineistonhallintasuunnitelmassa. Mainitse myös arkistosijainti.

Mitä hyötyä sinulle on aineistosi julkaisemisesta?

Tutkimusaineistosi avaaminen vastaa rahoittajien vaatimuksiin avoimesta tieteestä ja tekee maailmasta paremman paikan, mutta hyödyttää suoraan myös sinua itseäsi:

  • Tutkimustasi on helpompi arvioida ja se on aidosti toistettavissa tieteen perusvaatimusten mukaisesti.
  • Löydät itsekin aineistosi myöhemmin varmemmin ja nopeammin jatkokäyttöön, vuosienkin kuluttua, vaikka välissä olisi vaihtunut tietokone, yliopisto tai vaikka manner.
  • Onko joskus ollut hankala muistaa, mitä joitakin vuosia vanhan datatiedoston tuokin sarake oikein tarkoitti? Tai miettiä, kenet täytyisi reiluuden nimissä pyytää mukaan jatkotutkimuksen julkaisuun, ja kuka taas ei ollut aineistoa keräämässä tai analysoimassa? Tutkimustyösi on helpompaa ja laadukkaampaa kun nämäkin tiedot ovat alusta asti tallessa ja julkaistu.
  • Tutkimustyöhösi voidaan viitata tätäkin kautta, ja sinut löydetään helpommin = uusia yhteistyökumppaneita, tunnetumpi nimi, enemmän mahdollisuuksia kiinnostavaan ja palkitsevaan tieteen tekemiseen.
  • Aineistollasi voidaan tehdä tiedettä tavoilla, joita et itse osannut edes kuvitella.
  • Julkaistut aineistot ovat jo nyt merkittävä kohta useiden rahoittajien CV-vaatimuksissa. Tämän ansioituneisuuden merkitys tulee varmuudella kasvamaan tulevaisuudessa. Ole ensimmäisten joukossa liikkeellä ja avaa kaikki mitä vain voit: saat etua kilpaillun rahoituksen hakemisessa ja muutenkin akateemisten ansioiden arvioinneissa. Vaikkapa hakiessasi professuuria 2020-luvulla!
  • Tärkeimpänä: tutkimustyösi tilaisuus vaikuttaa maailmaan kasvaa – paljon.

Näin valmistelet aineistosi avaamisen

Aineiston avaamisen edellytyksenä on metatietojen ja aineiston dokumentaation ajantasaisuus. Hyvä tapa varmistaa se tutkimushankkeen alusta asti on säilyttää menetelmiä, aineiston rakennetta, sisältöä ja muuta tutkimuksen kannalta oleellista tietoa koskeva dokumentaatio aineiston yhteydessä /DOCUMENTATION-nimisessä alakansiossa. Aineiston yleisiä metatietoja pidät yllä yliopiston Converis-järjestelmän Tutkimusaineistot-osiossa. Aineistojen kuvailuun on olemassa myös kansallinen Qvain-työkalu, mutta suosittelemme ensisijaisesti käyttämään yliopiston omaa järjestelmää.

Metatietotallenteen luominen ei tarkoita vielä julkaisemista. Voit säilyttää sen vain omana tai tutkimusryhmäsi tietona, kunnes olet valmis avaamaan aineiston maailmalle. Luotu tallenne kuitenkin mahdollistaa jo varhaisen vaiheen tuen Jyväskylän yliopistolta aineistonhallinta-asioissasi. Converis-järjestelmän kautta voit pyytää valmiiden metatietojen tai vaikka koko aineistonkin julkaisemista yliopiston JYX-julkaisuarkistossa.

Suositeltavia data-arkistoja

Hyviä käytäntöjä: 

  • Julkaise aineistosi ensisijaisesti tieteenala- tai tutkimusalakohtaisessa digitaalisessa tietoarkistossa (eng. repository). Alakohtaisessa arkistossa data päätyy varmimmin alasi tutkijoiden löydettäväksi. 
  • Re3data-portaali on hyvä paikka sopivan arkiston hakuun ja oman alan arkistojen selailuun. 
  • Jos sopivaa alakohtaista tietoarkistoa ei ole saatavilla, julkaise datasi yliopiston JYX-julkaisuarkistossa.
  • Käytä yleisiä data-arkistoja kuten Zenodoa, Dryadia ja figsharea vasta viimeisenä vaihtoehtona. Niiden sisällön sekalaisuus heikentää datan löydettävyyttä ja vaikeuttaa löydösten arviointia.
  • Pelkkä omilla tai hankkeen kotisivuilla julkaiseminen ei täytä rahoittajien vaatimuksia eikä yliopiston odotuksia aineiston löydettävyydestä ja saavutettavuudesta. 

 

Tietoarkisto

Tietoarkisto (FSD) on tutkimuksen ja opetuksen valtakunnallinen palveluinfrastruktuuri. Se arkistoi ja välittää sähköisiä tutkimusaineistoja tutkimukseen, opetukseen ja opiskeluun. Yksikkö toimii Tampereen yliopiston yhteydessä.

Tietoarkisto edistää tieteen avoimuutta, läpinäkyvyyttä, tiedon kumuloitumista ja olemassa olevan tiedon tehokasta tutkimuskäyttöä ja toteuttaa vastuullisesti FAIR-periaatteita. FAIR tarkoittaa, että palvelut ja aineistot ovat helposti löydettäviä, saavutettavia, yhteentoimivia ja jatkokäytettäviä. Toiminnan perusta on asiantunteva, nopea, tasapuolinen ja maksuton palvelu.

Tietoarkisto vastaanottaa digitaalisia tutkimusaineistoja, jotka sopivat esimerkiksi yhteiskuntatieteiden, humanististen alojen, kasvatustieteiden sekä terveystieteiden tutkimukseen, opetukseen ja opiskeluun. Aineistojen tulee olla teknisesti ja juridisesti arkistointikelpoisia. Tietoarkisto tarkistaa aineistot ja niiden dokumentaation.


Kielipankki -The Language Bank of Finland


Kielipankki on vakiintunut tieteenalakohtainen tietoarkisto. Se on kieliaineistoja käyttävien tutkijoiden palvelukokonaisuus. Kielipankissa on laaja valikoima teksti- ja puheaineistoja, joista voi tehdä monipuolisia hakuja. Voit tutkia ja käsitellä aineistoja virtuaalisessa työtilassa Kielipankin työkaluilla tai ladata niitä omalle koneellesi.

Monet aineistot ovat käytettävissä avoimesti, osa puolestaan oman yliopiston myöntämin tunnuksin. Suojattujen aineistojen käyttöoikeuksia voi hakea sähköisesti. Kielipankin peruskäyttö on tutkijoille ja opiskelijoille ilmaista.

Ohjeet Kielipankin sisällöntuottajille




JYX

JYX on Jyväskylän yliopiston julkaisualusta julkaisuille ja tutkimusaineistoille. JYX tarjoaa aineistoille pysyvät tunnisteet (DOI, URN). Palveluun syötettyjen datasettien metatiedot toimitetaan kansalliseen METAX-katalogiin, josta ne päätyvät JYXin lisäksi löydättäväksi kansallisesta ETSIN-palvelusta ja keskeisimmistä eurooppalaisista tutkimusaineistojen hakupalveluista.

Datan julkaiseminen JYXissä on yksinkertaista: syötä vain datan metatiedot tutkimustietojärjestelmä Converikseen ja pyydä sieltä aineiston julkaisemista. Ohjeet löydät täältä.

JYX-huoltokatko ke 6.11.2019 klo 15:30 — Digipalvelut



Zenodo


Zenodo on EU-rahoitteinen tutkimustulosten jakamiseen keskittyvä palvelu. Aineistojen pitkäaikaissäilytyksestä vastaa CERN Data Center. Zenodo on suunnattu kaikille tieteenaloille. Palvelussa on tällä hetkellä avoimesti saatavissa datasettien lisäksi mm. postereita, esitelmiä, konferenssijulkaisuja, kuvia ja artikkeleita. Arkistossa julkaistessaan kannattaa huomioida alustan heterogeenisyys, jonka tähden suosittelemme ensisijaisesti tieteenalakohtaisia arkistoja tai JYXiä.

Kun käytät yllä annettua linkkiä, tallenteesi liittyy automaattisesti Jyväskylän yliopiston yhteisökokoelmaan Zenodossa.

Zenodon palvelut ovat tutkijalle maksuttomia. Palveluun kirjaudutaan joko luomalla tunnukset tai käyttämällä ORCIDin tai GitHubin tunnuksia.

zenodo-gradient-2500.png



EOSC portal

Paljon tietoa tutkimusaineistojen hallinnasta sekä kattavan listauksen erityyppisistä data-arkistoista löydät European Open Science Cloudin (EOSC) portaalista.

Home

Aineiston hävittäminen

Henkilötietoja tai arkaluonteisia tietoja sisältävien tiedostojen deletointi ja poistaminen tietokoneen roskakorista ei tarkoita sitä, että aineisto on hävitetty peruuttamattomasti ja tietosuojan mukaisesti. Sopiva hävittämismenetelmä valitaan tallennusformaatin mukaisesti:

  • Paperiaineisto hävitetään yliopiston kampuksilta löytyviin harmaisiin lukollisiin tietoturva-astioihin.
  • Sähköiset tiedostot voi päällekirjoittaa tarkoitukseen kehitetyllä ohjelmistolla. Avoimen lähdekoodin ylikirjoitusohjelmistoja ovat mm. Eraser ja WipeFile. Kysy tarvittaessa neuvoa yliopiston tietoturva-asiantuntijalta HelpJYU-portaalin kautta.

Aineiston pitkäaikaissäilytys

Tutkimusaineiston pitkäaikaissäilytyksellä tarkoitetaan vähintään 25 vuoden säilytysaikaa. Kansallisesti arvokkaille aineistoille on tähän tarkoitukseen tarjolla CSC:n ylläpitämä Fairdata-PAS-palvelu, joka säilyttää aineistoja kymmenistä satoihin vuosiin. Tutkimusdatapolitiikkansa mukaisesti Jyväskylän yliopisto koordinoi keskitetysti aineistojensa pitkäaikaistallentamista siten, että merkittävimmät yliopiston aineistot tullaan pitkäaikaistallentamaan. 


Kaikissa aineistojen hallintaan ja julkaisemiseen liittyvissä kysymyksissä sinua auttaa Avoimen tiedon keskus: researchsupport-osc@jyu.fi.

Ohjeiden laatimisessa on käytetty lähteenä Helsingin yliopiston Aineistonhallinta-sivustoa (CC BY 4.0), viitattu 28.2.2021, sekä Helsingin yliopiston Making a research project understandable - A guide to data documentation -opasta (CC BY 4.0).