Ohjeita tutkimusaineistojen hallintaan

"Aineistonhallinnalla tarkoitetaan käytänteitä, joita noudattamalla tutkimusdata ja niihin liittyvä kuvaileva tieto (metatieto, metadata) on luotu, tallennettu ja järjestetty siten, että tutkimusdata säilyy käyttökuntoisena ja luotettavana ja että tietosuoja ja tietoturva on varmistettu tutkimusdatan koko elinkaaren ajan"​ (Kuusniemi et al, Avoimen tieteen osalinjaus. Luonnos. URL: https://avointiede.fi/sites/default/files/2020-09/LUONNOS-tutkimusainestot-menetelmat--OSALINJAUS1.pdf, Linkki tarkistettu 1.10.2020.)

Tutkimuksen tietoaineistolla tarkoitetaan digitaalisessa tai analogisessa muodossa olevia tieteellisen tutkimuksen perusaineistoja, niistä jalostettuja aineistoja, muistiinpanoja ja kenttätyö-/laboratoriopäiväkirjoja sekä lähdekoodia ja ohjelmistoja, joihin tutkimuksen löydökset ja julkaistut tulokset perustuvat. Tiedeyliopistossa tutkimuksen tietoaineistojen hallinta, säilytys ja uudelleenkäyttö ovat tutkimusinfrastruktuurin keskeisiä osia. Tutkimuksen kotimaiset ja kansainväliset rahoittajat sekä julkaisujen kustantajat arvostavat ja yhä useammin myös edellyttävät tutkimusaineistojen avoimuutta ja läpinäkyvyyttä. Aineistojen avoimuus on kuitenkin vain mahdollisuus, jonka hyvä aineistonhallinta tarjoaa. Ennen kaikkea se tuottaa hyvin järjestettyjä, käyttökelpoisia aineistoja, jotka helpottavat tutkijan itsensä työtä tutkimuksen eri vaiheissa.

JYU tarjoaa tutkijoille erilaisia työkaluja aineistonhallinnan eri vaiheisiin sekä niihin liittyvää neuvontaa ja opastusta.

Seuraavassa ohjeessa käydään läpi aineistonhallinnan suunnittelun ja siihen liittyvien esimerkkien kautta läpi tutkimusaineiston hallintaa tutkimuksen eri vaiheissa.

Aineistonhallinnan suunnittelu

Jyväskylän yliopisto edellyttää datapolitiikassaan useimpien rahoittajien tapaan tutkijoilta aineistonhallintasuunnitelman tekemistä: mitä aineistoja tutkimuksessa käsitellään, miten lainsäädäntöön, eettisiin periaatteisiin ja oikeuksiin vastataan, miten aineisto dokumentoidaan ja sen metatiedot tallennetaan, missä aineistoa säilytetään ja miten siitä huolehditaan (arkistoidaan, avataan, hävitetään) tutkimushankkeen päätyttyä.

Aineistonhallintasuunnitelma toimii tutkijan apuvälineenä läpi tutkimusprosessin. Se on elävä dokumentti, jota päivitetään tutkimushankkeen edetessä ja joka auttaa varmistamaan, että hankkeen aikana syntyneet tutkimusaineistot ovat korkealaatuisia ja FAIR-periaatteiden mukaisia.

Aineistonhallintasuunnitelmien työkalut ja ohjeet päivittyvät jatkuvasti, joten ajanmukaisimmat ohjeet kannattaa käydä läpi aina ennen suunnitelman laatimista.

Tutkimusaineiston yleiskuvaus

Oleellisia kysymyksiä: Millaista tutkimusaineistosi on? Millaista aineistoa kerätään, tuotetaan tai käytetään uudelleen? Missä muodossa aineisto on? Kuinka paljon sitä on?

Luokittele ja kuvaile lyhyesti aineistosi erilaisiin tyyppeihin. Voit käyttää taulukkoa tai luetteloita. Aineistotyypit kannattaa nimetä, jotta niihin voi helpommin viitata myöhemmin suunnitelmassa.

Kannattaa muistaa, että aineiston käsite on todella laaja. Se käsittää käytännössä kaiken materiaalin, jonka kautta tutkimuksen tulokset johdetaan. Samassa tutkimuksessa voidaan käsitellä tutkimusta varten kerättävää aineistoa, tutkimusprosessin tuloksena syntyvää aineistoa (esim. dokumentaatio, analyysit, tietokannat), aiemmin kerättyä aineistoa (esim. tilastokeskus, arkistot) ja vielä käsitellä sitä koodein, jotka tulee myös huomioida.

tutkimusaineisto.png

Mikäli aineiston keruussa ja käsittelyssä on tunnistettu aineiston yhtenäisyyden ja laadunvarmistukseen liittyviä vaatimuksia ja toimia, tulee myös ne suunnitella ja kuvata.

 

Lainsäädännölliset kysymykset, eettiset periaatteet ja oikeudet

Oleelliset kysymykset: Mitä juridisia seikkoja liittyy aineiston hallintaan? Käsitteletkö henkilötietoja? Millä tavoin sovit käyttämäsi, tuottamasi ja jakamasi aineiston oikeuksista?

Sopimukset ja oikeudet

Yhteistä jokaiselle tutkimushankkeelle on, että aineiston käytöstä ja siihen liittyvistä oikeuksista tulee sopia kirjallisesti. Tämä varmistaa tutkijoiden oikeusturvaa ja käyttöoikeutta aineistoon myös yllättävissä ongelmatilanteissa. Lisäksi useat rahoittajat vaativat tätä oleellisena osana rahoitusehtojaan. JYU on datapolitiikassaan linjannut yliopistolla tehdyssä tutkimuksessa tuotettujen aineistojen oikeuksien kuuluvan lähtökohtaisesti yliopistolle. Tästä huolimatta asiasta on sovittava kirjallisesti, jotta varmistetaan tutkijoiden käyttöoikeudet, määritetään taho, joka tekee aineistoon liittyvät päätökset ja voi mahdollisesti päättää aineiston julkaisemisesta. Myös aineiston tekijyydestä kannattaa sopia, jotta se aineistoa julkaistaessa ilmoitetaan oikein perustein.

Mikäli aineiston keruuseen tai käyttöön liittyy opiskelijoita, tulee näissä tapauksissa sopia aina aineiston oikeuksien luovuttamisesta hankkeelle ja opiskelijoiden käyttöoikeuksista ja niiden rajoista.

Sopimukset tulee laatia mahdollisimman varhaisessa vaiheessa ja niitä tulee tarvittaessa henkilövaihdosten yhteydessä tai olosuhteiden muuttuessa päivittää. Yliopisto tarjoaa mallipohjia sopimiseen. Lisätietoa ja neuvoa voit kysyä yliopiston lakimiehiltä.

Oikeuksiin liittyy myös julkaistavan aineiston lisensseistä päättäminen. Lisensoinnilla varmistetaan aineiston käytettävyys selkeiden ehtojen mukaan. JYUssa käytetään kansainvälisten standardien mukaisia koneluettavia lisenssejä (esim. Creative Commons).

Eettiset periaatteet ja tietosuoja

Yleisin eettinen toimenpiteitä aiheuttava kysymys on, käsitelläänkö tutkimuksessa henkilötietoja. Henkilötietojen kanssa turvallisesta toimimisesta kerrotaan JYUn tietosuojaohjeissa tutkijoille. Henkilötiedot vaikuttavat aineiston käsittelyyn, säilyttämiseen sekä rajoittavat mahdollisesti sen julkaisemista ja arkistointia.

Dokumentointi ja metatiedot

Oleelliset kysymykset: Miten dokumentoit aineistosi siten, että se on löydettävissä, saavutettavissa, yhteentoimiva ja uudelleenkäytetävissä itsellesi ja muille? Jos täysin tuntematon tutkija löytää aineistoni, ymmärtääkö hän sitä? Mitä minun tulisi tehdä, jotta hän ymmärtäisi ja pystyisi käyttämään aineistoani?”

Metadatalla tarkoitetaan yleistä tietoa tutkimusaineistosta (esim. omistaja, tekijät, jakelija, nimi, lyhyt kuvaus, sijainti…) Niiden ajantasaisuus ovat avain aineiston löydettävyyteen ja saavutettavuuteen. Tätä ylläpidetään JYUn tutkimustietojärjestelmä Converiksen Tutkimusaineisto -osiossa. Jokaisesta tutkimusaineistosta tulee laatia tänne metatiedot sisältävä syöte. Aineistojen kuvailussa tärkeää on jaotella ne sellaisiksi kokonaisuuksiksi, että ne voidaan kuvailla yksikäsitteisesti. Tarkemmin kuvailtuja aineistoja voidaan niputtaa suuremmiksi kokonaisuuksiksi ”emoaineiston” alle. Tarkempia ohjeita Converiksen aineisto-osion käytöstä löydät Converiksen ohjeista. Yliopistossa edellytetään useimpien rahoittajien tapaan vähintään näiden metatietojen julkaisemista, vaikkei itse aineistoa voitaisi julkaista. Metatiedot on syytä pitää ajantasalla, jolloin ne ovat hallittavissa, eivätkä tuota merkittävästi lisätyötä.

Dokumentaatiolla tarkoitetaan aineiston menetelmien, kokoamisen ja käsittelyn dokumentaatiota, tiedostojärjestelmän (esim. alakansiot, nimeämiset jne.) kuvailua. Se voi tarkoittaa esimerkiksi muuttujien ja keskeisen sanaston sekä mittayksiköiden kuvaamista tai vaikkapa inventaariota tutkimuksen haastatteluista ja niihin liittyvistä perustiedoista. Dokumentaatio voi sisältää tietoa myös esimeriksi aineiston versioinnista. Myös teknisten laitteiden tuottama tekninen metatieto (esim. kalibraatiot jne.) ovat tärkeää dokumentaatiota.

Toisin sanoen tutkimuksen perusaineistoja kerätään kyselylomakkeilla, haastatteluilla, videoimalla sekä erilaisilla laitteilla ja antureilla. Erilaiset mittaus- ja tiedonkeruutavat tuottavat erilaisia metatieto- ja tiedostoformaatteja. Tämä aiheuttaa haasteita erityisesti silloin, kun halutaan tutkia samaa ilmiötä erilaisilla havainnointitavoilla ja -aineistoilla. Aineiston analyysivaiheessa tuotetaan raaka-aineistosta empiirisen tutkimuksen varsinaiset tulokset. Kun raaka-aineistoa käsitellään, yhdistellään ja analysoidaan, syntyy erilaisia työstö- ja tulosaineistoja. Tutkimuksen sujuvuuden kannalta tärkeää, että syntyviä aineistoja voidaan käsitellä ja kuvailla hallitusti. Tähän kuuluu myös aineistojen kuvailu ns. metatiedoilla ja dokumentointi.

Tällaista tietoa tulee säilyttää erillisissä tiedostoissa (esim. README-tiedostot, inventaario-excelit…) aineiston yhteydessä /DOCUMENTATION -alakansiossa. Tämä on tärkeää, jotta dokumentoivat tiedostot löytää, vaikkei tuntisi aineiston rakennetta tarkemmin.

Aineistonhallintasuunnitelmaa tehdessäsi sinun tulee suunnitella, millaista dokumentaatiota tuotat ja mistä sen löytää, mikäli et käytä /DOCUMENTATION -alakansiota. Mikäli mahdollista, käytä dokumentaatiossa alakohtaisia metatietostandardeja.

Dokumentaatiota on erityisen tärkeää pitää jatkuvasti ajan tasalla. Yhtä aikaa aineistotyön kanssa tehtynä se on pieni vaiva, mutta jälkikäteen käytännössä mahdotonta.

Tallentaminen ja varmuuskopiointi

Oleellisia kysymyksiä: Minne aineistosi tallennetaan? Miten se varmuuskopioidaan? Miten pääsyä aineistoon valvotaan?

Aineiston kanssa pitää käyttää tarkoituksenmukaisinta tallennusratkaisua. Se riippuu aineiston ominaisuuksista (koosta, tyypistä ja mahdollisten henkilötietojen arkaluontoisuudesta). Lähtökohtaisesti kaikki JYUssa tuotettu ja käytetty tutkimusaineisto tallennetaan yliopiston tai CSC:n järjestelmiin. Omia laitteita tai ulkoisia tallennusvälineitä ei tulisi käyttää.

Yliopistolla on tarjolla:

  1. Verkkolevyt (U: ja S: -asemat), jotka ovat nopeita ja toimintavarmoja, mutta niiden etäkäyttö ja tietojen jakaminen on vaikeaa.
  2. Nextcloud: pilvitallennuspalvelu, jolla saat Dropboxin ja OneDriven hyvät puolet tietäen, että aineistosi pysyy yliopiston palvelimilla ja hallussasi. Nextcloudiin saa henkilökohtaisen tilan lisäksi ryhmätyökansioita (vrt. S: -asema), jotka säilyvät, vaikka yksittäinen tutkija poistuisikin yliopiston palveluiden piiristä. Lisätietoa ohjeista.
  3. Tutkimusmoniviestin: verkkoselaimen ylitse toimiva palvelu ääni- ja videotiedostojen tallentamiseen ja käyttämiseen suoratoistolla.
  4. Arkaluontoiselle ja salassa pidettävälle aineistolle Collabroom -pilvipalvelu.
  5. Jyväskylän yliopiston kiintiö CSC:n IDA-palvelussa. Mahdolliset muut erityisratkaisut CSC:n kanssa.

Useimmat palveluista tilataan HelpJyu -palvelusta.

Yliopiston järjestelmät ottavat säännöllisiä varmuuskopioita. Sinun tulee kuitenkin suunnitella ja toteuttaa varmuuskopioiden ottaminen merkittävien aineistoon tehtävien muutosten yhteydessä. Suosittelemme myös säilyttämään erikseen alkuperäiset tiedostot, mikäli niiden prosessoinnissa jokin menee pieleen.

Pääsy aineistoon on syytä suunnitella ja dokumentoida. Nimeä vastuuhenkilö tälle ja pidä yllä tietoja siitä, kuka aineistoon on päässyt käsiksi ja kenellä on siihen pysyvä pääsy. Voit kuvata myös erilaisia oikeuksia tässä yhteydessä (katselu, muokkaus, poisto).

Kuvaa aineistonhallintasuunnitelmassa käyttämäsi ratkaisut.

Aineiston avaaminen, arkistointi ja tuhoaminen

Oleellisia kysymyksiä: Mitä aineistosta julkaistaan? Missä? Arkistoidaanko aineistoa vai hävitetäänkö se?

JYUssa noudatetaan periaatetta, jonka mukaan aineistojen tulee olla niin avoimia kuin mahdollista ja niin suljettuja kuin tarpeen. Oletusarvoisesti tutkimusaineistot tulee avata, suljettuna pitäminen on perusteltava suunnitelmassa. Jo aineistonhallintaa suunnitellessa on syytä harkita, mitä osia aineistosta voidaan julkaista, mitä toimenpiteitä se vaatii ja mitä muulle aineistolle tehdään (arkistointi, tuhoaminen). Näin aineiston elinkaari on alusta asti suunniteltu kokonaisuudessaan.

Aineistojen julkaisemiseen suositellaan data-arkistoja. Pelkkä omilla kotisivuilla julkaiseminen ei täytä rahoittajien vaatimuksia ja yliopiston odotuksia aineiston löydettävyydestä ja saavutettavuudesta.

Mikäli aineistoa ei julkaista, mutta se halutaan arkistoida, tulee sen säilytysaika suunnitella ja ilmoittaa. Myös arkistosijainti on tärkeä tieto.

Tiedot julkaisu- ja tallennuspaikasta sekä mahdolliset julkaisun esteet tulee suunnitella huolella ja kirjata suunnitelman lisäksi Converiksen aineisto-osioon. Yliopistolle jää näin tieto, missä sen aineistoja on säilytyksessä/julkaistu. Mikäli aineisto julkaistaan yliopiston JYX-julkaisualustalla, huolehtii Avoimen tiedon keskus saatavuustietojen kirjaamisesta.

Kaikissa aineistojen hallintaan ja julkaisemiseen liittyvissä kysymyksissä sinua auttaa Avoimen tiedon keskus osoitteessa researchsupport-osc@jyu.fi