Opas tutkimusaineistojen hallintaan

1. Aineistonhallinnan suunnittelu

Miksi aineistonhallintaa?

"Aineistonhallinnalla tarkoitetaan käytänteitä, joita noudattamalla tutkimusdata ja niihin liittyvä kuvaileva tieto (metatieto, metadata) on luotu, tallennettu ja järjestetty siten, että tutkimusdata säilyy käyttökuntoisena ja luotettavana ja että tietosuoja ja tietoturva on varmistettu tutkimusdatan koko elinkaaren ajan."​ (Kuusniemi et al., Avoimen tieteen osalinjaus. Luonnos. URL: https://avointiede.fi/sites/default/files/2020-09/LUONNOS-tutkimusainestot-menetelmat--OSALINJAUS1.pdf, linkki tarkistettu 29.12.2020).

Tutkimusaineistot ovat 

  • digitaalisessa tai analogisessa muodossa olevia tieteellisen tutkimuksen perusaineistoja,
  • niistä edelleen jalostettuja aineistoja, mm.
  • muistiinpanoja sekä kenttätyö-/laboratoriopäiväkirjoja sekä
  • lähdekoodia ja ohjelmistoja, joihin tutkimuksen löydökset ja julkaistut tulokset perustuvat.

Tiedeyliopistossa tutkimusaineistojen hallinta, säilytys ja uudelleenkäyttö muodostavat tutkimusinfrastruktuurin keskeisen osan. Kotimaiset ja kansainväliset tutkimusrahoittajat sekä julkaisujen kustantajat arvostavat ja yhä useammin myös edellyttävät tutkimusaineistojen avoimuutta ja läpinäkyvyyttä. Aineistojen avoimuus on kuitenkin vain yksi hyvän aineistonhallinnan luoma mahdollisuus. Ennen kaikkea aineistonhallinta tuottaa hyvin järjestettyjä ja käyttökelpoisia aineistoja, jotka helpottavat ja edistävät tutkijan itsensä työtä tutkimuksen eri vaiheissa.

Hyvin suunnitellun aineistonhallinnan avulla

  • tutkimustyösi tehostuu
  • vältät aineiston katoamisen 
  • vastaat rahoittajien vaatimuksiin 
  • noudatat tietosuojalainsäädäntöä ja turvaat tutkittaviesi oikeudet
  • sinä ja yhteistyökumppanisi olette selvillä aineistoon liittyvistä sopimuksista ja oikeuksista
  • tiedät, miten, missä ja millä ehdoilla avaat aineistosi
  • muut voivat viitata dataasi ja sinä meritoidut 
  • varmistat, että hankkeellasi on käytössään tarvittavat resurssit – voit säästää ajan lisäksi rahaa.


Jyväskylän yliopisto tarjoaa tutkijoille erilaisia työkaluja aineistonhallinnan eri vaiheisiin sekä niihin liittyvää neuvontaa ja opastusta.

Tutkimusdatapolitiikka ja FAIR-periaatteet

Jyväskylän yliopisto kannustaa datapolitiikassaan kansainvälisten FAIR-periaatteiden mukaisesti tutkijoita huolehtimaan tutkimusaineistoistaan niin, että niiden kuvailutiedot ja mahdollisuuden mukaan myös datasetit ovat mahdollisimman sujuvasti ja kestävästi löydettäviä, saavutettavia, (yhteen)toimivia ja (uudelleen)käytettäviä (Findable, Accessible, Interoperable, Reusable). Valtaosa tutkimusrahoittajista, mukaan lukien Suomen Akatemia, edellyttävät rahoitusta saavilta hankkeilta, että niissä syntyvät aineistot ovat vähintään kuvailutietojen osalta avoimia. FAIR-periaatteiden käytännön toteuttamisen viisi perusaskelta ovat:

  • Arkistoi aineistosi tai vähintään sen kuvailutiedot laadukkaaseen digitaaliseen arkistoon
  • Valitse arkisto, joka tarjoaa aineistolle ja/tai kuvailutiedoille pysyvän tunnisteen kuten DOI tai URN
  • Käytä aineiston tallentamiseen ja säilyttämiseen avoimia tiedostoformaatteja, jotka takaavat tiedostojen avautumisen mahdollisimman monissa ohjelmistoissa ja takaavat pääsyn pidempään kuin suljetut kaupalliset formaatit
  • Dokumentoi aineistosi kokonaisuudessaan ja pidä sen kuvailutiedot eli metadata ajan tasalla tutkimuksen aikana
  • Anna aineistolle lisenssi, joka ilmaisee selkeästi aineiston käyttöehdot ja -luvat sekä tarvittavat rajoitukset aineiston jatkokäytölle. 

Aineistonhallintasuunnitelma

Jyväskylän yliopisto edellyttää datapolitiikassaan useimpien rahoittajien tapaan tutkijoilta aineistonhallintasuunnitelman (Data management plan, DMP) tekemistä. Siinä kuvaat, 

1) mitä aineistoja tutkimuksessa käsittelet,
2) miten huomioit lainsäädännön, tutkimusta ohjaavat eettiset periaatteet sekä aineistoa koskevat oikeudet
3) miten dokumentoit aineiston ja tallennat sen metatiedot,
4) missä säilytät aineistoa tutkimuksen aikana ja miten takaat sen eheyden, 
5) miten huolehdit siitä (arkistointi, julkaiseminen, hävittäminen) tutkimushankkeen päätteeksi sekä 
6) millaisia rooleja aineiston hallintaan liittyy sekä mitä resursseja kuvaamasi toimenpiteet vaativat. 

Aineistonhallintasuunnitelma täydentää tutkimussuunnitelmaa. Se toimii tutkijan apuvälineenä läpi tutkimusprosessin. Se on elävä dokumentti, jota päivitetään tutkimushankkeen edetessä. Suunnitelma auttaa varmistamaan, että hankkeen aikana syntyneet tutkimusaineistot ovat korkealaatuisia ja FAIR-periaatteiden mukaisia eli sinun ja muiden löydettävissä ja saavutettavissa, teknisesti yhteentoimivia ja uudelleenkäytettäviä. Suunnitelma kuvaa ja kattaa aineiston koko elinkaaren datan keruusta, tuottamisesta ja käsittelystä sen julkaisemiseen tai arkistoimiseen jatkokäyttöä varten. 

Voit käyttää suunnitelman laatimisessa apuna sähköistä DMPTuuli-työkalua. DMPTuulissa voit 

  • laatia ja tallentaa suunnitelman ohjatusti sekä päivittää sitä
  • jakaa suunnitelman tutkimusryhmän sisällä ja yhteistyökumppaneille
  • halutessasi julkaista suunnitelmasi ja saada työllesi näkyvyyttä. 

Ohjeet tunnusten luomiseen ja DMPTuulin käyttöön löydät täältä.

Tutustu myös aineistonhallinnan suunnittelun video-ohjeisiin (Tieteen tietotekniikan keskus CSC). 

Tunne aineistosi

Ydinkysymyksiä: Millaista tutkimusaineistosi on? Käytätkö olemassa olevaa aineistoa uudelleen? Millaista aineistoa kerätään, tuotetaan tai käytetään uudelleen? Missä muodossa aineisto on? Kuinka paljon sitä on?

Aineistonhallintasuunnitelman laatiminen alkaa omien aineistojen inventaariosta ja kuvauksesta. Luokittele ja kuvaile lyhyesti aineistosi erilaisiin tyyppeihin (esim. valmis pohja-aineisto, jota käytät uudelleen, itse keräämäsi raakadata, siitä prosessoimasi analyysiaineisto). Voit käyttää taulukkoa tai luetteloa. Aineistotyypit kannattaa nimetä, jotta niihin voi helpommin viitata myöhemmin aineistonhallintasuunnitelmassa.

Esimerkkejä:

Aineistotyyppi Alkuperä Henkilötiedot / arkaluonteisuus Tiedostotyyppi (suositeltavia, avoimia formaatteja:) Arvioitu koko
Analysoitu DNA-näyte Itse tuotettu (raaka-aineistona DNA-näyte) Ei .xlsx, .csv 2 Gb
Tilastoaineisto X Valmis aineisto Tietoarkistosta Ei SPSS (.por, .sav)   
Kysely Kerätty tutkittavilta Kyllä, sisältää tietoa tutkittavien terveydentilasta .csv,  5 Mt 
Haastattelutallenne, video Kerätty tutkittavilta Kyllä .avi, .mp4  
Haastattelun transkriptio Tuotettu raaka-aineistosta Ei .csv, .txt, .xlsx >10 Mt
Kuva Tuotettua havaintoaineistoa Kyllä .tif, .jpeg, .gif, .raw  

Lähde: Fuchs, S. 2020. RDM : Research Data Management Basics, Meilahti. Helsingin yliopisto. CC BY 4.0. Viitattu 27.1.2021. 

Huomioi, että aineiston käsite on todella laaja. Se käsittää käytännössä kaiken materiaalin, josta tutkimustulokset johdetaan. Samassa tutkimuksessa voidaan käsitellä tutkimusta varten kerättävää aineistoa, tutkimusprosessin tuloksena syntyvää aineistoa (esim. dokumentaatio, analyysit, tietokannat), aiemmin kerättyä aineistoa (esim. Tilastokeskus, arkistot) ja vielä käsitellä sitä koodein, jotka tulee myös huomioida. Tutkimusdatasta puhutaan silloin, kun viitataan nimenomaan digitaaliseen tutkimusaineistoon.

Sopimukset, oikeudet ja lisensointi

Miten sovit käyttämäsi, tuottamasi ja jakamasi aineiston oikeuksista? Kenellä on oikeus päättää aineiston käytöstä, nyt ja tulevaisuudessa? Kuka aineiston omistaa?

Sovi näistä sekä aineiston tekijyydestä osapuolten kanssa kirjallisesti hankkeen alkaessa. Täydennä sopimuksia niiden mahdollisesti muuttuessa. Yliopiston lakipalvelut tarjoavat käyttöösi sopimusmalleja.

Yhteistä jokaiselle tutkimushankkeelle on, että aineiston käytöstä ja siihen liittyvistä oikeuksista tulee sopia kirjallisesti. Tämä varmistaa tutkijoiden oikeusturvan ja käyttöoikeuden aineistoon myös yllättävissä ongelmatilanteissa. Lisäksi useat rahoittajat vaativat sopimusta oleellisena osana rahoitusehtojaan. JYU linjaa datapolitiikassaan, että yliopistolla tehdyssä tutkimuksessa tuotettujen aineistojen oikeudet kuuluvat lähtökohtaisesti yliopistolle. Tästä huolimatta asiasta on sovittava kirjallisesti, jotta 1) varmistetaan tutkijoiden käyttöoikeudet ja 2) määritetään se taho, joka tekee aineistoon liittyvät päätökset ja joka voi mahdollisesti päättää aineiston julkaisemisesta. Myös aineiston tekijyydestä kannattaa sopia, jotta se aineistoa julkaistaessa ilmoitetaan oikein perustein. 

Mikäli aineiston keruussa tai käytössä on mukana opiskelijoita, tulee näissä tapauksissa sopia aina aineiston oikeuksien luovuttamisesta hankkeelle sekä opiskelijoiden käyttöoikeuksista ja niiden rajoista.

Sopimukset tulee laatia mahdollisimman varhaisessa vaiheessa ja niitä tulee tarvittaessa henkilövaihdosten yhteydessä tai olosuhteiden muuttuessa päivittää. Yliopisto tarjoaa mallipohjia sopimiseen. Hankkeen vastuullisen johtajan velvollisuutena on huolehtia siitä, että kaikki hankkeeseen osallistuvat siirtävät oikeutensa yliopistolle ennen hankesopimuksen allekirjoitusta tai viimeistään ennen sopimuksessa määritellyn työn aloittamista.

Huomaa, että oikeuksiensiirtosopimukset on tehtävä aina seuraavissa hankkeissa:

  • Business Finlandin rahoittamat hankkeet
  • EU:n tutkimusohjelmat
  • tilaustutkimukset.

Lisätietoa ja neuvoja saat yliopiston lakiasiantuntijoilta

Oikeuksiin liittyy myös julkaistavan aineiston lisensseistä päättäminen. Lisensoinnilla varmistat aineiston käytettävyyden selkeiden, sinun itse asettamiesi ehtojen mukaan. Jyväskylän yliopistossa käytetään kansainvälisten standardien mukaisia koneluettavia lisenssejä (erit. Creative Commons tai Open Data Commons), joiden avulla aineisto on uudelleenkäytettävissä  niin laajasti kuin mahdollista. Voit valita aineistollesi sopivan lisenssin esimerkiksi Creative Commonsin valintatyökalullaLisensointi on ehdoton edellytys aineiston jatkokäytölle, sillä lisensoimatonta aineistoa on turvatonta jatkokäyttää. 

Sopimuksen laatimisessa huomioitavaa

  • Mitkä aineistot on tarkoitus luovuttaa jatkokäyttöön?
  • Mikäli yksi tai useampi tutkija on tuonut tutkimushankkeeseen mukaan aiempaa tutkimusaineistoa, sisällytetäänkö tämä jatkokäyttöön luovutettavaan aineistoon?
  • Milloin aineisto tai osat siitä voidaan luovuttaa jatkokäyttöön? (Esimerkiksi ennalta määrätty aikataulu tai julkaisujen valmistuminen)
  • Mihin käyttötarkoituksiin aineisto luovutetaan (pelkästään tutkimukseen vai lisäksi myös opetus- ja opiskelukäyttöön)?
  • Kenellä on oikeus tehdä arkistointisopimus tutkimusaineistosta?
  • Halutaanko jatkokäytölle asettaa ehtoja lisenssin avulla?
  • Mikäli jatkokäyttö halutaan tehdä luvanvaraiseksi, kuka päättää luvan myöntämisestä?



Immateriaalioikeudet ja aineistot

Tekijänoikeus

Tutkimusaineistot sellaisenaan eivät nykyisessä lainsäädännössä kuulu tekijänoikeuden piiriin, poikkeuksena valokuvat, teoskynnyksen ylittävät videot, koodi ja teoskynnyksen ylittävät tietokannat. Tutkimusprosessissa luotavat tietokannat voivat kuulua EU:n sui generis -tietokantaoikeuden piiriin, jos niiden koostamisessa ja järjestämisessä on tehty huomattavia päätöksiä, valintoja ja investointeja. Tutkimuksen sekundaariaineistoihin eli uudelleen käytettäviin, jo olemassa oleviin aineistoihin voi sisältyä tekijänoikeuden alaista tekstiä, kuvia ja videokuvaa. Jollei näillä ole lähdeaineistossa selkeästi ilmoitettua lisenssiä, niiden käytöstä tulee sopia tekijänoikeuksien haltijoiden kanssa.

Keksintö 

Jos aineistosta kehittyy keksintö, keksinnön tehneen tutkijan tulee tehdä siitä viipymättä keksintöilmoitus. Lisätietoja ilmoituksen tekemisestä ja innovaatiopalveluista Jyväskylän yliopistossa löydät täältä.  

Eettiset seikat ja henkilötietojen käsittely

Tutkimuseettiset seikat, etenkin tutkittavien laillinen oikeus itseään koskeviin tietoihin ja niiden suojaan, voivat vaikuttaa siihen miten keräät, säilytät ja käsittelet tutkimusaineistoja, siihen kuka saa käyttää aineistoa ja mihin tarkoitukseen, sekä aineiston arkistointiin.

Jos tutkimukseesi liittyy minkään sellaisen tiedon käsittelyä, joka voidaan joko suoraan tai epäsuorasti yhdistää henkilöön, tietosuojalainsäädäntö koskee tutkimustasi. Informoi tutkittavia ennen tutkimuksen alkua selkeästi siitä, miten ja kenen toimesta heidän henkilötietojaan tullaan käsittelemään ja hallinnoimaan halki tutkimushankkeen elinkaaren. Jyväskylän yliopiston tietosuojaohje tutkijoille neuvoo, miten käsittelet henkilötietoja tietoturvallisesti ja lainsäädännön edellytysten mukaisesti tutkimuksen eri vaiheissa. 

Erityiset henkilötietoryhmät ja arkaluonteiset tiedot

Erityisiä henkilötietoja ovat henkilön etninen alkuperä, poliittinen mielipide, uskonnollinen tai maailmankatsomuksellinen vakaumus, ammattiyhdistysliikkeen jäsenyys, geneettinen data, yksilöivä biometrinen data, terveystiedot sekä seksuaalinen käyttäytyminen tai suuntautuminen. Arkaluonteisia tietoja ovat lisäksi henkilötunnus, pankkitilitiedot sekä rikosrekisteritiedot. 

Jos käsittelet erityisiä henkilötietoja, tutkimustasi koskevat erityiset säännökset liittyen henkilötietojen käsittelyn poikkeusperusteen määrittelyyn sekä aineiston säilytykseen ja käsittelyyn. 

  • Määrittele arkaluonteisten tietojen käsittelylle tietosuoja-asetuksen edellyttämä poikkeusperuste. Ohjeen tähän löydät tutkijan tietosuojaohjeesta kohdasta Erityiset henkilötietoryhmät.
  • Kerro tutkittaville toimittamassasi informoinnissa sekä tietosuojaselosteessa, kuka hankkeessasi toimii tietojen rekisterinpitäjänä. Erittele myös, mitkä kaikki tahot tulevat käsittelemään henkilötietoja tutkimuksen aikana, sekä miksi. 
  • Erittele tutkittaville toimittamassasi tietosuojaselosteessa ja aineistonhallintasuunnitelmassasi, miten huolehdit tietojen tietoturvallisesta ja luottamuksellisesta säilytyksestä ja käsittelystä tutkimuksen aikana. 
  • Kuvaile samoin se, miten pseudonymisoit tai anonymisoit tunnisteelliset tiedot siinä vaiheessa, kun et enää tarvitse tunnisteita tutkimuksesi tarkoitusta varten. Miten arkistoit tai hävität tiedot hankkeen päättyessä?
  • Jos yhteistyökumppanisi tai rahoittajasi vaatii tietojen arkaluonteisuuteen perustuen eettisen ennakkoarvioinnin, löydät ohjeet täältä
  • Pidä tutkimuksen aikana yllä ajantasaista dokumentaatiota siitä, miten käytännössä toteutat ja seuraat tietosuojaselosteessa kuvaamiasi tietosuojatoimenpiteitä. 

Vaikutustenarviointi

Tee henkilötietoja käsittelevälle tutkimuksellesi aina vähintään suppea, vapaamuotoinen riskienarvointi, josta löydät lisätietoa täältä. Jos riski on suuri, tutkimukselle on tehtävä EU:n yleisen tietosuoja-asetuksen mukainen vaikutustenarviointi, Data Protection Impact Assessment (DPIA).
Erityisen suureksi riskiksi katsotaan

  • suuri määrä henkilöitä, joiden tietoja käsitellään
  • suuri määrä tietoa henkilöstä
  • sensitiivinen tieto
  • herkästi haavoittuvien henkilöiden (esim. lasten) tiedot
  • tietojen käyttö automatisoituun päätöksentekoon
  • systemaattinen seuranta.

Tarkemmat ohjeet löydät tutkijan tietosuojaohjeesta

Eettinen ennakkoarviointi ihmistieteissä

Saatat tarvita tutkimuksellesi ennakkoarvioinnin yliopiston Ihmistieteiden eettiseltä toimikunnalta tai Keski-Suomen sairaanhoitopiirin eettiseltä toimikunnalta, jos tutkimusasetelmasi täyttää yhden tai useamman Tutkimuseettisen neuvottelukunnan määrittelemistä kuudesta erityisestä kriteeristä:

1) Tutkimukseen osallistumisessa poiketaan tietoon perustuvan suostumuksen periaatteesta,
2) tutkimuksessa puututaan tutkittavien fyysiseen koskemattomuuteen,
3) tutkimus kohdistuu alle 15-vuotiaisiin ilman huoltajan erillistä suostumusta tai informointia, jonka perusteella huoltajalla olisi mahdollisuus kieltää lasta osallistumasta tutkimukseen,
4) tutkimuksessa tutkittaville esitetään poikkeuksellisen voimakkaita ärsykkeitä,
5) tutkimuksessa on riski aiheuttaa tutkittaville tai heidän läheisilleen normaalin arkielämän rajat ylittävää henkistä haittaa tai
6) tutkimuksen toteuttaminen voi merkitä turvallisuusuhkaa tutkittaville tai tutkijalle tai heidän läheisilleen.

Ota tarvittaessa yhteyttä yliopiston Ihmistieteiden eettiseen toimikuntaan hyvissä ajoin ennen kuin aloitat tutkimuksen. Ennakkoarviointia ei voi pyytää enää tutkimuksen käynnistymisen jälkeen. Täältä löydät lisätietoa ennakkoarvioinnista ja tilanteista, joissa sitä ei tarvita. 

Henkilötietojen käsittelijän muistilista

  • Perustele, että sinulla on tietosuoja-asetuksen mukainen oikeus kerätä, käsitellä ja säilyttää aineistoa. Tarkista henkilötietojen käsittelyperusteet. Huolehdi, että eettinen ennakkoarviointi on tarvittaessa tehty ennen tutkimuksen aloittamista. 
  • Kerro, mitkä tahot käsittelevät tietoja ja kuka tai ketkä ovat aineiston rekisterinpitäjiä. HUOM! Ota tässä huomioon myös käyttämäsi palveluntarjoajat. Jos teet kyselytutkimuksen käyttäen vaikkapa Webropol- tai SurveyMonkey-palveluja, niillä on teknisesti mahdollisuus päästä näkemään sisältö.
  • Kuvaile, mitä henkilöihin liittyviä tietoja tarvitset ja miksi.
  • Määritä käsittelyn lainmukainen peruste: onko se 1) suostumus vai 2) yleisen edun mukainen, tieteellinen tutkimus?
  • Arvioi, mitä riskejä henkilötietojen käsittelystä voi aiheutua tutkittaville.
  • Selvitä, vaatiiko projektisi vaikutustenarviointia, ja tee se tarvittaessa.
  • Kerro, miten suojaat käsiteltävät tiedot ja tutkittavien yksityisyyden sekä tarvittaessa anonymisoit tai pseudonymisoit aineiston.
  • Miten hävität tarpeettomiksi käyneet henkilötiedot niin, etteivät ne ole enää palautettavissa?
  • Mitä teet aineistolle, kun tutkimus päättyy?
  • Muista, että henkilötietoja saa käsitellä vain siten kuin tutkittavia on informoitu tietosuojailmoituksessa ennen tutkimuksen aloittamista. Jos aineiston käsittelyssä tulee esiin tarve poiketa tietosuojailmoituksessa määritellystä, informoi tutkittavia siitä heti ja päivitä tietosuojailmoitus sekä muut tarvittavat dokumentit.

Varmista, että henkilötietojen käsittely on kuvattu yhdenmukaisesti tutkimus- ja aineistonhallintasuunnitelmassasi sekä tietosuojailmoituksessa. 


2. Aineiston keruu ja analyysi

Dokumentaatio tutkimuksen aikana

Oleelliset kysymykset: Miten dokumentoin aineistoni siten, että se on sekä minun että muiden löydettävissä, saavutettavissa ja käytettävissä myös huomenna, viikon kuluttua ja vielä vuosien päästä? Jos täysin tuntematon tutkija löytäisi aineistoni, hahmottaisiko hän, mistä siinä on kyse? Mitä minun tulee tehdä, jotta hän ymmärtäisi ja pystyisi käyttämään aineistoani?

Dokumentaatio on aineiston menetelmien, kokoamisen ja käsittelyn dokumentoimista ja mm. tiedostojärjestelmän (kansiot ja alakansiot, nimeämiskäytännöt jne.) tutkimuksenaikaista kuvailua. Suurin osa dokumentaatiosta on yksinkertaisesti hyvää tieteellistä käytäntöä, jota toteutat jo nyt päivittäin tutkimuksen arjessa. Dokumentaatiota on muun muassa

  • muuttujien ja keskeisen sanaston sekä mittayksiköiden kirjallinen kuvailu 
  • taulukkomuotoinen inventaario haastattelujen perustiedoista, asetelmasta ja toteutuksesta
  • koodikirjat, kenttä- ja laboratoriopäiväkirjat
  • teknisten laitteiden tuottama tekninen metatieto kuten kalibraatiot. 

Dokumentaatiota on erittäin tärkeää pitää jatkuvasti ajan tasalla. Yhtä aikaa aineistotyön kanssa tehtynä se on pieni vaiva, mutta jälkikäteen käytännössä mahdotonta.

Tutkimuksen perusaineistoja kerätään kyselylomakkeilla, haastatteluilla, videoimalla sekä erilaisilla laitteilla ja antureilla. Erilaiset mittaus- ja tiedonkeruutavat tuottavat erilaisia metatieto- ja tiedostoformaatteja. Aineiston analyysivaiheessa raaka-aineistosta tuotetaan empiirisen tutkimuksen varsinaiset tulokset. Kun raaka-aineistoa käsitellään, yhdistellään ja analysoidaan, syntyy erilaisia työstö- ja tulosaineistoja. Tutkimuksen sujuvuuden ja toistettavuuden kannalta on tärkeää, että käsittelet ja kuvailet syntyviä aineistoja suunnitelmallisesti ja yhteistyökumppaniesi kanssa etukäteen sovitulla tavalla. 

Tieteenalakohtaisia ohjeita [täydentyy kevään 2021 aikana]

Hyviä käytäntöjä

  • Säilytä kuvailutieto erillisissä tiedostoissa (esim. Readme-tiedostot, inventaarioexcelit) aineiston yhteydessä alakansiossa, jolle annat nimen /DOCUMENTATION. Tämä on tärkeää, jotta dokumentoivat tiedostot löytää sellainenkin henkilö, joka ei tunne aineiston rakennetta tarkemmin.
  • Suunnittele, millaista dokumentaatiota tuotat ja mistä sen löytää, jollet käytä /DOCUMENTATION-alakansiota. Mikäli mahdollista, käytä dokumentaatiossa oman alasi metadatastandardeja.
  • Sovi tutkimusryhmän kesken jo tutkimuksen suunnitteluvaiheessa yhtenäinen käytäntö tiedostojen ja kansioiden nimeämiselle.
  • Sovi yhtenäinen tapa, jolla tallennatte tiedostot kansioihin ja alakansioihin. Looginen kansiorakenne tehostaa työtä ja vähentää katoamisriskiä.
  • Käytä avoimia tiedostoformaatteja kaupallisten formaattien sijaan. Avoimet, standardimuotoiset tiedostoformaatit takaavat parhaiten tietojen saavutettavuuden vielä useiden vuosien kuluttua. Esimerkkejä löydät esim. UK Data Servicen formaattivertailutaulukosta.

Metadatan laatiminen ja päivittäminen

Metadata on yleistä bibliografista kuvailutietoa tutkimusaineistosta (esim. nimi, omistaja, tekijät, jakelija, aikaväli, lyhyt kuvaus, sijainti, lisenssitiedot jne.) Se on kuin aineiston käyntikortti, jolla kuvaat toisille, mistä aineistossasi on kyse. Ajantasainen metadata on avain aineiston löydettävyyteen ja saavutettavuuteen. JYU sekä useimmat rahoittajat edellyttävät vähintään metadatan julkaisemista, vaikkei itse aineistoa voitaisi perustellusta syystä julkaista. Tutkimuksen edetessä metatiedot on hyvä pitää jatkuvasti ajan tasalla. Tällöin ne pysyvät hallittavissasi eivätkä tuota merkittävästi lisätyötä.

Jyväskylän yliopistossa metadataa ylläpidetään tutkimustietojärjestelmä Converiksen Tutkimusaineisto-osiossa. Jokaisesta tutkimusaineistosta on hyvä laatia Converikseen kuvailutiedot sisältävä kirjaus. Kun kuvailet aineistoja, jaottele ne sellaisiksi kokonaisuuksiksi, että voit kuvailla kunkin datasetin yksiselitteisesti. Tarkemmin kuvailtuja aineistoja voit niputtaa Converiksessa suuremmiksi kokonaisuuksiksi laajemman emoaineiston alle. Kun kirjaat aineistosi metatiedot Converikseen, voit samalla tilata Converiksen kautta tukea aineistonhallinnan kysymyksiisi yliopiston aineistoasiantuntijoilta. Yksityiskohtaiset ohjeet metadatan kirjaamiseksi tutkimuksesi eri vaiheissa löydät metadatan kirjausohjeista (Intranet Unossa). 

Aineiston laatu ja eheys  

Aineiston yhtenäisyydestä ja laadusta huolehtiminen on tärkeä osa aineistonhallintaa. Suunnittele ja kuvaa aineistonhallintasuunnitelmassasi laadunvarmistusta koskevat vaatimukset sekä toimenpiteet, joilla turvaat sen, ettei aineisto katoa tai korruptoidu sen käsittelyn ja säilytyksen aikana. Aineistotyypistä, laitteistosta ja menetelmistä riippuen eheyttä ja laatua voidaan varmistaa esimerkiksi 

  • kalibroimalla mittausvälineitä havaintotarkkuuden ja -skaalan monitoroimiseksi
  • tarkistuttamalla litteroitu haastatteluaineisto ulkopuolisella asiantuntijalla 
  • käyttämällä alan standardoituja menetelmiä, laitteita ja ohjelmistoja
  • tekemällä kyselyaineiston puuttuvista arvoista katoanalyysi
  • ottamalla datasta tarkistussumma puuttuvien tai poikkeavien arvojen havaitsemiseksi. 

Versionhallinta

Versionhallinta on keskeinen osa aineiston dokumentaatiota ja sen eheyden varmistamista. Yksinkertaisin manuaalinen keino versionhallintaan on tiedostojen nimeäminen siten, että version numero merkitään nimen loppuun. Monet ohjelmistot myös tuottavat automaattista versiolokia, joten on hyvä tutustua käytetyn järjestelmän asetuksiin. Sovi tutkimusryhmän kanssa yhtenäinen käytäntö versioiden nimeämiseen ja versioiden synkronointiin sekä siihen, montako versiota aineistosta tuotetaan ja säilytetään. Jyväskylän yliopisto tarjoaa GitLab-palvelua koodin versionhallintaan. 

Pseudonymisointi ja anonymisointi

Kun käsittelet tutkimuksessasi henkilötietoja, huolehdi niiden pseudonymisoinnista tai mahdollisuuksien mukaan anonymisoinnista. Henkilötiedot ovat pseudonyymejä, kun suorat tunnisteet on krovattu koodilla tai peitenimillä, ja koodiavainta säilytetään erillään analyysiaineistosta. Aineiston arkaluonteisuuden asteesta riippuen pseudonymisointi saattaa riittää suojauskeinoksi tutkimushankkeen aikana, kunhan koodiavainta säilytetään arkaluonteiselle aineistolle soveltuvassa paikassa ja sen pääsyoikeudet ja käsittelytavat on selkeästi sovittu ja määritelty. Tietosuojalainsäädännössä suositellaan suorien tunnisteiden hävittämistä heti siinä vaiheessa, kun niitä ei enää tarvita tutkimuksen tarkoitusta varten.

Anonymisointi tarkoittaa, että aineiston tietoja ei voida kohtuullisin ponnistuksin yhdistää yksittäiseen luonnolliseen henkilöön, eli kaikki tunnisteelliset tiedot on poistettu. Aineiston koosta ja laadusta riippuen tämä vaatii aikaa ja muita resursseja, joten toimenpiteet on hyvä suunnitella mahdollisimman varhaisessa vaiheessa ja kirjata aineistonhallintasuunnitelmaan. Tietoarkiston Aineistonhallinnan käsikirjassa on seikkaperäiset ohjeet määrällisten ja laadullisten aineistojen anonymisoinnin suunnitteluun ja toteuttamiseen. 


3. Tallentaminen, jakaminen ja pääsynhallinta 

Oleellisia kysymyksiä: Minne tallennat aineistosi? Miten se varmuuskopioidaan? Miten jaat aineistoa tarvittaessa tietosuojan huomioiden? Miten valvot pääsyä aineistoon? Siirrätkö aineistoa EU:n ja ETA-alueen ulkopuolelle?

Tallennuspaikan valinta 

Aineistolle valittava, tarkoituksenmukaisin tallennusratkaisu riippuu riippuu aineiston ominaisuuksista: koosta, tyypistä sekä mahdollisten henkilötietojen arkaluonteisuudesta. Lähtökohtaisesti kaikki JYUssa tuotettu ja käytetty tutkimusaineisto tallennetaan yliopiston tai CSC:n järjestelmiin. Omien laitteiden tai ulkoisten tallennusvälineiden käyttöä tulee välttää.

Yliopiston tarjoamia tallennuspaikkoja ovat

  1. Nextcloud: pilvitallennuspalvelu, jolla saat Dropboxin ja OneDriven hyvät puolet tietäen, että aineistosi pysyy yliopiston palvelimilla ja hallussasi. Nextcloudiin saa henkilökohtaisen tilan lisäksi ryhmätyökansioita (vrt. S:-asema), jotka säilyvät, vaikka yksittäinen tutkija poistuisikin yliopiston palveluiden piiristä. HUOM: Nextcloud ei sovellu videoaineistolle. Lisätietoa ohjeista.
  2. Verkkolevyt (U:- ja S:-asemat). Ne ovat nopeita, tietoturvallisia ja toimintavarmoja, mutta niiden etäkäyttö ja tietojen jakaminen on vaikeaa.
  3. Tutkimusmoniviestin: verkkoselaimella toimiva palvelu ääni- ja videotiedostojen tallentamiseen ja käyttämiseen suoratoistolla (HUOM: ei sensitiiviselle aineistolle).
  4. Arkaluonteiselle ja salassa pidettävälle aineistolle CollabRoom-pilvipalvelu, jossa säilytät ja jolla jaat aineistoa tietoturvallisesti myös yliopiston ulkopuolisille partnereille. 
  5. Jyväskylän yliopiston kiintiö CSC:n IDA-palvelussa

Nextcloudin ja CollabRoomin tilaat HelpJYUsta.

Varmuuskopiointi

Yliopiston järjestelmät ottavat automaattisesti säännöllisiä varmuuskopioita. Sinun tulee kuitenkin suunnitella ja toteuttaa varmuuskopioiden ottaminen siinä vaiheessa, kun teet aineistoon merkittäviä muokkauksia. Säilytä alkuperäiset tiedostot eli ns. masterfilet erillään analyysitiedostoista ja tee kaikki muokkaukset analyysitiedostoihin. Näin aineisto ei katoa, jos datan prosessoinnissa tapahtuu jokin virhe. 

Pääsynhallinta

  • Nimeä ja dokumentoi vastuuhenkilö, joka valvoo pääsynhallintaa aineistoihin.
  • Pidä yllä tietoja siitä, kuka aineistoon on päässyt käsiksi ja kenellä on pääsyoikeus mihinkin osaan aineistosta.
  • Määrittele, kenellä on aineistoon katselu-, muokkaus- ja poisto-oikeudet.
  • Jos käsittelet henkilötietoja tai muutoin luottamuksellisia tai arkaluonteisia tietoja, määrittele erikseen, kenellä on pääsy niihin. 
  • Millä perusteella kukin käyttöoikeus (muokkaus, katselu, poisto) on myönnetty?
  • Miten valvonta toteutuu käytännössä (esim. salasanalla suojatut käyttöoikeudet, muutoslokin seuranta, kryptaus, fyysisten tilojen valvonta, lukitut säilytyskaapit)? 
  • Jos käsittelet erityisiä henkilötietoja, huolehdi siitä, että noudatat tutkittaville antamaasi kuvausta.  

Kuvaa ratkaisusi aineistonhallintasuunnitelmassasi.

Henkilötietoja sisältävän ja sensitiivisen aineiston tallennus ja siirto

Käsittele henkilötietoja sisältävää aineistoa alkuperäisessä tietojärjestelmässä aina, kun se on mahdollista. Henkilötietoja ei lähtökohtaisesti kannata siirtää ulos alkuperäistä järjestelmästä, esimerkiksi Excel-taulukkoon. Alkuperäisessä tietojärjestelmässä pystyt pitämään yllä lokitietoja siitä, kenellä on ollut pääsy aineistoon. Tämä on erityisen tärkeää, kun aineisto on arkaluonteista tai luottamuksellista. 

Jos siirrät henkilötietoja sisältävää aineistoa, huolehdi, että siirto tapahtuu tietoturvallisesti ja luottamuksellisesti. JYUn tallennuspalvelu CollabRoom soveltuu myös tietojen jakamiseen yhteistyökumppaneille yliopiston ulkopuolella. Jos joudut siirtämään tietoja sähköpostitse, käytä turvasähköpostia tai lähetä aineisto salattuna liitetiedostona. Varmista, että vain nimetyillä vastaanottajilla on pääsy aineistoon. Sovi vastaanottajan kanssa tietojen käsittelyn ehdoista.

Huolehdi, että siirrät aineistoa vain siten kuin olet kuvaillut tutkittaville antamassasi tietosuojailmoituksessa tai informoinnissa, jonka olet antanut tutkittaville esimerkiksi kyselyn tai haastattelun yhteydessä.   

Kansainvälisessä yhteistutkimuksessa voi syntyä tarve siirtää henkilötietoja sisältävää aineistoa joko muihin EU:n ja Euroopan talousalueen maihin tai niiden ulkopuolelle kolmansiin maihin. Syynä voi olla esimerkiksi se, että analyysiin tarvittava laitteisto on saatavilla vain jossain tietyssä maassa. Huomioi tällaisessa tilanteessa seuraava: 

  • Saat siirtää henkilötietoja EU:n ja ETA-alueen jäsenmaihin samoilla perusteilla kuin Suomen sisällä. Tietosuoja-asetuksessa on kuitenkin kansallista liikkumavaraa, joten säädösten yksityiskohdat voivat vaihdella maittain. Selvitä siksi hyvissä ajoin kansainvälisten yhteistyökumppaneiden kanssa kunkin maan erityissäädökset henkilötietojen tutkimustarkoituksessa tapahtuvan käsittelyn osalta. Dokumentoikaa ne tietosuojailmoitusta varten. 
  • Jos henkilötietoja on tarpeen siirtää EU- ja ETA-alueen ulkopuolelle, tietojen siirrolle on oltava Suomessa laillinen peruste, joka rekisterinpitäjänä toimivan tahon (tutkija, tutkimusryhmä tai yliopisto) tulee varmistaa. Lisäksi siirrossa tulee noudattaa tietosuoja-asetuksessa määriteltyjä erityisperiaatteita. Jos siirrät hankkeessasi henkilötietoja EU:n ja ETA-alueen ulkopuolelle, ole ensin yhteydessä yliopiston tietosuojavastaavaan: tietosuoja@jyu.fi

4. Aineiston avaaminen, arkistointi ja hävittäminen

Oleellisia kysymyksiä: Mitä osia aineistosta julkaisen, ja missä? Arkistoinko aineistoni vai hävitänkö sen tai osan siitä, ja millä perusteella? Miten toimin?

Aineistojen avaaminen Jyväskylän yliopistossa

Jyväskylän yliopisto pyrkii mahdollisimman laajaan tutkimusaineistojen ja niiden kuvailutietojen avoimuuteen. Samalla se tunnistaa, että aineiston luonteesta riippuen avoimuudessa on eri asteita:


Näin valmistelet aineistosi avaamisen

Aineiston avaamisen edellytyksenä on metatietojen ja aineiston dokumentaation ajantasaisuus. Julkaise aineistostasi aina peruskuvailutiedot eli metadata, vaikket voisi perustellusta syystä julkaista itse aineistoa. Tämä tapahtuu tutkimustietojärjestelmä Converiksen Tutkimusaineistot-osiossa. Sinne kirjataan aineiston perustietojen lisäksi tiedot siitä, missä julkaiset aineiston sekä mahdolliset julkaisemisen esteet. Näin yliopistolle jää arvokas tieto siitä, missä sen aineistoja säilytetään tai on julkaistu. Metadatan julkaiseminen kattaa myös useimpien merkittävien rahoittajien vaatimukset aineiston avoimuuden osalta tilanteessa, jossa aineiston avaamiselle on perusteltu este kuten arkaluonteisuus tai salassapitoveloite.

Hyvä tapa varmistaa tutkimushankkeen alusta asti on säilyttää menetelmiä, aineiston rakennetta, sisältöä ja muuta tutkimuksen kannalta oleellista tietoa koskeva dokumentaatio aineiston yhteydessä /DOCUMENTATION-nimisessä alakansiossa. Aineiston yleisiä metatietoja ylläpidät yliopiston Converiksen Tutkimusaineistot-osiossa. Aineistojen kuvailuun on olemassa myös kansallinen Qvain-työkalu, mutta suosittelemme ensisijaisesti käyttämään yliopiston omaa järjestelmää.

Luo aineistoistasi metatietokuvailu Converikseen jo hankkeesi alkuvaiheessa, jolloin voit päivittää sitä työn edetessä. Tällöin sitä ei tarvitse vielä julkistaa, vaan säilytät kuvailun omana tai tutkimusryhmäsi tietona siihen asti, että haluat julkaista metatiedot sekä mahdollisesti itse aineiston muulle maailmalle. Tässä vaiheessa voit pyytää Converiksen kautta valmiiden metatietojen ja koko aineiston julkaisemista JYX-julkaisuarkistossa. Kohta kohdalta -ohjeen löydät täältä.


Aineiston avaaminen

  • Aineistojen julkaisemista ohjaa "Niin avointa kuin mahdollista, niin suljettua kuin tarpeen" -periaate. Sen mukaisesti tutkija on aineistonsa paras tuntija ja harkitsee, mitä osia aineistosta voidaan julkaista, mitä toimenpiteitä julkaiseminen vaatii, ja mitä muulle aineistolle tehdään (arkistointi, hävittäminen). Näin suunnitelma kattaa aineiston koko elinkaaren. Jos aineistoa ei perustellusta syystä voida julkaista, syyt dokumentoidaan aineistonhallintasuunnitelmaan.
  • Valitse julkaistavaksi ne aineiston osat, jotka ovat relevantteja ja keskeisiä tutkimustulosten todentamista varten ja joilla on eniten uudelleenkäyttöarvoa. Vaikka osa aineistosta olisi arkaluonteista tai sisältäisi henkilötietoja, mukana voi kuitenkin olla arvokkaita osia, joiden julkaisemiselle ei ole estettä.
  • Kun suunnittelet aineistojen julkaisemisen alusta asti, vältyt turhalta ja vaivalloiselta työltä tutkimuksen edetessä ja saat aineistot julkaistua vaivatta. Julkaise aineistot kuvailtuina, järjestettyinä kokonaisuuksina luotettavissa, kuratoiduissa data-arkistoissa (ks. ohje edempänä). Näin takaat, että aineistosi on löydettävissä, saavutettavaa, teknisesti yhteentoimivaa ja uudelleenkäytettävää. Kerro julkaistavan aineiston kuvailutiedoissa aineistojen tekijätiedot, aineistoa koskevat sopimusehdot sekä käyttölisenssi. Näin varmistat, että muiden on mahdollista käyttää aineistoa uudelleen. Ilman selkeästi ilmoitettua käyttöehtolisenssiä aineisto on käyttökelvotonta.

Näin hyödyt aineistosi avaamisesta

Tutkimusaineistosi avaaminen vastaa rahoittajien vaatimuksiin avoimesta tieteestä ja tekee maailmasta paremman paikan, mutta hyödyttää suoraan myös sinua itseäsi:

  • Tutkimustasi on helpompi arvioida ja se on aidosti toistettavissa tieteen perusvaatimusten mukaisesti.
  • Löydät itsekin aineistosi myöhemmin varmemmin ja nopeammin jatkokäyttöön, vuosienkin kuluttua, vaikka välissä olisi vaihtunut tietokone, yliopisto tai vaikka manner.
  • Onko joskus ollut hankala muistaa, mitä joitakin vuosia vanhan datatiedoston tuokin sarake oikein tarkoitti? Tai miettiä, kenet täytyisi reiluuden nimissä pyytää mukaan jatkotutkimuksen julkaisuun, ja kuka taas ei ollut aineistoa keräämässä tai analysoimassa? Tutkimustyösi on helpompaa ja laadukkaampaa kun nämäkin tiedot ovat alusta asti tallessa ja julkaistu.
  • Tutkimustyöhösi voidaan viitata tätäkin kautta, ja sinut löydetään helpommin = uusia yhteistyökumppaneita, tunnetumpi nimi, enemmän mahdollisuuksia kiinnostavaan ja palkitsevaan tieteen tekemiseen.
  • Aineistollasi voidaan tehdä tiedettä tavoilla, joita et itse osannut edes kuvitella.
  • Julkaistut aineistot ovat jo nyt merkittävä kohta useiden rahoittajien CV-vaatimuksissa. Tämän ansioituneisuuden merkitys tulee varmuudella kasvamaan tulevaisuudessa. Ole ensimmäisten joukossa liikkeellä ja avaa kaikki mitä vain voit: saat etua kilpaillun rahoituksen hakemisessa ja muutenkin akateemisten ansioiden arvioinneissa. Vaikkapa hakiessasi professuuria 2020-luvulla!
  • Tärkeimpänä: tutkimustyösi tilaisuus vaikuttaa maailmaan kasvaa – paljon.

Näin valmistelet aineistosi avaamisen

Aineiston avaamisen edellytyksenä on metatietojen ja aineiston dokumentaation ajantasaisuus. Hyvä tapa varmistaa se tutkimushankkeen alusta asti on säilyttää menetelmiä, aineiston rakennetta, sisältöä ja muuta tutkimuksen kannalta oleellista tietoa koskeva dokumentaatio aineiston yhteydessä /DOCUMENTATION-nimisessä alakansiossa. Aineiston yleisiä metatietoja pidät yllä yliopiston Converis-järjestelmän Tutkimusaineistot-osiossa. Aineistojen kuvailuun on olemassa myös kansallinen Qvain-työkalu, mutta suosittelemme ensisijaisesti käyttämään yliopiston omaa järjestelmää.

Metatietotallenteen luominen ei tarkoita vielä julkaisemista. Voit säilyttää sen vain omana tai tutkimusryhmäsi tietona, kunnes olet valmis avaamaan aineiston maailmalle. Luotu tallenne kuitenkin mahdollistaa jo varhaisen vaiheen tuen Jyväskylän yliopistolta aineistonhallinta-asioissasi. Converis-järjestelmän kautta voit pyytää valmiiden metatietojen tai vaikka koko aineistonkin julkaisemista yliopiston JYX-julkaisuarkistossa.

Sopivan data-arkiston valinta

Hyviä käytäntöjä

  • Julkaise aineistosi ensisijaisesti tieteenala- tai tutkimusalakohtaisessa digitaalisessa tietoarkistossa (eng. repository). Alakohtaisessa arkistossa data päätyy varmimmin alasi tutkijoiden löydettäväksi. 
  • Re3data-portaali on hyvä paikka sopivan arkiston hakuun ja oman alan arkistojen selailuun. 
  • Jos sopivaa alakohtaista tietoarkistoa ei ole saatavilla, julkaise datasi yliopiston JYX-julkaisuarkistossa.
  • Käytä yleisiä data-arkistoja kuten Zenodoa, Dryadia ja figsharea vasta viimeisenä vaihtoehtona. Niiden sisällön sekalaisuus heikentää datan löydettävyyttä ja vaikeuttaa löydösten arviointia.
  • Pelkkä omilla tai hankkeen kotisivuilla julkaiseminen ei täytä rahoittajien vaatimuksia eikä yliopiston odotuksia aineiston löydettävyydestä ja saavutettavuudesta. 


Näin tunnistat suositeltavan data-arkiston

  • Arkisto on alasi tutkijoiden laajalti käyttämä
  • Arkisto antaa aineistolle pysyvän tunnisteen, kuten DOI tai URN
  • Arkisto julkaisee koneluettavan metadatan ja käyttää tunnettua metadatastandardia
  • Arkistolla on toiminnan luotettavuutta osoittava sertifikaatti, esimerkiksi Core Trust Seal ja ISO 16363 –standardi
  • Arkisto antaa sinun valita käyttöehdot, joilla aineisto on jatkokäytettävissä.

 

Tietoarkisto

Tietoarkisto (FSD) on tutkimuksen ja opetuksen valtakunnallinen palveluinfrastruktuuri. Se arkistoi ja välittää sähköisiä tutkimusaineistoja tutkimukseen, opetukseen ja opiskeluun. Yksikkö toimii Tampereen yliopiston yhteydessä.

Tietoarkisto edistää tieteen avoimuutta, läpinäkyvyyttä, tiedon kumuloitumista ja olemassa olevan tiedon tehokasta tutkimuskäyttöä ja toteuttaa vastuullisesti FAIR-periaatteita. FAIR tarkoittaa, että palvelut ja aineistot ovat helposti löydettäviä, saavutettavia, yhteentoimivia ja jatkokäytettäviä. Toiminnan perusta on asiantunteva, nopea, tasapuolinen ja maksuton palvelu.

Tietoarkisto vastaanottaa digitaalisia tutkimusaineistoja, jotka sopivat esimerkiksi yhteiskuntatieteiden, humanististen alojen, kasvatustieteiden sekä terveystieteiden tutkimukseen, opetukseen ja opiskeluun. Aineistojen tulee olla teknisesti ja juridisesti arkistointikelpoisia. Tietoarkisto tarkistaa aineistot ja niiden dokumentaation.


Kielipankki 


Kielipankki on vakiintunut tieteenalakohtainen tietoarkisto. Se on kieliaineistoja käyttävien tutkijoiden palvelukokonaisuus. Kielipankissa on laaja valikoima teksti- ja puheaineistoja, joista voi tehdä monipuolisia hakuja. Voit tutkia ja käsitellä aineistoja virtuaalisessa työtilassa Kielipankin työkaluilla tai ladata niitä omalle koneellesi.

Monet aineistot ovat käytettävissä avoimesti, osa puolestaan oman yliopiston myöntämin tunnuksin. Suojattujen aineistojen käyttöoikeuksia voi hakea sähköisesti. Kielipankin peruskäyttö on tutkijoille ja opiskelijoille ilmaista.

Ohjeet Kielipankin sisällöntuottajille




JYX

JYX on Jyväskylän yliopiston julkaisualusta julkaisuille ja tutkimusaineistoille. JYX tarjoaa aineistoille pysyvät tunnisteet (DOI, URN). Palveluun syötettyjen datasettien metatiedot toimitetaan kansalliseen METAX-katalogiin, josta ne päätyvät JYXin lisäksi löydättäväksi kansallisesta ETSIN-palvelusta ja keskeisimmistä eurooppalaisista tutkimusaineistojen hakupalveluista.

Datan julkaiseminen JYXissä on yksinkertaista: syötä vain datan metatiedot tutkimustietojärjestelmä Converikseen ja pyydä sieltä aineiston julkaisemista. Ohjeet löydät täältä.

JYX-huoltokatko ke 6.11.2019 klo 15:30 — Digipalvelut

Aineiston arkistointi ja hävittäminen

Mikäli et julkaise aineistoa mutta haluat arkistoida sen, suunnittele säilytysaika ja ilmoita se aineistonhallintasuunnitelmassa. Mainitse myös arkistosijainti. Jyväskylän yliopiston arkistonmuodostussuunnitelman mukaan tutkimusaineistojen säilytysaika on pääsääntöisesti 1-5 vuotta tutkimuksen julkaisemisen jälkeen. Mikäli tutkimuksella on rahoittaja, tarkista säilytysajan osalta myös se, mitä rahoittajan kanssa on sovittu.

Hyviä käytäntöjä

  • Ennen hävittämistä tarkista omalta laitokseltasi, kuinka kauan tutkimusaineistoja tulee säilyttää oppiaineessasi. 
  • Paperiset aineistot hävitetään luottamuksellisten paperien kierrätyslaatikkoon, josta ne päätyvät silppuriin. Useissa yliopiston rakennuksissa on tähän tarkoitukseen tummanharmaita lukollisia tietoturva-astioita.
  • Palautettavat tallennusvälineet (esim. nauhurit) tyhjennetään ylikirjoittamalla ennen palautusta. Ylikirjoittaminen tarkoittaa sitä, että tallennusväline täytetään useita kertoja satunnaisella datalla, jonka jälkeen ei pystytä enää saamaan esille alkuperäisiä tiedostoja. Avoimen lähdekoodin ylikirjoitusohjelmistoja ovat mm. Eraser ja WipeFile. Kysy tarvittaessa neuvoa yliopiston tietoturva-asiantuntijalta HelpJYU-portaalin kautta.
  • Hävitettävät tallennusvälineet tyhjennetään ylikirjoittamalla ja viedään lukittuun luottamuksellisen materiaalin kierrätyslaatikkoon. Näitä vihreitä lukollisia astioita löydät yliopiston eri rakennusten vahtimestaripisteistä.
  • Merkitse Converiksessa aineiston metatietoihin aineisto hävitetyksi.

Aineiston pitkäaikaissäilytys

Tutkimusaineiston pitkäaikaissäilytyksellä tarkoitetaan vähintään 25 vuoden säilytysaikaa. Kansallisesti arvokkaille aineistoille on tähän tarkoitukseen tarjolla CSC:n ylläpitämä Fairdata-PAS-palvelu, joka säilyttää aineistoja kymmenistä satoihin vuosiin. Tutkimusdatapolitiikkansa mukaisesti Jyväskylän yliopisto koordinoi keskitetysti aineistojensa pitkäaikaistallentamista siten, että merkittävimmät yliopiston aineistot tullaan pitkäaikaistallentamaan. Aineistojen valintakriteerit ja menettely tarkentuvat myöhemmin. 


Kaikissa aineistojen hallintaan ja julkaisemiseen liittyvissä kysymyksissä sinua auttaa Avoimen tiedon keskus: researchsupport-osc@jyu.fi.

Ohjeiden laatimisessa on käytetty lähteinä Helsingin yliopiston Aineistonhallinta-sivustoa (CC BY 4.0), viitattu 28.2.2021, Helsingin yliopiston Making a research project understandable - A guide to data documentation -opasta (CC BY 4.0) ja Tampereen yliopiston Tutkimusaineistojen hallinta -opasta (CC BY 4.0, viitattu 1.3.2021).