Dokumentointi ja metatiedot

Aineistonhallintasuunnitelmassa kerrot tässä kohtaa

1) Miksi aineistonhallinnan dokumentointi ja metatietojen kirjaaminen kannattaa?

2) Kerro kuinka dokumentoit aineistoasi ja sen käsittelyä. Kerro esimerkein aineistosi metatiedot siltä osin kuin pystyt. Jos et ole vielä saanut aineistoa, kerro asiasta yleisellä tasolla.

Osio liittyy kaikkiin FAIR-periaatteisiin eli Findable, Accessible, Interoperable ja Re-usable.

Aineistonhallinnan olennainen osa on huolehtia dokumentoinnista eli pitää kirjaa siitä, mitä olet tekemässä. Tämän voi tehdä esimerkiksi kirjoittamalla tutkimuspäiväkirjaa tai käyttämällä excel-taulukkoa, johon aineiston käsittelyn vaiheita kirjataan. Dokumentointi on siis prosessi, joka tekee aineistosta ymmärrettävää ja käyttökelpoista. 

Entä mitä on metadata eli metatiedot? Kuvittele aineistosi suljettuna pakettina, jonka sisältöä et tunne. Metadata on ikään kuin paketin päällä oleva tarra, jossa kerrotaan paketin sisältö. 

  • Tutkimuksessa metatiedoilla tarkoitetaan aineistoa kuvailevia perustietoja, jotka on laadittu ihmis- ja koneluettavassa muodossa ja jotka mahdollistavat aineiston identifoimisen ja löydettävyyden, jos aineisto julkaistaan verkossa.
  • Opinnäytetyöprosessissa metatietoja ei yleensä julkaista, joten niitä voi ajatella aineiston sisällysluettelona, jonka laatimalla pidät tiedostot ja kansiot järjestyksessä. Sinulla voi olla esimerkiksi kaksi kokoelmaa valokuvia. Mitä perustietoja sinun on listattava niistä, jotta erotat ne toisistaan ja pystyt työskentelemään sujuvasti? 

Dokumentointi ja metatiedot auttavat varmistamaan, että työskentelysi on sujuvaa ja järjestelmällistä.

Dokumentointi

  • Tieteellisessä tiedontuottamisessa edellytetään, että tutkimusprosessi dokumentoidaan niin tarkasti, että tutkimusasetelma olisi mahdollista toistaa jälkikäteen samanlaisena. Näin tulosten luotettavuus voidaan todentaa.
  • Pidä tutkimusprosessissasi alusta alkaen huoli siitä, että sinun on mahdollista kuvata se tarpeeksi tarkasti opinnäytteessäsi.
  • Dokumentointivaatimus koskee myös aineistoja – aineistojen synty, rakenne ja käsittely tulee pystyä kuvaamaan muille ymmärrettävässä muodossa.
  • Aineistoon liittyvään dokumentointiin voi käyttää esimerkiksi formaalia tutkimuspäiväkirjaa tai excel-taulukkoa, joissa kerrotaan
    • mistä eri osista aineisto koostuu, sekä
    • keskeiset tiedot aineiston osista (esim. haastattelujen määrä, haastattelupäivä, erityiset teemat jne.)
 

Käytännössä pidät kirjaa siitä, mitä teit, milloin, miten, miksi ja keiden kanssa. Dokumentointi auttaa sinua löytämään esimerkiksi tekemiesi haastatteluiden joukosta juuri sen yhden haastattelun, jossa puhuttiin asiasta X. Esimerkiksi käyttämiesi muuttujien selitysten kirjaaminen auki sekä muistiinpanojen laatiminen aineiston muokkaamisen ja analyysin kustakin vaiheesta ovat keskeinen osa dokumentointia.  

Näin tehdessäsi työskentelysi on pidemmälle ajateltua, systemaattisempaa ja jäsentyneempää eli teet parempaa tiedettä. Helpotat omaa etenemistäsi, kun tiedät, mitä olet tekemässä ja miten löydät aineistostasi sen, mitä kulloinkin tarvitset. Voit näin myös palata aineistoosi ongelmitta tai luovuttaa sen lupien salliessa muiden tutkijoiden käyttöön niin, että se on heille ymmärrettävää.

Eri tieteenaloilla voi olla dokumentointiin liittyviä omia käytänteitä. Kemian opiskelijat voivat katsoa esimerkin laboratoriopäiväkirjan täyttämisestä.

Metatiedot osana dokumentointiprosessia

Huomaa, että vaikka et todennäköisesti pysty määrittelemään täysin tarkasti kaikkia tutkimuksesi kannalta relevantteja metatietoja tutkimuksesi alkuvaiheessa, niin suunnittele ne sillä tarkkuudella kuin se on mahdollista. Näin kuvailet aineistosi loogisesti työn aikana, eivätkä tiedostot ja kansiot mene sekaisin.

  • Dokumentointiin kuuluu aineiston metatietojen eli peruskuvailutietojen kirjaaminen ja päivittäminen.
  • Käytännössä tarvitset tutkimusaineistosi liitteeksi sitä kuvailevaa ja teknistä tietoa. Näistä muodostuvat aineistosi metatiedot (metadata). Toisin sanoen metatieto tarkoittaa tietoa tiedosta, tässä tapauksessa kuvailutietoa tutkimusaineistostasi.
  • Jos aineistosi soveltuu julkaistavaksi tai tarjottavaksi arkistoitavaksi opinnäytteen valmistumisen jälkeen, tarvitset metatiedot sitä varten.

Metatietoja ovat aineistotyypistä riippuen esimerkiksi aineistolle annettu nimi, tekijä sekä milloin, missä ja miten aineisto on kerätty. Tärkeää on muun muassa se, millä periaatteella nimeät kansiot ja tiedostot. Esimerkiksi tiedoston uusimman version tunnistaminen on helppoa, kun nimeät uusimman version aina johdonmukaisesti samalla tavalla

Metatietojen avulla varmistat, että sinä tai jatkokäyttäjä pystyy löytämään kaiken tarvittavan ja tulkitsemaan aineiston yksiselitteisesti käyttöhetkestä ja -kontekstista riippumatta. Jos sinulla olisi pelkkä keräämäsi aineisto, mutta ei minkäänlaista selittävää tietoa ja gradun tekemiseen tulisi tauko, muistaisitko enää kuukauden päästä, mitä olit tekemässä ja mitä missäkin tiedostossa on? Ja jos luovuttaisit aineiston tutkimusryhmän käyttöön, mutta et olisi selittänyt käyttämiäsi muuttujia ja lyhenteitä, pystyisikö tutkimusryhmä edes ymmärtämään aineistoasi? Voit ajatella dokumentaatiota ja metatietoja yhdenlaisena aineiston luku- ja käyttöoppaana (”readme” tiedosto, esim. Guide to writing ”readme” style metadata).

Entä jos käytät valmista aineistoa? Arkistoidussa valmiissa aineistossa arkistoija on hoitanut kuvailut ja löydät ne arkiston aineistoluetteloista. Huomioi kuitenkin, että valmiin aineiston pohjalta tekemäsi omat taulukoinnit yms. vaativat, että kuvailet ne itse. Omassa aineistossasi voit tallentaa sekä tutkimusaineiston että sen kuvailutiedot sisältävät tiedostot samaan paikkaan.

Muista tarkentaa suunnitelmaasi koko tutkimusprosessin ajan eli myös kurssin jälkeen!

Katso video, jolla kerrotaan muun muassa dokumentoinnin kannalta haasteellisesta tilanteesta, kun gradu on jäänyt odottamaan useaksi vuodeksi.

Esimerkkejä metatiedoista

  • Metatietoja on monenlaisia ja eri tilanteissa saatetaan tarvita erilaisia metatietoja.
  • Jos jokin tieto on jo kerrottu tutkimussuunnitelmassa, sitä ei tarvitse kertoa uudestaan aineistonhallintasuunnitelmassa.
  • Muista, että vaikka et todennäköisesti pysty määrittelemään tarkasti kaikkia tutkimuksesi kannalta relevantteja metatietoja tutkimuksesi alkuvaiheessa, niin suunnittele ne sillä tarkkuudella kuin mahdollista.

Kuvaile tai suunnittele aineistonhallintasuunnitelmassa esimerkiksi nämä metatiedot soveltuvilta osin:

1. Yleiset tiedot

  • Koko aineiston nimi – sisältöä kuvaavasti
  • Tutkijan/tutkijoiden nimet
  • Mahdolliset muut tutkimusprosessiin osallistujat rooleineen, esimerkiksi litteroija
  • Milloin aineisto on kerätty (pp.kk.vvvv tai aikaväli)
  • Missä aineisto on kerätty, esimerkiksi ”näytteet on otettu paikassa x” jos olennainen tieto
  • Avainsanat, esimerkiksi sosiaalityöntekijät, eduskuntavaalit, verkkopalvelut
  • Miten dokumentoit aineiston keräämisen ja käsittelyn? Esimerkiksi formaali tutkimuspäiväkirja tai excel-taulukko.

2. Tiedostot ja kansiot

Kirjaa seuraavista kohdista vastaukseesi ne tiedot, jotka kertovat siitä, miten ja missä säilytät aineistoa. Kerro vastauksessasi esimerkiksi, millä logiikalla nimeät kansiot ja tiedostot (kansiorakenne, uusimman tiedoston tunnistaminen).

  • Nimeä tiedostot ja kansiot johdonmukaisesti samalla tavalla – sisältöä kuvaavasti
    • Lyhyt kuvausteksti kansion sisällöstä (esimerkiksi .txt-tekstidokumentti, joka tallennetaan kansioon)
    • Tarvittaessa kuvausteksti siitä, miten tiedostot ja kansiot on nimetty (esimerkiksi .txt-tekstidokumentti, joka tallennetaan kansioon)
  • Luo johdonmukainen kansiorakenne ja kirjoita muistiin, missä aineisto on
    • Kansiopolku esimerkiksi U : Documents > Opiskelu > Gradu > Data jne.
    • Jos aineisto tai osa siitä on muualla kuin tietokoneella, kirjoita muistiin, missä aineisto on
    • Jos aineisto on todella laaja, saatat tarvita hakemiston, joka helpottaa kulloinkin tarvittavan tiedon löytymistä aineistosta.
  • Milloin kansiot ja tiedostot on luotu (pp.kk.vvvv tai aikaväli)
  • Milloin eri versiot on luotu (pp.kk.vvvv tai aikaväli)
    • Kun teet merkittäviä muutoksia tai eri versioita, kuvaile muutokset esim. tiedoston nimessä, erillisessä tekstidokumentissa tai tutkimuspäiväkirjassa

3. Miten aineisto kerätty ja miten sitä tulkitaan

  • Miten aineisto on kerätty? Kerro käytetty metodologia.
    • Voit liittää tai linkittää lomakkeet tms. (ei tarvitse laittaa vastaukseen)
  • Miten aineistoa käytetään tutkimuksessasi?
  • Kirjaa ohjelmistot tai laitteet, joita aineiston keräämiseen on käytetty tai joita tarvitaan, jos halutaan katsella dataa
    • Esimerkiksi haastatteluiden tekemiseen oikea nauhuri, ei puhelin, joka usein tallentaa sisältöä automaattisesti pilvipalveluun.
    • Kirjaa laitteiden kalibroinnit.
  • Muuttujat ja niiden määritelmät.
  • Koodien, symboleiden ja lyhenteiden selitykset.
  • Jos aineistossa on puuttuvia/puutteellisia kohtia, miten merkitset ne?

4. Jakamiseen ja pääsyyn liittyvä tieto

    • Jos käytät jonkun toisen tuottamaa aineistoa, liittyykö aineistoon lisenssejä, esimerkiksi cc-lisenssit?
      • Lisensseillä voidaan määritellä, kenellä on oikeus käyttää aineistoa ja mitä aineistolla saa tehdä. CC-lisenssit ovat avoimen käytön mahdollistavia lisenssejä, joilla voi antaa erilaisia lupia.
    • Millaisia rajoituksia käyttämäsi valmiin aineiston ja/tai itse tuottamasi aineiston käyttöön ja jakamiseen liittyy? Esimerkiksi henkilötiedot yleensä rajoittavat.
  • Onko aineisto jo julkaistu jossain? Miten siihen pääsee käsiksi?

Metatiedoista kattavammin Aineistonhallinnan käsikirjassa.