Dokumentointi ja metatiedot
Aineistonhallintasuunnitelmassa kerrot tässä kohtaa
1) Miksi aineistonhallinnan dokumentointi ja metatietojen kirjaaminen kannattaa?
Kirjoita oman aineistosi keskeiset metatiedot siltä osin kuin mahdollista.
Osio liittyy kaikkiin FAIR-periaatteisiin eli Findable, Accessible, Interoperable ja Re-usable.
Aineistonhallinnan olennainen osa on huolehtia dokumentoinnista eli pitää kirjaa siitä, mitä olet tekemässä. Tämän voi tehdä esimerkiksi kirjoittamalla tutkimuspäiväkirjaa tai käyttämällä excel-taulukkoa, johon aineiston käsittelyn vaiheita kirjataan.
Entä mitä on metadata? Kuvittele aineistosi suljettuna pakettina, jonka sisältöä et tunne. Metadata on ikään kuin paketin päällä oleva tarra, jossa kerrotaan paketin sisältö.
Dokumentointi
- Tieteellisessä tiedontuottamisessa edellytetään, että tutkimusprosessi dokumentoidaan niin tarkasti, että tutkimus olisi mahdollista toistaa jälkikäteen samanlaisena.
- Pidä tutkimusprosessissasi alusta alkaen huoli siitä, että sinun on mahdollista kuvata se tarpeeksi tarkasti opinnäytteessäsi.
- Dokumentointivaatimus koskee myös aineistoja – aineistojen synty, rakenne ja käsittely tulee pystyä kuvaamaan muille ymmärrettävässä muodossa.
- Aineistoon liittyvään dokumentointiin voi käyttää esimerkiksi formaalia tutkimuspäiväkirjaa tai excel-taulukkoa, joissa kerrotaan
- mistä eri osista aineisto koostuu, sekä
- keskeiset tiedot aineiston osista (esim. haastattelujen määrä, haastattelupäivä, erityiset teemat jne.)
Käytännössä pidät kirjaa siitä, mitä teit, milloin, miten ja keiden kanssa. Dokumentointi auttaa sinua löytämään esimerkiksi tekemiesi haastatteluiden joukosta juuri sen yhden haastattelun, jossa puhuttiin asiasta X.
Näin tehdessäsi työskentelysi on pidemmälle ajateltua, systemaattisempaa ja jäsentyneempää eli teet parempaa tiedettä. Helpotat omaa etenemistäsi, kun tiedät, mitä olet tekemässä ja miten löydät aineistostasi sen, mitä kulloinkin tarvitset. Voit näin myös palata aineistoosi ongelmitta tai luovuttaa sen lupien salliessa muiden tutkijoiden käyttöön niin, että se on heille ymmärrettävää.
Eri tieteenaloilla voi olla dokumentointiin liittyviä omia käytänteitä. Kemian opiskelijat voivat katsoa esimerkin laboratoriopäiväkirjan täyttämisestä.
Metatiedot ovat osa dokumentointia
- Dokumentointiin kuuluu aineiston metatietojen kirjaaminen ja päivittäminen.
- Käytännössä tarvitset tutkimusaineistosi liitteeksi sitä kuvailevaa ja teknistä tietoa. Näistä muodostuvat aineistosi metatiedot (metadata). Toisin sanoen metatieto tarkoittaa tietoa tiedosta, tässä tapauksessa tietoa tutkimusaineistostasi.
Metatietoja ovat esimerkiksi aineistolle annettu nimi sekä milloin ja miten aineisto on kerätty. Tärkeää on muun muassa se, millä periaatteella nimeät kansiot ja tiedostot. Esimerkiksi tiedoston uusimman version tunnistaminen on helppoa, kun nimeät uusimman version aina johdonmukaisesti samalla tavala. Voit ajatella metatietoja yhdenlaisena aineiston luku- ja käyttöoppaana (”readme” tiedosto, esim. Guide to writing ”readme” style metadata).
Metatietojen avulla varmistat, että sinä tai jatkokäyttäjä pystyy löytämään kaiken tarvittavan ja tulkitsemaan aineiston samalla tavalla käyttöhetkestä ja -kontekstista riippumatta. Jos sinulla olisi pelkkä keräämäsi aineisto, mutta ei minkäänlaista selittävää tietoa ja gradun tekemiseen tulisi tauko, muistaisitko enää kuukauden päästä, mitä olit tekemässä ja mitä missäkin tiedostossa on? Ja jos luovuttaisit aineiston tutkimusryhmän käyttöön, mutta et olisi selittänyt käyttämiäsi muuttujia ja lyhenteitä, pystyisikö tutkimusryhmä edes ymmärtämään aineistoasi?
Entä jos käytät valmista aineistoa? Arkistoidussa valmiissa aineistossa arkistoija on hoitanut kuvailut ja löydät ne arkiston aineistoluetteloista. Huomioi kuitenkin, että valmiin aineiston pohjalta tekemäsi omat taulukoinnit yms. vaativat, että kuvailet ne itse. Omassa aineistossasi voit tallentaa sekä tutkimusaineiston että sen kuvailutiedot sisältävän tiedoston samaan paikkaan.
Huomaa, että vaikka et todennäköisesti pysty määrittelemään täysin tarkasti kaikkia tutkimuksesi kannalta relevantteja metatietoja tutkimuksesi alkuvaiheessa, niin suunnittele ne sillä tarkkuudella kuin se on mahdollista.
- Metatiedoissa ei tarvitse kertoa uudestaan asioita, jotka on jo kerrottu muualla. Jos jokin asia on selitetty esimerkiksi tutkimussuunnitelmassa, sitä ei tarvitse selittää uudestaan aineistonhallintasuunnitelman metatieto-osiossa.
Muista tarkentaa suunnitelmaasi koko tutkimusprosessin ajan eli myös kurssin jälkeen!
Katso video, jolla kerrotaan muun muassa dokumentoinnin kannalta haasteellisesta tilanteesta, kun gradu on jäänyt odottamaan useaksi vuodeksi.
Esimerkkejä metatiedoista
- Metatietoja on monenlaisia ja eri tilanteissa saatetaan tarvita erilaisia metatietoja.
- Jos jokin tieto on jo kerrottu tutkimussuunnitelmassa, sitä ei tarvitse kertoa uudestaan aineistonhallintasuunnitelmassa.
Kuvaile aineistonhallintasuunnitelmassa esimerkiksi nämä metatiedot soveltuvilta osin:
1. Yleiset tiedot
- Koko aineiston nimi – sisältöä kuvaavasti
- Tutkijan/tutkijoiden nimet
- Mahdolliset muut tutkimusprosessiin osallistujat rooleineen, esimerkiksi litteroija
- Milloin aineisto on kerätty (pp.kk.vvvv tai aikaväli)
- Missä aineisto on kerätty, esimerkiksi ”näytteet on otettu paikassa x” jos olennainen tieto
- Avainsanat, esimerkiksi sosiaalityöntekijät, eduskuntavaalit, verkkopalvelut
- Miten dokumentoit aineiston keräämisen ja käsittelyn? Esimerkiksi formaali tutkimuspäiväkirja tai excel-taulukko.
2. Tiedostot ja kansiot
Kirjaa seuraavista kohdista vastaukseesi ne tiedot, jotka kertovat siitä, miten ja missä säilytät aineistoa. Vastauksessa ei tarvitse luetella kansioiden ja tiedostojen nimiä, eikä siihen tarvitse sisällyttää kansioiden sisällönkuvauksia. Kerro vastauksessasi esimerkiksi, millä logiikalla nimeät kansiot ja tiedostot (kansiorakenne, uusimman tiedoston tunnistaminen).
- Nimeä tiedostot ja kansiot johdonmukaisesti samalla tavalla – sisältöä kuvaavasti
- Lyhyt kuvausteksti kansion sisällöstä (esimerkiksi .txt-tekstidokumentti, joka tallennetaan kansioon)
- Tarvittaessa kuvausteksti siitä, miten tiedostot ja kansiot on nimetty (esimerkiksi .txt-tekstidokumentti, joka tallennetaan kansioon)
- Luo johdonmukainen kansiorakenne ja kirjoita muistiin, missä aineisto on
- Kansiopolku esimerkiksi U : Documents > Opiskelu > Gradu > Data jne.
- Jos aineisto tai osa siitä on muualla kuin tietokoneella, kirjoita muistiin, missä aineisto on
- Jos aineisto on todella laaja, saatat tarvita hakemiston, joka helpottaa kulloinkin tarvittavan tiedon löytymistä aineistosta.
- Milloin kansiot ja tiedostot on luotu (pp.kk.vvvv tai aikaväli)
- Milloin eri versiot on luotu (pp.kk.vvvv tai aikaväli)
- Kun teet merkittäviä muutoksia tai eri versioita, kuvaile muutokset esim. tiedoston nimessä, erillisessä tekstidokumentissa tai tutkimuspäiväkirjassa
3. Miten aineisto kerätty ja miten sitä tulkitaan
- Miten aineisto on kerätty? Kerro käytetty metodologia.
- Voit liittää tai linkittää lomakkeet tms. (ei tarvitse laittaa vastaukseen)
- Miten aineistoa käytetään tutkimuksessasi?
- Kirjaa ohjelmistot tai laitteet, joita aineiston keräämiseen on käytetty tai joita tarvitaan, jos halutaan katsella dataa
- Esimerkiksi haastatteluiden tekemiseen oikea nauhuri, ei puhelin, joka usein tallentaa sisältöä automaattisesti pilvipalveluun.
- Kirjaa laitteiden kalibroinnit.
- Muuttujat ja niiden määritelmät.
- Koodien, symboleiden ja lyhenteiden selitykset.
- Jos aineistossa on puuttuvia/puutteellisia kohtia, miten merkitset ne?
4. Jakamiseen ja pääsyyn liittyvä tieto
- Liittyykö aineistoon lisenssejä, esimerkiksi cc-lisenssit?
- Lisensseillä voidaan määritellä, kenellä on oikeus käyttää aineistoa ja mitä aineistolla saa tehdä. CC-lisenssit ovat avoimen käytön mahdollistavia lisenssejä, joilla voi antaa erilaisia lupia.
- Millaisia rajoituksia aineiston käyttöön ja jakamiseen liittyy?
- Onko aineisto jo julkaistu jossain? Miten siihen pääsee käsiksi?
Tarvitessasi metatiedoista kattavammin Aineistonhallinnan käsikirjassa.