Siirry pääsisältöön

Avoimen TKI-toiminnan opas

Aineistojen tallennusohjeet

Xamkin tiedostojen tallennusohjeen löydät Xamkin opiskelijoiden ja henkilökunnan yhteisestä intranetistä, Luxista (vaatii kirjautumisen Xamkin tunnuksilla). Helsingin yliopiston ja CSC:n tuottama Datan organisoinnin ABC sisältää kootusti tietoa kansiorakenteesta, nimeämisestä, versionhallinnasta, dokumentoinnista sekä taulukkomuotoisten tiedostojen käytöstä (tiedosto nimetty Datan_organisoinnin_ABC_alustus_FI). 
 

Hankkeessa kerätyn aineiston hyvät tallennus- ja dokumentointikäytännöt

  • auttavat välttämään virheitä ja sekaannuksia sekä helpottavat aineiston jakamista eri toimijoiden kesken
  • varmistavat, että aineistot ovat löydettävissä ja käytettävissä tarvittaessa vielä hankkeen jälkeenkin

Tietoturvan varmistaminen on oleellinen osa tallentamista. Tietoturvan varmistaminen edellyttää muun muassa organisaation tietoturvaohjeistuksen noudattamista ja erilaisia teknisiä toimenpiteitä, joilla varmistetaan tiedon luottamuksellisuus.

Tiedostojen tallennuspaikan valintaan vaikuttavat mm. hankkeen toimijoiden yhteistyötarpeet, tiedostojen koko ja luonne sekä tietoturvaan liittyvät seikat.

  • Tietoturvasta huolehtiminen on tärkeää aina, mutta erityisen tärkeää se on silloin, kun on kyse arkaluontoisesta aineistosta.
  • Tietoturvan varmistamiseen kuuluu aineiston tuhoutumisen, vahingoittumisen ja muuttumisen tai varastamisen estäminen sekä pääsy- ja käyttöoikeuksien hallinta.
  • Myös varmuuskopiointi on osa tietoturvaa.

Tiedostojen hallinta

Tiedostojen organisointi ja nimeäminen
  • Nimeämiskäytännöt on hyvä suunnitella ja sopia projektin alussa 
  • Nimeämisen tulee olla johdonmukaista ja selkeää
  • Nimien ei tulisi olla liian pitkiä kuin ei myöskään liian lyhyitä
  • Hyvä tiedostonimi on loogisesti jäsennetty ja se kertoo sisällöstä (esim. projektin nimi, aineiston nimi, tekijä, pvm vuosi-kk-pv versionumero)
  • Käytä tarvittaessa lyhenteitä. Lyhenteiden merkitys tulee dokumentoida, jotta lyhenteet ovat ymmärrettävissä. 
  • Vältä erikoismerkkejä

Systemaattinen aineistojen organisointi ja dokumentointi helpottavat hankkeen aineistojen löytymistä ja käyttöä hankkeen aikana ja luovat edellytykset myös aineistojen mahdolliselle jatkohyödyntämiselle.

Tiedostomuodon (tiedostoformaatin) valinta
  • Tiedostomuodon  valinta kannattaa tehdä varhaisessa vaiheessa, jotta vältytään esimerkiksi turhilta formaatinmuutoksilta.

  • Tiedon siirtäminen formaatista toiseen ei yleensä onnistu täydellisesti, jotain tietoa saattaa hävitä, esim. tekstin muotoilut, taulukoiden tietosisältö, kuvien resoluutio tai äänenlaatu.

  • Tiedostomuodon tulisi olla sellainen, joka on käytettävissä mahdollisimman pitkään. Kokonaan ohjelmistoriippumattomia tallennusformaatteja ei kuitenkaan ole tarjolla.

Yleisiä tiedostoformaatteja, joita useimmat eri ohjelmistot tukevat:

Teksti:
txt, .odt., .rtf, .csv, PDF/A, .html,.xml

Kuva: jpeg, tiff, png, dng

Video: MPEG-4 (.mp4), dpx

Ääni:  FLAC, aif, aac

Lisätietoja:

Dokumentointi

Aineiston hyvällä dokumentointilla varmistetaan aineiston ymmärrettävyys. Dokumentointavia asioita ovat mm.

  • miten aineisto on kerätty
  • miten sitä on käsitelty, kuka ja milloin
  • käytetyt laitteet ja ohjelmistot
  • muuttujien arvot
  • käytetyt koodit ja lyhenteet
  • eri versioiden hallinta
  • laadunvarmistusprosessit
  • muu tieto, jolla varmistat aineiston ymmärrettävyyden

Datan yhteyteen on hyvä tehdä erillinen readme.txt-tiedosto, jossa kokonaisuus ja dokumentointi on kuvailtu.

 

 

 

Saavutettavuusseloste | Accessibility statement