Fagspecifikke forskningsdata

Forskellige videnskabelige retninger har forskellige traditioner, og det afspejler sig i forskningsdata. Med hensyn til langtidsbevaring er der især grund til at være opmærksom på, at nogle fag kan have data i form af for eksempel billeder og lyd. Andre fag er karakteriseret ved, at der produceres en meget stor mængde forskningsdata. Disse forhold spiller en rolle, når man skal løse opgaven med langtidsbevaring af forskningsdata.

Humanistiske og samfundsvidenskabelige forskningsdata

Nogen humanistisk og i højere grad samfundsvidenskabelig forskning er rettet mod data forstået som tal, eller genstandsfelter, der kan beskrives udtømmende gennem tal. Hvor talopgørelser ikke er meningsfulde, for eksempel studier af byrum og arkitektur, kan billeder være en erstatning. Hvor billeder og lyd giver fyldestgørende beskrivelser, angiver Rigsarkivet formater (som nævnt JPEG-2000, TIFF, MP3 og/eller WAVE eller MPEG formater), til at klare opgaven. I det omfang Rigsarkivet tilføjer nye formater må man forvente, at disse sikrer langtidsbevaring.

Data som beskrevet ovenfor, er der ikke problemer med at bevare. Men det efterlader analogt materiale med dertil hørende forskningsdata, hvor nytteværdien vil være afhængig af genstandenes fysiske fremtoning, for eksempel tekstur i klæde. Ved digitalisering af analogt materiale anbefales det, at man fra start benytter et af de ovennævnte formater.

Naturvidenskabelige forskningsdata

Inden for naturvidenskab er det særligt relevant at være opmærksom på, om man genererer store mængder eksperimentelle data. Joint European Torus er et eksempel. JET er et forskningsanlæg for forsøg inden for fusionsenergi. Mens JET er i brug skabes data i forbindelse med hvert forsøg, og der kan for det enkelte være tale om meget store datamængder. Det er relevant at bevare data ud over det enkelte eksperiments tidshorisont og sådan set også længere end JET’s fysiske levetid.

Eksemplet viser to overvejelser, som er vigtige i forhold til naturvidenskab. Erfaringer fra JET viser, at når der genereres meget store datamængder, er det væsentligt, at bevarings- og arkiveringsstrategi fra starten er indlejret i projektet. Spørgsmålet om databevaring er altså også et spørgsmål om organisation. JET’s første arkiv dækker en periode fra år 1983 til år 2000, hvor data migreredes til et nyt arkiv. I tilfældet med JET viste det sig, at udskiftning af arkivmedier (maskiner) var et mindre problem. Derimod har forældelse af filformater vist sig at være et problem. For yderligere beskrivelse henvises læseren til Layne et al (2012).

Layne et al (2012) identificerer tre særlige opmærksomhedspunkter. Langtidsbevaring af store datamængder er et organisationsspørgsmål. Arkivmedier forældes og langtidsbevaring og adgang kræver derfor planlagt udskiftning af arkivmedier. Formater til bevaring skal være velbeskrevne og dokumenterede og denne information skal opbevares centralt i organisationen.

Biomedicinske forskningsdata

Der er inden for det biomedicinske område særlig interesse for dataopbevaring, formentlig fordi området er udviklet til at være datatungt. Navale og McAuliffe (2018) giver den meget specifikke anbefaling, at man gennem Open Archival Information System modellen sikrer autenticitet og præcision i forhold til opbevaring af biomedicinske data. OAIS-modellen fungerer sammen med for eksempel Archivematica. Der findes en generel introduktion til best practices for bevaring – men ikke med særligt fokus på langtidsbevaring – af biomedicinske data.

Sundhedsvidenskabelige forskningsdata

Sundhedsvidenskabelige forskningsdata stammer dels fra forskningsaktiviteter, dels fra registre oprettet af myndigheder, fx Cancerregistret og Det Psykiatriske Centralregister. Rigsarkivet modtager og arkiverer også sundhedsdata. Metadata og datadokumentation er her standardiseret.

 

Læs også artiklerne

Om forskningsdata og forældelse

Fem gode råd om sikring af data

Beskrivelse af data — metadata

Forberedelse til langtidsbevaring

Referencer

Layne, R., Capel, A., Cook, N., & Wheatley, M. (2012) Long term preservation of scientific data: Lessons from jet and other domains, Fusion Engineering and Design, 87(12), pp. 2209 – 2212. https://doi.org/10.1016/j.fusengdes.2012.07.004

Navale, V. & McAuliffe, M. (2018), Long-term preservation of biomedical research data [version 1; peer review: 4 approved, 1 approved with reservations], F1000Research, 7:1353. https://doi.org/10.12688/f1000research.16015.1

 

Henrik Vetter, Det Kgl. Bibliotek, december 2019