Forberedelse til langtidsbevaring

Det er i mange tilfælde overkommeligt at forberede data til langtidsbevaring. Til helt særlige behov findes der særlige produkter, som er specifikt rettet mod de problemer — for eksempel opdatering af metadata — der opstår i forbindelse med langtidsbevaring.

Langtidsbevaring af forskningsdata kan betragtes som en både generel og fagspecifik opgave. Som nævnt skal data forberedes for bevaring. Der er problemer, som for eksempel ændret sprogbrug og opdatering af emneord, som må forventes at være fælles for forskellige fag. Men der kan også være væsentlige forskelligheder. Nogle fag kan generere meget store mængder af data, fysiske materialer kan spille en stor rolle osv. Det er en konkret vurdering, om der er fagspecifikke krav til bevaring af data og dermed behov for helt særlige produkter og faciliteter.

I mange tilfælde er det ret overkommeligt at forberede data til langtidsbevaring. Danmarks Tekniske Universitet, der tilbyder forskerne datalagring, har en beskrivelse, som ofte vil kunne række i en forberedelsesfase. Når det drejer sig om langtidsbevaring af data, er genfinding i særlig grad afhængig af gode metadata og god datadokumentation og vigtigheden heraf vil vokse med tidshorisonten for bevaring. I den sammenhæng kan man for eksempel bruge FAIR-principperne som retningslinje.

Hvis man er tilfreds med den metadatering, som vejledningen fra Danmarks Tekniske Universitet anviser, er næste skridt i databevaringsprocessen at finde et repositorie.

Hvis der er særlige behov til databeskrivelsen, som ikke tilfredsstilles af vejledningen fra Danmarks Tekniske Universitet, fx på grund af specifikke forhold ved data, eller særlige ønsker til forberedelse af data til lagring (for eksempel for at tilgodese opdatering af metadata), kan man overveje at bruge værktøjer fra en af de forskellige platforme, der er til rådighed for denne type opgave.

Særlige værktøjer til langtidsbevaring

Archivematica indeholder værktøjer til brug for sikring af langtidsbevaring af data. Det er en platform, der bygger på standardprodukter, og som opfylder krav om at være interoperationel. Platformen baserer sig på open source produkter, hvorfor den enkelte bruger har mulighed for at modificere platformen til eget brug. I forhold til formater er platformen meget fleksibel. Den har gode søgemuligheder og kan anvendes (integreres) med tredjeparts produkter. Den er en samling af værktøjer og ikke et repositorie i sig selv.

RODA er en platform der har mange af de samme funktioner som Archivematica, og RODA baserer sig også på open-source og standardprodukter. RODA har et særligt fokus på at sikre autenticitet gennem vedligeholdelse af metadata.

Det gælder om begge førnævnte platforme, at brugen af dem kræver en del arbejde. Men der findes en række produkter, der kombinerer repositorier med værktøjer, der er mere tilgængelige. Se evt. Amorim et al (2017), hvor en række repositorier, der kræver begrænset indsats af brugeren, sammenlignes. Disse repositorier udmærker sig i højere grad ved forholdsvis let anvendelighed, snarere end ved specifik relevans i forhold til langtidsbevaring af data.

Læs også artiklerne

Om forskningsdata og forældelse

Fem gode råd om sikring af data

Beskrivelse af data — metadata

Fagspecifikke forskningsdata

Reference

Amorim, R.C., Castro, J.A., Rocha da Silva, J. et al.:  A comparison of research data management platforms: architecture, flexible metadata and interoperability, Universal Access in the Information Society, 16(4): 851-862, 2017. https://doi.org/10.1007/s10209-016-0475-y

Henrik Vetter, Det Kgl. Bibliotek, December 2019