Bitbevaring – hvordan forbliver data uskadte og læsbare over tid?

Bevaring af et digitale materiale kan kun ske, hvis bittene og deres rækkefølge i materialet forbliver uskadte. Hvis der er ændringer vil det digitale materiale i bedste fald se anderledes ud og i værste fald være ulæseligt i fremtiden. Derfor er der behov for bitbevaring. Der er forskellige måder at sikre og overvåge bittene, alt efter hvor sikkert du ønsker, at dine bits skal bevares.

Bitbevaring

Bevaring af bits består i at sikre, at værdier og rækkefølge af bits for digitalt materiale forbliver korrekte, uskadte og læsbare. Det betyder, at de forbliver de samme, efter de er leveret, til de efterspørges i fremtiden. Hvis ikke bittene og deres rækkefølge er uskadte for et digitalt materiale, vil det digitale materiale i bedste fald se lidt anderledes ud, og i værste fald vil det ikke kunne læses igen.

Bitbevaring er ikke logisk bevaring

Det er vigtigt at bemærke, at bevaring af bits kun sikrer, at bittene er de samme, og at de står i den samme rækkefølge i de filer, som indgår i det digitale materiale. Det vil sige, at der parallelt med bitbevaring skal sørges for, at filerne kan læses og formidles, for eksempel som afspilning af lyd. Med andre ord skal man parallelt med bevaringen af bittene også sørge for den logiske bevaring.

Bitintegritet

Sikring af at bitværdier og deres rækkefølge forbliver uskadte i fremtiden, vil sige, at bittene forbliver intakte. Det kaldes også at bevare bitintegritet og er illustreret i nedenstående figur, hvor vi kan se, at bittene og deres rækkefølge er ens både i fortiden og i fremtiden.

Bitsikkerhed

Bitbevaring bygger bl.a. på vurdering af risici. For at bevare bits er det vigtigt at tage højde for alle risici, som kan skade bitintegriteten. Dvs. man skal sikre sig imod farer, som kan ændre bits, ændre rækkefølgen af bits eller forårsage tab af bits. Jo mere man sikrer sine bits, jo større sikkerhed får man for sine bits. Det kaldes bitsikkerhed.

Aktiv bitbevaring

En del af metoden til at bevare bits består traditionelt i at lave flere kopier af det digitale materiale. For at sikre at bittene er intakte over lang tid, er det nødvendigt at tjekke kopierne jævnligt, for at se om de har fået fejl, der skal rettes. Bemærk, at vi i aktiv bitbevaring ser alle kopier som lige vigtige, hvilket ikke er tilfældet for traditionel backup. I aktiv bitbevaring tjekker man aktivt, om bits stadig er bevaret korrekt. Et vigtigt element i aktiv bitbevaring er at sikre, at kopierne ikke risikerer at blive ramt af samme fejl eller samme ulykke, som vil betyde, at fejlen ikke bliver opdaget, eller at man mister alle kopierne.

Bitsikkerhed ved risikospredning

Man opnår forskellig bitsikkerhed ved at lave aktiv bitbevaring ud fra en risikovurdering af, hvordan de forskellige risici er spredt. Dette indeholder følgende:

  • Antal af kopier der gemmes
    Jo flere kopier der gemmes af data, jo større er chancen for, at mindst en af dem er intakt. Man behøver mindst en kopi til at opdatere sine fejlbehæftede kopier med.
  • Hyppighed af tjek om kopier er intakte
    Jo hyppigere det tjekkes, om kopier er uskadte, jo større er chancen for, at mindst en af dem er uskadt. Den uskadte fil kan bruges til at erstatte de kopier, som har fejl. Dette tjek af kopierne kaldes for integritetscheck.
  • Uafhængighed mellem de gemte kopier
    Jo mere uafhængighed der er mellem de gemte kopier, jo større er chancen for, at de ikke får ens fejl, som man ikke opdager. Fejl kan f.eks. opstå, hvis kopierne lægges på samme type hardware, som kan rammes af samme hardwarefejl. En geografisk adskillelse kan sikre, at de ikke bliver ødelagt af samme hændelse som f.eks. en naturkatastrofe, og ved at placere kopierne i forskellige organisationers varetægt, kan man sikre sig mod organisatoriske forandringer.

Integritetstjek baseret på checksummer

Tjek af bitintegriteten er ofte baseret på checksummer af de arkiverede filer. En checksum er en slags fingeraftryk fra filen. Checksummer bruges i stedet for direkte sammenligninger af filerne, da det tager så meget længere tid med direkte sammenligning, at det kan blive umuligt at lave et tjek inden for rimelig tid. For at afgøre hvilke kopier der er uskadte, laver man en afstemning mellem kopierne. Hvis der er et flertal, som er enige om en checksum, går man ud fra, at det er fordi, dette er den rigtige checksum. For at øge antallet af stemmer til en sådan afstemning, kan man gemme kopier af den oprindelige checksum. Denne ekstra stemme fra checksumskopien kan være afgørende i situationer, hvor der kun er en intakt kopi tilbage, men hvor det ikke er klart, hvilken en af kopierne der er den intakte.

Mediemigrering

I bitbevaring er det vigtigt at være opmærksom på, at de lagringsmedier, som kopierne placeres på, ikke holder evigt. Derfor skal bits en gang imellem flyttes til nye medier, som kan holde en ny årrække. Dvs. at man foretager en mediemigrering. Da en mediemigrering betyder, at bittene er mere udsat, mens mediemigreringen foretages, er det vigtigt, at de forskellige kopier ikke udsættes for mediemigrering på samme tid. Det vil nemlig betyde, at der kan være stor fare for tab af en eller flere kopier.

Andre overvejelser før bitbevaring

Når man skal foretage aktiv bitbevaring, er der en lang række andre overvejelser, der også bør foretages:

  • Hvor meget må det koste?
  • Hvor stor bitsikkerhed ønskes for et bestemt digitalt materiale?
  • Skal der tages højde for fortrolighed i det digitale materiale?
  • Hvordan får man fat i sine bits igen

I artiklen om bevaringsmetoder er der givet nogle simple eksempler på, hvordan digitale materialer med forskellig værdi kan bevares med forskellig bitsikkerhed.

Det Nationale Bitmagasin

Statsbiblioteket, Det Kongelige Bibliotek og Rigsarkivet arbejder på at udvikle og etablere et nationalt bitmagasin, hvor bits kan bevares på mange forskellige måder. Det vil blive muligt at vælge mellem forskellige aftaler, som dækker forskellige måder at bevare bits, med større eller mindre hensyn til fortrolighed, til forskellige priser osv.

Få mere information

En mere generel tilgang til bitbevaring, og hvad der skal til for at finde en optimal bitbevaringsløsning kan findes i ph.d. afhandlingen ”A Holistic Approach to Bit Preservation” af Eld Zierau. Et kortere og mere letforståelig beskrivelse af afhandlingen kan findes i resumet “En holistisk tilgang til bitbevaring”. Selve afhandlingen kan downloades her.

En interessant artikel, om hvorfor bitbevaring ikke er så lige til, er ”Bit Preservation: A Solved Problem?” af David S. H. Rosenthal, International Journal of Digital Curation Vol 5, No 1, 2010 (kan downloades her).

 

Eld Zierau, Det Kongelige Bibliotek,  november 2010 / revideret marts 2012 / revideret januar 2015

Skriv et svar

Din e-mailadresse vil ikke blive publiceret. Krævede felter er markeret med *