Bitbevaring – Ph.d. om holistisk tilgang til bitbevaring

Hvad skal der til for at finde den optimale bitbevaringsløsning for et digitalt materiale?

Billede6

Valg af den optimale bitbevaringsløsning for et digitalt materiale

Der er i stigende grad brug for at bevare digitale materialer indenfor mange brancher. Dette gælder især arkiver, biblioteker og museer som er forpligtet til at bevare materialer for eftertiden. Materialer er i stigende grad skabt i digital form, som for eksempel billeder fra digitalkameraer eller danske internetsider. Det er i mange tilfælde kun muligt at bevare digitalt fødte materialer i deres digitale form. Derudover kan det i nogle tilfælde også betale sig at lave digitale sikkerhedskopier af analogt materiale, og dermed gå fra analog til digital bevaring.

Hvad går digital bevaring ud på?

Digital bevaring adskiller sig fra analog bevaring f.eks. ved mediets betydning, og hvordan det sikres at det digitale materiale er forståeligt for eftertiden. Dette er illustreret i nedenstående figur, hvor papir og vinyl er medierne for de analoge udgaver af en bog, mens en disk i en computer er mediet for den digitale udgave af bogen.

Billede1
Figur 1: Forskellige analoge og digitale udgaver af en bog

I digital bevaring er lagringsmediet ikke så vigtig som for analog bevaring. Digitalt materiale består grundlæggende af sekvenser af bits som har værdien 0 eller 1. Om disse bits er gemt på en DVD eller et magnetisk bånd er underordnet. Det vigtige er, at værdierne og rækkefølgen er den samme og at de kan læses. Denne del af den digitale bevaring kaldes bitbevaring.

For at kunne forstå de digitale materialer skal det være muligt at få mening ud af bittene. Dette kan bestå i at flere bit-sekvenser skal kunne fortolkes til lyd i højtalere, billeder på skærm osv. Denne del af den digitale bevaring kaldes den logiske bevaring. Dette svarer for LP pladens vedkommende til at rillerne i vinylen fortolkes som lyd. Den digitale omdannelse af bits til lyd og billeder er dog langt mere kompliceret.

Digital bevaring blev anerkendt som en af hvor tids store udfordringer i midten af 1990’erne. Siden da har fokus primært været på den meget komplicerede logiske bevaring, mens bitbevaring har været set som løst problem af mange. Min ph.d. afhandling ”A Holistic Approach to Bit Preservation” peger på at bitbevaring er langt fra et løst problem og præsenterer resultater, som kan bidrage til at finde optimale løsninger til bitbevaring, når bit bevaring ses som del af et hele.

Hvad skal man overveje for en løsning til bitbevaring?

Når man overvejer en løsning til bitbevaring, skal man først og fremmest overveje hvor stor bitsikkerhed en løsning kan give. Dvs. hvor stor sikkerhed der skal være for at bittene forbliver intakte.

Der er dog også mange andre faktorer som skal tages i betragtning, idet bevaring skal ses i forhold til anvendelsen af det digitale materiale i nutid og fremtid. Der kan f.eks. være love som kræver at materialet skal holdes fortroligt gennem en årrække, eller der kan være behov for at materialet kan gøres hurtigt tilgængeligt på brugervenlig vis overfor offentligheden. Figuren nedenfor viser hvordan bitbevaring er en del af en større sammenhæng. Figuren illustrerer et eksempel hvor den digitale udgave af det materiale som bitbevares, er i en anden form når den publiceres. Et eksempel på dette kunne være store pladskrævende billeder i TIFF filer som transformeres til lavere opløsning JPEG når de formidles.

Billede2
Figur 2: Bitbevaring set i sammenhæng med bevaring, formidling og forvaltning

For at få den optimale løsning til bitbevaring, så skal denne løsning også kunne understøtte materialets anvendelse. Derudover kommer andre betragtninger. Det skal f.eks. være muligt at lave funktionel bevaring på det bitbevarede materiale. Ikke mindst er der økonomiske betragtninger, såsom hvor mange penge der er til at betale for en sådan løsning.

Hvilke løsninger findes der til bitbevaring?

Der er mange eksempler på, at lagring og backup løsninger ses som løsninger til bitbevaring. Sådanne løsninger er dog ikke sikre eftersom der mangler procedure for f.eks.

  • at kontrollere at bit-sekvenserne er intakte
  • at sikre uafhængighed mellem forskellige kopier af bit-sekvenserne
  • at planlægge fremtidige tiltag der sikrer den digitale bevaring
  • at vurdere hvor mange kopier der skal være for at opnå den ønskede bitsikkerhed

Der er i øjeblikket ved at blive implementeret en løsning, hvor sådanne procedurer kan understøttes. Denne løsning er også kendt under navnet ’det nationale bitmagasin’. Bitmagasinet vil kunne give mulighed for at gemme data på forskellige udvalg af platforme, geografisk placeringer og organisationer. Dette er illustreret i figuren nedenfor.

Billede3
Figur 3: Arkitektur og indhold af DK bitmagasin

Endvidere er det f.eks. muligt at variere hvor tit det tjekkes, om der er opstået fejl i en af kopierne bit-sekvenserne, når denne sammenlignes med de andre kopier.

En stor fordel ved dette bitmagasin er også at man kan vælge at lægge kopier af data på lagringsenheder, som kan understøtte anvendelsen og evt. fortroligheden af materialet. For eksempel kan en kopi på en distribueret platform give muligheder for hurtig fremsøgning, mens en kopi på DVD i sikrede lokaler kan være god kandidat for fortrolige materialer.

Hovedresultater fra ph.d. afhandlingen

Det primære mål for ph.d. afhandlingen er at give værktøjer til at finde den optimale løsning til bitbevaring for digitale materialer, når brugbarhed af løsningen skal ses i en større sammenhæng, dvs. når vi inddrager betragtninger som f.eks. fortrolighed og tilgængelighed.

Det første hovedresultat går ud på at se en løsning til bitbevaring som et selvstændigt magasin, der skal indeholde procedure for administration, data management, bevaringsplaner og lagring som beskrevet i  OAIS reference modellen. Dette resultat er også brugt i grundlaget for arkitekturen til DK bitmagasinet.

Billede4

Det andet hovedresultat er et redskab til at afdække kravene til bitbevaringen for et specifikt digitalt materiale. Denne afdækning baseres bl.a. på: hvilke krav der er adgang til materialet, hvilken strategi der er for logisk bevaring, hvor stort budget der er for bevaringen og hvor sikkert bittene skal bevares. Endvidere omfatter det analyse af, hvilken form det digitale materiale skal have, når det sendes til bitbevaring, da dette kan påvirke, hvad der er den optimale løsning.

Det tredje hovedresultat giver en metode til at vælge mellem specifikke bitbevaringsløsninger for et specifikt digitalt materiale. Det kan være meget komplekst at evaluere, hvilken bitbevaringsløsning der er optimal, da de forskellige krav til en bitbevaringsløsning kan være i modstrid med hinanden. For eksempel øges bitsikkerheden ved at have ekstra kopier, mens faren for at bryde fortrolighed også øges. Den helt store udfordring er, at ekstra sikkerhed og service til enhver tid vil have omkostninger. Sådanne krav kan derfor nemt komme i konflikt med de givne budgetter for bevaringen.

Om Ph.d’en

Ph.d’en har titlen “En holistisk tilgang til bitbevaring” og er skrevet og forsvaret af Eld Zierau.

Ph.d’en er den første danske ph.d. indenfor digital bevaring. Den er indgivet som en Ph.d. uden forudgående indskrivning. Afhandlingen er en artikelbaseret afhandling, hvor artiklerne er lavet i forbindelse med forfatterens arbejde i afdelingen Digital Bevaring på Det Kongelige Bibliotek, mens selve afhandlingen er lavet i forfatterens fritid. Ph.d.-afhandlingen kan lånes på Det Kongelige Bibliotek. En elektronisk udgave uden artikler er tilgængelig via Københavns Universitet website.

Logoet for ph.d’en er den digitale globe, som er vist øverst på denne side.

Eld Zierau, Det Kongelige Bibliotek, marts 2012 / revideret september 2016

Skriv et svar

Din e-mailadresse vil ikke blive publiceret. Krævede felter er markeret med *