Omkostninger – Hvad koster det at bevare digitale samlinger?

Digital bevaring kan være en dyr opgave for en institution, og det er vigtigt at vide, hvordan man beregner omkostningerne for bevaringen af sin digitale samling. Prisen for at bevare digitale samlinger afhænger af forhold, der ofte hverken er målbare, velafgrænsede eller gennemskuelige. Hyppigt står man også over for den udfordring at skulle forudsige omkostninger for filformater, systemer og programmer, som ikke eksisterer endnu.

 

Beregning af omkostninger

For at kunne beregne omkostningerne ved digital bevaring er det ikke nok blot at kortlægge området og identificere, hvilke aktiviteter det indbefatter. Det handler i lige så høj grad om at opnå enighed om, hvordan området kortlægges så en fælles forståelse kan skabes på tværs af bevaringsinstitutioner, samt om, hvad der er kvalitativ bevaring, altså forsvarlig, effektiv og nyttig bevaring. Det er ligeledes vigtigt at foretage beregninger, som er baserede på erfaringer og på de målbare størrelser som trods alt findes.

Artiklen svarer således ikke præcist på, hvad det koster at bevare digitalt materiale – det er en øvelse som bevaringsinstitutioner verden over stadig udfordres af –, men beskriver de metoder, der skal til for at beregne omkostningerne; hvilke områder af digital bevaring der koster mest; hvilke faldgruber man bør undgå; og hvilke anbefalinger man bør følge for at reducere sine omkostninger.

Hvad skal prissættes?

I første omgang skal det område, vi vil kende udgifterne for afgrænses, nedbrydes i aktiviteter og beskrives. I anden omgang skal vi finde ud af, hvor meget de forskellige opgaver inden for de identificerede aktiviter koster.

Digital bevaring blev i 2002 beskrevet på et overordnet plan af en ISO standard (OAIS – Open Archival Information Systems – revideret i 2012). Standarden underopdeler digital bevaring i seks Functional Entities, og denne opdeling er en god start, dels fordi den er bredt anerkendt, og dels fordi den faktisk er ganske udmærket:

Enhed Beskrivelse
Indsamling af digitalt materiale (Ingest) Når data modtages af en bevaringsinstitution, bearbejdes det, så det bedst muligt kan indgå i bevaringsmiljøet.
Beskrivelse af digitalt materiale (Data Management) Dokumentation og metadata udarbejdes og tilknyttes det digitale materiale så det bedre kan genfindes og forstås.
Bitbevaring (Archival Storage) Det digitale materiale bevares fysisk, gerne på flere forskellige geografiske lokationer og flere forskellige medietyper (fx dvd og harddisk).
Bevaringsplanlægning (Preservation Planning) Mens bitbevaring sørger for materialets fysiske overlevelse, kigger bevaringsplanlægning på materialets logiske ditto. Den mest populære metode hos biblioteker og arkiver er migrering til tidssvarende formater. En anden er emulering.
Administration (Administration) Administration handler om fastlæggelse af rammerne for den digitale bevaring samt drift og koordinering af den organisation, der er bygget op omkring den.
Tilgængeliggørelse (Access) Mulighed for at tilgå det digitale materiale for brugerne, fx på en læsesal eller over internettet.

Beskrivelse af OAIS-modellens seks enheder

Til hver enhed er knyttet en række opgaver og aktiviteter, som beskriver processerne i en bevaringsinstitution.

OAIS-standarden giver et fint udgangspunkt for afklaring af, hvad digital bevaring består af og kan med tilpasninger bruges i opstillingen af en model for omkostninger.

Udover de direkte omkostninger for den digitale bevaring, fx udgifter til køb af dvd’er, skal man tage højde for de indirekte omkostninger. Det kan fx være hvad huslejen er i den bygning, den digitale bevaring foregår i. Eller hvad institutionens generelle administration og personaleledelse koster

Hvordan skal der prissættes, og hvordan bør vi udtrykke omkostningerne?

Når området er kortlagt, og alle omkostninger inkluderet, skal metoden til beregningerne bestemmes.

Typisk prissættes opgaver ved at estimere den tid, det tager at udføre dem, og gange dette tal med et lønniveau. Dertil lægges udgifter til indkøb af eventuelt udstyr.

  • konomiske faktorer som diskontering, afskrivning og inflation skal herudover også indregnes for at sikre et retvisende billede af omkostningerne.

Det er afgørende at udtrykke omkostningerne på en sammenlignelig måde. Det betyder, at vi skal vælge de enheder, der betyder mest for flest: Hvis vi bor i Danmark og kun skal sammenligne danske bevaringsinstitutioners omkostninger, vil det være tilstrækkeligt at bruge kroner og ører samt den 37 timers arbejdsuge. Skal vi derimod sammenligne tal over landegrænser, er det en idé at benytte sig af fx dollar eller euro og se på internationale normer til beregning af fx en arbejdsuge og Generally accepted accounting principles (GAAP). I begyndelsen af 2015 afsluttedes et EU-projekt, hvis fokus var netop økonomien ved digital bevaring. Projektet stillede et værktøj til rådighed, som kan bruges til at sammenligne omkostninger på tværs af institutioner, landegrænser og strategier. Værktøjet findes på hjemmesiden  Curation Cost Exchange.

Det er dog ikke kun valg af beregningsmetoder og standardiserede udtryksformer, som bestemmer, om vi kan beregne og sammenligne vores tal.

Parametre for prissætning af digital bevaring

Bevaringskvalitet: Hvilken kvalitet skal bevaringen have?

Bevaringskvaliteten beskriver, hvilken kvalitet bevaringen skal leve op til: Er det nok at bevare digitalt materiale i ét eksemplar på én dvd, som ligger i kosteskabet? Eller skal materialet krypteres og bevares på flere forskellige fysiske medier på flere forskellige – hemmelige – lokationer? Skal brugerne af de data, der bevares, hjælpes til at forstå indholdet vha. udførlig dokumentation? Og skal informationerne være tilgængelige for brugerne online? Kan vi nøjes med at bevare data i deres oprindelige formater, eller skal vi fremtidssikre adgangen til informationen ved at flytte den over i mere robuste og langtidsholdbare bevaringsformater?

En seriøs model for beregning af omkostninger bør indeholde muligheder for differentiering af kvaliteten, idet institutioners forskellige behov fordrer forskellige niveauer af bevaringskvalitet.

Bevaringsstrategi: Hvordan skal materialet overleve?

Et andet afgørende parameter for prisen for digital bevaring er, hvilken bevaringsstrategi der vælges.

De to mest fremherskende bevaringsstrategier, migrering og emulering, er væsensforskellige: Migrering fokuserer på at lade den information, som skal bevares, overleve ved tilpasning til nye teknologier, mens emulering har til formål at gengive informationen ved hjælp af simulering af gammelt software på nyt hardware.

Fælles for dem er dog, at det er nødvendigt at kunne forudsige, hvordan informationsteknologien udvikler sig, og det er en af de faktorer, som gør det svært at estimere prisen på digital bevaring.

Bevaringsformål: Hvad skal data bruges til, og hvem skal bruge dem?

Formålet med bevaringen har også indflydelse på prisen.

Drejer det sig om informationer om, hvor atomaffald er gemt af vejen, og som skal kunne findes frem og forstås om 1.000, ja 10.000 år? Eller er det forskningsdata, der skal tilgængeliggøres og anvendes så hurtigt som muligt?

Som det fremgår af eksemplerne, skal formål og brugergrupper altid defineres, før det er muligt at afgøre, hvordan materialet skal behandles, og det parameter bestemmer en betydelig del af omkostningerne.

Bevaringsdata: Hvilken type formater skal bevares, og hvad indeholder de?

Det filformat, som det digitale materiale bevares i, har også betydning for prissætningen.

Det koster ikke det samme at anskaffe, bevare og tilgængeliggøre simple billedfiler, som det koster at håndtere komplekse regneark. Udover at simple filformater sædvanligvis fylder mindre end komplekse, så indeholder de også typisk nemmere håndterbart indhold end de komplekse filformater. Desuden er de ofte også mere langtidsholdbare, men mindre brugervenlige til tilgængeliggørelsesformål.

Andre parametre vedrørende filformattype har betydning for omkostningerne til digital bevaring, fx filformatudbredelse, softwareunderstøttelse, åbenhed, dokumentationskvalitet, stabilitet, identificér- og validérbarhed, platformsuafhængighed, levetid og genbrugelighed.

Hvis du har mod på at bygge din egen omkostningsmodel, er en god start at kigge på 4C-projektets anbefalinger. Hjemmesiden Curation Cost Exchange giver også en god gennemgang af, hvilke basiskoncepter man må tage i betragtning, når økonomien ved digital bevaring skal vurderes.

Hvad er dyrest, hvad bør undgås, og hvad kan anbefales?

Kigger vi på digital bevaring som bestående af de aktiviteter, OAIS-modellen beskriver, viser de seneste 15 års undersøgelser, hvilke områder der er dyrest, og de kan derfor give os et praj om, hvad vi bør undgå, og hvad vi bør tilstræbe. Det skal bemærkes at størstedelen af disse undersøgelser har fokuseret på bevaring ved migrering og altså hverken har beregnet udgifter til emulering eller museal bevaring.

Der er bred enighed om, at de tre områder inden for digital bevaring, som koster absolut mest, er:

  1. Modtagelseaf digitalt materiale (Ingest).
  2. Bevaringsplanlægning, herunder strategiske valg om det digitale materiales læsbarhed over tid, fx migrering til tidssvarende formater eller emulering (Preservation Planning).
  3. Tilgængeliggørelseaf digitalt materiale – mulighed for at tilgå data for brugerne (Access).

Der er uenighed om, hvilke(t) af de tre områder der er dyrest, og det afhænger også af bevaringens formål, men tilsammen kan de snildt nå op over 80 % af de samlede omkostninger til digital bevaring.

Det er derfor vigtigt at holde fokus på disse omkostninger, og ikke mindst på, hvad der kan gøres for at minimere dem. Fælles for disse aktiviteter er, at de kræver en hel del manuelt arbejde, og derfor er løntunge. Løn kan dermed siges at spille en helt afgørende rolle, og maksimal automatisering af opgaver kan derfor være en rigtig god idé, selvom det typisk koster mange penge at etablere automatisering.

Det er mindst ligeså vigtigt at sørge for, at det digitale materiale som indgår i ens samling bliver brugt. Genbrug er hvad der giver det digitale materiale værdi. Fokus på materialets værdi retfærdiggør altså udgifterne til dets bevaring, og genbrug kan som bekendt ligeledes føre til at de bevaringsværdige data ikke blot frigiver deres iboende værdi, men også afføder deciderede indtægter.

Det skal bemærkes, at andre områder inden for digital bevaring, fx bitbevaring, sagtens kan være dyrere end de ovenfor nævnte. Dette afhænger af bevaringsinstitutionens formål med bevaringen, dens valg af kvalitet (bevaringsniveau), mængden af metadataberigelse, tilgængeliggørelseskrav, mm.

Minimering af omkostninger

For at minimere omkostningerne er der tre tommelfingerregler, som bør følges (igen fokuseres her på migrering).

For det første er der altid en økonomisk fordel ved stordrift. Hvis der fx er behov for at migrere dele af ens samling til andre, tidssvarende formater, kan der være ræson i enten at vente til samme behov opstår for andre formater i samlingen, eller migrere hele samlingen med det samme.

For det andet er der økonomiske fordele ved at standardisere ens samling, så den ikke består af for mange forskellige formater. Et eksempel kan være ved modtagelse at migrere samtlige billedformater til ét billedformat, som overholder nogle af de filformatparametre, der er nævnt ovenfor. Denne strategi er en afart af migreringsstrategien, og kaldes normalisering.

Der er også en økonomisk fordel i at standardisere sin samling i tide. Det kan være endog meget dyrt at gøre det for sent. Årsagen til dette er, at hvis man venter for længe, risikerer man, at der fx ikke længere findes software til at migrere et format (eksempel: WordPerfect), og man vil derfor være nødt til selv at udvikle det.

Etablerings- og driftsomkostninger til digital bevaring er generelt høje, om end det skal bemærkes, at det som regel ikke er lagerplads, der er dyrt, med mindre man fx beskæftiger sig med forskning, der genererer enorme mængder data (fx CERN).

Hvem forsøger at omkostningsbestemme digital bevaring i dag?

Siden slutningen af 1990’erne, hvor digital bevaring for alvor så dagens lys, har der været interesse for at omkostningsbestemme området. Det er dog først inden for de seneste år, at en række projekter har forsøgt at opgøre omkostningerne systematisk.

Kulturministeriet finansierede et projekt, der havde til formål at etablere en model til omkostningsberegning af bevaring af digitale materialer, som indehaves af kulturarvsinstitutioner. Se mere om projektet på www.costmodelfordigitalpreservation.dk.

Målet med projektet var at skabe et grundlag for sammenligning og vurdering af de fremtidige omkostningskrav til digital bevaring samt at øge omkostningseffektiviteten af aktiviteter, der vedrører digital bevaring. Projektet udførtes af Statens Arkiver og Det Kongelige Bibliotek1.

Parallelt hermed findes flere projekter i Europa, som har samme formål, bl.a. i Holland (Cost Model for Digital Preservation) og England (LIFE og Keeping Research Data Safe).

De nævnte projekter forsøger (slutningen af 2010) at undersøge, i hvor høj grad det er muligt at ensrette modellerne via enten uformelle eller formelle samarbejder.

I 2015 afsluttedes 4C-projektet som nævnt. Projektet havde samlet mange af de kræfter, der indgik i de ovennævnte projekter. 4C-projektets resultater er formidlet på www.curationexchange.org.

 

Alex Thirifays, Rigsarkivet / november 2010 – revideret maj 2015.


1. Statsbiblioteket og Det Kongelige Bibliotek fusionerede pr. 1. januar 2017. Med afdeling i hhv. Aarhus og København er institutionerne nu samlet under navnet: Det Kgl. Bibliotek. Da Det Kgl. Bibliotek var to adskilte institutioner under udgivelsen af denne side, er teksten beholdt uændret.

Skriv et svar

Din e-mailadresse vil ikke blive publiceret. Krævede felter er markeret med *