Refleksioner om skalerbarhed af ARC/WARC migreringer

Sven Schlarb fra det østrigske nationalbibliotek, som bl.a. i SCAPE-projektet arbejder med webarkivering, har skrevet et blogindlæg, hvor han reflekterer over skalerbarhed af ARC/WARC. Blogindlægget introducerer, hvorfor migrering fra ARC-pakkeformatet til det ISO-standardiserede WARC-format er vigtig, især for webarkiver. Derefter beskrives udfordringerne ved at lave migrering af store data mængder, – og der gives en detaljeret beskrivelse af forsøg med sådanne migreringer.

WARC_DigitalPreservation

Dette blogindlæg kan også være interessant for andre end webarkiver; for det første fordi WARC-formatet er interessant for andre end webarkiver, og for det andet fordi problematikken med migrering af store datamængder også vil være relevant for store digitaliseringsprojekter. Relevansen af WARC-formatet for andre end webarkiver vil fremgå af en artikel, som senere på året vil blive lagt på digitalbevaring.dk – indtil da henvises til artiklen ”Package Formats for Preserved Digital Material, s. 54-62 i iPres 2012  proceedings

Sven Schlarbs blogindlæg kan læses her.

Der er også senere kommet endnu et blogindlæg af Sven Schlarb, denne gang om de-duplikering i forbindelse med ARC/WARC migreringer. Dette blogindlæg er dog direkte rettet mod webarkivering. Blogindlægget kan læses her.

Skriv et svar

Din e-mailadresse vil ikke blive publiceret. Krævede felter er markeret med *

Vi gør opmærksom på, at Digitalbevaring.dk frasiger sig ethvert ansvar for indholdet af offentlige kommentarer. Vi gør samtidig opmærksom på, at Digitalbevaring.dk forbeholder sig retten til at publicere, slette og redigere kommentarer på hjemmesiden samt opbevare navn, e-mail og ip-adresse på kommentarskrivere. Hvis du ønsker din kommentar og tilhørende brugeroplysninger slettet, bedes du kontakte os.