Refleksioner om skalerbarhed af ARC/WARC migreringer

Sven Schlarb fra det østrigske nationalbibliotek, som bl.a. i SCAPE-projektet arbejder med webarkivering, har skrevet et blogindlæg, hvor han reflekterer over skalerbarhed af ARC/WARC. Blogindlægget introducerer, hvorfor migrering fra ARC-pakkeformatet til det ISO-standardiserede WARC-format er vigtig, især for webarkiver. Derefter beskrives udfordringerne ved at lave migrering af store data mængder, – og der gives en detaljeret beskrivelse af forsøg med sådanne migreringer.

WARC_DigitalPreservation

Dette blogindlæg kan også være interessant for andre end webarkiver; for det første fordi WARC-formatet er interessant for andre end webarkiver, og for det andet fordi problematikken med migrering af store datamængder også vil være relevant for store digitaliseringsprojekter. Relevansen af WARC-formatet for andre end webarkiver vil fremgå af en artikel, som senere på året vil blive lagt på digitalbevaring.dk – indtil da henvises til artiklen ”Package Formats for Preserved Digital Material, s. 54-62 i iPres 2012  proceedings

Sven Schlarbs blogindlæg kan læses her.

Der er også senere kommet endnu et blogindlæg af Sven Schlarb, denne gang om de-duplikering i forbindelse med ARC/WARC migreringer. Dette blogindlæg er dog direkte rettet mod webarkivering. Blogindlægget kan læses her.

Skriv et svar

Din e-mailadresse vil ikke blive publiceret. Krævede felter er markeret med *