Digital lyd

Digital lyd er et vidt begreb via vores personlige musikafspillere, DAB-radioer og webtjenester som spotify og bibzoom.dk. Cd’er, dvd’er og Blu-Ray-plader indeholder også lyd i digital form. Men hvordan kan digital lyd bedst bevares for eftertiden? For at finde svaret på dette, er man nødt til først at forstå de begreber, som bruges til at beskrive lydfiler.

 

Kendetegn for lydfiler

Lyd er en sekvens af trykbølger gennem luft, som i digital form repræsenteres ved en sekvens af tal, der varierer i takt med det lufttryk, de modsvarer.

Samplingfrekvens

Samplingfrekvens er et udtryk for, hvor hyppigt optagelsen afspejler variationerne i lufttrykket. Øret kan høre frekvenser på op til omkring 20.000 variationer pr. sekund (20 kHz), og samplingfrekvensen skal være mindst to gange højere, hvis de højeste lyde skal kunne genskabes. Cd’er bruger 44,1kHz samplingfrekvens. International Association of Sound and Visual Archives (IASA) anbefaler 48kHz til højkvalitetslyd og 96kHz som en guldstandard, se Guidelines on the Production and Preservation of Digital Audio Objects.

Bitdybde

Bitdybde fortæller noget om, hvor mange forskellige styrkeniveauer i lydsignalet, man måler. 16 bits, som svarer til 16,536 niveauer, vil normalt være minimum for god musiklyd. IASA anbefaler 24 bits. 8 bits kan bruges til tale, hvis det eneste krav til kvaliteten er, at man skal kunne forstå det, der bliver sagt.

Container, Formats og Codecs

En container er det overordnede lydfilformat, en slags ”kasse” som indeholder både metadata og selve lyden. Almindeligt kendte containers til lyd er fx wav, wma, og asf. Inden for containeren ligger selv lydstrømmen i et af mange forskellige lydformater, såsom mp3, aac osv. Ordene ”format” og ”codec” blandes ofte sammen, så man kan høre sagt, at en fil indeholder lyd med ”aac codec”, hvilket ikke er rigtigt. Et codec er et computerprogram, som genererer eller afspiller lyd i et bestemt format. Det er derfor mere korrekt at sige, at en fil indeholder lyd i aac-format, som kræver et passende aac-codec for at kunne afspilles.

Komprimering

En ukomprimeret lydfil består af tal, som direkte repræsenterer det varierende lufttryk, der udgøres af lyden selv. En komprimeret lydfil bruger en algoritme til at repræsentere lyden på mindre diskplads end en tilsvarende ukomprimeret fil. Der findes to typer af komprimering:

  • Tabsfri (lossless) komprimering, hvor den originale lydstrøm kan genskabes ved at fjerne komprimeringen.
  • Tabsgivende (lossy) komprimering. Her vil noget information fra det oprindelige signal gå tabt, så den originale fil ikke længere kan genskabes.

Tabsfri komprimering kan mindske filen med omkring 50% uden tab af lydkvalitet. Ved tabsgivende komprimering kan spares meget mere diskplads, men her risikeres et betydeligt lydkvalitetstab.

Lydkanaler

Lyd kan gemmes i én kanal (mono), to kanaler (stereo) eller flere kanaler (surround sound). Stort set alle lydformater understøtter både mono og stereo. Filformater til surround er et område, som er under stadig udvikling, og det er svært at komme med klare anbefalinger til det. Der findes endnu ingen åben standard for surround sound, og alle eksisterende formater bruger komprimering, fordi surround typisk har seks eller flere kanaler og derfor kan komme til at fylde ret meget.

Undgå komprimering ved langtidsbevaring

Generelt anbefales det at undlade komprimering af filer til langtidsbevaring, da

  • komprimerede filer er mere udsatte over for bitfejl
  • en tabsgivende komprimeret fil risikerer yderligere kvalitetsforringelse, hvis den senere migreres til et andet format.

Hvis man er nødt til at vælge komprimering, fx på grund af økonomi, bør man vælge tabsfri komprimering. Free Lossless Audio Codec (FLAC) kan anbefales.

Metadata

Metadata er kritiske for langtidsbevaring, og der findes en række anbefalinger af standarder. Man kan med fordel bruge et containerformat, som tillader, at metadata gemmes i samme fil som selve lyden. Herved minimeres risikoen for, at forbindelsen mellem data og metadata går tabt. Broadcast Wave Format (BWF) er en udvidelse af wav-formatet, som understøtter indlejrede metadata.

Kilder og anbefalinger

  • Wav-formattet med LPCM-codec (Linear pulse-code modulation, se artikel på wikipedia) kan anbefales til de fleste langtidsbevaringsopgaver
  • Med BWF-varianten af wav kan metadata og lyddata holdes sammenkoblet
  • Komprimering af lydfiler kan ikke anbefales
  • Hvor komprimering alligevel er nødvendigt, bør man vælge tabsfri komprimering frem for tabsgivende komprimering.

Digitalisering og lydoptagelse

Lydfilens oprindelse har også stor betydning for valget af format.

Stammer lyden fra et analogt format som fx bånd eller vinylplade, eller fra egen optagelse (se også artiklen om digitalisering af lyd), har man en meget stor frihedsgrad i forhold til samplingrate og bitrate.

  • På Statsbiblioteket1 følger vi, så vidt det er muligt, IASA’s anbefaling om at bruge 48kHz/24-bit eller 96kHz/24-bit.

Ripning af digitalt født materiale

Når man arbejder med digitalt født materiale som fx lydfiler på en cd, er det bedst ikke at ændre mere på originalen end højst nødvendigt.

  • Cd’er indeholder lyd i ukomprimeret PCM-format, som kan gemmes direkte i en WAV- eller BWF-fil
  • For andre digitale former bør man så vidt muligt beholde den originale sampling-frekvens for at undgå at miste lydkvalitet.

Komprimerede originaler

Hvis originalfilen er i et tabsgivende komprimeret format som fx mp3, bør man

  • Lave en arkivkopi i et anbefalet format (dvs. wav eller BWF, 48kz, 24-bit) med et passende værktøj. På Statsbiblioteket bruger vi ffmpeg til konvertering fra mp3 til wav. Der findes en lang række programmer til konvertering af lyd, men mange af dem bruger faktisk samme codecs, så man får en identisk lydkvalitet til slut.
  • Gemme originalerne for det tilfælde, at der senere vil dukke et bedre konverteringsværktøj op.

Lyd i video

Videofiler indeholder også lyd, og da diskplads er afgørende for video, da det fylder meget, er lyden på videofilen nogle gang komprimeret. Dvd’er kan fx indeholde lyd i flere forskellige formater, bl.a. mp2, mp3 og pcm/wav. På Statsbiblioteket arkiverer vi normalt videofiler, som fx TV-optagelser og rippede dvd’er, i deres originale formater, da massetranskodning af video er et dyr proces. Derfor er lyden også gemt i sin oprindelige form, selv om det tit er tabsgivende og komprimeret, som vi ellers ikke anbefaler.

Er det muligt selv at bestemme lydformatet, fx ved digitalisering af analog video, er anbefalingen generelt den samme som for andre lydfiler – ikke-komprimeret format eller tabsfri komprimering er bedst.

Læs mere om videobevaring i artiklen Digital video.

Referencer

IASA Technical Committee, Guidelines on the Production and Preservation of Digital Audio Objects, ed. by Kevin Bradley. Second edition 2009.
Standards, Recommended Practices and Strategies, IASA-TC 04.
Denne bog er ‘Bibelen’ inden for bevaring af lyd og indeholder masser af gode råd om emner, som ikke er diskuteret i artiklen ovenfor, fx metadata-standarder, digitalisering, og persistent identifiers.

BWF-Format User Guide

Colin S. Rosenthal, Statsbiblioteket, maj 2012 | revideret januar 2015


1. Statsbiblioteket og Det Kongelige Bibliotek fusionerede pr. 1. januar 2017. Med afdeling i hhv. Aarhus og København er institutionerne nu samlet under navnet: Det Kgl. Bibliotek. Da Det Kgl. Bibliotek var to adskilte institutioner under udgivelsen af denne side, er teksten beholdt uændret.

Skriv et svar

Din e-mailadresse vil ikke blive publiceret. Krævede felter er markeret med *