När en musiker spelar in sin musik i studion så har eller hon bara en tanke: att den ska låta så bra som möjligt. Att förmedla gnistan och känslan som artisten har där och då, genom musik.
När själva musicerandet är avklarat sätter sig producenten och ljudteknikerna ner och slår sina kloka huvuden ihop för att skapa rätt ljudbild. Och oavsett om ljudet trimmas åt ena eller andra hållet – rått och tungt eller mjukt och luftigt – så är det just den ljudbilden som lyssnarna förtjänar att få höra.
Även om tekniken nu för tiden ligger mycket längre fram än den gjorde för bara ett par år sedan, verkar det som om ljudet kunderna hör i högtalarna har blivit markant sämre sedan 70-, 80- och framför allt 90-talet. Och det trots att utrustningen som används både för att spela in och spela upp musiken är både bättre och billigare.
Från inspelning till uppspelning
Inte ens när ljudteknikerna har gjort sitt allra bästa med en inspelning, och musiken har fått ett Drömljud med stort D, är resan över. Inspelningen, som vid det här laget har reducerats från 12 kanaler till 2, ska nu vidare till mastering-processen. Det är en sista finslipning som görs för att musiken ska låta mindre rå och mer silkeslen. Den dynamiska kontrasten mildras för att musiken ska kunna spelas på mindre ljudanläggningar.
Okomprimerad WAV-fil. Hela musikens frekvensregister upp till 20 kHz finns med.
Konsumentformat
Om vi utgår från att mastering-processen görs ordentligt och faktiskt gagnar musiken i stället för att förstöra den med överkomprimering och ”brickwall limiting” så ska ljudet vidare i signalkedjan. Musiken är fortfarande lagrad i hög upplösning, ofta högre än CD-kvalitet. Men nu ska den skalas ned till konsumentvänliga format. På 1970- och 1980-talen handlade det om LP och kassetter, på 1990- och 2000-talen om CD.
MP3 – 320 kbit/s. De flesta frekvenser mellan 16 kHz och 20 kHz har tagits bort. Bara bitvis dyker de upp, vi kan anta att komprimeringen bara prioriterer detta område vid högfrekventa transienter som exempelvis slag på cymbal, hi-hat, etc. De flesta vuxna människor hör inte mycket över 16 kHz så i praktiken är detta inte något stort problem.
MP3
I dag är det MP3 och alla dess släktingar som är de vanligaste musikformaten. MP3 är ett format som togs fram på 1990-talet för att göra delning via internet mer praktisk. Tekniken går ut på att komprimera musiken så att den tar ungefär en tiondel så mycket plats, för att spara utrymme på hårddisken och för att den ska kräva så lite bandbredd att det faktiskt går att skicka runt den på internet. Internet var inte så snabbt på den tiden, och lagringsplats var kostsamt. Både på internetservrar och datorhårddiskar. Det var helt enkelt inte praktiskt att lagra musiken i full upplösning utan komprimering.
MP3 – 192 kbit/s. Ännu mindre information över 16 kHz. Ett annat problem som inte syns i den här bilden är drop-outs vid lägre frekvenser.
Även om vi numera har stora hårddiskar och tillräcklig bandbredd för att hantera musiken i full CD-kvalitet så blir det oftast inte så.
Vad förlorar du?
Vad är det då du blir av med när musiken komprimeras från studiokvalitet till MP3? Jo, om man tar hänsyn till alla led och använder maximal datahastighet, vilket är 320 kilobit per sekund (kbit/s) kan den subjektiva upplevelsen av ljudkvaliteten faktiskt vara riktigt bra, och i vissa fall vara svår att skilja från CD. Men något försvinner naturligtvis på vägen. Om man jämför med äkta CD-kvalitet så har det formatet en datahastighet på 1411 kbit/s, eller nästan fem gånger mer information. Och man kan inte plocka bort 80 procent av ljudinformationen och ändå ha kvar full kvalitet. Det går dock att komma så nära att de flesta inte reagerar. Men det slarvas …
10 sekunder i 320 kbit/s. 10 sekunders ur David Bowies ”Baby Loves That Way” visar att informationen under 16 kHz är välbevarad.
Upplösning
Det vanligaste sättet att förstöra ljudet är genom att inte ha tillräckligt hög datahastighet. MP3 med 192 kbit/s eller ännu lägre är helt enkelt för dåligt, särskilt i övertonregistret hörs artefakter. En sak är ju om det försvinner toner, en helt annan om det förekommer oönskade toner som slinker med – och som inte harmonierar med alla andra. MP3-filer med låg datahastighet har för mycket förvrängning för att de ska kunna godkännas som ett riktigt musikformat. Bra ljud börjar vid 256 kbit/s, helst bör man upp till det maximala för MP3-kodeken, 320 kbit/s. Då kan musiken faktiskt låta riktigt bra, och det blir viktigare hur själva inspelningen gjordes – och att den inte förstördes under mastering-processen som ett led i ljudnivåkriget.
Transkodning
Det värsta som görs är att musiken ofta lagras i ett komprimerat format, bara för att sedan kodas om till ett nytt. Eftersom skivbranschen och butikerna inte har kommit överens om ramar och standarder har skivbolagen kommit på att de kan skicka komprimerade MP3-filer av sina skivor till streaming-tjänster och online-butiker. Dessa tjänster och butiker har redan anammat ett visst format och en upplösning som de lagrar och säljer sin musik i. Spotify har till exempel sin musik i Ogg Vorbis och Wimp använder AAC-formatet. Om de tar emot musiken i MP3 så måste filerna packas upp och sedan kodas om i det nya formatet. Detta kallas transkodning. Och det är då det dystra börjar. I en MP3-fil är nämligen allt som går att plocka bort utan att det hörs redan bortplockat. Man tar hänsyn till psykoakustik, så att man tar bort toner som hjärnan återskapar utifrån andra harmoniska toner. Men eftersom olika kodekar väljer lite olika variabler för att lösa samma problem, blir artefakter hörbara när man tar bort för mycket och förstör den psykoakustiska rekonstruktionen.
10 sekunder i 192 kbit/s. Samma 10 sekunder visar att musikfilen har ”svarta hål” i det hörbara registret.
MP3 för PC och bärbart
Personligen har jag den bestämda åsikten att MP3 och andra musikformat som innebär dataförluster passar bäst att spelas genom datorhögtalare och när man är ute och rör på sig med bärbara musikspelare. Om allt görs rätt går det utmärkt att spela musiken på stereon hemma också, men i synnerhet om du lyssnar länge så kommer du att märka att lyssningströttheten dyker upp tidigare än om du lyssnar på CD. Att ljudet inte är riktigt snällt mot öronen under längre stunder beror på att det både tas bort och läggs till saker i ljudbilden. Ska man lyssna länge hemma på stereon rekommenderar jag absolut högre upplösning.
Wim kopplar greppet
Streaming-tjänsten Wimp är den första som gör någonting ljudkvaliteten. Fram tills nu har de haft AAC-format med 256 kbit/s som högsta upplösning. Nu har den höjts till 320 kbit/s. Men desto viktigare är att de har städat upp all transkodad musik i sitt bibliotek.
– Hela backkatalogen håller på att levereras till oss på nytt, i förlustfritt format, sedan lagrar vi musiken i det förlustfria FLAC-formatet, berättar Pål Bråtelund på Wimp.
Med andra ord har Wimp inte längre någon musik som först lagrats som MP3 och sedan ändrats om till AAC.
Utöver att höja datahastigheten och städa upp i biblioteket kommer Wimp på sikt att lansera en prenumerationstjänst för puritaner, med ren FLAC-kvalitet. FLAC är ett ljudformat som visserligen komprimerar musiken men som gör det på ett sådant sätt att det inte påverkar kvaliteten alls. När alla data packas upp igen är de helt intakta, tekniken fungerar ungefär som ett ZIP-format för musik.
Apple visar vägen
Apple har också visat att de bryr sig om ljudkvalitet. För ett tag sedan började de med Mastered for iTunes-konceptet. Det har samma ljudformat som annan musik man köper på iTunes, alltså AAC i 256 kbit/s. Skillnaden är att skivbolagen och artisterna har fått konkreta riktlinjer att förhålla sig till, både när det gäller en lägstanivå för dynamikomfång i inspelningen, samt att musiken måste levereras till iTunes i 24 bit/96 kHz-upplösning. Garanterat ingen transkodning alltså, och vi kan utgå från att det bara är en tidsfråga innan Apple trycker på en knapp och börjar sälja musiken i full 24 bit/96 kHz-upplösning direkt.
Högupplösta musiktjänster
Utbudet av högupplöst musik växer också. Tjänster som gubemusic.com och hdtracks.com får allt mer musik i CD-kvalitet eller ännu bättre. Mycket musik går att köpa ända upp i 24 bit/192 kHz-upplösning, vilket i okomprimerat skick har 6,5 gånger högre datahastighet än CD (16 bit/44,1 kHz). Man kan dock inte säga att det är samma sak som 6,5 gånger bättre ljud, eftersom de subjektiva skillnaderna är marginella. Det finns faktiskt två åsikter: dels de som tycker att det inte går att höra någon skillnad på CD och ännu högre upplösning, och dels som tycker att de kan. Själv tillhör jag den senare gruppen.
Högre upplösning ger ingen wow-känsla direkt, själva klangstrukturen i musiken är väldigt snarlik. Men det känns mer naturligt och har ett större lugn, kanske för att hjärnan inte behöver jobba lika hårt med att rekonstruera de delar av ljudbilden som saknas. Och man behöver inte någon dyr highend-anläggning för att höra det. Till och med billiga stereoanläggningar kan låta förvånansvärt bra om de matas med bra ljud.
Än så länge är det opraktiskt att strömma högupplöst ljud, till och med komprimerade förlustfria format (FLAC eller ALAC) har en 4 gånger större dataström än CD. Den som gillar att ha musiken liggande på en hårddisk bör dock använda sig av de förlustfria formaten.
Musikindustrin ändrar sig
Det verkar som om allting äntligen håller på att ändras till det bättre, ett stort steg framåt sedan bakslaget med MP3-formatet i slutet av 90-talet.
Samtidigt som streaming-tjänsterna börjar erbjuda musik i högre upplösning arbetas det med normer för hur man ska få bukt med ljud-nivåkriget, även kallat The Loudness War. Bland annat genom att musiktjänsterna implementerar en så kallad Normalized Level Control, vilket betyder att både genomsnittlig och maximal ljudnivå i varje fil läses av, varpå låten passerar en enkel volymkontroll så att Abba låter lika högt som Rihanna, trots att Rihanna är mycket kraftigare analogt komprimerad och därför borde låta högre. En sådan kontroll skulle ta bort fördelarna med att överkomprimera musiken, så att man kan koncentrera sig på att göra så bra ljud som möjligt i stället för så högt som möjligt.
Ljudkvaliteten går med andra ord en spännande tid till mötes!