17 mars 2005
Jag var inne i en lokal hifi-butik igår på spaning efter ett stativ till min ena surroundhögtalare och råkade hamna i en diskussion med den ena affärsinnehavaren kring ljudformat och musikutrustning i största allmänhet. Denna man visade sig vara en äkta
Jag tycker förstås att mycket av detta är trams. Så vitt jag vet innebär begreppet high fidelity att man vill ha en så trogen återgivning av verkligheten som möjligt. Jag äger i princip knappast några vinylskivor (förutom någon gammal Thompson Twins och Depeche Mode, som samlar damm någonstans i föräldrahemmet) och känner därför att jag har svårt att uttala mig över detta mediums förtjänster. Emellertid har jag förstått att denna teknik innebär en komprimering av det inspelade ljudet, med en förstärkning av svagare ljud, som leder till en minskad dynamik. En CD-inspelning består av ett digitalt stereospår (i bästa fall) på 16 bitar, samplat i en frekvens av 44.1 kHz, vilket innebär att det inspelade ljudet kraftigt komprimerats. SACD och DVD-audio erbjuder istället samplingsfrekvenser på upp till 192 kHz i 24 bitar, vilket ger möjlighet till en betydligt bättre approximation av verkligheten, med bättre återgivning av dynamik, upplösning och klangdjup. Av dessa skäl tycker jag att dessa båda nya ljudformat erbjuder större möjligheter till hifi är föregångarna. Att skivbolagen sedan månglar ut undermåliga surroundmixar är ju knappast formatens fel. Ett liknande fenomen sågs ju även i CD-skivans barndom, när kassa vinylinspelningar snabbt pressades i det nya digitala mediet.
Nästa fråga är huruvida verkligheten bäst fångas i en stereo- eller en surroundmix. Visst kan man hävda att man vanligen sitter en bit ifrån en livespelning och hör musiken framifrån, men den totala upplevelsen inbegriper även ljudreflexioner från väggar och föremål omkring oss. Således torde en väl genomförd surroundinspelning bättre efterlikna verkliga förhållanden. Hur bra en stereoinspelning än är genomförd så är den till syvende och sist tvådimensionell. I min hjärna kommer en bra surroundinspelning alltid att sopa mattan med en bra stereoinspelning, sedan får vinylfanatiker säga vad de vill. Det är trots allt den upplevda verkligheten som borde vara referenspunkten.
Vad killen i hifi-butiken trots allt har rätt i är att musik, oberoende av medium, alltid låter bättre på bra grejer.
1David Pettersson skriver:
Ja, det är helt klart högupplöst tvåkanalers ljud som är intressant snarare än 5-kanaligt ljud. Jag kan nog tycka att vinyl låter bättre än cd, huruvida det sen beror på att återgivningen är trognare eller inte vet jag inte. Helt säkert är att en DVD-Audio-skiva är mycket bekvämare att hantera än en LP-skiva. Mycket beror på hur väl mastringen gjorts, man får hoppas att bolagen verkligen lägger krut på det på SACD- och DVD-utgåvorna annars är det ju helt meningslöst.
2Henrik Sundström skriver:
Finns mycket att säga om detta, men låt mig lite skämtsamt få utmana ditt tänkande med följande: Vi har bara två öron, varför då ha fem högtalare? Det ultimata är att spela in binaural och lyssna med hörlurar.
Kolla t ex: The Binaural Source
;-)
Joakim skriver:
Henrik: Vi har visserligen bara två öron, men de är inte riktade framåt. Vår hörsel är konstruerad för ett tredimensionellt lyssnande. Man kan säkert imitera tre dimensioner med tvåkanaligt ljud, men min logik säger mig att fler kanaler borde ge en bättre approximering av verkliga förhållanden.
Joakim skriver:
Jag kollade sidan om binaural inspelningsteknik och jag måste säga att det verkar rätt coolt. Som jag ser det är det ett annat sätt att angripa problemet med att skapa ett tredimensionellt ljudrum. Antingen skapar man illusionen i periferin (surround med flera ljudkällor), eller centralt vid öronen (binauralt). Se där, ja.
5Henrik Sundström skriver:
Binaural är ett enormt fascinerande koncept med många fördelar. För att spela in en konsert live är det bäst om man placerar en levande mänska (eftersom densitet etc blir mer naturtroget än om det är på en docka) på ‘bästa’ platsen och sätter ett par mikrofoner långt in i öronen. Min bror som jobbat mkt med inspelningsteknik har lärt mig en del om detta och det finns en liten ‘binauralkult’ som du säkert kan hitta en del skoj om på nätet – även en del inspelningar. Hör där, ja! ;-)
6David skriver:
Det finns en sak som är viktigare än allt teknisk mumbo-jumbo i hela världen.
-En bra låt!Allt annat är egentligen oväsentligt.
7Thebe skriver:
Utan att kunna något om musik och högtalaranläggningar eller så, egentligen, kan man fundera över det här i ett fysikaliskt perspektiv. Ljudvågor alltså, frekvenser, förstärkningar och fasförskjutningar. Om man tänker i frekvensdomänen nu (energi på y-axeln, frekvens på x-axeln). En analog ljudkälla borde ge ifrån sig ljud i ett brett frekvensintervall, dessa ljud studsar i väggar och annat. Mottagarens trumhinnor försätts i svängning av det överlagrade, studsade, fasförskjutna ljudet som till sist når h*ns öron. Två stycken. Som Henrik skriver borde man alltså bara kunna “höra” två olika svängningar samtidigt, en från varje trumhinna.
Högtalarnas, eller sorroundsystemets uppgift är då att approximera alla studsar, fasförskjutningar och superpositioner som gör ljudvågen innan den kommer till trumhinnan, för att bäst efterlikna en analog ljudkälla. Frekvensomfånget, bandbredden, och frekvensupplösningen bestäms av samplingstid och antal bitar. Ju högre samplingsfrekvens (kortare samplingstid) desto bättre (om man lyckas undertrycka högfrekvent brus), och ju fler bitar desto bättre upplösning. Om man har hundra småhögtalare torde man klara sig med betydligt enklare algoritmer för att “mixa” ljudet än om man bara har två högtalare. Alltså borde det inte vara ett självklart att säga att surround är bättre än stereo, det beror på hur skickligt man lyckas fixa frekvensblandningen, samt hur de placeras. Och eftersom man kan anta att vi befinner oss i det linjära, eller det kan i alla fall approximeras linjärt borde man, med skicklighet, faktiskt kunna lyckas lika bra med stereo som med surround.
Joakim skriver:
Thebe: Om vi befann oss i det linjära borde det väl i sådana fall räcka med en monoinspelning: förutsatt att ljudteknikern är tillräckligt skicklig?
En bra stereoinspelning kan säkert skapa en riktigt bra illusion av det tredimensionella rummet – tills vi rör aldrig så lite på huvudet i förhållande till högtalarna. Vår hörsels riktningskänslighet avslöjar då nämligen direkt trollkarlen bakom skynket. En annan förutsättning för att en sådan illusion skulle fungera är att vi placerar de två stereohögtalarna på ett standardiserat sätt och plötsligt är vi då tillbaka i binaural teknik som lyfts fram ovan. Rätta mig om jag har fel.
9Thebe skriver:
Linjäritet är inte detsamma som mono. Man kan approximera olinjära fenomen (övertoner) med godtyckligt antal linjära spektralkomponenter. Själva definitionen av frekvensdomänen kräver förresten linjäritet. Men det jag menar är att det viktiga är att åstadkomma rätt approximerade svängningar vid respektive trumhinna, rätt spektralbild kan man säga. Och visst har du rätt i att den kommer att ändra sig när man vrider på huvudet, och hoppar man omkring mycket i rummet blir det ännu svårare. Vilket iofs lutar mer åt Henriks förslag, faktiskt, än “fjärr-stereo”. Jag menar att i princip borde skicklig stereo-hantering kunna vara rätt hyfsat, och inte självklart sämre än taskig surround. Man borde kunna ställa till rätt mycket med surround förresten, övertoner och superpositioner och fasförskjutningar som inte finns i den ursprungliga inspelningen :-)!
10Henrik Sundström skriver:
Ja, jag måste skratta åt era underbara kommentarer, joakim och Thebe! Ni har rätt i så mycket – och faktiskt verkar ni närma er min sanning ju mer ni tänker! Binarual är det ultimata helt enkelt! Såvida man inte via surroundinspelning vill åhöragöra hur musikanter hoppar runt omkring en – eller hur det låter för någon som dansar bland muskerna – eller, antagligen mest realistiskt, vill ljudsätta ett skeende som utspelas på “vita duken”.
11Henrik Sundström skriver:
Måste också påpeka att jag finner dessa kommentarer vara ännu roligare med tanke på Hz.
12Isaac skriver:
Enda sättet att få ett riktigt 3D-ljud är att spela in med binaural inspelning (två kondensatormikrofoner i varge öra som går till varsin separerad kanal).
Tyvärr så är det endast ett par hörlurar som kan återskapa det verkliga 3D-ljudet.
13Isaac skriver:
Man kan spela in stereo inspelningar med samplingsfrekvenser på upp till 192 kHz i 24 bitar. Men frågan är hur mycket information hjätnan kan ta in.
Det är en stor skillnad mellan 8 bitar och 16 bitar men 16 bitar och 24 märks knappast om man har en bra inspelning.
14Isaac skriver:
Varför skall man ha en samplingsfrekvens på 192 kHz när homosapiens homosapiens endast kan höra innom frekvensomfånget 20-22500 Hz. Det behövs inte mer en det dubbla t.ex. 44,1 kHz.
Att ha mer en vad man behöver slösar bara på platts och energi.
15Henrik Sundström skriver:
Isaac: Samplingsfrekvens innebär hur ofta (1 kHz = 1 tusen gånger per sekund) man samlar in ljud (detta eftersom man med digital inspelning inte kan lagra information kontinuerligt utan enbart med vissa intervall – ju högre intervall desto större naturtrogenhet – och större datamängder) och har inget direkt att göra med det frekvensområde inom vilket människans hörsel förmår uppfatta svängningar. Däremot har antalet bitar med vilken varje enskild sampling lagras en direkt relation till antalet frekvenser som kan återges. Typ.
Kul att du gillar binaural. Har du några inspelningar du kan dela med dig?
Tyvärr har jag inga själv att dela med mig :-(
16Per Gabrielsson skriver:
Faktum är att Isaac har rätt. Enligt Nyqvists samplingsteorem krävs att man minst samplar i en hastighet dubbelt så hög som den högsta ingående signalfrekvensen för att unvika s.k. aliasing/vikningsdistortion. Antalet bitar ger upplösningen på samplingarna, ju högre upplösning, desto mindre kvantiseringsdistortion, detta har ingenting med frekvensinnehållet att göra. Genom att sampla i högre hastighet, s.k. översampling kan man göra mindre branta filter (med bättre fasegenskaper än branta), och på så sätt förbättra ljudet, även om människan inte kan uppfatta frekvenser högre än ca 22kHz.
17Henrik Sundström skriver:
Ja just det!
Whittaker-Nyquist-Kotelnikov-Shannon sampling theoremDet finns de som målar kanten på sina cd skivor med en speciell färgpenna för att minska reflektioner av ljus som stör ljudet. Eller de som köper hgt-sladd för 1000:-/meter och de som säger att det går lika bra med en lampsladd bara den inte är längre än 5 meter.
Blinda A-B test är det enda som gäller. Objektiviteten i testet är förstås central (alla övriga parametrar ska vara samma). Detta går ju inte att uppnå eftersom du inte kan lyssna på både A och B samtidigt. Redan där liksom….
:-D
18Isaac skriver:
Det finns ju metoder för att ta bort information utan att vi märker någon skillnad. Jag tycker inte att det är någon skillnad mellan t.ex. wave på 44,1KHz som är på ca 1400kbit/s och konverterard fil t.ex. MP3 på ca 320kbit/s 44,1KHz inte ens när man spelar klassisk musik i hörlurar.
Jag har gjort en binaural inspelning men det var med två ganska dåliga mikrofoner. Jag sparar just nu till två stycken små kondensatormikrofoner av en högre kvalitet som är mindre och har ett lägre brusförhållande med möjligheter att ta in ett större frekvensområde ni kanske har några tipps.
Då tackar jag på förhand.
19Isaac skriver:
Jag glömde nämna altså 44,1KHz 16bitar 1400Kbit/s = wave
och 44,1KHz 320Kbit/s m.m. = MP3
21Thebe skriver:
Samplar man en signal med 10 Hz kommer man att kunna se frekvenser upp till 5 Hz, enl samplingsteoremet. Men, man bör sampla 5-10 gånger snabbare än den frekvens man är intresserad av bra upplösning för. Säg att man är intresserad av området 4-5 Hz. Samplar man med 10 Hz får man med det, men samplingen är inte ideal eftersom man måste ha antialiasfilter som inte har skarp brytfrekvens, alltså får man in skräp i området också. Så är man intresserad av bra återgivning av 4-5 Hz borde man sampla med 25-50 Hz. Och vill man nu fånga frekvenser på 20 kHz (eller vad var det) samplar man lämpligen med 100-200 kHz. Simsalabim :-)!
22Thebe skriver:
Släng dig i väggen, Nyquist, strunt i bitar hit och dit, för att inte tala om surround med rätta placeringen och utformningen! HyperSonic Sound: “How about the potential to reflect the rear channels of your surround TV from the rear wall of your living room, by focusing HSS speakers mounted on the TV itself – no rear speakers, no rear wiring. Think about the ability to focus sound into a crowd of people on a football field and talk only to a selected few.”
http://www.atcsd.com/tl_hss.html
http://www.woodynorris.com/Articles/USAToday2.htm (via Henrik)Plötsligen blev det lite high-tech med ljud :-D!
23Isaac skriver:
Jag säger bara en sak problemet med att återge den verkliga spatiala upplevelsen är stor med surroundhögtalarna så blir det inte samma 3D-ljud som man vill återskapa och inte med binaurala inspelningar heller för sanningen är den att enda sättet att få 3D-ljud är att lyssna med hörlurar men pga alla menniskor har olika HRTF altså olika överkroppar och olika ytteröron m.m. så får man helt enkelt göra så att man har ett program som läser av din HRTF med ett par miniatyr condensatormikrofoner så att den sedan kan mixa iordning ljudet så att det passar just din hjärna.
Joakim Hertze är läkare och blivande psykiatriker, med särskilt intresse för tillstånd som drabbar hjärnans kognitiva förmågor. Här publicerar han sina alster och bloggar om saker som intresserar honom. En smula spretigt — som livet självt minsann. Läs mer…