De geweldige audiomythe: waarom je die 32-bits DAC niet nodig hebt

Inhoud

Hoor je dat?
Trap naar de hemel
De waarheid over 32-bit en 192 kHz
Afronden

Zoals je waarschijnlijk hebt gemerkt, is er een nieuwe trend in de smartphone-industrie om audiochips van "studiokwaliteit" op te nemen in moderne vlaggenschip-smartphones. Hoewel een 32-bits DAC (digitaal naar analoog converter) met 192 kHz audio-ondersteuning er zeker goed uitziet op het specificatieblad, heeft het eenvoudigweg geen voordeel om de omvang van onze audiocollecties te vergroten.

Ik ben hier om uit te leggen waarom deze bitdiepte en sample rate opscheppen gewoon een ander voorbeeld is van de audio-industrie die profiteert van het gebrek aan consumenten- en zelfs audiofiele kennis over het onderwerp. Trek je nerd caps aan, we gaan in op een aantal serieuze technische punten om de ins en outs van pro audio uit te leggen. En hopelijk zal ik je ook bewijzen waarom je de meeste marketinghype zou moeten negeren.

Hoor je dat?

Voordat we verder duiken, biedt dit eerste segment wat vereiste achtergrondinformatie over de twee hoofdconcepten van digitale audio, bitdiepte en samplefrequentie.

Sample rate verwijst naar hoe vaak we amplitude-informatie over een signaal gaan vastleggen of reproduceren. In wezen hakken we een golfvorm in veel kleine delen om er op een specifiek tijdstip meer over te weten te komen. De stelling van Nyquist stelt dat de hoogst mogelijke frequentie die kan worden vastgelegd of gereproduceerd, precies de helft is van de bemonsteringssnelheid. Dit is vrij eenvoudig voor te stellen, omdat we de amplitudes voor de boven- en onderkant van de golfvorm (waarvoor twee monsters nodig zijn) nodig hebben om de frequentie nauwkeurig te kennen.

Het verhogen van de sample-snelheid (boven) resulteert in extra samples per seconde, terwijl een grotere bit-diepte (onder) meer mogelijke waarden biedt om de sample op te nemen.

Voor audio houden we ons alleen bezig met wat we kunnen horen en het overgrote deel van het gehoor van mensen neemt af vlak voor 20 kHz. Nu we de Nyquist-stelling kennen, kunnen we begrijpen waarom 44,1 kHz en 48 kHz veelvoorkomende bemonsteringsfrequenties zijn, omdat ze iets meer dan twee keer de maximale frequentie zijn die we kunnen horen. Het gebruik van 96kHz- en 192kHz-normen voor studiokwaliteit heeft niets te maken met het vastleggen van gegevens met een hogere frequentie, dat zou zinloos zijn. Maar daar gaan we zo meteen op in.

Aangezien we naar amplitudes in de tijd kijken, verwijst de bitdiepte eenvoudig naar de resolutie of het aantal beschikbare punten om deze amplitudegegevens op te slaan. 8-bits biedt ons bijvoorbeeld 256 verschillende punten om af te ronden, 16-bits resultaten in 65.534 punten, en 32-bits aan gegevens geeft ons 4.294.967.294 gegevenspunten. Hoewel het duidelijk is, vergroot dit de grootte van alle bestanden aanzienlijk.

Het is misschien gemakkelijk om meteen na te denken over bitdiepte in termen van amplitudeauwkeurigheid, maar de belangrijkste concepten om te begrijpen zijn die van ruis en vervorming. Met een zeer lage resolutie zullen we waarschijnlijk brokken met lagere amplitude-informatie missen of de toppen van golfvormen afsnijden, wat onnauwkeurigheid en vervorming introduceert (kwantisatiefouten). Interessant genoeg klinkt dit vaak als ruis als je een bestand met een lage resolutie afspeelt, omdat we de grootte van het kleinst mogelijke signaal dat kan worden vastgelegd en gereproduceerd, effectief hebben vergroot. Dit is precies hetzelfde als het toevoegen van een ruisbron aan onze golfvorm. Met andere woorden, het verlagen van de bitdiepte vermindert ook de ruisvloer. Het kan ook helpen om hier aan te denken in termen van een binair monster, waarbij het minst significante bit de ruisvloer vertegenwoordigt.

Daarom geeft een hogere bitdiepte ons een grotere ruisvloer, maar er is een eindige limiet aan hoe praktisch dit in de echte wereld is. Helaas is er overal achtergrondgeluid en ik bedoel niet dat de bus op straat voorbij rijdt. Van kabels tot je koptelefoon, de transistors in een versterker en zelfs de oren in je hoofd, de maximale signaal / ruisverhouding in de echte wereld is ongeveer 124dB, wat neerkomt op ongeveer 21-bits gegevenswaarde.Jargon Buster:

DAC- Een digitaal-naar-analoog omzetter neemt digitale audiogegevens en zet deze om in een analoog signaal om naar hoofdtelefoons of luidsprekers te verzenden.

Sample Rate- Gemeten in Hertz (Hz), is dit het aantal digitale datamonsters dat elke seconde wordt vastgelegd.

SNR- Signaal-ruisverhouding is het verschil tussen het gewenste signaal en de achtergrondsysteemruis. In een digitaal systeem is dit direct gekoppeld aan de bit-diepte.

Ter vergelijking biedt 16-bits opname een signaal-ruisverhouding (het verschil tussen het signaal en achtergrondruis) van 96,33 dB, terwijl 24-bits 144,49 dB biedt, wat de grenzen van hardware-opname en menselijke perceptie overschrijdt. Dus je 32-bits DAC kan eigenlijk alleen maar de meeste 21-bits bruikbare gegevens uitvoeren en de andere bits worden gemaskeerd door circuitruis. In werkelijkheid worden de meeste redelijk geprijsde apparaten uitgerust met een SNR van 100 tot 110dB, omdat de meeste andere circuitelementen hun eigen ruis introduceren. Het is dus duidelijk dat 32-bits bestanden al behoorlijk overbodig lijken.

Nu we de basis van digitale audio hebben begrepen, gaan we verder met enkele van de meer technische punten.

Trap naar de hemel

De meeste problemen rond het begrip en de misvatting van audio hangen samen met de manier waarop educatieve bronnen en bedrijven proberen de voordelen te verklaren met behulp van visuele signalen. Je hebt waarschijnlijk allemaal audio gezien als een reeks traptreden voor bitdiepte en rechthoekige lijnen voor de samplefrequentie. Dit ziet er zeker niet erg goed uit als je het vergelijkt met een soepel ogende analoge golfvorm, dus het is gemakkelijk om fijnere, "gladdere" trappen te draven om een meer accurate outputgolfvorm te vertegenwoordigen.

Hoewel het misschien een gemakkelijke verkoop aan het publiek is, is deze gemeenschappelijke "trap" -nauwkeurigheidsanaloog een enorme misleiding en wordt niet gewaardeerd hoe digitale audio eigenlijk werkt. Negeer het.

Deze visuele weergave geeft echter niet goed weer hoe audio werkt. Hoewel het er rommelig uitziet, zijn de gegevens onder de Nyquist-frequentie, dat is de helft van de bemonsteringsfrequentie, wiskundig perfect vastgelegd en kunnen perfect worden gereproduceerd. Stel je dit voor, zelfs bij de Nyquist-frequentie, die vaak kan worden weergegeven als een blokgolf in plaats van een vloeiende sinusgolf, we hebben nauwkeurige gegevens voor de amplitude op een specifiek tijdstip, wat alles is dat we nodig hebben. Wij mensen kijken vaak ten onrechte naar de ruimte tussen de monsters, maar een digitaal systeem werkt niet op dezelfde manier.

Bitdiepte wordt vaak gekoppeld aan nauwkeurigheid, maar definieert echt de geluidsprestaties van het systeem. Met andere woorden, het kleinst detecteerbare of reproduceerbare signaal.

Als het op afspelen aankomt, kan dit een beetje lastiger worden, vanwege het gemakkelijk te begrijpen concept van "nul-orde hold" DAC's, die eenvoudig tussen waarden schakelen met een ingestelde sample rate, waardoor een trapvormig resultaat ontstaat. Dit is eigenlijk geen eerlijke weergave van hoe audio-DAC's werken, maar terwijl we hier zijn, kunnen we dit voorbeeld gebruiken om te bewijzen dat je je toch geen zorgen hoeft te maken over die trappen.

Een belangrijk feit om op te merken is dat alle golfvormen kunnen worden uitgedrukt als de som van meerdere sinusgolven, een fundamentele frequentie en extra componenten bij harmonische veelvouden. Een driehoeksgolf (of een traptrede) bestaat uit vreemde harmonischen bij afnemende amplitudes. Dus als er veel zeer kleine stappen plaatsvinden op onze steekproefsnelheid, kunnen we zeggen dat er wat extra harmonische inhoud is toegevoegd, maar het gebeurt op het dubbele van onze hoorbare (Nyquist) frequentie en waarschijnlijk een paar harmonischen daarbuiten, dus we hebben gewonnen kan ze toch niet horen. Bovendien zou dit vrij eenvoudig uit te filteren zijn met behulp van een paar componenten.

Als we de DAC-monsters scheiden, kunnen we gemakkelijk zien dat ons gewenste signaal perfect wordt weergegeven samen met een extra golfvorm bij de DAC-samplefrequentie.

Als dit waar is, moeten we dit kunnen waarnemen met een snel experiment. Laten we een uitgang rechtstreeks van een standaard nul-orde hold-DAC nemen en het signaal ook door een heel eenvoudige 2 leiden^nd bestel laagdoorlaatfilter ingesteld op de helft van onze sample-snelheid. Ik heb hier eigenlijk alleen een 6-bits signaal gebruikt, zodat we de uitvoer op een oscilloscoop kunnen zien. Een 16-bits of 24-bits audiobestand zou veel minder ruis op het signaal hebben, zowel voor als na het filteren.

Een nogal grof voorbeeld, maar dit bewijst het punt dat audiogegevens perfect worden nagebouwd in deze rommelige trap.

En als bij toverslag, is de traptreden bijna volledig verdwenen en wordt de output "gladgestreken", alleen door een laagdoorlaatfilter te gebruiken dat onze sinusgolfoutput niet verstoort. In werkelijkheid hebben we alleen delen van het signaal eruit gefilterd die je toch niet zou hebben gehoord. Dat is echt geen slecht resultaat voor vier extra componenten die in principe gratis zijn (twee condensatoren en twee weerstanden kosten minder dan 5 pence), maar er zijn eigenlijk meer geavanceerde technieken die we kunnen gebruiken om deze ruis nog verder te verminderen. Beter nog, deze zijn standaard opgenomen in de meeste DAC's van goede kwaliteit.

Omgaan met een realistischer voorbeeld, elke DAC voor gebruik met audio zal ook een interpolatiefilter bevatten, ook bekend als up-sampling. Interpolatie is eenvoudigweg een manier om tussenliggende punten tussen twee monsters te berekenen, dus uw DAC doet eigenlijk veel van deze "afvlakking" alleen, en veel meer dan het verdubbelen of verviervoudigen van de bemonsteringssnelheid. Beter nog, het neemt geen extra bestandsruimte in beslag.

Interpolatiefilters die vaak voorkomen in elke DAC die zijn zout waard is, zijn een veel betere oplossing dan bestanden met hogere bemonsteringsfrequenties mee te nemen.

De methoden om dit te doen kunnen behoorlijk ingewikkeld zijn, maar in wezen verandert uw DAC zijn outputwaarde veel vaker dan de samplefrequentie van uw audiobestand zou suggereren. Dit duwt de onhoorbare traptreden harmonischen ver buiten de bemonsteringsfrequentie, waardoor het gebruik van langzamere, beter bereikbare filters mogelijk is die minder rimpel hebben, waardoor de bits die we eigenlijk willen horen behouden blijven.

Als je nieuwsgierig bent waarom we deze inhoud willen verwijderen die we niet kunnen horen, is de eenvoudige reden dat het reproduceren van deze extra gegevens verderop in de signaalketen, bijvoorbeeld in een versterker, energie zou verspillen. Verder, afhankelijk van andere componenten in het systeem, kan deze "ultrasonische" inhoud met hogere frequentie in feite leiden tot grotere hoeveelheden intermodulatie-vervorming in componenten met beperkte bandbreedte. Daarom zou je 192 kHz-bestand waarschijnlijk meer kwaad dan goed veroorzaken, als er daadwerkelijk ultrasone inhoud in die bestanden zit.

Als er nog meer bewijs nodig was, zal ik ook een uitvoer van een hoogwaardige DAC tonen met behulp van de Circus Logic CS4272 (bovenaan afgebeeld). De CS4272 beschikt over een interpolatiesectie en een steil ingebouwd outputfilter. Het enige dat we voor deze test doen, is een microcontroller gebruiken om de DAC twee 16-bits hoge en lage monsters op 48 kHz te voeden, waardoor we de maximaal mogelijke outputgolfvorm op 24 kHz hebben. Er zijn geen andere filtercomponenten gebruikt, deze uitgang komt rechtstreeks van de DAC.

Het 24kHz-uitgangssignaal (boven) van dit DAC-component van studiokwaliteit lijkt zeker niet op de rechthoekige golfvorm die hoort bij het gebruikelijke marketingmateriaal. De sample-snelheid (Fs) wordt onderaan de oscilloscoop weergegeven.

Merk op hoe de uitgangsinusgolf (boven) precies de helft is van de snelheid van de frequentieklok (onder). Er zijn geen merkbare traptreden en deze golfvorm met zeer hoge frequentie lijkt bijna op een perfecte sinusgolf, niet op een blokachtige vierkante golf die het marketingmateriaal of zelfs een informele glimp op de uitvoergegevens suggereert. Dit laat zien dat zelfs met slechts twee samples de Nyquist-theorie in de praktijk perfect werkt en we een pure sinusgolf kunnen maken, zonder extra harmonische inhoud, zonder een enorme bitdiepte of sample-snelheid.

De waarheid over 32-bit en 192 kHz

Zoals met de meeste dingen, is er een waarheid verborgen achter al het jargon en is 32-bits, 192 kHz audio iets dat praktisch bruikbaar is, gewoon niet in de palm van je hand. Deze digitale attributen komen eigenlijk van pas wanneer je in een studio-omgeving bent, vandaar de bewering "audio van studiokwaliteit naar mobiel te brengen", maar deze regels zijn gewoon niet van toepassing wanneer je het voltooide nummer in je zak wilt steken.

Laten we eerst beginnen met de steekproefsnelheid. Een vaak aangeprezen voordeel van audio met een hogere resolutie is het bewaren van ultrasonische gegevens die u niet kunt horen maar die de muziek beïnvloedt. Onzin, de meeste instrumenten vallen er al ver voor de frequentielimieten van ons gehoor, de microfoon werd gebruikt om een ruimterol af te vangen op ongeveer 20 kHz, en je hoofdtelefoon die je gebruikt zal ook zeker niet zo ver reiken. Zelfs als ze dat konden, kunnen je oren het eenvoudig niet detecteren.

Typische menselijke gehoorgevoeligheid piekt op 3 kHz en begint snel af te rollen na 16 kHz.

Bemonstering met 192 kHz is echter behoorlijk nuttig bij het verminderen van ruis (dat sleutelwoord nog eens) bij het bemonsteren van gegevens, maakt een eenvoudiger constructie van essentiële invoerfilters mogelijk en is ook belangrijk voor een digitaal snel effect. Oversampling boven het hoorbare spectrum stelt ons in staat om het signaal te middelen om de ruisvloer naar beneden te duwen. U zult merken dat de meeste goede ADC's (analoog naar digitaal converters) tegenwoordig worden geleverd met ingebouwde 64-bit over-sampling of meer.

Elke ADC moet ook frequenties boven de Nyquist-limiet verwijderen, anders krijg je een vreselijk klinkende aliasing omdat hogere frequenties worden "ingeklapt" in het hoorbare spectrum. Het hebben van een grotere kloof tussen onze filterhoekfrequentie van 20 kHz en de maximale bemonsteringsfrequentie is meer geschikt voor filters uit de echte wereld die gewoon niet zo steil en stabiel kunnen zijn als de theoretische filters die nodig zijn. Hetzelfde geldt aan het DAC-uiteinde, maar zoals we hebben besproken, kan intermodulatie deze ruis zeer effectief naar hogere frequenties duwen voor eenvoudiger filteren.

Hoe steiler het filter, des te meer rimpel in de pasband. Door de bemonsteringssnelheid te verhogen, kunnen "langzamere" filters worden gebruikt, waardoor een vlakke frequentierespons in de hoorbare doorlaatband behouden blijft.

In het digitale domein gelden vergelijkbare regels voor filters die vaak worden gebruikt in het studiomixproces. Hogere bemonsteringsfrequenties zorgen voor steilere, sneller werkende filters die extra gegevens nodig hebben om goed te functioneren. Niets van dit alles is vereist als het gaat om afspelen en DAC's, omdat we alleen interessant zijn in wat u daadwerkelijk kunt horen.

Als we overstappen op 32-bits, zal iedereen die ooit heeft geprobeerd om op afstand complexe wiskunde te coderen, het belang van bitdiepte begrijpen, zowel met integer- als drijvende-kommagegevens. Zoals we hebben besproken, hoe meer bits, hoe minder ruis en dit wordt belangrijker wanneer we signalen in het digitale domein gaan delen of aftrekken vanwege afrondingsfouten en om afbeeldingsfouten bij het vermenigvuldigen of optellen te voorkomen.

Extra bitdiepte is belangrijk voor het behouden van de integriteit van een signaal bij het uitvoeren van wiskundige bewerkingen, zoals in studio-audiosoftware. Maar we kunnen deze extra gegevens weggooien zodra het masteren is voltooid.

Hier is een voorbeeld, stel dat we een 4-bit sample nemen en onze huidige sample is 13, dat is 1101 in binair getal. Probeer nu om dat door vier te delen en we blijven achter met 0011, of gewoon 3. We hebben de extra 0,25 verloren en dit zal een fout zijn als we probeerden extra wiskunde te doen of ons signaal weer in een analoge golfvorm te veranderen.

Deze afrondingsfouten manifesteren zich als zeer kleine hoeveelheden vervorming of ruis, die zich kunnen ophopen over een groot aantal wiskundige functies. Als we dit 4-bits monster echter uitbreiden met extra stukjes informatie om te gebruiken als een factie of decimale punt, kunnen we nog veel langer delen, toevoegen en vermenigvuldigen dankzij de extra gegevenspunten. Dus in de echte wereld helpt het bemonsteren op 16 of 24 bit en deze gegevens vervolgens om te zetten in een 32-bit formaat voor verwerking opnieuw om te besparen op ruis en vervorming. Zoals we al hebben gezegd, zijn 32-bits ontzettend veel nauwkeurigheidspunten.

Wat net zo belangrijk is om te erkennen, is dat we deze extra hoofdruimte niet nodig hebben als we terugkomen in het analoge domein. Zoals we al hebben besproken, ongeveer 20-bits gegevens (-120dB ruis) het absolute maximum dat mogelijk kan detecteren, dus we kunnen terug converteren naar een redelijkere bestandsgrootte zonder de audiokwaliteit te beïnvloeden, ondanks het feit dat "audiofielen" waarschijnlijk klagen over deze verloren gegevens.

We zullen echter onvermijdelijk enkele afrondingsfouten introduceren wanneer we naar een lagere bitdiepte gaan, dus er zal altijd een heel kleine hoeveelheid extra vervorming zijn omdat deze fouten niet altijd willekeurig voorkomen. Hoewel dit geen probleem is met 24-bits audio omdat het al veel verder reikt dan de analoge ruisvloer, lost een techniek met de naam "dithering" dit probleem netjes op voor 16-bits bestanden.

Een voorbeeldvergelijking van de vervorming die wordt geïntroduceerd door truncatie en dithering.

Dit wordt gedaan door het minst significante deel van het audiofragment willekeurig te maken, vervormingsfouten te elimineren, maar wat zeer stille willekeurige achtergrondruis te introduceren die over frequenties wordt verspreid. Hoewel de introductie van ruis contra-intuïtief lijkt, vermindert dit feitelijk de hoeveelheid hoorbare vervorming vanwege de willekeur. Bovendien, met behulp van speciale ruisvormige ditheringpatronen die de frequentierespons van het menselijk oor misbruiken, kan 16-bit dithered audio een waargenomen ruisvloer zeer dicht bij 120dB behouden, precies aan de grenzen van onze waarneming.

32-bit gegevens en 192 kHz samplefrequenties hebben opmerkelijke voordelen in de studio, maar dezelfde regels zijn niet van toepassing op het afspelen.

Simpel gezegd, laat de studio's hun harde schijven verstoppen met deze hoge resolutie-inhoud, we hebben gewoon niet al die overbodige gegevens nodig als het gaat om afspelen van hoge kwaliteit.

Afronden

Als je nog steeds bij me bent, interpreteer dit artikel dan niet als een volledig afwijzing van de inspanningen om de audiocomponenten van smartphones te verbeteren. Hoewel het aantal touting nutteloos kan zijn, zijn componenten van hogere kwaliteit en een beter circuitontwerp nog steeds een uitstekende ontwikkeling in de mobiele markt, maar we moeten er alleen voor zorgen dat fabrikanten hun aandacht op de juiste dingen richten. De 32-bits DAC in de LG V10 klinkt bijvoorbeeld geweldig, maar je hoeft geen moeite te doen met enorme audiobestandsgroottes om ervan te profiteren.

De mogelijkheid om hoofdtelefoons met een lage impedantie aan te sturen, een laag ruisniveau van de DAC naar de aansluiting te behouden en minimale vervorming te bieden, zijn veel belangrijker kenmerken voor smartphone-audio dan de theoretisch ondersteunde bitdiepte of samplefrequentie, en hopelijk kunnen we om in de toekomst in meer detail op deze punten in te gaan.

Inhoud

Hoor je dat?

Trap naar de hemel

De waarheid over 32-bit en 192 kHz

Afronden

Deze smartphone heeft een batterij van 18.000 mAh en ziet er gevaarlijk zwaar uit

Energizer kondigt de opvouwbare Power Max P8100S aan

Samsung Galaxy Note 9 batterijbeoordeling: enorm, maar genoeg?

Deal: Samsung Galaxy Note 9 kost slechts $ 700 voor de komende zes uur - haal het snel!

Koop een Samsung Galaxy Note 9, krijg gratis Galaxy Tab A