Den Zeitaspekt verstehen und Geld sparen
Anbieter buhlen bei digitalen Audioformaten mit immer höheren Samplingraten um die Konsumenten. Doch mehr ist nicht immer besser. Das beweist das Nyquist-Shannon-Abtasttheorem.
Bei digitalen Audioformaten wie WAV, FLAC und DSD hat sich ein Rennen um immer höhere Wortlängen und Samplingraten etabliert. Je besser, desto teurer, lautet die Logik der Content-Anbieter und Gerätehersteller.
Der kanadische Blog Archimago’s Musings erhebt mehr Anspruch nach "Objektivität bei audiophilen Themen". Im Blog vom 4. Juni 2016 stellt Archimago die Frage, ob Sampleraten von 176.4 und 192 kHz sinnvoll seien. In der Folge analysiert er den Frequenzumfang einiger Musiktitel in seiner High-Res-Bibliothek und stellt fest, dass kaum ein Titel über ein Frequenzspektrum oberhalb von 40 kHz verfügt. Damit stellt eine Auflösung von 24 Bit/96 kHz das ideale Dateiformat dar, um den gesamten Frequenz- und Dynamikumfang seiner Musik mit diesem Format zu speichern und reproduzieren.
Die Grundlage: das Abtasttheorem
Fragestellungen zur notwendigen Abtastfrequenz lassen sich mit dem Nyquist-Shannon-Abtasttheorem und der Funktionsweise von Analog/Digital- und Digital/Analog-Wandlern beantworten. Das Abtasttheorem besagt, dass in einem digitalen System die Abtastfrequenz (Samplingrate) doppelt so hoch wie die höchste im Signal vorkommende Frequenz sein muss, damit aus zeitdiskreten, digitalen Werten das zeitkontinuierliche analoge Signal exakt rekonstruiert werden kann.
Diese Regel gilt für ein bandbegrenztes Signal. Mit 44.1 Samplingfrequenz lassen sich Tonsignale bis 22.05 kHz speichern, mit 96 kHz Tonsignale bis 48 kHz usw. Bandbegrenzung bedeutet, dass keine Frequenzanteile oberhalb der halben Samplingrate vorhanden sein dürfen, denn diese Frequenzanteile lassen sich nicht mehr richtig rekonstruieren (Aliasing), da weniger als zwei Samples pro Schwingung (Periode) erzeugt werden. Die Bandbegrenzung wird mit Filtern erreicht. Die richtige Auslegung dieser Filter ist klangentscheidend. Auch die analoge Wiedergabetechnik setzt Filterelemente für ein korrektes Funktionieren ein.
Laut dem Abtasttheorem ist ein durch den D/A-Wandler rekonstruiertes analoges Signal von 20 kHz nicht genauer, wenn es zuvor mit 96 kHz anstatt mit 44.1 kHz digitalisiert wurde, da auch die Information zwischen den Samples vollständig rekonstruiert wird.
Ein 96-kHz-System kann zusätzlich den Frequenzbereich zwischen 22.05 kHz und 48 kHz aufzeichnen, ein 192-kHz-System im Vergleich zu einem 96-kHz-System die Frequenzen zwischen 48 kHz und 96 kHz. Ist oberhalb von 48 kHz nichts mehr vorhanden, kann das Aufzeichnungssystem auch nichts speichern.
Mehr ist nicht besser. Liegen die Samples näher beieinander, werden die Kurven bei der D/A-Wandlung nicht genauer wiederhergestellt. Der grosse Irrtum, dem viele unterliegen ist, dass sie das Nyquist-Shannon-Theorem ausser Acht lassen und den Frequenz- und Zeitbereich als zwei unterschiedliche Aspekte verstehen. Frequenz und Zeit sind dasselbe, nur aus unterschiedlichen Blickwinkeln betrachtet. Das Impulsverhalten (oder das zeitliche Verhalten) wird durch die höchste im Signal vorkommende Frequenz bestimmt und steht somit in Bezug zur Bandbreite des Audiosystems. Bei einem Musiksignal mit einem Frequenzumfang bis 22kHz gibt es somit keine Ereignisse, die eine kürzere Zeitdauer als 45.2 μS haben. Auch der Abtastzeitpunkt hat keinen Einfluss darauf, ob das Signal exakt rekonstruiert werden kann. Eine Phasenverschiebung ist ebenfalls ein Zeitaspekt und kann problemlos reproduziert werden.
Zu welchem Zeitpunkt ein Signal abgetastet wird, ist demnach irrelevant. Eine Phasenverschiebung von x oder y Grad oder von etwa 4 μS wird vom System erfasst und genauso reproduziert. Messungen haben ergeben, dass eine zeitliche Verschiebung eines Signals von 45 Nanosekunden in einem mit 44.1 kHz arbeitenden System reproduziert werden kann. Was um den Faktor 100 besser als das menschliche Auflösungsvermögen ist.
Fazit
Welche Samplingfrequenz (kHz) und welche Wortbreite (Bit) notwendig ist, um ein Musiksignal vollständig und genau speichern und reproduzieren zu können, bestimmt der Frequenz- und Dynamikumfang eines Musikstücks. Absurd hohe Samplingraten und Wortbreiten generieren kein genaueres Resultat. Man verschwendet lediglich Speicherplatz, hat längere Download- und Back-up-Zeiten und zahlt oft ein paar Franken mehr für einen Trugschluss. "Mehr ist besser" mag in vielen Fällen richtig sein, aber nicht bei immer höheren Sampleraten.