|
Die
"Trägheit" des Filters ist für Frequenzen oberhalb der
Grenzfrequenz eben nicht beliebig hoch. Da diese je nach Tonhöhe
mehr oder weniger gut dargestellt sind, werden zu hohe
Frequenzanteile im Datenstrom falsch dargestellt und führen
mitunter zu hörbaren Frequenzen- wenn auch mit sehr geringer
Lautstärke! Ausserdem muss auch eingangsseitig verhindert
werden, dass ein hochfrequenter Anteil oberhalb des Hörbereichs
den Messwert im Moment der Abtastung verfälscht, was ebenfalls
durch ein Tiefpassfilter gelöst werden kann. Das Ziel muss also
sein:
a)
Frequenzen oberhalb der Übertragungsgrenze bei der Aufnahme
möglichst herauszuhalten
b) die analog aufgenommene hochfrequenten Anteile vor der
Abtastung zu dämpfen
c) die noch enthaltenen Anteile korrekt zu wandeln
d) diese Anteile bei der Bearbeitung möglichst korrekt
beizubehalten
e) diese Anteile bei der Wandlung im Rekonstruktionsfilter korrekt
zurückwandeln
Die
Anforderung a) wird z.T. bereits in Mikrofonen und den
Vorverstärkern gelöst, die das Signal analog auf den hörbaren
Bereich begrenzen. Solange die Eckfrequenzen dieser Filter weit
genug vom Übetragungsbereich entfernt sind, liegt keinerlei
Deformation in der Klangkurve vor.
Der
Aspekt b) wird durch das Tiefpassfilter vor dem AD-Wnadler
gelöst. Dieses sogenannte Anit-Alisaingfilter verhindert, daß
der hochfrequente Anteil im Signale leichte Zufallswerte bei der
Wandlung erzeugt. Der aktuelle Analogwert ist ja immer eine Summe
aller Frequenzen und damit durch die unerwünschten Oberwellen
verfälscht. Unterstützt wird dieser Prozess durch das sogenannte
Oversampling (Überabtastung): Jeder Wert wird mehrfach
abgestastet und zu einem Mittelwert verrechnet. Alles, was sich
während des Abtastintervalls (also zu schnell) ändert, wird so
gedämpft.
Beim
Punkt c) wird nun der Anteil an Hochfrequenz betrachtet, der nicht
durch die vorherigen Dämpfungen verschwunden ist. Dieser wird bei
der Abtastung nun falsch erfasst und zwarnach Massgabe der
Interferenz des analogen Signalanteils (jeweilge Oberwelle) mit
der Abtastfrequenz, wo nun die 96kHz erstmalig ins Spiel kommen.
Wie unter d) erwähnt, ist es auch wichtig, dass nicht etwa durch
eine falsche Bearbeitung, z.B. durch Resampling, Filtereffekte
o.ä. der hochfrequente Signalanteil nichtlinear deformiert wird,
wodurch niederfrequentere und damit wieder hörbare Signalanteil
entstehen könnten. Der Beibehalt der zeiltichen Auslösung des
Signales (unveränderte Samplingfrequenz) bei der Bearbeitung ist
daher wichtig.
Beim
Schritt e) wird durch ein adäquates Tiefpassfilter (dem bereits
erwähnten Rekonstruktionsfilter) aus dem digitale Datenstrom
wieder ein Analogsignal erzeugt. Die hochfrequenten Anteile
oberhalb der Grenzfrequenz werden dabei weiter abgesenkt und
führen sofern noch vorhanden auch im späteren Audiosignal nur zu
analogen Signalanteilen oberhalb des Hörbaren, was unkritisch
ist. ->
Wozu
nun 96kHz?
Bei
Tiefpassfiltern hat man immer die Wahl zwischen flachen Filtern,
die recht linear verlaufen und hohe Frequenzen mit z.B. Faktor 2
je Oktave dämpfen, sowie Filtern, die mit einem Mehrfachen
dämpfen, dafür aber im Bereich der Grenzfrequenz stark verzerren
(also die Lautstärke nicht korrekt erfassen). Es ist also immer
ein Kompromiss gefragt.
Betrachten
wir nun das Antialiasing-Filter: Im Falle eines 44kHz-Systemes
muss die Grenzfrequenz im Bereich 15-16 kHz liegen, und zudem der
Filter recht steil sein. Damit liegen Verzerrungen im Bereich
höherer Frequenzen vor. Ein 96kHz-System kann es sich dagegen
"erlauben", mit einer Grenzfrequenz deutlich ausser dem
Hörbereich zu arbeiten (z.B. 25kHz -> daher keine Verzerrungen
im Hörbereich) und auch ein flacheres Filter zu nutzen. Zwar sind
dann effektiv deutlich mehr Oberwellen im Bereich 25kHz-40kHz im
Mix enthalten, doch werden diese ja am Ausgang korrekt(er)
gewandelt (s.u.) und stören insgesamt weniger.
Eine
ähnliche Betrachtung gilt für das bereits angesprochene
Ausgangsfilter: In einem 44kHz-System muss dieses Filter recht
steil sein, um die gewünschte Filterträgheit zu erzeugen, was
man sich jedoch durch neue Verzerrungen erkauft. Im 96kHz-System
dagegen hat man es wieder einfacher : Es können Frequenzen bishin
zu 48kHz korrekt dargestellt werden. Daher legt man die
Eckfrequenz weit ausserhalb des Hörbereiches und nutzt diesmal
ein sehr steiles Filter z.B. bei 30-40kHz : Es schneidet
wesentlich besser ab und erfüllt also seine theoretische Aufgabe
viel besser : Es entstehen im Analogsignal weniger falsche
Frequenzanteile, welche auch noch eine Oktave Abstand zum
hörbaren Bereich haben und daher statistisch überwiegend im
Unhörbaren liegen. Der theoretische Nachteil des steilen Filters
wirkts sich aber nicht aus, da die Verzerrungen auch im
unhörbaren Bereich liegen!
Und
was ist die Wirkung:
Die
Tatsache, daß sich
trotz einer praktischen Verdopplung der Datenmenge kein
Quantensprung im Klangerlebnis
ergibt, laesst sich damit begründen, daß der Anteil von Höhen
im Bereich über 10kHz generell recht gering ist und daher nicht
so sehr ins Gewicht fällt. Generell laesst sich jedoch
bilanzieren, daß die Verwendung eines 96kHz-Systemes einige faule
Kompromisse des 44kHz-Systemes beseitigt, welche im Bereich der
korrekten Repräsentation des Oberwellengehaltes in Audiodaten
liegen. Musikalisch gesprochen, werden die Höhen korrekter
dargestellt, was sich z.B. beim gesprochenen "s" und
"t" sowie in mehr Brillianz bei klassischen
Musikinstrumenten aeussert.
Die Exaktheit der Oberwellenrepräsentation eines
Übertragungssystemes hängt direkt mit dem sog.
Transientenverhalten zusammen: Schnelle Impulsänderungen können
von einem feiner abgetasteten System auch exakter übertragen
werden. Dies äussert sich vor allem bei bestimmten Aspekten der
Stereofonie: Die Zeitverschiebung eines Tones an den beiden Ohren,
die mit der Phasenlage (dem zeitlichen Versatz der Wellen durch
mehr Weg) und dem Zeitpunkt der ersten Eintreffen eines Impulses
zusammenhängt, bestimmt die Art und Weise, ob, und wie genau wir
eine Schallquelle lokalisieren können. Eine direkte technische
Betrachtung liefert, daß Ereignisse bei 44kHz mit etwa 20us
aufgelöst werden können, während 96kHz rund 10us Auflösung
bieten. Das menschliche Ohr indes kann (frequenzabhängig)
Phasendifferenzen von unter 6us unterscheiden.
Zwar kann theoretisch betrachtet
auch in einem System niedrigerer Frequenz, die Wellenphase bedingt
durch das Rekonstruktionsfilter am Ausgang der AD-Wandlung,
prinzipiell korrekt wiederhergestellt werden. Jedoch scheitert
dies in der Praxis an den nicht idealen Filtern.
Eine Abtastfrequenz von 96kHz und dafür ausgelegten Filtern kommt
dem Ideal näher und repräsentiert besonders die für das
Stereoempfinden verantwortlichen hohen Frequenzen dem Prinzip nach
deutlich besser. Besonders Schlaginstrumente und andere steilflankige
Schallereignisse, sowie die Exaktheit und Deutlichkeit von Zisch-
und Explosivlauten werden in 96kHz-Systemen oft exakter
wiedergegeben.
Ob und
inwieweit diese
Klangverbesserung beim Hörer aber auch ankommt, hängt sehr von
der Güte des verwendeten Wiedergabesystemes ab. Leider können
die theoretisch zweifelsfrei bestehenden Vorteile jedoch von den
handelsüblichen Lautsprechern der heimischen Stereoanlagen in
keinster Weise übertragen werden. Selbst hochwertige
Monitorlautsprecher in Tonstudios bilden das im Signal enthaltene
original Impulsverhalten nur sehr unvollständig ab.
So
ist es verständlich, daß in Hörversuchen selbst von Experten
oft keine oder kaum Unterschiede zwischen 44/48kHz und
96kHz-Systemen erkannt werden können.
Oft
sind erkannte Unterschiede sogar die Folge von Artefakten wie z.B.
die abweichende Qualität der Wandlersysteme und
Mikrofonverstärker, oder die Verwendung von Querkombinationen wie
z.B. das Abpielen eines 96kHz-Datenstromes durch ein 44kHz-Filter
und umgekehrt.
J.S.
Stand August 2001 |