Auditive Wahrnehmung und kritische Bandbreiten: |
7. Anwendungen
|
|
|
Perzeptive digitale Audiocodierung | |||
Ausreichende Komprimierungsraten lassen sich bei Audiodaten nur durch verlustbehaftete Verfahren erreichen, bei denen Teile der ursprünglichen Informationen verloren gehen. Sogenannte perzeptive Codierungsverfahren machen sich dabei die Filtereigenschaften des menschlichen Gehörs zunutze. Die mit diesen Systemen erzeugten Signale erhalten objektiv beträchtliche Störungen und Verzerrungen, die jedoch vom gewünschten Signal verdeckt werden. Sie werden aufgrund der Mechanismen der Schallverarbeitung durch das Gehör nicht wahrgenommen und beeinträchtigen dadurch die subjektive Qualität nicht. Speicherbedarf für digitale Audiodaten Bei der Digitalisierung von Audiodaten in CD-Qualität werden eine Samplingrate von 44,1 kHz und eine Auflösung von 16 Bit für die Dynamik verwendet. Das bedeutet, dass 44.100 Mal in der Sekunde die Amplitude des Schallsignals ermittelt wird und als eine 216 Stufen abgespeichert wird. Mit der Samplingrate von 44,1 kHz kann der gesamte hörbare Frequenzbereich abgedeckt werden. Aus Samplingrate und Dynamikauflösung kann die entstehende Datenmenge errechnet werden. Ein Musikstück von 3 Minuten Länge (in Stereo) braucht mindestens 3*60 (Länge in Sek.) *44.100 (Samplingrate) * 2 (bei Stereo) * 16 Bit (für die Dynamik) - das sind rund 250 Mio. Bit bzw. gut 30 MB Speicherplatz. Ein MP3-codiertes Stück dieser Länge kommt bei annähernder CD-Qualität meist mit 3-4 MB aus. Wie funktioniert die MP3-Codierung? Für die MP3 - Codierung dagegen wird das Signal zunächst in mehrere aneinandergrenzende Frequenzbänder (Sub-Bands) aufgeteilt und anschließend digitalisiert. Der entscheidende Vorteil der Filterung liegt darin, dass es nicht notwendig ist, jedes Frequenzband mit 16 Bit zu codieren. Liegt die Bandbreite der verwendeten Filter in der Größenordnung der auditiven Filter, ist nur eine Auflösung von 5-6 Bit für die einzelnen Bänder notwendig. Das wird dadurch ermöglicht, dass die einzelnen Frequenzbänder zusätzlich in kurze Zeitabschnitte (Blöcke von 1.5 - 12 ms) unterteilt und ihre Pegel separat codiert werden, wofür für wenige Daten nötig sind. Eine weitere Reduzierung der Datenmenge kann erreicht werden, indem für jeden Zeitabschnitt (Block) eines Frequenzbandes berechnet wird, wie weit das darin enthaltene Signal über der Maskierungsschwelle liegt, die von den angrenzenden Bändern verursacht wird. Die dem Frequenzband zugewiesene Auflösung ist umso höher, je weiter das Signal die Maskierungsschwellen überschreitet. Liegt das Band unter der berechneten Maskierungsschwelle, werden ihm keine Bits zugewiesen. Die Zuweisung der Bits ändert sich dynamisch von Block zu Block, so dass die erreichbare Reduzierung der Datenmenge auch von den Eigenschaften des Signals abhängt. Mit perzeptiven Codierungsverfahren ist meist eine Reduzierung um den Faktor 5-10 im Vergleich zu CD-Audio möglich, ohne dass für die große Mehrheit der Hörer Qualitätsverluste zu erkennen sind. |
|||
|
|||