Digital Audio/de

Digitales Audio This is a work-in progress translation to German of Digital Audio.

Digitales Abtasten
Alle Töne die wir mit unseren Ohren hören sind Schallwellen in der Luft. Mit der Demonstration des ersten Phonographen von Thomas Edison anfangs 1877 war es möglich, die Schallwellen auf ein physisches Medium einzufangen und diese dann später mit den selben Schallwellen regenerierend wieder hervorzubringen. Schallwellen sehen in etwa so aus:



Analoge Datenträger, wie z.B. Schallplatten und Tonbänder, spiegeln die Form der Schallwellen wider, entweder mit der Tiefe der Rillen (im Fall einer Schallplatte), oder mit der Stärke der Magnetisierung (im Fall von Tonbändern). Analoge Aufnahmetechniken können eine grosse Vielzahl von Geräuschen und Tönen reproduzieren. Allerdings ist Rauschen bei dieser Aufnahmetechnik unvermeidbar. Bei jedem Kopiervorgang wird der Pegel des Rauschens deutlich erhöht. Dies beeinträchtigt die Tonwiedergabe. Das Rauschen kann reduziert, aber nicht vollständig entfernt werden.

Die digitale Aufnahmetechnik funktioniert anders: sie zerlegt die Wellenform in gleichmässigen Abschnitte und bildet jeden Abschnitt mit einer Zahl ab. Digitale Aufnahmen verlieren nicht an Qualität, egal ob sie auf einer CD, einem DAT-Band oder auf einem PC gespeichert werden. Sie können ohne Qualitätsverlust oder zusätzliches Rauschen beliebig oft kopiert werden. Das folgende Bild zeigt eine in Abschnitte zerlegte Schallwelle:



Digitale Tonaufnahmen können ohne Qualitätsverlust bearbeitet und gemischt werden. Zusätzlich kann man zahlreiche digitale Effekte anwenden, um z.B. Hall zu simulieren, bestimmte Frequenzen zu verstärken, oder die Tonhöhe zu verändern. Audacity ist ein Computerprogramm, welches die Bearbeitung, Mischung und Anwendung von Effekten auf digitalen Tonaufnahmen ermöglicht.

Die Möglichkeit mit Audacity Tonaufnahmen direkt vom Computer abzuspielen oder aufzunehmen hängt vom Computersystem (also der Hardware) ab. Die meisten Computer sind mit einer Soundkarte ausgestattet, die es ermöglicht einen 1/8" Mikrofonstecker, oder andere Quellen, von denen aufgenommen werden kann, anzuschliessen, und sie verfügen ausserdem noch über einen Lautsprecher-, bzw. Kopfhöreranschluß. Viele Laptop-Computer haben Mikrofon und Lautsprechen bereits eingebaut. Die Soundkarte, mit der die meisten Computer ausgestattet sind, ist meist nicht von besonders guter Qualität. Falls du qualitativ hochwertige Aufnahmen machen möchtest, schau unter  Aufnahmequalität nach; dort findest du weiterführende Infos dazu.  Für Informationen dazu, wie du Audacity für die Aufnahme und Wiedergabe konfigurieren kannst, schaue unter  Audacity Installation und Konfiguration.

Digitale Audio-Qualität
Die Qualität einer digitalen Audio-Aufnahme hängt stark von zwei Faktoren ab: die Abtastrate und das Abtastformat (auch Bittiefe genannt). Die Erhöhung der Abtastrate oder der Anzahl der Bits in jedem Sample erhöht die Qualität der Aufnahme, vergrössert aber gleichzeitig Datenmenge, die auf der Festplatte gespeichert werden muß.

Abtast-Raten (Sample-Raten)
Abtast-Raten werden in Hertz (Hz) oder Zyklen pro Sekunde gemessen. Dieser Wert bezeichnet die Anzahl der Samples, die pro Sekunde abgetastet und aufgenommen werden, um sie in einer Wellenform wiederzugeben. Je mehr Abtastungen pro Sekunde, umso höher ist die Auflösung und damit die Genauigkeit der Wellenform. Das menschliche Ohr ist empfänglich für Frequenzen zwischen ca. 20 Hz und 20.000 Hz. Geräusche ausserhalb dieser Frequenzen sind für uns nicht hörbar, obwohl Rupert Neve subjektiv die Existenz von psycho-akustischer Hörfähigkeit bewiesen hat, undzwar von Frequenzen, die oberhalb des mutmaßlichen 20.000 kHz Limits liegen.

Um ein Geräusch, das sich in einer bestimmten Frequenz befindet, aufzunehmen, benötigt man mindestens eine Sampling Rate, die doppelt so hoch ist, wie die Frequenz selbst (auch bekannt als Nyquist Frequenz). Das bedeutet, daß eine Sample-Rate in Höhe von 40.000 Hz das absolute Minimum darstellt, um Tonaufnahmen wiedergeben zu können, die im Bereich des menschlichen Hörens liegen. Höhere Sample-Raten (auch sampling genannt) erhöhen die Qualität, indem sie Artefakte, die um die Nyquist Frequenz herum auftreten, vermeiden helfen. Die Abtast-Rate, die bei Audio-CDs benutzt wird, beträgt 44.100 Hz. Die menschliche Sprache ist sogar dann noch verständlich, wenn alle Frequenzen oberhalb von 4.000 Hz entfernt werden. In der Tat übertragen Telefone lediglich Frequenzen zwischen 200 Hz und 4.000 Hz. Deshalb ist eine übliche Abtast-Rate für Tonaufnahmen 8.000 Hz; dies wird manchmal auch "Sprach-Qualität" genannt. Beachte, daß sehr steiles Filtern (Anti-Aliasing, oder Treppeneffekt-Filtern genannt), oberhalb der Nyquist Frequenz notwendig ist, um Audio-Signale, die oberhalb der abgeschnittenen Frequenzen liegen, daran zu hindern, sichmit Hilfe des digitalen Konverters in den hörbaren Bereich "zurückzufalten", und dann dort verzerrende Artefakte oder sogenanntes Treppenrauschen zu erzeugen.

Die meistverwandten Abtast-Raten, gemessen in Kilohertz (kHz oder 1.000 Hz) sind 8kHz, 16 kHz, 22,05 kHz, 22.25 kHz, 44.1 kHz, 48 kHz, 96 kHz und 192 kHz. Audacity unterstützt jede dieser Abtast-Raten, allerdings sind die Soundkarten der meisten Computer auf 48 kHz, oder manchmal 96 kHz berschränkt. Die mit Abstand gebräuchlichste Sample-, bzw. Abtast-Rate beträgt allerdings 44,1 kHz (44.100 Hz).

Das Bild unten zeigt in der linken Hälfte eine niedrige Abtastrate und in der rechten Hälfte eine hohe Abtast-Rate (bzw. hohe Auflösung):



Abtast Formate
Die andere Meßeinheit für die Qualität einer Tonaufnahme ist das Abtast-Format (dieses wird auch Bittiefe genannt). Die Bittiefe wird üblicherweise mit der Anzahl der "Computer-Bits" gemessen, die benötigt werden, um jedes Sample abzubilden. Je mehr Bits verwandt werden, umso genauer ist die Abbildung von jedem Sample. Erhöht man also die Anzahl der Bits, dann steigert man damit auch den Lautstärke-Umfang einer Tonaufnahme; also in anderen Worten die Differenz zwischen dem lautesten und dem leisesten Geräusch oder Ton, welches abgebildet werden kann.

Der Lautstärkeumfang wird in Dezibel gemessen (dB). Das menschliche Ohr kann Töne und Geräusche mit einem Lautstärkeumfang von minestens 90dB wahrnehmen. Nichtsdestotrotz ist es besser, wann immer es möglich ist, Die Tonaufnahmen mit einem weitaus höheren Lautstärke-Umfang zu machen, u.a. auch deshalb, damit man Tonaufnahmen, die zu leise sind, ohne Qualitätsverlust verstärken kann. Beachte, daß Geräusche und Töne, die mit durchgehend sehr niedrigem Pegel aufgenommen worden sind, angehoben werden können (dies nennt man auch "normalised"), um den Lautstärkeumfang zu erhöhen. Die mit niedrigem Pegel aufgenommenen Töne und Geräusche werden allerdings nicht die vorhandene Bittiefe ausnutzen. Daraus ergibt sich ein Qualitätsverlust, der durch Anhebung des Gesamtpegels der digitalen Wellenform nicht kompensiert werden kann.

Übliche Abtast-Formate und ihr entsprechender Lautstärke-Umfang sind:

(sehr sehr viele Nachkommstellen, dadurch ergibt sich eine grosse Genauigkeit, allerdings wird auch viel Platz auf der Festplatte beansprucht. Dieses Abtast-Format wird auch "floating point" genannt.)
 * 8-bit integer: 45 dB
 * 16-bit integer: 90 dB
 * 24-bit integer: 135 dB
 * 32-bit Fliesskomma: fast unendlich dB

Andere Abtast-Formate, wie z.B. ADPCM entsprechen ungefähr einer 16-bit Tonaufnahme mit komprimierten 4-bit Samples. Audacity kann viele dieser Formate importieren, aber sie werden sehr selten verwandt, da es mittlerweile neue, wesentlich bessere Komprimierungsmethoden gibt.

Audio CDs, sowie die meisten Computer Audio-Dateien benutzen das 16-bit integer-Format. Audacity nutzt intern standardmässig 32-bit floating-point Samples während du im Projekt arbeitest und exportiert deine Endmischung mit dem 16-bit integer-Format. Dies ermöglich eine bessere Qualität als andere Audio-Programme, die lediglich 16-bit or 24-bit Audio Samples verwenden. Audacitys Standard Sample format kann in den Qualität Präferenzen konfiguriert werden, oder aber für jede Tonspur individuell festgelegt werden. Aufklappmenü der Tonspur.

Das Bild unten zeigt eine Schallwelle, deren linke Hälfte ein Abtast-Format mit wenigen Bits ist, wohingegen die rechte Hälfte ein Abtast-Format mit mehr Bits ist. Wenn du dir die Abtast-Rate als die Avstände zwischen vertikalen Gitternetzlinien vorstellst, dann entspricht das Abtast-Format den Abständen der horizontalen Gitternetzlinien.



Größe der Audio-Dateien
Audio-Dateien sind sehr groß, viel größer als die meisten anderen Dateien mit denen Sie arbeiten (es sei denn, Sie arbeiten mit Video-Dateien). Um die Größe einer unkomprimierten Audiodatei zu bestimmen, wird die Abtastraterate (z.B. 44100 Hz) mit der Abtast-Bitrate (z.B. 16 Bit) mit die Anzahl der Kanäle (2 für Stereo) mit der Zahl der Sekunden multipliziert. Eine vollständige 74-minütige Audio-CD beansprucht über 6 Billionen Bits. Wird diese mit 8 geteilt, dann erhalten Sie die Anzahl der Bytes; eine Audio-CD ist ein wenig kleiner als 800 Megabyte (MB). Siehe auch Komprimiertes Audio.

Rechenbeispiel: 44100 Hz • 16 Bit • 2 Kanäle • 60 Sekunden = 84.672.000 Bit (: 8 = 10.584.000 Bytes). Rechenbeispiel kann ungenau sein, bitte gegenprüfen ob dieses Beispiel stimmt.

Begrenzung
Eine Einschränkung der digitalen Tonaufnahmen besteht darin, daß es Schallwellen, die den vorgegebenen Maximum-Pegel überschreiten, nicht bewältigen kann. Sobald ein Geräusch oder Ton aufgenommen wird, welches den vorgegebenen Maximum-Pegel überschreitet, werden die Abschnitte ausserhalb des Maximum-Pegels abgeschnitten, so wie hier:



Eine Tonaufnahme, die in dieser Form abgeschnitten ist, klingt verzerrt und rauh. Obwohl es Techniken gibt, die einen Teil des Rauschens entfernen können, welches durch das Beschneiden der Wellenform entstehen, so ist es doch besser, das Beschneiden beim Aufnehmen zu vermeiden. Verändere dazu die Lautstärke deiner Aufnahmequelle (Mikrofon, Kasettenrekorder, Schallplattenspieler) und stelle Audacitys Eingabe-Lautstärke-Kontrolle (in der  Mischpult-Werkzeugleiste) so ein, daß die Wellenform so groß wie möglich ist (für die beste Wiedergabequalität), ohne daß die Schallwelle beschnitten wird.

Komprimiertes Audio
Da digitale Tondateien so groß sind, wurden, wo immer es möglich war, reduzierte Abtast-Raten angewandt. 1991 hat der MP3 Standard ((MPEG I, 3 Layer) das verändert. MP3 ist eine verlustreiche Komprimierungstechnik, die dafür aber die Dateigrösse einer Audiodatei drastisch verringert, mit erstaunlich kleinem Qualitätsverlust. Eine Sekunde einer Tonaufnahme in CD-Qualität benötigt 1,4 Megabit, wohingegen die übliche Bitrate für MP3-Dateien 128 Kilobit beträgt - dies ist eine mehr als 10-fache Komprimierung! MP3 funktioniert so, daß es Details der Wellenform, die die Schallwelle darstellt, "wegwirft", undzwar diejenigen Teile, die wir nur schwach wahrnehmen, gemäß dem Psychoakustischen Modell, das erklärt wir unsere Ohren und unser Gehirn Töne und Geräusche verarbeitet. Dabei ähnelt keine MP3-Datei einer anderen; verschiedene psychoakustische Modelle führen zu Unterschieden, in der Wahrnehmung der Verzerrung einer Audiodatei.

Mit guten lautsprechen ist jeder imstande, den Unterschied zwischen einem 128k MP3 und einer unkomprimierten Audiodatei von einer CD zu hören. 192k und 256k MP3-Dateien sind deshalb unter Musikbegeisterten, die eine gute Qualität bevorzugen, beliebter.

Es gibt mehrere andere "verlustreich" komprimierende Audiodatei-Formate. Audacity unterstützt vollständig das Ogg Vorbis Format, welches dem MP3-Format sehr ähnlich ist und dabei gleichzeitig ein patentfreier, "offener" Standard ist. Mittlerweile ist die Qualität der Ogg Vorbis-Dateien besser, als die der MP3-Dateien und sie sind ausserdem mehr erweiterbar und deshalb sind mehr Verbesserungen möglich. Ogg Vorbis ist eine gute Wahl für deine Tonaufnahmen; nichtsdestotrotz unterstützen die meisten Geräte, wie z.B. iPods und andere tragbare Tonabspielgeräte Mp3 und leider noch nicht Ogg Vorbis.

Andere bekannte Komprimierungsmethoden sind ATRAC (welches von den Sony Minidisc Rekordern benutzt wird), sowie Windows Media Audio (WMA) und AAC ein.