Die Festlegung auf eine Samplerate von 8000 Hz und somit eine Audio-Bandbreite von 4000 Hz ist keine Entscheidung, die wir während der Entwicklung der Talkmaster-Software getroffen haben, sondern sie folgt der Vorgabe des internationalen Standardisierungsgremiums ITU-T (früher CCITT). Weil mit vorhandener Zweidrahttechnik die Bandbreite von 64 kbps pro Nutzdatenkanal flächendeckend selbst in entlegenen Ansiedlungen realisiert werden kann, hat das Gremium innerhalb des ISDN zur Digitalisierung von Sprache zwei Codierungen erlaubt, die beide eine logarithmisch angewendete Sampletiefe von 8 bit und eine Samplerate von 8000 Hz benutzen: Mu-Law und A-Law. In den USA wird Mulaw verwendet (auch Mu-Law oder mit dem griechischen Buchstaben u-Law - genannt, gesprochen "Mü", dann englisch "Law"), in allen anderen Ländern Alaw (auch A-Law genannt, englisch ausgesprochen). Auch im VoIP werden die Codierungen verwendet.
Verglichen mit der in Hifi-Systemen verwendeten Sampletiefe von konstant 16 bit und der Samplerate von 44100 Hz mögen die Werte niedrig erscheinen. Berücksichtigt man aber den Anwendungszweck, nämlich die Sprachverständigung von Mensch zu Mensch, sind sie es nicht. Denn über Jahrzehnte hinweg haben Menschen festgestellt: Ein Frequenzumfang von 300 Hz bis 3300 Hz reicht aus, um Gespräche zu führen. Im Mobilfunknetz nehmen sie sogar stärkere Einschränkungen hin.
Ein höherer Frequenzumfang, wie er auf Basis von VoIP (Voice over IP, Telefonieren im LAN oder im Internet) gelegentlich versucht wird, scheitert häufig an der mangelnden Audioqualität der Telefon-Endgeräte. Wer z. B. einmal die unangenehm zischenden hohen Frequenzen in einem IP-Telefon gehört hat, wünscht sich herkömmliche Telefonqualität zurück. Hohe Klangqualität können nur große und aufwendig hergestellte Lautsprecher in Verbindung mit einem abgestimmten Resonanzraum gewährleisten. Telefone sollen aber klein und handlich sein. Einen Kompromiss kann das Telefonieren mittels Headset darstellen, also der Kombination aus Kopfhörer oder einem einzelnen Ohrhörer und einem Mikrofon. Wenn hier hochwertige Komponenten verwendet werden, mag ein höherer Frequenzumfang von Vorteil sein.
Ein höherer Frequenzumfang erfordert aber eine höhere Übertragungsbandbreite. Die steht im Internet, zumal länderübergreifend, nicht unbegrenzt zur Verfügung. Deshalb wird die zu übertragende Datenmenge auf andere Weise verringert: durch Verwendung eines stark komprimierenden Codecs, was zu schwankend-schwebendem Klang führt, manchmal auch durch vollständige Unterdrückung in Gesprächspausen. Letzteres ruft ständige Unsicherheit der Gesprächspartner hervor, ob die Verbindung noch besteht. Wird gar ein solches Gespräch in das herkömmliche Telefonnetz überführt, etwa weil der externe Teilnehmer nicht über VoIP erreichbar ist, kombiniert man die Nachteile beider Systeme.
Der Verzicht auf Komprimierung ist oft keine Lösung, weil er aufgrund von Latenzzeiten (Verzögerung einzelner Datenpakete) zu einer verzögerten Wiedergabe oder aufgrund des Vorrangs anderer Datenpakete zu gestörter Wiedergabe führen kann.
|