aes_logo_shieldSeit der Veröffentlichung der EBU R128 Empfehlung bzw deren US Äquivalent ATSC A/85 vor nunmehr sechs Jahren, ist der Loudness-War wenigstens im Fernsehen zu Ende gegangen. Nachdem Fernsehsender weltweit die Empfehlungen zur Herstellung lautheitsausgesteuerter Programme in ihren Richtlinien übernommen haben, gingen Zuschauerbeschwerden über Lautstärkesprünge deutlich zurück, lässt es sich ohne zu erschrecken zwischen Sendern umzuschalten und selbst Werbeblöcke lassen sich ertragen, ohne zumindest wegen der Lautstärke sofort zur Fernbedienung greifen zu müssen. Die EBU hat ihre Empfehlung schrittweise verfeinert und ergänzt und die den Empfehlungen zugrundeliegenden Messverfahren, wurden von der ITU standardisiert.
Im Internet jedoch, ist die Lautheit von Videoprogrammen bekanntlich überhaupt nicht geregelt. Schlimmer als es im Fernsehen je war, herrscht ein wildes Durcheinander von vollausgesteuerten Inhalten, Programmen nach alten oder neuen Fernsehpegeln erstellt oder von Anbietern nach eigenen Regeln selbst normalisiert werden.
Diesem „Wilden Westen der Programmaussteuerung“ hat sich die AES vor einiger Zeit angenommen. Die Anfang des Jahres gebildete Audio Guidelines for Over the Top Television and Video Streaming Study Group (AGOTTVS), eine Untergruppe des Broadcast and Online Delivery Technical Committee der AES, hat nun eine erste, vorläufige Lautheits-Empfehlung für Videoinhalte im Internet veröffentlicht.
Die Kernpukte der Empfehlung sind:

  • Inhalte, deren Formate und Vertriebswege Metadaten zur Lautheitskontrolle unterstützen, sollten so aufbereitet sein, dass die gemessene Programmslautheit in den Metadaten des Bitstream enthalten ist. Soweit es keine abweichende Vereinbarung gibt, sollte die Lautheit dem regionalen TV-Standard von -24 LKFS bzw–23 LUFS entsprechen.
  • Inhalte die keine Metadaten zur Lautheitssteuerung erlauben oder deren Vertriebssystem solche nicht unterstützt, sollen mit –16 LUFS ausgesteuert werden, wenn die zu erwartende Wiedergabe auf Endgeräten mit begrenztem Dynamikumfang stattfindet und mit –24 LKFS bzw -23 LUFS ausgesteuert werden, wenn das zu erwartende Endgerät vollen Dynamikumfang ermöglicht.
  • Werden mehrere Versionen des selben Inhalts mit und ohne Metadaten zur Lautheitskontrolle hergestellt, so soll die Version mit Metadaten den vollen Dynamikumfang nutzen, wohingegen die Version ohne Metadaten eine begrenzte Dynamik (-16 LUFS) haben sollte, um mit möglichst vielen Endgeräten und Anwendungsfällen kompatibel zu sein.

Als Endgeräte mit begrenztem Dynamikumfang nennt die AES zB Mobiltelefone und Laptops, während Spielekonsolen, Set-Top-Boxen und AV-Receiver als Geräte mit vollem Dynamikumfang bezeichnet werden. An dieser Unterscheidung – und der damit einhergehenden Nennung zweier Lautheitspegel – sieht man selbstverständlich auch die Problematik, vor der die AES steht: die Wiedergabeszenarien von Filmen im Internet sind um ein Vielfaches größer, als bei traditionellen elektronischen Vertriebswegen. Und der Wandel des Sehverhalten, weg vom linearen Fernsehen, hin zur IP-basierten Wiedergabe auf einer Vielzahl von Endgeräten, geht so schnell voran, dass Empfehlungen und Standards nur hinterherhinken können.
Die vollständige vorläufige Empfehlung findet sich hier (pdf in englischer Sprache).