II. Современные проблемы уровней

В музыке и в индустрии радиовещания в настоящее время преобладает хаос. На рисунке приведена сигналограмма, полученная на компьютере цифровой звукозаписи, которая представляет три различных стиля записи музыки. Общая длительность сигналограммы приблизительно 10 минут, вертикальная шкала линейна, ±1 при полном уровне цифрового сигнала, 0,5 амплитуды соответствует –6 дБ полной шкалы. Плотность сигналограммы дает грубое представление о динамическом диапазоне музыки и пик-факторе. Левый фрагмент – сильно компрессированная псевдо-популярная музыка, которую я обработал для демонстрации на 107-ом съезде AES. В середине – четырехминутный популярный CD-сингл, произведенный в 1999 г. с миллионной продажей. Справа – четырехминутная запись популярного рок-н-ролла, сделанная в 1990 г. – весьма динамичное звучание для рок-н-ролла того периода. Разница в восприятии громкости между компакт-дисками 1990 г. и 1999 г. более 6 дБ, хотя пики обеих записей имеют полную шкалу. Прослушивая компакт-диск 1999 года, один инженер мастеринга заметил, что "Этот компакт-диск, как лампочка! Запускается музыка, все светодиоды измерителя загораются и остаются так все время". Про искажения сказать нечего. Неужели мы действительно заняты в бизнесе по созданию прямоугольных колебаний?

Безумное увеличение уровней в самых популярных компакт-дисках
КРАСНЫЙ – средний уровень; БЕЛЫЙ – зона пиков. Высота красного столбца отражает восприятие громкости и потенциальную потерю качества и ясности.

Средний уровень компакт-дисков с популярной музыкой продолжает расти. Компакт-диски с этой проблемой становятся все более распространенными, сосуществуя с дисками, которые имеют прекрасный динамический диапазон и звучание, но чьи громкость и уровень искажений намного ниже. Есть много технических, социологических и экономических причин этого хаоса, но они не являются темой этой статьи. Давайте сконцентрируемся на том, что мы, как техническое сообщество, можем сделать, чтобы уменьшить этот хаос, который также является препятствием созданию качественного программного материала в XXI веке. Насколько хорошей является система цифровой звукозаписи 24 бит 96 кГц, если программы, которые мы создаем, имеют динамический диапазон только в 1 бит (6 дБ)?

Что будет записываться на носители следующего поколения (DVD-Audio, SACD)? Похоже, их ждет та же проблема, если мы не предпримем шаги, чтобы остановить рост среднего уровня. В отличие от виниловых пластинок, в цифровой среде нет никакого ФИЗИЧЕСКОГО предела росту среднего уровня. Заметьте, что существует порог уменьшения отдачи, он несколько выше, чем –14 dBFS. Начинает проявляться динамическая инверсия, и программный материал перестает восприниматься, как более громкий, потому что он теряет ясность и прозрачность.

III. Волшебное число "83" в аудиотреках фильмов

В настоящее время в мире музыки каждый сам определяет свой средний уровень записи, и соответственно регулирует свой монитор. В отсутствие стандарта субъективная громкость в популярной музыке изменяется от компакт-диска к компакт-диску на целых 10-12 дБ, что является недопустимым по любому профессиональному стандарту. Но в мире кинопроизводства аудиотреки не отличаются один от другого, потому что усиление громкоговорителей было стандартизировано. В 1983 году, как председатель симпозиума AES, я пригласил Tomlinson Holman из Lucasfilm продемонстрировать звуковую технику, используемую в создании фильмов «Звездные Войны». Инженеры Dolby Systems трудились в течение двух дней, чтобы откалибровать систему звуковоспроизведения в ведущем театре Нью-Йорка Ziegfeld. Более чем 1000 посетителей соглашения заполнили театральную секцию центра. В конце демонстрации Том предложил голосование. "Кто из Вас думает, что звук был слишком громок?" Были подняты 4 руки. "Сколько думает, что это было слишком тихо?" Нет рук. "Кто думает, что была нормальная громкость?" По крайней мере 996 звуковых инженеров подняли руки.

83 дБ SPL ( Sound Pressure Level = по уровню звукового давления) – это стандарт, предложенный в середине 70-ых Иоаном Алленом из Dolby Systems, приведенный к уровню 0 VU при использовании аналоговой магнитной ленты. Выбор 83 дБ SPL выдержал испытание временем, поскольку он разрешает записи с широким динамическим диапазоном с малым или нулевым воспринимаемым шумом системы при записи на магнитную ленту или 20-битной оцифровке. Диалог, музыка и звуковые эффекты имеют в естественную перспективу с превосходным соотношением сигнал/шум и запасом по перегрузке (headroom). Хороший звукоинженер может работать на озвучке фильма без измерителя и делать все сведéние по мониторам, используя измеритель просто как ориентир. Фактически работа с фиксированным усилением монитора освобождает, а не ограничивает. Когда цифровая технология достигла большого театра, SMPTE предложил калибровку SPL в точке ниже полной цифровой шкалы. Когда мы перешли к цифровой технологии, VU-метр был быстро заменен пиковым измерителем программного сигнала (PPM = Peak Program Meter).

Когда системы AC-3 и DTS стали доступными для домашнего театра, компетентные специалисты рекомендовали снизить усиление монитора на 6 дБ, потому что типичная домашняя комната прослушивания не соответствовала высокому уровню звукового давления и широкому динамическому диапазону. Если DVD содержит микс с широким театральным диапазоном, многие домашние слушатели жалуются, что "этот DVD слишком громок", или "я теряю диалог, когда я делаю громкость меньше, чтобы звуковые эффекты не звучали слишком громко". С уменьшенным усилением монитора, тихие фрагменты становятся слишком тихими. Для таких слушателей динамический диапазон можно уменьшить на 6 дБ (компрессия вверх на 6 дБ), чтобы использовать меньшее усиление монитора.

Метаданные – это закодированные данные, которые содержат информацию о динамике сигнала и предназначенной громкости; это разрешит конфликт между слушателями, которые хотят полный театральный диапазон и теми, кому нужно слушать тихо. Но без метаданных есть только два решения: компрессировать саундтрек кинофильма или, что лучше, использовать дополнительный компрессор в домашней системе. В последнем случае оригинальное звучание трека сохраняется.