Возможности современных средств шумоочистки (реставрации) речевых фонограмм и звукоряда видеофонограмм (на примере Adobe Audition 3.0)

Устная речь была, есть и будет важнейшим средством коммуникации во всех областях человеческой деятельности, поэтому широкое распространение получили средства ее документирования, или звукозаписи. Но достаточно часто препятствием для эффективного использования фонограмм и видеофонограмм речи является низкое качество записи звука, связанное с негативным воздействием шумов и искажений на разборчивость речи и узнаваемость дикторов. Это объясняется тем, что подобные видео- и фонограммы записываются вне стен музыкальных студий, зачастую, без возможности оперативного реагирования на изменение условий записи, с использованием миниатюрных, в т.ч. скрыто расположенных микрофонов, в условиях воздействия посторонних шумов и помех. Естественно, объекты наблюдения, как правило, не проявляют заинтересованности в том, чтобы их услышали другие. В связи с этим подобные фонограммы часто охарактеризуются следующим образом:

  • недостаточный динамический диапазон и большой перепад уровней речевых сигналов дикторов находящихся на различном расстоянии от микрофона;
  • изменение положения источников речевого сигнала относительно микрофона сопровождаемое изменением уровня полезного сигнала;
  • высокий уровень и разнообразная природа маскирующих полезный сигнал шумов и помех:

ü шумы бытовой или офисной техники, систем вентиляции и кондиционирования, транспорта;

ü шумы от действий других людей - речь, шаги, стуки дверей и пр.;

ü шумы и помехи, источником которых является ТВ- и радиоприемники;

ü шумы от механического воздействия на корпус микрофона – удары, соприкосновение с другими предметами, трение об одежду и т.п.;

ü наводки от мощных источников электромагнитного излучения: бытовой и офисной техники; телефонов подвижной связи и т.п.

ü искажения сигнала и потери его компонента в спектральной и временной областях:

ü Акустические (реверберация и эхо);

ü Электрические (ограничение по амплитуде - клиппирование) из-за недостаточного динамического диапазона устройств канала записи;

ü потери относительно слабых в частотной и временной области компонент полезного сигнала, вызванные использованием различных алгоритмов кодирования (сжатия).

Главной задачей шумоочистки подобных фонограмм является повышение разборчивости записанных речевых сигналов на уровне реплик, слов, а в ряде случаев (при проведении идентификационной экспертизы) – и отдельных звуков, без снижения узнаваемости диктора и искажения идентификационно значимых признаков голоса и речи. Специалист может решить подобную задачу, используя программные (далее - ПСШ) или аппаратные[2] средства шумоочистки, обладающие следующими функциональными возможностями:

  • удаление или снижение уровня широкополосных шумов и помех;
  • удаление или снижение уровня тональных, гармонических и полигармонических помех, в т.ч. с автоматической адаптацией на изменение параметров помехи;
  • удаление или снижение уровня импульсных и прерывающихся шумов;
  • компенсация искажений, вызванных реверберацией и ограничением сигнала по амплитуде;
  • обработка сигнала с возможностью контроля сохранности формантно-временной структуры речевых сигналов.

В настоящее время специалистами в области шумоочистки используется целый ряд ПСШ, в той или иной степени, удовлетворяющие вышеназванные требования, и которые можно классифицировать следующим образом:

  1. Узкоспециализированные ПСШ, предназначенные исключительно для шумоочистки звуковых сигналов. Например, Sound Cleaner или CEDAR;
  2. Специализированное ПО, предназначенное для решения задач судебной экспертизы звукозаписей, со встроенными функциями шумоочистки. Например, SIS, Сапфир, OTExpert;.
  3. Видео и звуковые редакторы для мастеринга видео- и фонограмм со встроенными функциями шумоочистки и подключаемыми модулями шумоочистки других производителей. Например, Adobe Audition или Sound Forge;
  4. Программные модули шумоочистки, подключаемых к другому ПО. Например, плагины шумоочистки SONY или Waves.

Наибольшее удобство и оперативность шумоочистки обеспечивают узкоспециализированные ПСШ. Судебному эксперту, удобнее работать со средствами шумоочистки, встроенными в ПО для судебной экспертизы. Но наибольшее распространение, благодаря сравнительно невысокой стоимости и универсальности (наличию других важных для работы с аудио- и видеосигналами функций), получили видео- и звуковые редакторы со встроенными или подключаемыми функциями шумоочистки. Поэтому поделюсь личным опытом и впечатлениями от работы с ПО Adobe Audition, знакомого подавляющему большинству специалистов и судебных экспертов в мире.

При анализе «шумоочистительных» возможностей Adobe Audition особое внимание уделялось следующим важным для эффективного использования характеристикам:

  • Способность удалять шумы различных типов и различной интенсивности.
  • Возможность настройки «на слух» без остановки воспроизведения.
  • Отсутствие значимых искажений полезного сигнала при шумоочистке.
  • Количество (меньше - лучше) настраиваемых вручную параметров для достижения результата.
  • Возможность одновременного (в цепочке) использования нескольких фильтров или алгоритмов шумоочистки.
  • Способность автоматически адаптироваться к существенным изменениям параметров шума.
  • Расширяемость – возможность наращивания возможностей за счет подключения дополнительных фильтров в т.ч. других производителей.
  • Общие впечатления от работы.

ПО Adobe Audition (далее, АА) обладает как встроенными средствами шумоочистки, представленными в разделах Amplitude and Compression, Restoration и Filter and EQ[3] меню Effects (рис. 1), так и способностью работы с модулями шумоочистки других производителей, представленных там же в виде DirectX и VST-плагинов (рис. 2). При этом пользователь АА имеет возможность объединять несколько встроенных или подключаемых модулей шумоочистки в цепочку (рис. 3).

Рассмотрение функций АА, которые могут использоваться в т.ч. для шумоочистки, логично начать с модуля Dinаmics Processing (рис. 6) из раздела Amplitude and Compression меню Effects. Модуль обладает самыми широкими возможностями работы с амплитудой сигнала и может быть использован в качестве компрессора, лимитера или экспандера. В роли компрессора или лимитера он уменьшает динамический диапазон сигнала и позволяет повысить уровень и, таким образом, демаскировать относительно слабые (тихие) сигналы. При использовании в качестве экспандера модуль позволяет полностью устранить шумы, находящиеся ниже заданного порога. При этом пользователь может устанавливать время атаки, восстановления, значение (в dB) порога срабатывания, и степени сжатия/расширения динамического диапазона. Пользователю также доступна настройка процесса обработки в графическом режиме, посредством коррекции графика (по сути отображающего передаточную функцию), на котором по вертикальной оси отложен уровень входного сигнала, а по горизонтальной - уровень выходного сигнала.

При использовании в АА данного модуля и всех других, о которых говориться ниже, пользователю доступно предварительное прослушивание сигнала с использованием шумоочистки и без, а также сохранение всех настроек в виде пресетов.

 

 

Несмотря на то, что большинство функций из раздела Filter and EQ меню Effects предназначены для создания звуковых эффектов и обеспечения «красивости» звучания при мастеринге фонограмм, они могут использоваться для фильтрации мощных гармонических и полигармонических помех, а также коррекции искажений, вносимых нелинейной АЧХ устройств канала записи. Настройка фильтров может производиться в графическом режиме – коррекцией частотной огибающей фильтра, как в FFT Filter (рис. 7), в режиме традиционного эквалайзера с разрешением до 30 полос, как в модуле Graphic Equalizer, а также посредством задания значений частоты фильтруемых гармоник в Notch Filter (рис. 8). Существенным недостатком фильтров, представленных в разделе Filter and EQ является, во-первых, отсутствие в окне фильтра (где оно есть) изображения усредненного спектра обрабатываемого сигнала. Что делает очень сложным или в ряде случаев невозможным создание адекватного помехе фильтра, во-вторых, отсутствие

 
 

самонастраивающихся фильтров, которые бы сами адаптировались к изменению частотных характеристик помехи.

 

Собственно модули шумоочистки АА представлены в разделе Restoration меню Effects. Начнем с модулей, предназначенных для подавления широкополосных шумов. Наилучшее качество обработки (максимальная степень подавления шума при минимальных искажениях полезного сигнала) обеспечивает модуль Noise Reduction (рис. 9). Такой эффект достигается за счет возможности самообучения модуля по образцу шума, называемому в модуле профилем шума. Для его создания необходимо выделить на фонограмме фрагмент с шумом, не содержащим полезный сигнал. Для обеспечения максимального качества обработки длина образца должна быть не менее 4 000 отсчетов[4]. После создания профиля шума его донастраивают вручную в отношении участков фонограммы, уже содержащих полезный сигнал: устанавливают прочие числовые параметры обработки, ориентируясь в т.ч. на слух. Важно отметить следующее – пользователю предоставляется возможность задавать степень подавления шума в отношении всего частотного диапазона фонограммы и для отдельных частотных полос в режиме он-лайн, без остановки прослушивания и с визуальным контролем. Но при создании и использовании профиля шума проявляется существенный недостаток 3-ей версии AA: невозможно изменить границы обрабатываемого фрагмента при открытом окне Noise Reduction. Поэтому после создания профиля шума необходимо закрыть окно Noise Reduction, затем выделить подлежащий обработке фрагмент и повторно запустить Noise Reduction, и т.д. Кроме того, в связи с тем, что в АА отсутствуют действительно самонастраивающиеся на изменения параметров широкополосного шума фильтры, пользователю приходится создавать и настраивать профили шума при каждом существенном изменении шума на фонограмме.

 

Другим интересным модулем шумоочистки, представленным в разделе Restoration меню Effects, является Click/Pop Eliminator, предназначенный для удаления как одиночных щелчков, так и треска. На практике он демонстрирует высокую эффективность в отношении одиночных контрастных импульсов или их групп, имеющих главным образом электрическое происхождение, или в отношении артефактов - остаточных явлений, образующихся после удаления (фильтрации) прерывающихся тональных сигналов. От других подобных модулей он отличается возможностью автоматической настройки на удаление помехи. Важно понимать, что на практике все существующие программные средства подавления импульсных помех не оправдывают ожиданий пользователя, т.к. не способны сколь-нибудь эффективно бороться с импульсными помехами акустического происхождения, типа стуков двери или шагов. Поэтому пользователю стоит обратить внимание на средства ручной и автоматической корректировки амплитуды сигнала, независимые от его природы. А эти средства АА, как будет отмечено ниже достаточно удобны.

Еще одним модулем шумоочистки AA из раздела Restoration, на котором стоит ненадолго остановиться, является Clip Restoration. Модуль предназначен для восстановления формы сигнала, подвергшегося «обрезанию», или клиппированию, в результате ограничения амплитуды по уровню во время звукозаписи[5]. Ожидать чудес от данного модуля не стоит, т.к. результаты его работы практически не сказываются (при значительном клиппировании) на разборчивости записанной речи, но могут улучшить комфортность прослушивания и повысить эффективность последующей шумоочистки с использованием других модулей.

АА имеет одни из самых удобных средств работы с визуализированным сигналом:

· Усиление/ослабление выделенного фрагмента сигнала на осциллограмме с визуальным контролем результата (рис. 4).

· Усиление/ослабление выделенных спектральных компонент сигнала непосредственного на изображении динамической спектрограммы (рис. 5).

Рис.5 Динамическая спектрограмма сигнала.

Функции «ручной» шумоочистки оказываются чрезвычайно полезными и даже незаменимыми при удалении особо сложных тональных и импульсных помех: речеподобных, звучащих одновременно с полезным сигналом; нестационарных и прерывающихся тональных; импульсных с большим временем затухания. С другой стороны, «ручная» шумоочистка малопроизводительна и временные затраты на обработку звукового сигнала могут в разы или даже десятки раз превышать длительность его звучания.

Как уже упоминалось ранее, АА способен работать с программными модулями (плагинами) шумоочистки других производителей. В связи с этим заслуживают внимания плагины компании Waves. И не столько из-за их выдающейся эффективности, сколько по причине удобства работы. Всего компания Waves предлагает 7 плагинов шумоочистки, из которых наиболее известны плагины из пакета Restoration. В качестве примера на рис. 10 (а и б) представлен интерфейс плагинов X-Noise и X-Click, который отличается простотой, наглядностью и унифицированным интерфейсом. Пользователь, по сути, должен настроить только два параметра, элементы управления которыми спутать с другими, менее значимыми, невозможно, по причине их большого размера, и проконтролировать результаты обработки на слух и по графику. При этом можно прослушивать как обработанный сигнал, так и вычитаемый из него шум. Естественно, в X-Noise, как и в ранее рассмотренном Noise Reduction, имеется возможность обработки по образцу шума.

 

В заключение анализа возможностей АА и следует отметить, что в шумоочистке фонограмм речи Аdobe Audition (при умелом использовании) позволяет достигнуть результатов, практически не уступающих результатам работы специализированного ПО.

Начинающих пользователей ПСШ хочу предостеречь от чрезмерно высоких надежд на всесилие техники. Для эффективного использования имеющихся в АА средств шумоочистки, необходимы теоретические знания в области ЦОС и психоакустики, и опыт работы, которые невозможно приобрести, лишь читая руководства пользователя или самоучители. Более того, невозможно достигнуть значимых успехов в этой области, полагаясь исключительно на самообучение, и занимаясь шумоочисткой время от времени.

[1] В данной области знаний диктором называю говорящего человека.
[2] Аппаратные средства шумоочистки в данной статье не рассматриваются в виду их ограниченных (по сравнению с ПСШ) функциональных возможностей (за исключением способности работать непосредственно в канале записи в реальном масштабе времени).
[3] EQ – сокращение от Еqualizer (эквалайзер)
[4] В соответствии с информацией представленной в разделе Help.
[5] Основной причиной клиппирования является недостаточный динамический диапазон устройств канала записи.

Список использованной литературы