Дискретно-косинусное преобразование

Методы преобразования изображения в общем случае основаны на том, что его цифровой эквивалент (сигнал ИКМ) приводится к виду, удобному для сокращения избыточной информации. В этом отношении наиболее эффективным является преобразование видеоинформации из временной области в спектральную. Это преобразование, как правило, предваряется разбивкой изображения на частичные подобласти, фрагменты (в терминологии МРЕG — блоки), которые затем по отдельности подвергаются необходимой обработке. Результат преобразования представляет собой совокупность спектральных коэффициентов, которые характеризуют амплитуды пространственных частот изображения.

В основу преобразования изображений могут быть положены различные приемы. Наиболее часто используются методы линейных ортогональных преобразований. Линейность преобразований означает, что операции сложения, вычитания и умножения на скаляр действительны в после преобразований, а ортогональность — что преобразуемый фрагмент представляется ограниченным набором ортогональных функций. Линейные преобразования можно осуществлять как с непрерывным, так и с дискретным сигналом. В первом случае процессу преобразования соответствует интегральная форма записи, во втором — матричная.

Из различных ортогональных преобразований, позволяющих эффективно выявлять избыточную информацию, стандартом MPEG рекомендовано использовать дискретно-косинусное преобразование (ДКП), являющееся частным случаем двумерного преобразования Фурье. Как известно, преобразование Фурье — это метод обработки, который, анализируя изменения сигнала во времени, выражает их в виде частотного спектра. Любой сигнал можно разложить на частотные гармонические составляющие, и затем по известным значениям амплитуды в фазы этих составляющих их линейным суммировав нем восстановить исходный сигнал. Последнюю операцию называют обратным преобразованием Фурье. В цифровых системах сигнал выражается последовательностью дискретных отсчетов. При использовании преобразования Фурье для фрагмента цифрового сигнала из некоторого ограниченного числа отсчетов последний можно разложить на такое же число дискретных частот. Это преобразование называют дискретным преобразованием Фурье.

Поскольку любое изображение или его фрагмент можно рассматривать как функцию изменения яркости (цветности) как по оси Х, так и по оси Y, то дискретное ортогональное преобразование Фурье будет представлять собой замену массива отсчетов изображения соответствующего фрагмента на массив коэффициентов, соответствующих амплитудам частотных составляющих Фурье.

Объем расчетов для нахождения этих коэффициентов весьма значителен. Поэтому преобразования осуществляются над небольшими по размеру фрагментами, обычно 8×8 элементов. Дискретно-косинусное преобразование Фурье в определенной степени минимизирует объем этих вычислений использованием в качестве набора преобразующих (базисных) функций только косинусных составляющих. В результате массиву исходных значений сигнала соответствует массив из такого же числа коэффициентов, представляющих собой амплитуды этих косинусных составляющих.

Рисунок 1.17 — Преобразование блока изображения f₍_x_,_y₎

в блок ДКП коэффициентов F₍_m_,_n₎:

а — блок изображения; б — блок коэффициентов ДКП

Аналитически двумерное дискретно-косинусное преобразование описывается следующим образом (рисунок 1.17):

где C₍_m₎ = 1 при m ≠ 1; С₍_m₎ = при m = 0; C₍_n₎ = 1 при n ≠ 1; С₍_n₎ = при n = 0; f₍_x_,_y₎ — отсчеты изображения с пространственными координатами x,y (от 0 до N-1); N — размер блока изображения (N×N элементов); F₍_m_,_n₎ — коэффициенты, характеризующие изображение в спектральной плоскости m, N (от 0 до N-1).

ДКП является обратимым: по распределению F₍_m_,_n₎ обратным преобразованием однозначно восстанавливается f₍_x_,_y₎.

Очевидно, что поскольку число отсчетов преобразуемого сигнала равно числу отсчетов преобразованного сигнала, устранения избыточности информации в результате такого преобразования не происходит. Однако следует обратить внимание на значительное изменение содержания блока коэффициентов ДКП по отношению к блоку преобразуемого изображения (рисунок 1.18).

Рисунок 1.18 — Пример дискретно-косинусного преобразования

для некоторого произвольного сюжета:

а — блок изображения; б — блок коэффициентов ДКП

По физическому смыслу блок коэффициентов ДКП представляет собой совокупность значений амплитуд пространственных косинусоидальных гармоник с частотами m и n. При этом значение F_(0,0) пропорционально среднему уровню (постоянной составляющей) в блоке и может достигать при 256 уровнях квантования значения 2040. (Чтобы ошибки от округления коэффициентов ДКП не сказывались существенным образом на точности преобразования, их значения на этапе преобразования увеличены в восемь раз по сравнению с их действительными значениями).

Компоненты F_(0,1) и F_(1,0) характеризуют плавное изменение яркости в блоке вдоль строки и поперек строк соответственно. Разночастотные изменения яркостей пикселей с диагональными структурами характеризуются диагональными спектральными компонентами F_(1,1), F_(1,2), F_(1,3)…

Обычно для большинства блоков изображения лишь малая часть коэффициентов имеет значительную величину. Это объясняется небольшими размерами блока, внутри которого яркость меняется мало, и поэтому относительно большие величины имеют только постоянная составляющая и несколько низкочастотных компонентов, расположенных в левом верхнем углу матрицы коэффициентов ДКП.

Мелким деталям изображения, как известно, соответствуют высокие пространственные частоты, и коэффициенты ДКП характеризующие их амплитуды, располагаются правее и ниже. Поскольку, как правило, мелкие детали изображения выражены энергетически слабо относительно среднего уровня, то и соответствующие им коэффициенты ДКП по сравнению с F_(0,0) малы или вообще равны нулю.

Таким образом, если передавать вместо значений яркости изображения коэффициенты ДКП, то сокращение скорости передачи данных может быть достигнуто уже хотя бы за счет исключения нулевых коэффициентов. Однако эта задача решается уже вне процедуры ДКП.