Состав полного телевизионного сигнала.
Лекция 6.
Обобщенная функциональная схема телевизионной системы.
Параметры телевизионного изображения.
Состав полного телевизионного сигнала.
Содержание:
· 6.1. Телевизионная система;
· 6.1.1. Принцип передачи изображения;
· 6.1.2. Развёртка изображения;
· 6.1.3. Искажения изображения при развёртке;
· 6.1.4. Получение цветного телевизионного изображения;
· 6.1.5. Цветовой видеосигнал;
· 6.1.6. Переход к цифровому видеосигналу;
· 6.2. Обобщенная структурная схема телевизионного тракта передачи цифрового видеосигнала;
· 6.2.1. Цифровое представление телевизионного сигнала;
· 6.2.2. Цифро-аналоговый преобразователь;
· 6.2.3.Структура дискретизации видеосигналов;
· 6.2.4. Оценка возможности передачи цифрового потока;
· 6.2.5. Выбор параметров преобразования;
· 6.2.6. Сжатие цифрового потока;
· 6.2.7. Стандарт цифрового телевидения.
6.1. Телевизионная система
Телевидением называют комплекс радиотехнических средств, позволяющих наблюдать изображение объектов за пределами видимости в режиме реального времени. Телевизионная система – это совокупность оптических, электрических и радиотехнических устройств для передачи изображения на расстоянии.
Рис.1. Структурная схема ТВ системы
1 – объект; 2 – оптический канал; 3 – приёмник оптического сигнала;
4 – электрический канал связи; 5 – вторичный преобразователь;
6 – оптический канал; 7 – получатель.
Известно, что любой окружающий нас объект представляет собой совокупность бесчисленных источников электромагнитных излучений. Если эти излучения лежат в оптическом диапазоне длин волн, то проявляются оптические свойства объекта, и мы можем их наблюдать.
В данном случае, излучение, исходящее от объекта, пройдя оптический канал, поступает на приёмник изображения и в плоскости фотомишени отображается в виде изображения. Под оптическим каналом мы понимаем канал, образуемый объективом в среде от объекта до плоскости изображения. Полученное таким образом изображение является вторичным источником электромагнитных излучений. В результате воздействия этих излучений на приёмник изображения происходит преобразование их в видео сигнал (сигнал изображения). Видеосигнал поступает через канал связи на вторичный преобразователь (воспроизводящее устройство), где восстанавливается оптическое изображение. Далее изображение объекта воспринимается получателем, т.е. поступает через оптический канал к получателю визуальной информации.
В качестве приёмника изображения (первичного преобразователя) в оптическом диапазоне применяются электронные или оптико-механические устройства, основанные на использовании явления фотоэффекта. В качестве вторичного преобразователя (воспроизводящего устройства) применяются электронно-лучевые приёмные трубки (кинескопы), основанные на использовании явления люминесценции. Сегодня получает широкое распространение другой вид воспроизводящих устройств – матричного типа на жидком кристалле.
6.1.1. Принцип передачи изображения
Характерной особенностью приёма и передачи изображений телевизионным методом является пространственная распределённость излучения объекта, т.е. пространственная многоканальность. Из этих совокупных излучений образуется оптическое изображение объекта. Поэтому плоскость изображения можно разбить на ряд независимых элементов (пикселей), как показано на рисунке ниже.
Рис.2. Разложение изображения на элементы
Под элементом (пикселем) изображения понимают минимальный по размерам участок изображения, яркость (цветность) которого независима от соседних участков изображения и имеет определённое постоянное значение.
Для приёма изображения либо используется N фотоэлектронных приборов, воспринимающих одновременно лучистые потоки от N элементов, либо один фотоэлектрический прибор, воспринимающий в определённой последовательности эти излучения от каждого из N элементов изображения.
В телевизионных системах информация о распределении лучистых потоков, исходящих от N независимых элементов изображения передаётся по одному и тому же каналу связи. Для этого, в случае использования N независимых фотоэлектронных приборов, осуществляется поочерёдное подсоединение их выводов к общему каналу путём коммутации. При использовании общего фотоэлектронного прибора последовательные посылки сигнала осуществляются путём последовательного пропуска сигнала потока от соответствующих Nэлементов изображения к приёмнику. Процесс последовательного преобразования (анализа-приёма) изображения, расчленённого на N элементов, в видеосигнал называется развёрткой передаваемого изображения.
Тем же методом возможно получение изображений в невидимых глазу областях электромагнитных волн (ИК, УФ, рентгеновских и гамма-лучей), если они аналогично оптическому представляют собой пространственное распределение излучения.
Изображение описывается распределением яркости В(х,у) в прямоугольной системе координат х,у. Для этого выделенное поле изображения (кадр) разбивается на элементы размером Х х Y. При этом, если величину выбрать достаточно малой, то погрешность разложения будет меньше, восстановленное на приёмной стороне изображение окажется более подробным исходному изображению.
В приёмнике осуществляется обратный процесс, т.е. принятый сигнал последовательно преобразуется с световой поток с ограниченным размером X x Y, и путём их свёртки (развёртки) восстанавливается исходное изображение.
В ТВ системах применяют электронный и механический способы развёртки изображения. Электронная развёртка осуществляется электронным лучом в электронно-лучевых приборах, а в приборах с зарядовой связью – путём переноса электронных пакетов.
На приёмной стороне для восстановления изображения также используют электронно-лучевые трубки (кинескопы) или электронные индикаторные панели (газоразрядные и жидкокристаллические). В этих приборах приём оптического изображения и преобразование его в электрический сигнал, а также обратное восстановление изображения по электронному сигналу на приёмном конце, осуществляются в аналоговой форме.
6.1.2. Развёртка изображения
В качестве примера рассмотрим образование видеосигнала при линейной развёртке изображения. На рис. 3а показано изображение и в нём – линии развёртки одной строки, а на рис. 3б – закон изменения яркости вдоль этой строки В(х). В ТВ системах развёртка изображения производится световым или электронным лучом. В первом приближении сечение луча можно представить круглым. Его диаметр в плоскости изображения d1 называют апертурой луча.
Развёртка (сканирование) происходит слева направо вдоль горизонтальных линий (строк) и сверху вниз по строкам (рис. 3г). Луч пробегает строку за строкой до самого «дна» экрана, образуя растр (рис. 3д), а затем возвращается назад и повторяет движение опять, образуя следующий кадр.
В точках, куда падает электронный луч, наблюдаются видимые глазу вспышки света. За счёт инерционности глаза в процессе сканирования электронным лучом эти вспышки сливаются в линии, далее в полный растр, образуя телевизионный кадр. ТВ изображение, таким образом, представляет собой совокупность последовательно высвечиваемых точек, передающих пространственное распределение яркости (цвета). Установлено, что для восприятия человеческим глазом этой совокупности как единого целого, она должна обновляться не реже 50 раз в секунду. В противном случае глаз начинает замечать мерцание строк – так называемый фликер-шум (flicker).
Рис. 3. Развёртка изображения
В телевидении был реализован чересстрочный режим развёртки (рис. 3ж), при котором за каждый проход луч пробегает только половину строк – сначала 288 чётных (нумерацию строк начинают с 0), а затем, вернувшись к началу, – 288 нечётных (здесь речь идёт об активных или видимых строках и цифра округлена до целого числа). Таким образом, телевизионный кадр оказывается разделённым на 2 полукадра – их называют полями.
В результате вертикальная частота оказывается в два раза выше, т.е. 50 Гц, а кадровая частота равна 25 Гц. Следовательно, передаваемый объём информации уменьшится в два раза, сохраняя реально временные параметры и качество изображения. Благодаря этому требуемая полоса канала передачи сокращается в 2 раза.
Однако чересстрочная развёртка ограничивает размер мелких деталей. При попытке передачи узкой горизонтальной линии толщиной не более 1/576 высоты изображения, эта линия будет прорисовываться только при каждом втором проходе, т.е. 25 раз в секунду. Вследствие чего происходит сливание горизонтальной линии, и глаз заметит её мерцание – фликкер-шум.
При прогрессивной развёртке полный кадр представляется одним полем. В этом случае видимая чёткость повышается вдвое, но чтобы избежать фликкер-шума, надо повысить кадровую частоту не менее чем в 2 раза.
6.1.3. Искажения изображения при развёртке
Закон изменения тока на выходе первичного преобразователя i(t) при развёртке вдоль строки отличается от закона изменения яркости тем, что резкие изменения яркости на кривой изменения тока сглажены (рис. 3в). Это искажение, возникающее в процессе первичного преобразования, называется апертурным искажением. Апертурные искажения снижают разрешающую способность ТВ системы, резкость и чёткость изображения.
Для его ослабления следует уменьшать апертуру луча первичного преобразователя, н в этом случае начинает сказываться другой фактор. В процессе первичного преобразования энергия излучения объекта собирается с площади, пропорциональной квадратуре апертуры луча. Следовательно, чем больше апертура луча, тем выше чувствительность телевизионной системы при фиксированной разрешающей способности. Однако увеличивать время накопления, уменьшая скорость развёртки, можно только при передаче изображения неподвижных или малоподвижных объектов.
На приёмной стороне системы во вторичном преобразователе имеют место также апертурные искажения. Здесь апертура луча вторичного преобразователя d2 связана интенсивностью излучаемого светового потока. Поэтому обычно выбирается d2>d1.
Таким образом, основным принципом ТВ передачи изображений является поэлементное сканирование путём развёртки оптической проекции объекта и передача значений яркости (цвета) в виде электрического сигнала изменяющейся амплитуды, и восстановление оптического изображения на приёмной стороне путём свёртки (развёртки) и модуляции приходящим сигналом светового (цветового) пятна (апертуры). Для правильного и полного восстановления изображения необходимо, чтобы на передающей и приёмной сторонах законы развёртки изображения были одинаковыми и протекали синхронно и синфазно. С целью обеспечения этих условий в телевизионной системе принят единый закон развёртки. Генераторы развёрток управляются от единого синхрогенератора. Поэтому в ТВ системе помимо канала для передачи сигналов изображения, интенсивность которых характеризует яркость отдельных элементов изображения, должен быть отдельный канал для передачи сигналов синхронизации. Чаще всего ТВ система выполняется с одной многоканальной линией связи, совмещающей каналы передачи сигнала изображения и сигналов синхронизации.
6.1.4. Получение цветного телевизионного изображения
Известно, что человеческий глаз воспринимает как единое целое красную (Red), зелёную (Green) и синюю (Blue) части спектра. Таким образом, цветовое восприятие человеческого глаза трёхкомпонентное. Конечно, мы воспринимаем больше цветовых оттенков – считается, что 16 миллионов – но для нас, в силу особенностей цветового восприятия, все они, с некоторыми оговорками, сведены к комбинациям этих трёх «основных» цветов. Исходя из этого, в телевизионных экранах одновременно сканируют три электронных луча, вызывая световые вспышки красного, зелёного и синего цветов, т.е. формируя соответственно R,G,B-составляющие одного и того же изображения. Глаз же воспринимает только результирующее изображение во всём богатстве цветов реального мира.
Глаз менее чувствителен к пространственным изменениям оттенков цвета по сравнению с чувствительностью к изменениям яркости, поэтому цветовая информация может передаваться с меньшей пространственной чёткостью (разрешением).
6.1.5. Цветовой видеосигнал
RGB-видеосигналы в телевидении перед передачей преобразуют в сигнал яркости Y и два цветоразностных сигнала U и V, а при приеме в телевизоре или ином приборе при воспроизведении изображения (иногда и в связи с обработкой) восстанавливают R,G,B-составляющие. Цветоразностные сигналы U и V передаются с разрешением в два раза меньшим, чем яркостной.
YUV сигналы Y=0,299R+ 0,587G+0,114В;
U=R–Y; V =В – Y; (1)
RGB сигналы R = U+Y; B = V+Y;
G = Y -0,509U-0,194V. (2)
Разделение сигнала цветного телевидения на яркостную и две цветоразностные составляющие возникло, чтобы удовлетворить жесткое требование двусторонней совместимости черно-белых и цветных приемников, работающих в одном стандарте разложения.
Яркостный сигнал Y заимствован из ч/б системы. Черно-белые приёмники воспринимают только его.
Цветоразностные U и V сигналы кодируются путем генерации специального гармонического сигнала (цветовой поднесущей). Модуляция поднесущей осуществляется по амплитуде и фазе в системе NTSC и PAL, по частоте в системе SECAM, согласно U- и V-значениям с последующим ее добавлением к Y-сигналу. При этом в начале каждого полукадра и в начале каждой телевизионной строки передаются специальные синхронизирующие импульсы, служащие для цветовой синхронизации и восстановления частоты поднесущей на приемном конце.
Телевизионный сигнал может быть композитным или компонентным.
Композитный телевизионный сигнал получается путем сложения яркостного V и модулированных цветоразностных U и V сигналов, а также синхроимпульсов. Для избежания эффектов интерференции складываемых сигналов и однозначного их разделения при декодировании, как яркостные, так и цветовые компоненты ограничиваются по ширине полосы путем предварительной фильтрации. Это уменьшает четкость (разрешение) изображения.
Компонентный телевизионный сигнал состоит из двух независимых сигналов Y/С: Y несет яркостную Y-компоненту и синхроимпульсы, С (Chrominance) – модулированные цветоразностные компоненты. Поскольку фильтрации не требуется, качество принимаемою изображения очень хорошее.
Компонентные телевизионные сигналы могут быть из трех независимых сигналов: Y для яркости и синхроимпульсов, U и V для цветоразностей. При этом не требуется ни фильтрации, ни цветового модулирования.
И, наконец, телевизионный сигнал может состоять из четырех независимых сигналов RGB и синхроимпульсов. Иногда синхроимпульсы также добавляются к G-компоненте.
Сигналы изображения в аналоговой форме, снимаемые с выхода первого преобразователя свет-сигнал, обязательно подвергаются помехам и искажаются. Поэтому основные требования к передаче ТВ сигналов сводятся к обеспечению их минимальных искажений и помехозащищенности. Однако при аналоговых методах и средствах формирования и консервации, а также передаче видеосигналов по линиям связи искажения и шумы накапливаются с увеличением числа обработок и переприемов. Особенно остро эти искажения проявляются при компоновке программ, осуществляемой путем электронного монтажа видеозаписей на магнитной ленте. При многократной перезаписи фрагментов программ, неизбежной во время монтажа, происходит существенное ухудшение качества аналоговых сигналов, в первую очередь снижается отношение сигнал/шум. Аналоговые ТВ сигналы лимитируют дальнейшее повышение качества электронной рир-проекции и возможности различных спецэффектов. Отмеченные ограничения могут быть преодолены путем перехода на цифровую форму ТВ сигнала [1,2,7].
6.1.6. Переход к цифровому видеосигналу
Современный уровень техники телевидения не позволяет непосредственно преобразовать оптические изображения в видеосигнал цифровой формы, также не существуют устройства, воспроизводящие изображение непосредственно с оцифрованного сигнала. В связи с этим для перехода к цифровому телевидению возникает необходимость в преобразовании аналогового видеосигнала с выхода приемника оптического изображения в цифровую форму и обратного преобразования в аналоговую форму перед воспроизведением изображения в воспроизводящем устройстве. При необходимости, преобразование аналогового видеосигнала в цифровой и обратно может быть осуществлено на любом участке телевизионного тракта.
6.2. Обобщенная структурная схема телевизионного тракта передачи цифрового видеосигнала
Аналоговый сигнал от телевизионной камеры поступает на аналоговой вход системы (рис.2.4(2)). Аналоговый сигнал подвергается предварительной обработке с целью упрощения последующих цифровых преобразующих устройств. Например, полный цветовой сигнал разделяется в устройстве предварительной обработки на сигнал яркости и цветоразностные сигналы для того, чтобы цифровые преобразования производились с каждым из трех сигналов отдельно. Возможно введение в аналоговый сигнал определенных предыскажений для улучшения субъективного качества выходного изображения и т.д. Несмотря на то, что многие из этих предварительных операций но обработке могут быть сделаны и в цифровой форме. Далее подготовленный для преобразования сигнал поступает на аналогово-цифровой преобразователь (3), в котором аналоговый сигнал дискретизируется, квантуется и предварительно кодируется (например, по методу ИКМ). Как указывалось, в полученном таким образом сигнале содержится значительная избыточность, которая может быть в определенной степени сокращена путём дополнительного более эффективного кодирования в блоке цифровой обработки сигнала (4).
Далее сигнал поступает в линейное кодирующее устройство (5), после которого может распределяться по потребителям (например» в устройство консервации ТВ сигнала, устройства коррекции ТВ сигнала и другие звенья, в которых производится обработка сигнала). Линейное кодирующее устройство предназначено для защиты цифрового ТВ сигнала от возможных помех в канале путем применения специальных, более помехозащищенных кодов. Наконец, сигнал в цифровой форме поступает на выходной преобразователь (6) (например, на модулятор радиопередающего устройства) и далее – в канал связи. Принятый приемным устройством сигнал демодулируется (7), подвергается обратному преобразованию в приемном декодирующем устройстве и поступает в блок цифровой обработки (8) декодирующего устройства цифрового сигнала. В нем лишенный избыточной информации сигнал приобретает исходную форму, затем в цифро-аналоговом преобразователе (10) преобразуется в аналоговый сигнал. Если на передающем конце тракта использовалась аналоговая обработка сигнала, то на приемном конце должна производиться обратная операция (9).
Приведенная на рис.2.4 схема является обобщенной. В зависимости от задач, стоящих перед цифровой системой, она может видоизменяться. Так, например, если в системе появится возможность преобразования свет-сигнал и сигнал-свет непосредственно в цифровой форме, система вообще не будет содержать аналоговых звеньев и аналого-цифрового и цифро-аналогового преобразователей.
В другом случае могут отсутствовать устройства, повышающие помехоустойчивость сигнала в каналах связи. Это допустимо в случае отсутствия протяженных линий связи и, в частности, при локальной цифровой обработке сигнала внутри одного телецентра. В этом же случае нет необходимости и в устройствах, устраняющих в ТВ сигнале избыточность и сокращающих цифровой поток.
6.2.1. Цифровое представление телевизионного сигнала
При представлении сигналов в цифровой форме возникает задача преобразования непрерывного во времени сигнала в последовательность отсчетов. Чаще всего такая задача решается в три этапа (рис.2.5): на первом – осуществляется дискретизация сигнала во времени (1) – U(nT); на втором - дискретизация отсчетов по амплитуде (2) – Uкв(nT), т.е. квантование (для устранения путаницы между дискретизацией во времени и по амплитуде и введена разная терминология); на третьем - кодирование (3) – Uк(nT), т.е. преобразование квантованного значения Uкв(nT) в соответствующую ему кодовую последовательность символов Uк(nT). Весь этот процесс происходит в аналого-цифровом преобразователе (АЦП). Таким образом, на выходе АЦП образуется последовательность двоичных чисел [3,4]
Дискретизация. Наиболее распространенной формой дискретного представления сигнала является дискретизация с равномерным шагом и постоянным периодом (рис.2.5.в), в основе которой лежит теорема Котельникова-Найквиста. Согласно этой теореме, любой непрерывный сигнал U(t), имеющий ограниченный спектр частот, может быть представлен значениями этого сигнала U(t), взятыми в дискретные моменты времени tn=nТ, где n=1,2,3,... - целые числа, Т - период или интервал дискретизации, выбранный из условия теоремы Котельникова-Найквиста: Т=1/2frp. Здесь fгр - максимальная частота спектра исходного сигнала U(t).
Величина, обратная периоду дискретизации, называется частотой дискретизации. Частота дискретизации fд = 2frp. Аналитическое выражение, утверждающее возможность замены непрерывного сигнала U(t) последовательностью дискретных значений U(nТ), имеет следующий вид:
Предполагается, что указанные отсчеты U=nT являются импульсами (бесконечно короткими).
Квантование. Информация об уровне сигнала в точке взятия того или иного отсчета передается высотой отсчета, т.е. остается в аналоговом представлении. Чтобы завершить преобразование сигнала в цифровую форму, необходимо заполнить уровневое квантование (рис.2.5ж). Квантование, как и предшествующий процесс, представляет собой дискретизацию телевизионного сигнала. Только дискретизация эта осуществляется не во времени, а по уровню сигнала U(t). Она заключается в разбиении уровневого интервала сигнала на ряд зон- каждой присваивается свой номер (рис.2.6), представленный в двоичном исчислении. При уровневом квантовании отсчету присваивается номер соответствующей зоны, в пределах которой находится его вершина (рнс.2.5ж).
Рис.2.5. Преобразование аналогового сигнала в цифровую форму
Так возникает дискретный набор уровневой информации, передающей точное значение с ошибкой в шаг квантования. Таким образом, квантование заключается в округлении полученных после дискретизации мгновенных значений отсчетов до ближайших из набора отдельных фиксированных уровней. Следствием этого становится появление в сигнале специфических шумов, называемых шумам квантования.
Уровневые номера отсчетов передаются с помощью импульсов стандартной формы и уровня, принимающих одно из двух возможных значений (рис 2.5.г) Одному приписывается «0», другому – «1». Комбинации подобных импульсов способны нести информацию о числах в двоичном исчислении. Таким образом, каждый отсчет передается группой импульсов, образующих кодовое слово. Число импульсов в кодовом слове определяет его информационное содержание в битах. Это число или, как часто говорят, длина кодового слова, относится к стандартизируемым параметрам цифрового кодирования.
Фиксированные уровни, к которым "привязываются" отсчёты, называют уровнями квантования. Разбивая динамически диапазон изменения сигнала U(t) уровнями квантования на отдельные области значений, называемые шагами квантования, образуют шкалу квантования. Округление отсчета до одного из двух ближайших уровней (верхнего или нижнего) определяет положением порогов квантования (рис.2.5ж).
Если возвести два в степень, равную длине кодового слова, то мы получим число уровней квантования. Обычно используется линейная шкала квантования, при которой размеры зон одинаковы. Однако не исключено и применение шкал с неравномерным шагом и даже адаптивных, т.е. приспосабливающихся к особенностям конкретных реализаций сигнала.
На рисунке 2.6 упрощенно воспроизведен процесс цифрового кодирования и декодирования пилообразного яркостного сигнала (непрерывное линейное изменение насыщенности серого от белого слева до черного справа) при трехразрядном квантовании, т.е. 8-ми уровневой дискретизации.
Возможность восстановления в зрительном аппарате человека исходного изображения по его квантованному приближению (в теореме Котельникова эта операция не предусматривается) вытекает из ограниченности контрастной (и цветовой) чувствительности зрительной системы.
Рис. 2.6. Пояснение к выбору числа уровней квантования
Кодирование. Строго говоря, дискретизированный и квантованный сигнал Uкв(nТ) уже является кодированным (рис.2.5г). Действительно, если амплитуда импульсов дискретизиро-ванного сигнала U(nT) может принимать любые произвольные значения в пределах исходного динамического диапазона сигнала U(t), то операция квантования привела к замене всех возможных значений амплитуды сигнала ограниченным числом значений, равным числу уровней квантования. Таким образом, квантованная выборка сигнала выражается некоторым числом в системе счисления с основанием m, где m - количество уровней квантования. Но цифровой сигнал в такой форме по помехозащищенности мало выигрывает по сравнению с аналоговым, особенно при большом m. Для увеличения помехозащищенности сигнала его лучше всего преобразовать в двоичную форму, т.е. каждое значение уровня сигнала записать в двоичной системе счисления. При этом номер (значение) уровня будет преобразован в кодовую комбинацию символов 0 или 1 (рис.2.5е). В этом и состоит третья заключительная операция по преобразованию дискретного сигнала U(nT) в цифровой Uк(nT), называемая операцией кодирования. Кодирование, таким образом, есть преобразование квантованного значения отсчета Uкв(nT) в соответствующую ему кодовую комбинацию символов Uк(nT). Наиболее распространенный способ кодирования ТВ сигнала – представление его дискретных и проквантованных отсчетов в натуральном двоичном коде. Этот способ получил название импульсно-кодовой модуляции (ИКМ). На рис.2.6г показан результат преобразования фрагмента исходного сигнала U(t) в последовательность комбинаций двоичного 3-разрядного кода [3].
Часто всю совокупность перечисленных операций – дискретизации, квантования и кодирования для краткости называют кодированием ТВ сигнала. Это имеет определенные технические техническим устройством – аналого-цифровым преобразователем (АЦП). Обратное преобразование цифрового сигнала в аналоговый производится в устройстве, называемом цифро-аналоговым преобразователем (ЦАП).
6.2.2. Цифро-аналоговый преобразователь
Для восстановления исходного аналогового сигнала U(t) из последовательности отсчетов U(nT) последние необходимо в соответствии с (3) пропустить через идеальный фильтр нижних частот со срезом на частоте fгр. Множитель представляет собой реакцию такого фильтра на единичный импульс U(nT). Для точного восстановления исходного сигнала по теореме Котельникова предполагается наличие бесконечно большого числа отсчётов. На практике же сигнал, всегда имеющий конечную длительность, описывается конечным количеством отсчетов. Несмотря на это несоответствие условиям теоремы, такой способ восстановления сигнала широко используется в цифровом телевидении, и точность восстановления при соблюдении определенных требований оказывается достаточной [5].
6.2.3. Структура дискретизации видеосигналов
Теоретический анализ и эксперименты показали, что наилучшей является ортогональная структура дискретизации, поясняемая рисунком 2.7.
Рис. 2.7. Структура дискретизации видеосигналов.
· - место снятия отсчёта CB и CR;
Y – отсчёты, соответствующие сигналу яркости;
CB и CR – отсчёты, соответствующие красному и
синему цветоразностным сигналам.
Отсчеты в этом случае берутся на пересечении горизонтальных и вертикальных линий ТВ растра. Положение этой сетки жестко связано с растром и не изменяется от поля к полю и от кадра к кадру. Поэтому, к примеру, аппаратурные помехи или искажения будут менее заметны на ТВ изображении, чем при подвижкой сетке отсчетов, поскольку способны создавать лишь неподвижные контура. Например, снижается заметность муаровых помех, возникающих при наложении спектров аналогового и дискретизированного ТВ сигналов, если фильтрация высокочастотных составляющих недостаточно глубокая. Кроме того, периодичность структуры дискретизации заметно упрощает процедуру цифровой обработки ТВ сигналов при информационном сжатии видеоданных, фильтрации, необходимой при формировании спектра кодируемого сигнала, при преобразовании стандартов разверток и т.п. Во всех упомянутых случаях при ортогональной дискретизации отсчеты ТВ сигналов в последовательных кадрах и строках пространственно совмещены, поэтому нет необходимости в промежуточной интерполяции (передискретизации) отсчетов, что характерно для структур дискретизации, не имеющих пространственной совместимости отсчетов.
Современная техника вносит свои коррективы в проблему дискретизации. Так, в настоящее время практически все телевизионные камеры работают с твердотельными преобразователями "свет-сигнал" (ПЗС матрицами), имеющими собственную, жестко заданную, ортогональную структуру дискретизации. Две различные структуры дискретизации в ПЗС и электрическая в кодере могут мешать друг другу, что в итоге ведет к появлению муаровых помех, если эти структуры будут выбираться произвольно [4.7]
Разработчики международных стандартов на параметры дискретизации и цифрового кодирования учитывали, помимо прочего, и потребности современной технологии производства телевизионных программ. Дело в том, что одни: электронная рир-проекция, микширование, спецэффекты и т.п., предъявляют наивысшие требования к качеству сигнала, другие могут удовлетворяться средним уровнем качества. Видеожурналистика – один из возможных примеров.
Поэтому принята стандартизованная иерархия частот дискретизации сигналов яркости и цветности, определяемая соответствующими коэффициентами 1,2,4,8. Коэффициенту 4 соответствует частота дискретизации 13,5 МГц = 4 х 3,375 МГц, соответственно 1 – 3,375 МГц.
Для наиболее ответственных технологических операций в студиях рекомендуется стандарт 4:4:4 - это означает, что яркостный и оба цветоразностных сигнала дискретизируются с одинаковой частотой 13,5 МГц. Более часто используется иерархический уровень 4:2:2, что означает частоту дискретизации для яркостного сигнала 13,5 МГц, для цветоразностных - 6,75 МГц. В четвертьдюймовом формате цифровой видеозаписи DVC Pro, например, используется уровень 4:1:1 (в системе NTSC), а значит при дискретизации сигнала яркости 13,5 МГц, цветоразностные дискретизируются вчетверо реже с частотой 3,375 МГц. Напротив, в преобразователях стандартов высшего уровня уже используется стандарт 8:8:8, что соответствует частоте дискретизации 27 МГц для всех компонент и по качеству – системам телевидения высокой четкости. В телевизионной журналистике используется иерархический уровень 2:1:1 [7].
6.2.4. Оценка возможности передачи цифрового потока
Оценим скорость передачи цифровой информации по каналу связи. При непосредственном кодировании телевизионного сигнала методом ИКМ по каналу связи передаются кодовые комбинации с частотой, равной отсчетам, т.е. частоте дискретизации fд.
Каждая кодовая комбинация соответствует определенному отсчету и содержит некоторое число k двоичных символов (битов).
Скоростью передачи цифровой информация по каналу связи называется количество передаваемых по этому каналу двоичных символов в единицу времени. За единицу скорости принимается 1 бит в секунду. Таким образом, скорость передачи телевизионного сигнала в цифровой форме будет равна произведению частоты дискретизации fд и числа двоичных символов в одном дискретном отсчете:
С = fдk (4)
Если верхняя граничная частота телевизионного сигнала, принята равной 6 Мгц, то минимальная частота дискретизации, согласно теореме Котельникова-Найквиста, fд=12 МГц.
Как отмечалось ранее, в системах цифрового телевидении с ИКМ частоту дискретизации fд выбирают несколько выше минимально допустимой, определяемой теоремой Котельникова-Найквиста; связано это с необходимостью гарантированного обеспечения исходного качества сигнала при его обратном преобразовании в аналоговую форму. Поэтому при верхней граничной частоте fгр=6 Мгц, как указали выше, fд выбирают не менее 13,5 МГц.
Число двоичных символов k в кодовой комбинации одного отсчета связано с числом уровней квантования исходного сигнала соотношением:
k = 1og2m ≈ 3,31 lg m. (5)
Число уровней квантования m сигнала должно быть выбрано не меньше максимального числа градаций яркости, различимых глазом, которое в зависимости от условий наблюдения колеблется примерно от 90 до 200. Отсюда
k = 6,4-7,6.
Количество символов в кодовой комбинации может быть только целым числом, поэтому выбор разрядности кодовой комбинации ограничится числами k=7 или k=8. В первом случае кодовая комбинация может нести информацию о возможных уровнях сигнала (градации яркости). Во втором случае (соответствующем лучшему качеству передачи градаций) m=28=256. В новейшей аппаратуре часто используют 10-битное уровневое кодирование.
Приняв k = 8 из (4) и (5) следует, что скорость передачи цифровой информации
С = fд k = 108 Мбит/с.
Все сказанное выше относилось к черно-белому изображению. Применительно к цветному, имея в виду стандарт 625/50, попробуем оценить скорость передачи данных.
Суммарная скорость цифрового потока при этом (для первого случая) составляет
13,5 х 8 + 2 х 6,75 х 8 = 216 Мбит/с.
Точно также можно подсчитать скорость передачи данных и для уровневого кодирования 10 бит, которое составит 270Мбит/с.
По теореме отсчета минимальная полоса частот Dfц цифрового канала, предназначенного для передачи цифровой информации со скоростью С, определяется выражением
При равномерном расположении тактовых импульсов внутри интервала дискретизации
fт = k fд,
где k - разрядность кодовых посылок.
Используя (4), получаем
Dfц = 0,5 С.
И для передачи ТВ сигнала потребуется канал с полосой пропускания, при вышеуказанных данных, Dfц = 108 МГц, 216 МГц и 270 МГц. Соответствующее быстродействие требуется от всех узлов преобразования, обработки и консервации сигнала [3].
Передача видеоданных с такими высокими скоростями может производиться по широкополосным ВОЛС, которые теперь часто используются на телецентрах для обмена цифровыми ТВ сигналами между аппаратными, участвующими в создании ТВ программ в сетях кабельного телевидения, но не по эфирным каналам. Стандартные ТВ вещательные радиоканалы имеют существенно меньшую полосу пропускания и для передачи по ним цифровых ТВ сигналов необходимо снизить скорость передачи видеоданных за счет сокращения избыточности, присущей цифровым ТВ сигналам, путем сжатия данных [1].
Цифровые стандарты телевидения высокой четкости и повышенного качества также привязаны к базовой частоте дискретизации.
Последние достижения микроэлектроники позволяют уже сегодня создавать различные цифровые телевизионные устройства, отвечающие указанной скорости передачи и обработки цифровой информации. Многие из этих устройств реализованы. Тем не менее, нельзя считать экономически целесообразным передачу такого большого цифрового потока по каналам связи. Учитывая перспективу создания единой автоматизированной системы связи (ЕАСС), необходимо цифровой поток телевизионного вещания передавать в одном из ее унифицированных цифровых каналов. Самый широкий по спектру канал ЕАСС пропускает цифровой поток около 140 Мбит/с. Это так называемый четверичный канал. Третичные магистрали пропускают только 34 Мбит/с. Расчеты показывают, что экономически целесообразно сигнал ТВ вещания передавать в полосе не шире третичной магистрали. В крайнем случае допустимо две ТВ программы разместить в четверичной магистрали ЕАСС [5].
Поэтому задача "сжатия" телевизионных сообщений в цифровых системах имеет важнейшее технико-экономическое значение. Эта задача является ключевой для построения экономичных систем ТВ связи.
6.2.5. Выбор параметров преобразования
Число уровней квантования, необходимое для высококачественного раздельного кодирования составляющих цветового ТВ сигнала, определялось экспериментально. Очевидно, что с ростом этого числа точность передачи уровневой информации возрастает, шумы квантования снижаются, но за это приходится расплачиваться соответствующим ростом информационного потока и расширением необходимой для передачи полосы частот. Это крайне нежелательно, и все усилия специалистов направлены, по объективным причинам, в противоположную сторону – максимально возможного снижения информационного потока. С другой стороны, при заниженном числе уровней квантования ухудшается качество изображения из-за появления на нем ложных контуров. Кроме того, слишком велики, а потому и заметны шумы квантования.
Механизм возникновения ложных контуров поясняется на рис.2.6. После декодирования вместо пилообразного сигнала воспроизводится ступенчатый. Все хорошо, если передаваемые ступенькой перепады яркости находятся за пределами чувствительности глаза. В противном случае, когда глаз видит эти перепады яркости, каждая ступенька начинает восприниматься как самостоятельный элемент изображения, в данном случае, в виде вертикальных полос с разной контрастностью или насыщенностью серого. Таким образом, на границах перехода от одной ступеньки к другой возникают ложные контура, которые отсутствуют в изображении при воспроизведении исходного пилообразного сигнала.
Пороговая чувствительность глаза к перепадам яркости в условиях наблюдения, обычных при просмотре ТВ программ, по экспериментальным оценкам составляет около 1 %, а это значит, что два соседних фрагмента изображения, отличающихся по яркости на 2 %, воспринимаются как раздельные части изображения [13]. Таким образом, кодирование сигнала яркости с числом уровней квантования меньшим или равным 100 ведет к появлению на изображении ложных контуров, что заметно ухудшает его качество. Ближайшим числом, являющимся степенью двух и превышающим 100, будет 128, а длина соответствующего кодового слова – 7 бит. Это минимальная длина кодового слова, при которой ложные контуры не видны.
Чтобы сделать окончательный выбор, следует оценить уровень шумов квантования. Известна очень простая и удобная для устных подсчетов формула: отношение сигнал/шум квантования (невзвешенное), выраженное в децибелах, приблизительно равно произведению 6 дБ на длину кодового слова. Для рассматриваемого случая это отношение 6 дБ х 7 = 42 дБ. Очевидный недостаток семиуровневого квантования заключается в опасной близости к порогу по шумам и ложным контурам.
Дальнейшие исследования показали, что для высококачественного раздельного кодирования нужно, как минимум, 8-битовое квантование. Оно-то и вошло в первые редакции Рекомендаций и Стандартов МККР. Важно было и то, что 8-битовое кодирование соответствовало техническим возможностям того времени. Однако сейчас прогресс интегральной технологии позволил начать промышленный выпуск 10-разрядных аналого-цифровых и цифро-аналоговых преобразователей для кодирования ТВ сигналов, что позволило разработчикам студийной аппаратуры особо высокого класса качества перейти от 8-разрядного к 10-разрядному раздельному кодированию. Дело в том, что по ряду ответственных операций, например: микширования, рир-проекции, монтажа, 8-битовое уровневое квантование не обеспечивает требуемого качества, а по некоторым коррекциям (в цифровых ТВ камерах) необходимо 14-битовое квантование.
Для цветных изображений соответственно необходима оцифровка трех составляющих (YUV или RGB), что соответствует заданию 16,78 млн. различных цветовых оттенков. При этом говорят о представлении в реальных цветах – true-color. Отметим, что понятие hi-color подразумевает RGB-представление в формате 5:5:5 (15 бит, 32768 цветов) или 5:6:5 (16 бит, 65536 цветов).
При линейном 8(10)-битовом кодировании имеется 256 (1024) уровней квантования, которым присваиваются номера 0-255 (0-1020). При этом уровни с номерами 0 и 255 при 8-битовом кодировании и уровни 0,1,2,3 и 1017, 1018, 1019 и 1020 при 10-бнтовом квантовании не используются, а соответствующие им кодовые слова предназначены для передачи сигналов цифровой синхронизации синхрослов начала активной строки (НАС) и конца активной строки (КАС).
Рис. 2.8. Фиксирование уровней сигналов
Как упоминалось выше, некоторые уровни квантования и соответствующие им кодовые слова привязаны к стандартным уровням в составе видеосигнала. Например, уровень 16(64) привязан к уровню черного (рис.2,8). Уровень 235 (940) соответствует номинальному значению уровня белого в сигнале яркости. Уровни 235 - 254 (940-1016) и 16 - 1 (64 - 4) используются как защитные. Сигнал яркости может иногда на короткое время заходить в эти области, например, при наличии выбросов на фронте и срезе импульса.
В отличие от сигнала яркости цветоразностные масштабированные сигналы голубого и красного симметричны относительно некоторого среднего значения сигнала и имеют тот же размах, что и сигнал яркости. К уровню симметрии (нулевому) цветоразностных сигналов привязан 128 (512) уровень шкалы квантования. Уровни цветоразностных сигналов передаются 16 (64) - 240 (960) уровнями шкалы квантования.[7].
Частота оцифровки – частота дискретизации видеосигнала, определяющая получаемое разрешение изображения. Выбирая частоту дискретизации, естественно стремятся к минимальным различиям кодированных сигналов стандартов разложения 625/50 и 525/59,94. Близость значений частот строчной развертки 15625 Гц (для систем SECAM и PAL) и 15734.264 Гц (для системы NTSC) позволяет выбрать одинаковое число отсчетов в активной части ТВ строк обоих стандартов ТВ разложения – тех, что воспроизводятся из экране телевизора. При таком выборе можно пытаться устранить процедуру передискретизации (интерполяции) отсчетов вдоль строки при преобразовании стандартов разложения. Это условие выполняется, если частота дискретизации сигнала яркости кратна частотам строк. Таким образом, остается определить наименьшее общее кратное. Оказалось – это 1,25 MГц. Кроме того, частота дискретизации должна удовлетворять требованиям теоремы отсчетов, согласно которой она должна в два раза превышать верхнюю частоту кодируемого сигнала, т.е. быть не менее 6 MГц х 2 = 12 МГц. Ближайшая частота, которая удовлетворяет двум этим требованиям 2,25 МГц х 6 = 13,5 МГц. Именно она и была, в конце концов, принята в качестве частоты дискретизации сигнала яркости в иерархии единых студийных стандартов цифрового кодирования, где опорная частота равна 3,375 МГц. Эта частота совпадает с 864 (или 858) гармоникой частоты строк системы с 625- (или 525) строчным разложением изображения. Поэтому в полной строке будет 864 (858) отсчетов сигнала яркости [11].
Разработчики стандарта пошли дальше и постановили, что в обоих стандартах разложения следует использовать одно число отсчетов – 720.
При цифровом кодировании синхроимпульс исключается из состава цифровой ТВ строки, поскольку передаваемая им информация о частоте строк легко восстанавливается в декодере по частоте дискретизации, так как последняя жестко связана с частотой строк. При этом, как отметили выше, для опознавания интервалов активной части ТВ строки в цифровой последовательности вводятся две опорные временные метки - синхрогруппа начала активной строки и ее конца.
Два стандарта телевизионного разложения родили клубок проблем, распутать который долгое время казалось невозможным. На первых порах и от цифрового кодирования не ждали ничего чрезвычайного, но внимательное изучение цифровых соотношений показало, что на уровне стандартов цифрового кодирования возможно создание единой иерархической системы стандартов, снимающей не все, но очень и очень многие проблемы. Этот интересный и важный вопрос, которого мы касались выше, заслуживает более детального рассмотрения.
Для системы PAL/SECAM приняты следующие стандарты:
Стандарт оцифровки | Частота оцифровки, МГц | Размер изображения |
CCIR 601 | 13,50 | 720 x 576 |
Квадратурный | 14,75 | 768 х 576 |
CCIR 656 | 27,00 | 1440 x 576 |
Здесь «Квадратный пиксель» означает, что ширина пикселя равна его высоте.
Как уже отмечалось, при YUV представлении видеосигнала цветоразностные компоненты U и V передаются с пространственным разрешением, в два раза меньшим разрешения по яркостному сигналу. Это позволяет осуществлять их выборку с частотой, в два раза меньшей частоты выборки яркостного сигнала без видимой потери качества. Обычно такую оцифровку описывают как 4:2:2 (Рекомендация 601 МККР)
6.2.6.Сжатие цифрового потока
Резервы для уменьшения цифрового потока без ущерба качеству воспроизводимого изображения, безусловно, существуют.
Телевизионный сигнал, как известно, избыточен. Различают статистическую избыточность, избыточность по восприятию, структурную и спектральную избыточность [9,12]. По теории вероятностей избыточность является следствием определенных корреляционных связей. Корреляция означает, что некоторый элемент изображения более или менее существенно зависит от соседей в пространстве и во времени.
Под статической избыточностью понимают корреляционные связи между соседними (по вертикали и горизонтали) отсчетами ТВ сигнала. Сразу надо подчеркнуть, что снижение избыточности в этом случае до определенных пределов обратимо, т.е. без потерь информации. Примером такого «беспроигрышного» кодирования служит предсказание на основе дискретно-косинусного преобразования. Можно назвать и другие разностные методы.
Избыточность по восприятию связана с особенностями зрения человека. Например, цветовое разрешение нашего зрения ниже яркостного. Эта особенность учтена во всех стандартных аналоговых системах цветового кодирования. В NTSC, PAL, SECAM цветовое разрешение существенно понижено по отношению к яркостному. То же самое зафиксировано в цифровом стандарте 4:2:2, где, по определению, две цветоразностные компоненты представлены таким же по объему информационным массивом, что и один яркостной сигнал.
Учтивая эту способность нашего зрения к восприятию мелких деталей цветного изображения, можно в несколько раз сократить полосу частот при передаче и кодировании сигналов цветности.
Структурная избыточность – итог особенностей стандарта разложения или, по иному, преобразования изображения в ТВ сигнал. В нем, например, периодически передаются неизменные по форме элементы сигнала: гасящие импульсы строк и полей. В цифровом ТВ сигнале нет необходимости передавать эти импульсы по каналу связи, т.к. они могут быть восстановлены в декодере по опорным сигналам синхронизации. Устранение из состава цифрового ТВ сигнала гасящих импульсов строк и полей снижает скорость передачи видеоданных примерно на 23 %.
Спектральная избыточностьпроявляется как результат излишне высокой частоты дискретизации. Используя интерполяцию и передискретизацию определенным образом выбранных групп отсчетов ТВ сигнала, можно, в принципе, видоизменить спектральный состав и снизить частоту дискретизации. Такая обработка обычно необратима и, как правило, ведет к некоторому снижению качества восстановленного ТВ изображения. Уменьшение цифрового потока ТВ сигнала за счет сокращения избыточности в ТВ изображении осуществляется в цифровом телевидении путем применения более эффективных методов кодирования по сравнению с ИКМ [6]. Из всего многообразия методов цифрового кодирования в настоящее время, как показывает опыт, наибольшее распространение получают методы цифрового кодирования с предсказанием, в частности дифференциальная импульсно-кодовая модуляция (ДИКМ) обладающая достаточной эффективностью и, в то же время, простотой практической реализации [8].
При кодировании с предсказанием вычисляется разность между истинным и предсказанным значением отсчета. Затем разность квантуется по уровню. От точности предсказания зависит среднее число бит, необходимых для передачи разностной информации. Предсказание может быть экстраполяционным. В этом случае (его часто называют предсказанием вперед) по предшествующим значениям отсчетов ТВ сигнала оцениваются последующие отсчеты. Интерполяционое (двунаправленное) предсказание означает, что оценка среднего по положению отсчета ТВ сигнала выполняется по известным значениям предшествующих и последующих отсчетов. Такое предсказание наиболее точно оценивает текущие отсчеты, однако за точность приходится расплачиваться возросшим объемом вычислений и, соответственно, памяти, необходимой для реализации. При этом эффект не окупает затраты.
Как уже отмечалось, предсказание выполняется по соседним с предсказываемым отсчётом, причем под соседними надо понимать отсчеты, расположенные перед и за рассматриваемым. К ним надо добавить соседей в предшествующей и последующей строках, полях и кадрах. Таким образом, возможно построчное, межстрочное, внутриполевое, внутрикадровое, межполевое и межкадровое предсказание. Это – полный набор возможных направлений корреляций. Но уже подчёркивалось, что предсказание вдоль отдельной строки по предшествующему и последующему элементу неэффективно. По этому же критерию можно отсеять и некоторые другие возможные направления.
При простейшем внутриполевом предсказании вперед предшествующий отсчет ТВ строки принимается как ожидаемый уровень последующего отсчета. Фактически это означает вычеркивание постоянной составляющей или, что то же самое, выделение разностной информации. Такой метод предсказания особенно эффективен, когда передаются крупные, не содержащие мелких деталей, фрагменты изображения, где яркость постоянна или изменяется медленно.
Другой способ – межкадровое предсказание вперед. В этом случае текущий отсчет оценивается по отсчету с теми же координатами, но предыдущего кадра. Это очень эффективный метод предсказания для неподвижных изображений. Ситуация усложняется, когда изображение содержит движущиеся объекты или изменятся в целом. В этом случае отсчеты, принадлежащие однотипным элементам изображения от кадра к кадру будут смещаться. Возникает разностная информация, даже если в остальном никаких изменений не происходит. Это можно ослабить, если ввести компенсацию движения. Для этого необходимо определить векторы перемещения движущихся частей изображения при последовательном переходе от кадра к кадру. Векторы движений позволяют определить положение кодируемого отсчета в новом кадре (скомпенсировать его перемещение) и, таким образом, сохранить высокую точность предсказания. Так же как и процессы дискретизации и квантования, эти методы представят предмет самостоятельного рассмотрения.
6.2.7. Стандарт цифрового телевидения
Над стандартом цифрового телевидение работали Европейский Вещательный Союз (EBU) и Общество инженеров кино и телевидения (SMPTE). Результатом этих работ стал международный стандарт по раздельному кодированию цветового ТВ сигнала. Итог – принятые МККР два документа. Рекомендация 601 «Параметры кодирования для цифровых телевизионных студий» (1982г.) и Рекомендация 656 «Видеостыки для раздельных видеосигналов в 525- и 625-сгрочных телевизионных системах» (1986 г.). Эти рекомендации являются общепризнанной основой для всех работ, связанных с профессиональным цифровым телевидением [10].
Эти Рекомендации стали базой при разработке Стандарта на цифровые видеостыки ТВ систем с 625- и 525-строчными растрами, документа EBU Tech.3267 «Видеостыки Европейского Вещательного Союза для 625-строчных цифровых видеосигналов уровня 4:2:2». Рекомендации МККР 60 (вторая редакция – 1992г.), документа SMPTE 259 М «Последовательные цифровые видеостыки для 10-битового раздельного кодирования уровня 4:2:2 и композитного кодирования с частотой дискретизации, равной 4-кратному значению цветовой поднесущей» (вторая редакция – август 1995 г.) и ряда других Стандартов. Вскоре в первые редакции (версии) упомянутых Рекомендаций и Стандартов были внесены некоторые изменения, в том числе и принципиального характера. Это необходимо иметь в виду при использовании ранних редакций документов.
Процесс дискретизации определяется тремя основными факторами: структурой дискретизации - относительным расположением отсчетов видеосигнала в пространстве и времени, числом отсчетов на одну ТВ строку – частотой дискретизации видеосигнала, и видом фильтрации видеосигнала, выполняемой до дискретизации [6].