Представление информации в ЭВМ. Кодирование информации

Носителем информации является сообщение. Сообщение ¾ это форма представления информации. Примерами сообщений являются: текст телеграммы, показания прибора, команды управления. Одним и тем же сообщением можно передавать разную информацию и наоборот ¾ одна и та же информация может быть передана различными сообщениями.

Связь между сообщением n и информацией i можно представить как некое отображение a, являющееся результатом договоренности между отправителем и получателем информации.

Сообщения передаются на определенном языке, понятном приемнику и передатчику. Это русский язык, жаргоны, язык глухонемых, печать для слепых, язык символов, знаков.

Запоминание и передача сообщений привела к возникновению письменности. Сообщения в письменной форме записываются знаками, выбираемыми из определенного алфавита. Сам алфавит и правила формирования из него сообщений (предложений) должны быть известны приемнику и передатчику (синтаксис). Семантика (изучает языки описания информации) может быть не известна, значит, сообщение будет передано третьему лицу.

Анализируя информацию, мы сталкиваемся с необходимостью оценки качества и определения количества полученной информации. Определить качество информации сложно, а часто и вообще невозможно.

Для определения количества информации нужно найти способ представить любую ее форму в едином виде, иначе говоря, надо суметь символьную, текстовую и графическую информацию преобразовать так, чтобы она получила единый стандартный вид. Таким видом стала так называемая двоичная форма представления информации. Она заключается записи любой информации в виде последовательности только двух символов.

Эти символы могут на бумаге обозначаться любым образом. Однако ради простоты записи взяты цифры 0, 1. В электронном аппарате, хранящем либо обрабатывающем информацию, рассматриваемые символы могут также обозначаться по-разному. Например, один из них ¾ наличием в рассматриваемой точке электрического тока, второй ¾ отсутствием в этой точке электрического тока.

Любой из ответов «да» или «нет» несет самую малую порцию информации (меньше быть не может). Эта порция определяет единицу измерения информации, называемую битом. Благодаря введению понятия единицы информации появилась возможность определения размера любой (графической, текстовой и символьной) информации числом битов.

Условимся каждый положительный ответ (“да”) представлять цифрой “1”, а отрицательный (“нет”) ¾ цифрой “0”. Тогда запись всех ответов образует многозначную последовательность цифр, состоящую из нулей и единицы, например 0100. Рассмотренный процесс получения двоичной информации об объектах называют кодированием информации.

Код ¾ правило, описывающее отображение одного набора знаков в другой.

Кодирование информации перечислением всех возможных событий очень трудоемко. Поэтому на практике кодирование осуществляется более простым способом. Он основан на том, что один разряд последовательности двоичных цифр имеет только два значения: 0,1. Двухразрядная последовательность имеет больше различных значений ¾ 00, 01, 10, 11, ¾ чем одноразрядная. Трехразрядная последовательность имеет также вдвое больше значений ¾ 000, 001, 010, 011, 100, 110, 101, 111, ¾ чем двухразрядная, и т. Д.

Для представления графической информации в двоичной форме используется так называемый поточечный способ. Поступают таким образом. На первом этапе вертикальными и горизонтальными линиями делят рассматриваемое изображение, например, на квадратики или пиксели (“точки”). Чем больше при этом получилось квадратиков, тем точнее будет передана информация о рассматриваемой картине. После этого необходимо записать в двоичной форме информацию о каждом из квадратиков. Как известно из физики, любой цвет может быть представлен в виде суммы различной яркости зеленого, синего и красного цветов. Любой цвет характеризуется тем, сколько в нем долей красного, зеленого и синего цветов. Поэтому информация о каждой клетке должна содержать следующие сведения: номер клетки, яркость ее зеленого цвета, яркость ее синего цвета, яркость ее красного цвета.

Итак, любое графическое изображение на экране можно закодировать с помощью чисел, сообщив, сколько в каждом пикселе долей красного, сколько ¾ долей зеленого и сколько ¾ долей синего.