Кодирование данных

Для цифрового представления текстовых данных (символов) используются кодовые таблицы, в которых каждой букве, цифре или служебным знакам соответствует какой-либо код – десятичное число в диапазоне от 0 до 255. Таким образом, можно закодировать 256 символов, поскольку каждый символ – это 8 разрядов, то число возможных перестановок равно 2⁸=256.

Международным стандартом для персональных компьютеров с 1981 г. принята таблица ASCII (American Standard Code for Information Interchange), в которой кодируется ровно половина символов от 0 до 127.

Вторая половина не определена американским стандартом и предназначена для размещения символов национальных алфавитов (в частности кириллицы), псевдографических символов и некоторых математических знаков.

Таким образом, кодовая таблица ASCII состоит из основного стандарта и расширенного стандарта, который для различных операционных систем может различаться.

Основной стандарт (см. таблицу 7) содержит десятичные коды от 0 до 127 (или шестнадцатеричные коды 00 – 7F), расширенный (см. таблицу 8)– десятичные коды от 128 до 255 (или шестнадцатеричные коды 8F – FF).

Таблица 7 – основной стандарт ASCII

Основной стандарт
Цифры, знаки	Буквы латинского алфавита

Таблица 8 – расширенный стандарт ASCII

Расширенный стандарт DOS	Расширенный стандарт Win
Буквы национальных алфавитов	Символы псевдографики	Символы псевдографики	Буквы национальных алфавитов

Например, "0" – соответствует десятичному коду 00, "." – соответствует десятичному коду 46, латинская буква "А" – соответствует десятичному коду – 65, строчная буква "q" – соответствует десятичному коду 113.

Основной стандарт является общепринятым в мире, а расширенный в зависимости от операционной системы может меняться, поэтому для кодирования русских букв существуют и другие кодовые таблицы, например КОИ8-Р (код для обмена информацией), Windows-1251, ГОСТ-альтернативная.

Отсутствие единого стандарта приводило к большим проблемам (например, при передаче сообщений электронной почты). Решить эту задачу можно лишь при переходе на 16-разрядное кодирование.

Ведущими фирмами предложена новая система кодировки символов Unicode (Universal Code), в которой каждый символ кодируется не одним, а двумя байтами. Он позволяет закодировать 2¹⁶=65536 символов, которых достаточно для кодирования всех национальных алфавитов в одной таблице. Несмотря на то, что объем информации увеличивается вдвое, современный уровень технических средств позволяет сгладить этот недостаток.

Для цифрового представления графической информациииспользуют два способа: растровый и векторный. Растровые изображения представляют собой однослойную сетку точек, называемых пикселями (pixel, от англ. picture element). Код каждого пикселя содержит информацию о его цвете.

Для черно-белого изображения (без полутонов) пиксель может принимать только два значения: белый и черный (светится экран или не светится), а для его кодирования достаточно одного бита: 1 - белый цвет, 0 — черный.

На цветном экране пиксель может иметь различную окраску, поэтому одного бита уже недостаточно. Цветные изображения кодируются тремя числами — яркостью красной, зелёной и синей составляющих цвета. Этот способ кодирования называетсяRGB (Red—Green—Blue). Его используют в устройствах, способных излучать свет (мониторы).

В отличие от растровой графики векторное изображение представляет собой совокупность не светящихся точек, а ряда графических элементов (линий, прямоугольников, эллипсов, фрагментов текста), каждый из которых описывается с помощью специального языка кодирования (математических уравнений линий и окружностей и т.п.). Этот способ кодирования идеально подходит для рисунков, составленных из отдельных фигур (например, технических чертежей, диаграмм, блок-схем). Преимущество векторной графики заключается в том, что форму, цвет и пространственное положение составляющих ее объектов можно описать с помощью достаточно простых математических формул, что облегчает манипуляции с ними в программах редактирования графики.

Кодирование звукаосновано на его преобразовании в электрические сигналы (например, с помощью микрофона или другой звукозаписывающей аппаратуры) с последующим представлением в виде последовательности двоичных чисел. Для этого измеряют напряжение записанных сигналов через равные (очень короткие) промежутки времени, и полученные значения заносят в память компьютера. Этот процесс называется дискретизацией (или оцифровкой), а устройство, выполняющее его – аналого-цифровым преобразователем (АЦП).

Чтобы воспроизвести закодированный таким образом звук, нужно выполнить обратное преобразование (для этого используют цифро-аналоговый преобразователь – ЦАП), а затем сгладить получившийся ступенчатый сигнал.

Контрольные вопросы:

1. Дать определение науке Информатика

2. Назвать три взаимосвязанные части информатики

3. Что такое новые информационные технологии, их разновидности?

4. Что такое информация? Какой эквивалентный термин используется в информатике?

5. Какие типы данных Вы знаете?

6. В какой системе счисления кодируются данные в ЭВМ?

7. Изучите таблицу соответствия кодов десятичных, шестнадцатеричных и двоичных цифр.

8. Каковы правила выполнения арифметических операций над двоичными числами?

9. Перечислите логические операции в порядке приоритета их выполнения.

10. В каких единицах измеряется компьютерная информация?

11. Сколько символов можно закодировать в Кодовой таблице?

12. Чем отличается новая система кодировки символов Unicode от предыдущих?

13.Какие способы используются для представления графической информации? Что такое RGB?

14. На чем основано кодирование звука?