Кодирование данных
Для цифрового представления текстовых данных (символов) используются кодовые таблицы, в которых каждой букве, цифре или служебным знакам соответствует какой-либо код – десятичное число в диапазоне от 0 до 255. Таким образом, можно закодировать 256 символов, поскольку каждый символ – это 8 разрядов, то число возможных перестановок равно 28=256.
Международным стандартом для персональных компьютеров с 1981 г. принята таблица ASCII (American Standard Code for Information Interchange), в которой кодируется ровно половина символов от 0 до 127.
Вторая половина не определена американским стандартом и предназначена для размещения символов национальных алфавитов (в частности кириллицы), псевдографических символов и некоторых математических знаков.
Таким образом, кодовая таблица ASCII состоит из основного стандарта и расширенного стандарта, который для различных операционных систем может различаться.
Основной стандарт (см. таблицу 7) содержит десятичные коды от 0 до 127 (или шестнадцатеричные коды 00 – 7F), расширенный (см. таблицу 8)– десятичные коды от 128 до 255 (или шестнадцатеричные коды 8F – FF).
Таблица 7 – основной стандарт ASCII
Основной стандарт | |
Цифры, знаки | Буквы латинского алфавита |
Таблица 8 – расширенный стандарт ASCII
Расширенный стандарт DOS | Расширенный стандарт Win | ||
Буквы национальных алфавитов | Символы псевдографики | Символы псевдографики | Буквы национальных алфавитов |
Например, "0" – соответствует десятичному коду 00, "." – соответствует десятичному коду 46, латинская буква "А" – соответствует десятичному коду – 65, строчная буква "q" – соответствует десятичному коду 113.
Основной стандарт является общепринятым в мире, а расширенный в зависимости от операционной системы может меняться, поэтому для кодирования русских букв существуют и другие кодовые таблицы, например КОИ8-Р (код для обмена информацией), Windows-1251, ГОСТ-альтернативная.
Отсутствие единого стандарта приводило к большим проблемам (например, при передаче сообщений электронной почты). Решить эту задачу можно лишь при переходе на 16-разрядное кодирование.
Ведущими фирмами предложена новая система кодировки символов Unicode (Universal Code), в которой каждый символ кодируется не одним, а двумя байтами. Он позволяет закодировать 216=65536 символов, которых достаточно для кодирования всех национальных алфавитов в одной таблице. Несмотря на то, что объем информации увеличивается вдвое, современный уровень технических средств позволяет сгладить этот недостаток.
Для цифрового представления графической информациииспользуют два способа: растровый и векторный. Растровые изображения представляют собой однослойную сетку точек, называемых пикселями (pixel, от англ. picture element). Код каждого пикселя содержит информацию о его цвете.
Для черно-белого изображения (без полутонов) пиксель может принимать только два значения: белый и черный (светится экран или не светится), а для его кодирования достаточно одного бита: 1 - белый цвет, 0 — черный.
На цветном экране пиксель может иметь различную окраску, поэтому одного бита уже недостаточно. Цветные изображения кодируются тремя числами — яркостью красной, зелёной и синей составляющих цвета. Этот способ кодирования называетсяRGB (Red—Green—Blue). Его используют в устройствах, способных излучать свет (мониторы).
В отличие от растровой графики векторное изображение представляет собой совокупность не светящихся точек, а ряда графических элементов (линий, прямоугольников, эллипсов, фрагментов текста), каждый из которых описывается с помощью специального языка кодирования (математических уравнений линий и окружностей и т.п.). Этот способ кодирования идеально подходит для рисунков, составленных из отдельных фигур (например, технических чертежей, диаграмм, блок-схем). Преимущество векторной графики заключается в том, что форму, цвет и пространственное положение составляющих ее объектов можно описать с помощью достаточно простых математических формул, что облегчает манипуляции с ними в программах редактирования графики.
Кодирование звукаосновано на его преобразовании в электрические сигналы (например, с помощью микрофона или другой звукозаписывающей аппаратуры) с последующим представлением в виде последовательности двоичных чисел. Для этого измеряют напряжение записанных сигналов через равные (очень короткие) промежутки времени, и полученные значения заносят в память компьютера. Этот процесс называется дискретизацией (или оцифровкой), а устройство, выполняющее его – аналого-цифровым преобразователем (АЦП).
Чтобы воспроизвести закодированный таким образом звук, нужно выполнить обратное преобразование (для этого используют цифро-аналоговый преобразователь – ЦАП), а затем сгладить получившийся ступенчатый сигнал.
Контрольные вопросы:
1. Дать определение науке Информатика
2. Назвать три взаимосвязанные части информатики
3. Что такое новые информационные технологии, их разновидности?
4. Что такое информация? Какой эквивалентный термин используется в информатике?
5. Какие типы данных Вы знаете?
6. В какой системе счисления кодируются данные в ЭВМ?
7. Изучите таблицу соответствия кодов десятичных, шестнадцатеричных и двоичных цифр.
8. Каковы правила выполнения арифметических операций над двоичными числами?
9. Перечислите логические операции в порядке приоритета их выполнения.
10. В каких единицах измеряется компьютерная информация?
11. Сколько символов можно закодировать в Кодовой таблице?
12. Чем отличается новая система кодировки символов Unicode от предыдущих?
13.Какие способы используются для представления графической информации? Что такое RGB?
14. На чем основано кодирование звука?