Тысячи путей ведут в заблуждению, к истине – только один.
Часть 1. Кодирование текстовой информации. Кодировки ASCII, Unicode, КОИ-8
Что нужно знать:
- Принцип кодирования текстовой информации;
- Единицы измерения информации;
- Как находить информационный объем текстов и сообщений.
Примеры заданий:
Задание 1.
Определите информационный объем текста:
Бамбарбия! Кергуду!
Задание 2. Считая, что каждый символ кодируется одним байтом, определите, чему равен информационный объем следующего высказывания Жан-Жака Руссо: |
Тысячи путей ведут в заблуждению, к истине – только один.
А) 92 бита; | Б) 220 бит; | В) 456 бит; | Г) 512 бит. |
Задание 3.
В кодировке Unicode на каждый символ отводится два байта. Определите информационный объем слова из 24 символов в этой кодировке.
А) 384 бита; | Б) 192 бита; | В) 256 бит; | Г) 48 бит. |
Задание 4.
Реферат, набранный на компьютере, содержит 16 страниц, на каждой странице 50 строк, в каждой строке 64 символа. Для кодирования символов используется кодировка Unicode, при которой каждый символ кодируется 16 битами. Определите информационный объем реферата.
А) 320 байт; | Б) 100 Кбайт; | В) 128 Кбайт; | Г) 1 Мбайт. |
Теоретические сведения:
Множество используемых в тексте символов называют алфавитом (буквы, цифры, знаки препинания и другие специальные знаки). У алфавита есть размер – мощность алфавита (N).
Все символы кодируются одинаковым числом бит. Чаще всего используются кодировки, в которых на один символ отводится 8 бит (ASCII, КОИ-8) или 16 бит (Unicode).
Основные единицы измерения информации:
1 байт = 8 бит
1 Килобайт = 1024 байта
1 Мегабайт = 1024 Килобайта
1 Гигабайт = 1024 Мегабайта.
Чтобы найти информационный объем текста (сообщения) нужно умножить количество символов на число бит на символ.
I = N * K
I – информационный объем текста (сообщения);
N – количество символов в тексте (сообщении);
K – число бит на символ.
Решение примеров заданий:
Задание 1. Определите информационный объем текста:
Бамбарбия! Кергуду!
А) 38 бит; | Б) 144 бита; | В) 152 бита; | Г) 19 бит. |
Решение:
1. Подсчитать количество символов в сообщении. В этом тексте 19 символов (обязательно считать пробелы и знаки препинания).
2. Если нет дополнительной информации, считаем, что используется 8-битная кодировка – поэтому в сообщении 19 * 8 = 152 бита информации (1 символ 8 бит, всего 19 символов).
Ответ: В.
Задание 2.
Считая, что каждый символ кодируется одним байтом, определите, чему равен информационный объем следующего высказывания Жан-Жака Руссо:
Тысячи путей ведут в заблуждению, к истине – только один.
А) 92 бита; | Б) 220 бит; | В) 456 бит; | Г) 512 бит. |
Решение:
1. Подсчитать количество символов в сообщении. В этом тексте 57 символов (обязательно считать пробелы и знаки препинания).
2. Известно, что один символ – 1 байт, следовательно весь текст – 57 байт или 57*8 = 456 бит (в одной байте 8 бит).
Ответ: В.
Задание 3.
В кодировке Unicode на каждый символ отводится два байта. Определите информационный объем слова из 24 символов в этой кодировке.
А) 384 бита; | Б) 192 бита; | В) 256 бит; | Г) 48 бит. |
Решение:
1. В слове 24 символа, один символ – 2 байта, следовательно информационный объем слова 24 * 2 = 48 байт, или 48 * 8 = 384 бита (в одном байте 8 бит).
Ответ: А.
Задание 4.
Реферат, набранный на компьютере, содержит 16 страниц, на каждой странице 50 строк, в каждой строке 64 символа. Для кодирования символов используется кодировка Unicode, при которой каждый символ кодируется 16 битами. Определите информационный объем реферата.
А) 320 байт; | Б) 100 Кбайт; | В) 128 Кбайт; | Г) 1 Мбайт. |
Решение:
1. Подсчитать количество символов в реферате: 16*50*64 = 51200 символов в реферате.
2. 1 символ – 16 бит или 2 байта (1 байт = 8 битам, 16 бит – 2 байта), значит в реферате 51200 * 2 = 102 400 байт.
3. 102 400 / 1024 (в одном Кбайте – 1024 байт) = 100 Кбайт.
Ответ: Б.
ЗАДАНИЯ ДЛЯ САМОСТОЯТЕЛЬНОГО ВЫПОЛНЕНИЯ:
№1.Считая, что каждый символ кодируется одним байтом, определите, чему равен информационный объем следующего высказывания Алексея Толстого: