Вопрос 2-2. Представление числовых и нечисловых данных в компьютере. Единицы измерения информации и объема данных

Для представления в компьютере объектов, их характеристик или исходов событий им ставятся в соответствие двоичные наборы длины, кратной 8. Этот процесс называют кодированием информации. Следует отметить, что ранее один из способов защиты информации (теперь шифрование) также называли кодированием.

Наиболее прост процесс кодирования неотрицательных целых чисел. Такому числу ставится в соответствие его запись в двоичной системе счисления, длина которой кратна 8 (при необходимости старшие разряды заполняются нулями). Располагая одним (двумя, четырьмя) байтом, можно закодировать числа от 0 до 255 (65535, 4294967295).

Символу (буква, цифра, специальный символ, знак пунктуации) ставится в соответствие число (код символа) согласно используемой при обработке информации таблице кодировки. Следует напомнить, что существует несколько таблиц кодировок.

При представлении целых чисел старший бит представления числа является знаковым. Если этот бит равен 1, то число отрицательное.

При представлении двоичного вещественного числа его записывают в виде М^х 2^Р, где 7₂ < \М\ < 1. Число М (число Р) называется мантиссой (порядком). Под мантиссу (порядок) отводят целое число байт. Число байт, отведенное под порядок (мантиссу), определяет диапазон (точность) представления числа.

Таким образом, внутри компьютера преобразование и хранение информации об объектах любой природы сводится к преобразованию и хранению двоичных наборов. Число компонент набора называется его длиной. Отметим, что число двоичных наборов длины п равно 2".

Единицей измерения информации является бит. Бит — это информация о

состоянии объекта с двумя равновероятными состояниями. Отметим, что определение количества информации в сообщении, как правило, является трудной задачей (надо знать вероятности событий). Например, количество информации в сообщении «Студент Иванов И.И. получил зачет по дисциплине "Информатика"» зависит от степени подготовленности Иванова И.И. и заданных ему вопросов.

При решении задач на компьютере обычно достаточно распознавать объекты и их характеристики. Это более простая задача.

При хранении и обработке информации в компьютере используются двоичные наборы длины, кратной 8. Это объясняется следующими соображениями: в настоящее время на компьютере обрабатывается в основном текстовая информация; число широко используемых символов (с учетом символов национальных алфавитов) превосходит 128 = 2⁷ и меньше 256 = 2⁸. В связи с этим следующей за битом единицей информации является байт. Байт — это информация о состоянии объекта с 256 равновероятными состояниями. Часто под битом понимают двоичный разряд, а под байтом — двоичный набор длины 8. Отметим, что байт, являясь наименьшей адресуемой единицей памяти компьютера (даже самого современного), есть единица объема данных.

Более крупными единицами информации и объема данных являются килобайт, мегабайт и гигабайт. Следует напомнить студентам причину, по которой переходной коэффициент равен 1024, а не 1000.