Семантическая мера информации
Классификация информации
Понятия виды и свойства информации.
Основные сведения об информации
Информация - это совокупность каких-либо сведений, данных, передаваемых устно (в форме речи), письменно (в виде текста, таблиц, рисунков, чертежей, схем, условных обозначений) либо другим способом (например, с помощью звуковых или световых сигналов, электрических и нервных импульсов, запахов, вкусовых ощущений, перепадов давления или температуры и т. д.).
Сообщение— это совокупность знаков или первичных сигналов, отображающих ту или иную информацию. Например, текст электронного письма представляет собой совокупность таких знаков, как буквы, цифры, знаки препинания, специальные символы. Примерами сообщений являются: текст телеграммы, данные на выходе ЭВМ, речь, музыка.
Сигнал - физический процесс, несущий передаваемое сообщение.
Информация разнообразна и подразделяется: на научную, техническую, производственную, управленческую, экономическую, социальную, правовую и т.д.
Экономическая информация — совокупность сведений, отражающих социально-экономические процессы и служащих для управления этими процессами и коллективами людей в производственной и непроизводственной сфере.
Реквизит — логически неделимый информационный элемент, описывающий определенное свойство объекта, процесса, явления и т.п.
Рисунок 1 - Классификация информации, циркулирующей в организации
.
Свойства информации:
Массовость, объемность и динамичность - представляются неотъемлемыми свойствами информации в силу того, что любые изучаемые объекты, процессы, явления могут характеризоваться большим количеством разносторонних и изменяющихся во времени сведений.
Степень полезности информации выражается в ее адекватности, полноте, объективности, доступности, актуальности.
Адекватность информации - это степень ее соответствия реальному состоянию объекта; только адекватная информация позволяет выносить достоверные суждения.
Полнота информации характеризует ее достаточность для принятия тех или иных решений или для создания новых данных на основе уже имеющихся.
Объективность информации означает отсутствие искажений, вызванных особенностями воспринимающего ее субъекта. Она всегда относительна, поскольку полностью исключить такие искажения невозможно. Например, одни и те же события, зафиксированные в исторических документах разных стран и народов, выглядят по-разному.
Доступность информации определяется возможностью ее получения посредством применения стандартных процедур поиска.
Актуальность информации характеризует ее соответствие текущему моменту времени; она тесно связана со своевременностью поступления необходимых сведений.
1.2.2 Формы представления информации. Меры и единицы
количества и объема информации
Различают две формы представления информации — непрерывную (аналоговую) и прерывистую (цифровую, дискретную).
Непрерывная форма характеризует процесс, который не имеет перерывов и теоретически может изменяться в любой момент времени и на любую величину (например, речь человека, музыкальное произведение).
Цифровой сигнал может изменяться лишь в определенные моменты времени и принимать лишь заранее обусловленные значения (например, только значения напряжений 0 и 3,5 В).
Для преобразования аналогового сигнала в цифровой требуется провести дискретизацию непрерывного сигнала во времени, квантование по уровню, а затем кодирование отобранных значений.
Дискретизация - замена непрерывного (аналогового) сигнала последовательностью отдельных во времени отсчетов этого сигнала.
Разрешение— это количество уровней квантования, используемых для замены непрерывного аналогового сигнала цифровым сигналом. Восьмиразрядная выборка позволяет получить только 256 различных уровней квантования цифрового сигнала, а шестнадцатиразрядная выборка — 65 536 уровней.
Частота дискретизации — количество преобразований аналог-цифра (выборок), производимое устройством в одну секунду. Этот показатель измеряют килогерцами (килогерц — тысяча выборок в секунду). Типичное значение частоты дискретизации современных лазерных аудиодисков — 44,1 кГц.
Для измерения информации вводятся два параметра: количество информации I и объем данных Vд.
Эти параметры имеют разные выражения и интерпретацию в зависимости от рассматриваемой формы адекватности.
Адекватность информации — это определенный уровень соответствия создаваемого с помощью полученной информации образа реальному объекту, процессу, явлению и т.п.
Адекватность информации может выражаться в трех формах:
§ синтаксической,
§ семантической,
§ прагматической.
Синтаксическая адекватность. Она отображает формально-структурные характеристики информации и не затрагивает ее смыслового содержания. На синтаксическом уровне учитываются тип носителя и способ представления информации, скорость передачи и обработки, размеры кодов представления информации, надежность и точность преобразования этих кодов и т.п.
Информацию, рассматриваемую только с синтаксических позиций, обычно называют данными, так как при этом не имеет значения смысловая сторона. Эта форма способствует восприятию внешних структурных характеристик, т.е. синтаксической стороны информации.
Семантическая (смысловая) адекватность. Эта форма определяет степень соответствия образа объекта и самого объекта. Семантический аспект предполагает учет смыслового содержания информации. На этом уровне анализируются те сведения, которые отражает информация, рассматриваются смысловые связи. В информатике устанавливаются смысловые связи между кодами представления информации. Эта форма служит для формирования понятий и представлений, выявления смысла, содержания информации и ее обобщения.
Прагматическая (потребительская) адекватность. Она отражает отношение информации и ее потребителя, соответствие информации цели управления, которая на ее основе реализуется. Проявляются прагматические свойства информации только при наличии единства информации (объекта), пользователя и цели управления. Прагматический аспект рассмотрения связан с ценностью, полезностью использования информации при выработке потребителем решения для достижения своей цели. С этой точки зрения анализируются потребительские свойства информации. Эта форма адекватности непосредственно связана с практическим использованием информации, с соответствием ее целевой функции деятельности системы.
Каждой форме адекватности соответствует своя мера количества информации и объема данных
Рисунок 2- Меры информации
Синтаксическая мера информации -Эта мера количества информации оперирует с обезличенной информацией, не выражающей смыслового отношения к объекту.
Объем данных Vд в сообщении измеряется количеством символов (разрядов) в этом сообщении. В различных системах счисления один разряд имеет различный вес и соответственно меняется единица измерения данных:
§ в двоичной системе счисления единица измерения — бит (bit — binary digit — двоичный разряд);
§ в десятичной системе счисления единица измерения — дит (десятичный разряд).
Пример: Сообщение в двоичной системе в виде восьмиразрядного двоичного кода 10111011 имеет объем данных Vд = 8 бит. Сообщение в десятичной системе в виде шестиразрядного числа 275903 имеет объем данных Vд = 6 дит.
Количество информации I измеряется величиной, на которую уменьшается неопределённость состояния системы после получения сообщения.
Меру неопределённости системы называют энтропией (Н).
Н=log2N, где N – число возможных состояний системы.
Формула Хартли применяется в случаях, когда появление различных символов в сообщении равновероятно. Это бывает, например, при передаче по каналу связи результатов математических расчетов (набор цифр), криптографических ключей, паролей и т. п. Получение одного символа из N допустимых символов используемого алфавита дает потребителю такой объем информации:
/=log2N. Здесь N — число допустимых символов (знаков), которое отправитель может использовать при формировании своего сообщения.
Указанную величину можно трактовать как количество информации, приходящееся на один символ (знак) сообщения. Согласно формуле Хартли, количество информации, содержащейся в двоичном числе, равно количеству двоичных разрядов в этом числе. Один разряд двоичного числа позволяет сформировать два знака (символа): 0 и 1. Если N = 2, то I = 1 бит. Для восьмиразрядного числа N= 256, а объем информации, которую несет это число, = 8 бит = 1 байт.
Формула Хартли является частным случаем формулы Шеннона. Последняя формула используется при расчете энтропии в ситуациях, когда вероятности появления символов различны:
Здесь pi — вероятность появления /-го символа.
Для измерения смыслового содержания информации, т.е. ее количества на семантическом уровне, наибольшее признание получила тезаурусная мера, которая связывает семантические свойства информации со способностью пользователя принимать поступившее сообщение. Для этого используется понятие тезаурус пользователя.
Тезаурус— это совокупность сведений, которыми располагает пользователь или система.