Свойства данных

Свойства данных, информации и знаний

Раздел 1. Свойства информации, мера информации, носители информации

ТЕМА 1 ИНФОРМАЦИЯ, ИНФОРМАЦИОННАЯ БЕЗОПАСНОСТЬ

ОСНОВНЫЕ ОПРЕДЕЛЕНИЯ

 

МАССА АВТОМОБИЛЯ - величина веса автомобиля. Подразделяется на собственную и полную.

Собственная - масса автомобиля в снаряженном состоянии без нагрузки. Слагается из сухой массы топлива, охлаждающей жидкости, запасного колеса (колес), инструмента, принадлежностей и обязательного оборудования.

Полная - масса снаряженного транспортного средства с грузом, водителем и пассажирами, установленная предприятием-изготовителем в качестве максимально допустимой.

 

ЕДИНИЦЫ ИЗМЕРЕНИЯ ДАВЛЕНИЯ:

Паскаль — единица измерения давления (механического напряжения) в СИ.

Паскаль равен давлению (механическому напряжению), вызываемому силой, равной одному ньютону, равномерно распределённой по нормальной к ней поверхности площадью один квадратный метр;

 

Бар — внесистемная единица измерения давления, примерно равная одной атмосфере. Один бар равен 105 Н/м² (ГОСТ 7664-61) или 106 дин/см² (в системе СГС);

 

Миллиметр ртутного столба — внесистемная единица измерения давления, равная 101 325 / 760 ≈ 133,322 368 4 Па; иногда называется „торр“ (русское обозначение — торр, международное — Torr) в честь Эванджелиста Торричелли;

 

Атмосфера — внесистемная единица измерения давления, приблизительно равная атмосферному давлению на поверхности Земли на уровне Мирового океана.

Существуют две примерно равные друг другу единицы с таким названием:

1. Стандартная, нормальная или физическая атмосфера (атм, atm) — в точности равна 101 325 Па или 760 миллиметрам ртутного столба. Давление, уравновешиваемое столбом ртути высотой 760 мм при 0 °C, плотность ртути 13595,1 кг/м³ и нормальное ускорение свободного падения 9,80665 м/с².

2. Техническая атмосфера (ат, at, кгс/см²) — равна давлению, производимому силой 1 кгс, направленной перпендикулярно и равномерно распределённой по плоской поверхности площадью 1 см² (98 066,5 Па). В техническом жаргоне используют синоним «килограмм», подразумевая силу давления.

 

Содержание

1.7. Свойства данных, информации и знаний

1.8. Носители и источники информации

1.9. Классификация информации в правовой системе

Далее обсудим свойства информации, выступающей в разных видах, которые существенно характеризуют возможности ее использования для подготовки и принятия решений.

Репрезентативность данных(или представительность) означает способность собранных данных адекватно отобразить свойства описываемого ими явления. Важное значение здесь имеют:

• правильный отбор объектов для сбора данных

• определение набора существенных признаков для измерения; ' достаточное количество объектов;

соответствие данных формулировке задачи, для решения которой осуществляется сбор данных.

Именно репрезентативность данных во многом определяет, насколько пригодной для подготовки и принятия решения будет полученная после обработки этих данных информация. Как мы знаем, информация появляется после того, как сформулирована задача, для решения которой существующие данные отбираются, обрабатываются и представляются — уже в виде информации.

Точность данных, принято выделять:

• формальную точность, измеряемую значением единицы последнего разряда числа;

• реальную точность, измеряемую значением единицы последнего разряда, достоверность которого гарантируется;

• максимальную, или достижимую, точность, которая может быть получена при конкретных условиях сбора данных;

• необходимую точность, определяемую требованиями задачи, для решения которой данные собираются.

Достоверности данных— это способность представлять описываемые объекты с заданной по условиям решаемой задачи точностью. Проблема достоверности экономических данных — одна из главных, определяющих целесообразность внедрения информационных систем: достоверность — это ключевой показатель данных. Существует известный принцип Джайгоу (Gigo principle): «Полезная информация не может быть получена из некачественных данных». На практике достоверность определяется погрешностью данных, на которую влияют также следующие факторы:

• точность измерения данных;

• методика измерения или расчета;

• полученные искажения, вносимые в данные на разных этапах информационного процесса заинтересованными лицами.

В случае когда погрешность полностью определяется факторами, степень влияния которых можно оценить (как, например, точность данных), такие данные еще называют надежными. Ясно, что данные, которые могут быть сознательно искажены в чьих-то интересах, не являются надежными и делают автоматизацию информационного процесса с их использованием бессмысленной. Теперь можно сформулировать понятие «хорошие данные» — это репрезентативные, точные и надежные данные. Наличие хороших данных — необходимое условие получения полезной информации, т.е. такой, которую можно объективно рекомендовать использованию для принятия решения.

Свойства информации - достоверность, полнота, актуальность, своевременность, адекватность, доступность, избыточность, полезность

Определим своего рода потребительские свойства, которые характеризуют полезную информацию, отличие от данных, которые более соответствуют синтаксическому аспекту рассмотрения информации, допускающему формальные количественные оценки, информация как таковая нас интересует прежде всего в семантическом, содержательном аспекте. Это означает, что мы должны будем использовать для оценки порой субъективные или качественные факторы. Два из них — актуальность и своевременность информации — зависят от времени.

Достоверность информации. Под достоверностью информации понимается ее соответствие объективной реальности (как текущей, так и прошедшей) окружающего мира.

Полнота информации. Под полнотой информации понимается ее достаточность для принятия решения.

Актуальность информации.Актуальность — это степень соответствия информации текущему моменту времени. Нередко с актуальностью, как и с полнотой, связывают коммерческую ценность информации. Поскольку информационные процессы растянуты во времени, то достоверная и адекватная, но устаревшая информация может приводить к ошибочным решениям. Необходимость поиска (или разработки) адекватного метода для работы с данными может приводить к такой задержке в получении информации, что она становится неактуальной и ненужной. На этом, в частности, основаны многие современные системы шифрования данных и механизмы электронной подписи. Лица, не владеющие ключом (методом) для чтения данных, могут заняться поиском ключа, поскольку алгоритм метода обычно доступен, но продолжительность этого поиска столь велика, что за время работы информация теряет актуальность и, соответственно, связанную с ней практическую ценность.

Своевременность информацииозначает, что она получена в нужный момент принятия решения, без опоздания. Информация, поступившая после принятия решения, скорее всего, не нужна. С другой стороны, не всякая заблаговременность предоставления информации хороша: может быть утрачена ее актуальность.

Адекватность информации- понимают степень соответствия информации, полученной потребителем, тому, что автор вложил в ее содержание.

Доступность информации — это мера возможности получить ту или иную информацию за определенный период времени. На степень доступности информации влияют одновременно как доступность данных, так и доступность адекватных методов для их интерпретации. Отсутствие доступа к данным или отсутствие адекватных методов обработки данных приводят к одинаковому результату: информация оказывается недоступной.

Полезность информации - степень необходимости информационного объекта для данного субъекта.

Избыточность информации. Если необходим информационный подобъект, но он является неотъемлемой частью большого информационного объекта, то передается весь объект. Так, например, чтобы осознать пару-тройку глубоких философских истин, нужно прочитать целую книгу.

Отметим, что между информацией и данными находятся методы обработки, превращающие данные в информацию. Если эти методы адекватны, т.е. выбраны правильно и применены верно к «хорошим» данным, тогда свойства данных можно перенести и на информацию: например, говорить о точной и надежной информации.

Свойства знаний.

Как мы знаем, знания формируются из обработанной информации, используемой и уже использовавшейся для принятия решений, так что положительные свойства и данных, и информации в знаниях молчаливо предполагаются. Поэтому знания характеризуются свойствами несколько иного типа.

Знания могут существовать в следующих видах:

• предметный или конкретный, использующий информацию из конкретной области, — это методики принятия решений для конкретно поставленной задачи (например, как спилить дерево, как обработать древесину, как сделать лодку и весла, как плыть на лодке по реке и т.д.);

• концептуальный, или обобщающий, использующий информацию из многих областей и определяющий, как извлекать знания из информации, — это методологии (например, принципы кораблестроения, землеведения, управления компаниями и т.д.);

• метазнания (знания о знаниях) — генерируют новые знания.

Примеры метазнаний в конкретной области:

химия — таблица Менделеева, предсказавшая появление новых химических элементов;

генетика — теория гомологических рядов Н.И. Вавилова, предсказывающая наличие растений с данными свойствами в конкретном районе;

физика — теория цепных реакций Н.Н. Семенова, объясняющая происхождение химических или ядерных реакций, в результате которых появляются энергия или новые продукты, способные продолжать цепную реакцию;

• обобщающие, или концептуальные, метазнания — это теория научных заключений, выводов;

• метаметазнания — философия науки.

Знания могут выступать как интеллектуальный капитал и как институциональный регулятор. В качестве институционального регулятора конкретные знания выступают в виде множества существующих документов — решений, правил, стандартов, законов, кодексов и т.п., регулирующих конкретную деятельность компании, отрасли и взаимодействие между ними. В этом случае обобщающие, или концептуальные, знания — это сформулированные принципы законотворчества, правила создания регламентирующих документов. Метазнания в институциональной среде — это законы об исполнении и исправлении действующих законов.

Подобно данным информация и знания также могут существовать в структурированном и неструктурированном видах. Сообщение, содержащее структурированную информацию, появляется в виде решения поставленной задачи обработки данных, представленного в соответствии с заданной формой либо стандартом. Эта форма или стандарт определяется возможным использованием информации в последующем принятии решения и его документальном оформлении. Неструктурированная информация появляется из сообщения, выраженного в свободной форме: устной, письменной, графической и т.д. На основе неструктурированной информации можно принимать решения, но ее нельзя использовать для автоматической обработки. Структурированные знания фиксированы, формируют интеллектуальный капитал и существуют в виде публикаций, документов, стандартов. Неструктурированные знания — это знания, содержащиеся в квалификации специалистов; по существу, это неосязаемый интеллектуальный капитал компании. Искусство управления компанией во многом определяется умением менеджеров создать среду, которая может стимулировать работников максимально использовать накопленные знания.

Существуют также всем известные «неписаные законы», формулируемые группами людей, объединенных по какому-либо признаку: религиозному, этническому, криминальному и т.п. Кеннет Эрроу отмечает, что такие группы формируют так называемые «невидимые институты» (invisible institutions), которые могут «врастать» в официальную институциональную инфраструктуру. В результате такой деятельности могут появляться и «писаные» законы, отражающие интересы не государства или компании, а именно этих групп.

Подведем некоторые итоги. Чрезвычайно сложно определить информацию вообще. Более продуктивно рассматривать ее как единство трех разновидностей: данных, собственно информации и знаний.

Далеко не всегда можно получить точную оценку меры информации. Семиотический подход наиболее продуктивен при попытке определения метрик информации. Наиболее простая мера — количество информации описывается строгим соотношением Шеннона только в случае синтаксического или технологического подхода. Информация в семантическом и прагматическом аспектах не имеет объективной меры.