Информационное общество. Информационные революции.

Классификация информации по разным признакам

Система кодирования информации, классификация методов.

Системы классификации информации, основные идеи.

Важным понятием при работе с информацией является классификация объектов - система распределения объектов (предметов, явлений, процессов, понятий) по классам в соответствии с определенным признаком.

Под объектом понимается любой предмет, процесс, явление материального или нематериального свойства. Система классификации позволяет сгруппировать объекты и выделить определенные классы, которые будут характеризоваться рядом общих свойств. Классификация объектов - это процедура группировки на качественном уровне, направленная на выделение однородных свойств.

Применительно к информации как к объекту классификации выделенные классы называют информационными объектами.

Свойства информационного объекта определяются информационными параметрами, называемыми реквизитами. Реквизит - логически неделимый информационный элемент, описывающий определенное свойство объекта, процесса, явления и т.п. Реквизиты представляются либо числовыми данными, например вес, стоимость, год, либо признаками, например цвет, марка машины, фамилия.

Кроме выявления общих свойств информационного объекта классификация нужна для разработки правил (алгоритмов) и процедур обработки информации, представленной совокупностью реквизитов.

При классификации широко используются понятия классификационный признак и значение классификационного признака, которые позволяют установить сходство или различие объектов. Возможен подход к классификации с объединением этих двух понятий в одно, названное как признак классификации. Признак классификации имеет также синоним основание деления.

Разработка классификаторов является достаточно сложной задачей и проводится, как правило, в несколько этапов.

На 1-м этапе проводят исследования, определяющие исходное множество объектов, подлежащих классификации; выбор метода классификации и классификационных признаков, позволяющих упорядочить объекты в систему.

На 2-м этапе разрабатывается методика создания классификатора, содержащая состав и характеристику объектов классификации: описание и обоснование классификационных признаков и методов классификации и кодирования объектов, включаемых в классификатор; структура классификатора.

3-й этап - создание классификатора и программного обеспечения системы ведения классификатора: сбор исходных данных; установление полного перечня объектов классификации и упорядочение этих объектов в систему; разработка структуры и формирование базы данных классификатора; подготовка задания на создание системы ведения классификатора; оформление, согласование и утверждение классификатора.

И только 4-й этап - ввод в действие классификатора.

Разработаны три метода классификации объектов: иерархический, фасетный, дескрипторный. Эти методы различаются разной стратегией применения классификационных признаков.

Иерархическая система классификации строится следующим образом: исходное множество элементов составляет 0-й уровень и делится в зависимости от выбранного классификационного признака на классы (группировки), которые образуют 1-й уровень; каждый класс 1-го уровня в соответствии со своим, характерным для него классификационным признаком делится на подклассы, которые образуют 2-й уровень; каждый класс 2-го уровня аналогично делится на группы, которые образуют 3-й уровень, и т.д.

Учитывая достаточно жесткую процедуру построения структуры классификации, необходимо перед началом работы определить ее цель, т.е. какими свойствами должны обладать объединяемые в классы объекты. Эти свойства принимаются в дальнейшем за признаки.

В иерархической системе классификации каждый объект на любом уровне должен быть отнесен к одному классу, который характеризуется конкретным значением выбранно­го классификационного признака. Для последующей группировки в каждом новом классе необходимо задать свои классификационные признаки и их значения. Таким образом, выбор классификационных признаков будет зависеть от семантического содержания того класса, для которого необходима группировка на последующем уровне иерархии.

Количество уровней классификации, соответствующее числу признаков, выбранных в качестве основания деления, характеризует глубину классификации.

Достоинства иерархической системы классификации: простота построения; использование независимых классификационных признаков в различных ветвях иерархической структуры.

Недостатки иерархической системы классификации: жесткая структура, которая приводит к сложности внесения изменений, так как приходится перераспределять все классификационные группировки; невозможность группировать объекты по заранее не предусмотренным сочетаниям признаков.

Фасетная система классификации в отличие от иерархической позволяет выбирать признаки классификации независимо как друг от друга, так и от семантического содержания классифицируемого объекта. Признаки классификации называются фасетами и (facet - рамка). Каждый фасет (Фi) содержит совокупность однородных значений данного классификационного признака. Причем значения в фасете могут располагаться в произвольном порядке, хотя предпочтительнее их упорядочение.

Процедура классификации состоит в присвоении каждому объекту соответствующих значений из фасетов. При этом могут быть использованы не все фасеты. Для каждого объекта задается конкретная группировка фасетов структурной формулой, в которой отражается их порядок следования:

Кs = (Ф1, Ф2, …, Фi, …, Фп),

гдеФi-i-й фасет, п - количество фасетов.

При построении фасетной системы классификации необходимо, чтобы значения, используемые в различных фасетах, не повторялись. Фасетную систему легко можно модифицировать, внося изменения в конкретные значения любого фасета.

Достоинства фасетной системы классификации: возможность создания большой емкости классификации, т.е. использования большого числа признаков классификации и их значений для создания группировок; возможность простой модификации всей системы классификации без изменения структуры существующих группировок.

Недостатком фасетной системы классификации является сложность ее построения, так как необходимо учитывать все многообразие классификационных признаков.

Примером фасетной системы классификации является система регистрации преступных элементов, предложенная французским криминалистом Альфонсом Бертильоном. Бертильон делит всех людей на три группы - по длине черепа, каждая из трех групп делится на три подгруппы - по ширине черепа, дальнейшие деления - по размеру среднего пальца левой руки, размеру правого уха, росту, длине рук, высоте в сидячем положении, размеру стопы, длине локтевого сустава. Всего 19683 категории.

Для организации поиска информации, для ведения тезаурусов (словарей) эффективно используется дескрипторная(описательная) система классификации, язык которой приближается к естественному языку описания информационных объектов. Особенно широко она используется в библиотечной системе поиска.

Суть дескрипторного метода классификации заключается в следующем: отбирается совокупность ключевых слов или словосочетаний, описывающих определенную предметную область или совокупность однородных объектов. Причем среди ключевых слов могут находиться синонимы; выбранные ключевые слова и словосочетания подвергаются нормализации, т.е. из совокупности синонимов выбирается один или несколько наиболее употребимых; создается словарь дескрипторов, т.е. словарь ключевых слов и словосочетаний, отобранных в результате процедуры нормализации.

Система кодирования применяется для замены названия объекта на условное обозначение (код) в целях обеспечения удобной и более эффективной обработки информации.

Система кодирования - совокупность правил кодового обозначения объектов.

Код строится на базе алфавита, состоящего из букв, цифр и других символов. Код характеризуется: длиной - числом позиций в коде; структурой - порядком расположения в коде символов, используемых для обозначения классификационного признака.

При кодировании могут ставится разные цели и соответственно применяться разные методы. Наиболее распространенные цели кодирования - это экономность, т.е. уменьшение избыточности сообщения; повышение скорости передачи или обработки; надежность, т.е. защита от случайных искажений; сохранность, т.е. защита от случайного доступа к информации; удобство физической реализации (например, двоичное кодирование информации в ЭВМ); удобство восприятия.

Процедура присвоения объекту кодового обозначения называется кодированием.

Можно выделить две группы методов, используемых в системе кодирования, которые образуют: классификационную систему кодирования, ориентированную на проведение предварительной классификации объектов либо на основе иерархической системы, либо на основе фасетной системы; регистрационную систему кодирования, не требующую предварительной классификации объектов.

Классификационное кодирование применяется после проведения классификации объектов. Различают последовательное и параллельное кодирование.

Последовательное кодирование используется для иерархической классификационной структуры. Суть метода заключается в следующем: сначала записывается код старшей группировки 1-го уровня, затем код группировки 2-го уровня, затем код группировки 3-го уровня и т.д. В результате получается кодовая комбинация, каждый разряд которой содержит информацию о специфике выделенной группы на каждом уровне иерархической структуры. Последовательная система кодирования обладает теми же достоинствами и недостатками, что и иерархическая система классификации.

Параллельное кодирование используется для фасетной системы классификации. Суть метода заключается в следующем: все фасеты кодируются независимо друг от друга; для значений каждого фасета выделяется определенное количество разрядов кода. Параллельная система кодирования обладает теми же достоинствами и недостатками, что и фасетная система классификации.

Регистрационное кодирование используется для однозначной идентификации объектов и не требует предварительной классификации объектов. Различают порядковую и серийно-порядковую систему.

Порядковая система кодирования предполагает последовательную нумерацию объектов числами натурального ряда. Этот порядок может быть случайным или определяться после предварительного упорядочения объектов, например по алфавиту. Этот метод применяется в том случае, когда количество объектов невелико, например кодирование названий факультетов университета, кодирование студентов в учебной группе.

Серийно-порядковая система кодирования предусматривает предварительное выделение групп объектов, которые составляют серию, а затем в каждой серии производится порядковая нумерация объектов. Каждая серия также будет иметь порядковую нумерацию. По своей сути серийно-порядковая система является смешанной: классифицирующей и идентифицирующей. Применяется тогда, когда количество групп невелико.

Любая классификация всегда относительна. Один и тот же объект может быть классифицирован по разным признакам или критериям. Часто встречаются ситуации, когда в зависимости от условий внешней среды объект может быть отнесен к разным классификационным группировкам. Эти рассуждения особенно актуальны при классификации видов информации без учета ее предметной ориентации, так как она часто может быть использована в разных условиях, разными потребителями, для разных целей.

В основу классификации информации, циркулирующей в организации (фирме), может быть положено пять наиболее общих признаков: место возникновения, стадия обработки, способ отображения, стабильность, функция управления.

Место возникновения. По этому признаку информацию можно разделить на входную выходную, внутреннюю, внешнюю.

Входная информация - это информация, поступающая в фирму или ее подразделения.

Выходная информация - это информация, поступающая из фирмы в другую фирму, организацию (подразделение).

Одна и та же информация может являться входной для одной фирмы, а для другой, ее вырабатывающей, выходной. По отношению к объекту управления (фирма или ее подразделение: цех, отдел, лаборатория) информация может быть определена как внутренняя, так и внешняя.

Внутренняя информация возникает внутри объекта, внешняя информация - за пределами объекта.

Стадия обработки. По стадии обработки информация может быть первичной, вторичной, промежуточной, результатной.

Первичная информация - это информация, которая возникает непосредственно в процессе деятельности объекта и регистрируется на начальной стадии.

Вторичная информация - это информация, которая получается в результате обработки первичной информации и может быть промежуточной и результатной.

Промежуточная информация используется в качестве исходных данных для последующих расчетов.

Результатная информация получается в процессе обработки первичной и промежуточной информации и используется для выработки управленческих решений.

Способ отображения. По способу отображения информация подразделяется на текстовую и графическую.

Текстовая информация - это совокупность алфавитных, цифровых и специальных символов, с помощью которых представляется информация на физическом носителе (бумага, изображение на экране дисплея).

Графическая информация - это различного рода графики, диаграммы, схемы, рисунки и т.д.

Стабильность. По стабильности информация может быть переменной (текущей) и постоянной (условно-постоянной).

Переменная информация отражает фактические количественные и качественные характеристики производственно-хозяйственной деятельности фирмы. Она может меняться для каждого случая как по назначению, так и по количеству. Например, количество произведенной продукции за смену, еженедельные затраты на доставку сырья, количество исправных станков и т.п.

Постоянная (условно-постоянная) информация - это неизменная и многократно используемая в течение длительного периода времени информация. Постоянная информация может быть справочной, нормативной, плановой: постоянная справочная информация включает описание постоянных свойств объекта в виде устойчивых длительное время признаков; постоянная нормативная информация содержит местные, отраслевые и общегосударственные нормативы; постоянная плановая информация содержит многократно используемые в фирме плановые показатели.

Функция управления. По функциям управления обычно классифицируют экономическую информацию. При этом выделяют следующие группы: плановую, нормативно-справочную, учетную и оперативную (текущую).

Плановая информация - информация о параметрах объекта управления на будущий период. На эту информацию идет ориентация всей деятельности фирмы.

Нормативно-справочная информация содержит различные нормативные и справочные данные. Ее обновление происходит достаточно редко.

Учетная информация - это информация, которая характеризует деятельность фирмы за определенный прошлый период времени. На основании этой информации могут быть проведены следующие действия: скорректирована плановая информация, сделан анализ хозяйственной деятельности фирмы, приняты решения по более эффективному управлению работами и пр. На практике в качестве учетной информации может выступать информация бухгалтерского учета, статистическая информация и информация оперативного учета.

Оперативная (текущая) информация - это информация, используемая в оперативном управлении и характеризующая производственные процессы в текущий (данный) период времени. К оперативной информации предъявляются серьезные требования по скорости поступления и обработки, а также по степени ее достоверности. От того, насколько быстро и качественно проводится ее обработка, во многом зависит успех фирмы на рынке.

В истории развития цивилизации произошло несколько информационных революций (преобразование общественных отношений из-за кардинальных изменений в сфере обработки информации).

Информационные революции:

1-я - изобретение письменности (возможность передачи знаний) - пять-шесть тысяч лет назад в Месопотамии, затем - независимо, но несколько тысяч лет спустя - в Китае, и еще на 1.500 лет позднее - майя в Центральной Америке. Затем изобрели рукописную книгу - сначала в Китае, вероятно, около 1300 г. до н.э., а затем, независимо и 800 лет спустя, в Греции, когда афинский тиран Песистрат распорядился записать в книгу поэмы Гомера, до этого передававшиеся изустно. Эффект рукописной книги в Греции и Риме был огромным, равно как и в Китае. По сути, вся китайская цивилизация и система государственного устройства основаны именно на рукописной книге.

2-я (середина XVI века) - книгопечатание (изменение культуры организации деятельности) - произошла после изобретения Гуттенбергом печатного пресса и наборного шрифта между 1450 и 1455 годами, а также изобретения гравировки примерно в то же время.

За очень незначительное время революция в книгопечатании изменила институты общества, включая и систему образования. В последовавшие за ней десятилетия по всей Европе были созданы новые университеты, однако, в отличие от ранее существовавших, они не были рассчитаны на священнослужителей и изучение теологии. Они были построены для изучения светских дисциплин: права, медицины, математики, натуральной философии (естественных наук).

3-я (конец XIX века) - электричество (телеграф, телефон, радиопередача оперативная, накопление информации в любом объеме);

4-я (70 годы XX века) - микропроцессорная технология ® персональный компьютер.

Реальные схемы составляют компьютеры, компьютерные сети, информационные телекоммуникации (системы передачи данных).

Три достижения данного периода:

1. переход от механических и электрических средств преобразования информации к электронным;

2. миниатюризация всех узлов, устройств, приборов, машин;

3. создание программно-управляемых устройств и процессов.

23. Информатизация общества.

Образование больших объемов информации определяется:

1. Чрезвычайно быстрым ростом числа документов, докладов, отчетов, диссертаций и т.д., в которых излагаются результаты отчетно-конструкторских работ.

2. Постоянно увеличивается число периодических изданий по разным областям человеческой деятельности.

3. Появлением разнообразных метеорологических, медицинских и других данных записываемых на магнитные носители.

В результате возникает информационный кризис.

Его проявления:

1. Противоречия между ограниченными возможностями человека по восприятию и переработки информации и огромными потоками хранящейся информации (Пример: изменение суммы значений: к 1900 г. - удваивалось каждые 50 лет, к 1950 г. - каждые 10 лет, к 1970 г. каждые 5 лет, с 1990 - каждый год).

2. Существует большое количество избыточной информации в обществе, которая препятствует быстрому извлечению полезной информации;

3. Возникают социальные барьеры (экономические, политические и др.), которые препятствуют распространению информации (Пример: секретность информации).

Возникает парадокс: громадный информационный потенциал, накопленный в мире, но люди не могут им воспользоваться.

Возникла необходимость выхода общества из кризиса. Внедрение ЭВМ, других средств переработки и передачи информации в различные сферы деятельности, послужили началом нового эволюционного процесса в развитии человеческого общества, названного информатизацией.

Информатизация общества - организованный социально-экономический и научно-технический процесс создания оптимальных условий для удовлетворения информационных потребностей и реализации прав граждан, органов государственной власти, органов местного самоуправления, организации общественных объединений на основе формирования и использования информационных ресурсов.

Информационные ресурсы - это формализованные идеи и знания, различные идеи и знания, различные данные, методы и средства их накопления, хранения и обмена между источниками и потребителями информации.