Внутримашинное информационное обеспечение

Под внутримашинным ИО понимают систему специальным образом организованных данных, подлежащих автоматизированной обработке, накоплению, хранению, поиску, передаче в виде, удобном для восприятия техническими средствами. Это могут быть информационные файлы, базы данных, базы знаний, хранилища данных и их системы (рис. 12).

Рис. 12. Компоненты внутримашинного ИО

Организация ВИО зависит от:

1. Информационных характеристик предприятия;

2. Состава решаемых задач;

3. Методов их решения;

4. Возможностей программных средств;

5. Организации массивов (файлов);

6. используемых технических средств.

Поскольку внутримашинное информационное обеспечение – это внемашинное информационное обеспечение, перенесенное в память компьютера, содержательно элементы этих видов соответствуют друг другу.

ОСНОВНЫЕ СПОСОБЫ ОРГАНИЗАЦИИ ВНУТРИМАШИННОГО ОБЕСПЕЧЕНИЯ:

1. ФАЙЛОВАЯ ОРГАНИЗАЦИЯ ДАННЫХ. Каждый программный продукт работал с одним или несколькими файлами данных, структура которых находились в прямой зависимости от приложений. При этом любые изменения в структуре данных были возможны только при условии соответствующего изменения приложений; информация, содержащаяся в файлах данных, в большинстве случаев оказывалась недоступной для других программных средств.

В целом такую организацию программного и информационного обеспечения можно представить в виде схемы:

На схеме видно, что некоторые приложения могут использовать одни и те же файлы данных; в других случаях требуется специальная программа-конвертер для преобразования данных из одного формата в другой, доступный для использования другим программным средством. Каждое из приложений хранит внутри себя описание используемых данных.

Недостатки такой организации:

1. Зависимость данных от приложений. Файлы данных жестко привязаны к программному обеспечению. Использование их возможно только вместе с соответствующими приложениями. Это ограничивает сферу использования данных (они не могут использоваться в тех узлах вычислительной системы, где не установлено соответствующее программное обеспечение) и ограничены возможности обработки информации из-за заложенных алгоритмов в программе, а разработка нового программного обеспечения на базе существующих файлов затруднено, так как описания данных и их структуры хранятся внутри программы.

2. Трудоемкость внесения изменений. Любые изменения в структуре информации требуют соответствующего изменения программного обеспечения, то есть, фактически, включают этап дополнительного программирования. Это ставит пользователя в зависимость от разработчиков программного обеспечения и в значительной мере увеличивает затраты на поддержание работоспособности автоматизированной информационной системы. Положение еще более усложняется, если одни и те же файлы используются несколькими приложениями - в этом случае потребуется переработка всех связанных программных средств.

3. Избыточность информации и дублирование данных. Разные программные средства могут использовать одну и ту же информацию, например, нормативно-справочные данные. Но, поскольку каждое приложение использует файлы данных собственного формата, приходится дублировать эту информацию для каждой из использующих программ. Это, с одной стороны, увеличивает непроизводительные затраты на хранение и использование излишней информации, с другой стороны, увеличивает расходы на программирование, поскольку в различных программах повторяются одни и те же процедуры обработки данных. Наконец, это приводит к дополнительным трудовым и материальным затратам при внесении любых изменений в данные, так как эту процедуру приходится повторять для каждого из приложений.

4. Разобщение данных. Файлы данных, используемые разными приложениями, не связаны или только частично связаны между собой. Это зачастую приводит к невозможности получить полную картину состояния предметной области, серьезным затруднениям при решении экономических задач, требующих работы с данными разных программ. Кроме того, это может вызывать временную или постоянную противоречивость данных, нарушение их целостности.

5. Неоперативность информации. Дублирование, переработка большого числа файлов, отсутствие целостности приводит к значительному снижению оперативности всей информационной системы.

Эти недостатки предопределили появление других способов организации внутримашинного ИО.

2. ОРГАНИЗАЦИЯ ИНФОРМАЦИОННОЙ БАЗЫ В ВИДЕ БАЗЫ ДАННЫХ. Базу данных можно представить как совокупность взаимосвязанной информации,она включает не только сами данные, но и взаимосвязи между ними. Одной из главных идей базы данных является совместное хранение данных с их описаниями. Благодаря этому хранимые данные становятся понятными для любого числа приложений, работающих с базой. Это делает базу данных самостоятельным информационным ресурсом, который может многократно использоваться различными приложениями, оставаясь при этом независимым от них.

Т.о. база данных представляет собой некий информационный ресурс структурированных данных, предназначенный для многоцелевого, многократного их использования в конкретных предметных областях.

Преимущества организации внутримашинного ИО в виде баз данных:

1. Сокращение избыточности хранимых данных за счет снижения до минимума объема дублируемых данных;

2. Устранение противоречивости хранимых данных;

3. Возможность использования данных оптимальным образом для множества приложений;

4. Обеспечение удобства доступа к данным;

5. Независимость данных от прикладных программ.

3. БАЗЫ ЗНАНИЙ – это знания человека, представленные в памяти компьютера в соответствии с какой-либо моделью. Базы знаний помимо данных о предметной области, содержат еще и правила их использования для принятия управленческих решений. На основе баз знаний разрабатываются экспертные системы. Особенностью баз знаний по сравнению с базами данных является выработка решений. В экспертных системах накапливаются и обрабатываются знания — высшая форма информации.

4.ХРАНИЛИЩЕ ДАННЫХ (ХД).В основе концепции хранилища данных лежат две основные идеи – интеграция разъединенных детализированных данных в едином хранилище и разделение наборов данных и приложений, используемых для оперативной обработки и применяемых для решения задач анализа. Определение понятия хранилище данных первым дал Г. Уильям Инмон в своей монографии «Построение хранилищ данных». В ней он определил хранилище данных как «предметно-ориентированную, интегрированную, содержащую исторические данные, не разрушаемую совокупность данных, предназначенную для поддержки принятия управленческих решений»

(DW – Data Warehouse) –это многомерная база данных, содержащая данные, агрегированные по многим измерениям. Данные из DW никогда не удаляются; пополнение происходит на периодической основе. При этом автоматически формируются новые агрегаты данных, зависящие от старых. Доступ к DW организован особым образом на основе модели многомерного куба (гиперкуба).

В обиходе термином «куб» обозначают фигуру с тремя измерениями, однако теоретически куб может иметь любое число измерений, на практике – от 4 до 12.

Хранилища данныхпредназначены для многолетнего оперативного многомерного анализа данных, результаты которого могут быть использованы для принятия решений. (Рис. 13).

Рис. 13. Трехмерный куб хранилища данных

Основные требования, предъявляемые к данным в ХД:

1. Предметная ориентированность. Все данные о некотором предмете (бизнес-объекте) собираются (обычно из множества различных источников), очищаются, согласовываются, дополняются, агрегируются и представляются в единой, удобной для их использования в бизнес-анализе форме.

2. Интегрированность. Все данные о разных бизнес-объектах взаимно согласованы и хранятся в едином хранилище.

3. Неизменяемость. Исходные (исторические) данные, после того как они были согласованы и внесены в хранилище данных, остаются неизменными (не обновляются) и используются исключительно в режиме чтения.

4. Поддержка хронологии. Данные хронологически структурированы и отражают историю за достаточный (10-15 лет) период времени. Пополнение ХД происходит на периодической основе. При этом автоматически формируются новые агрегаты данных, зависящие от старых.

Данные, которые в ХД подразделяют на детальные, агрегированныеи метаданные.

Детальными данными являются данные, переносимые непосредственно из оперативных источников данных. Принято разделять все данные на измерения и факты. Измерениями называются наборы данных, необходимые для описания событий (например, города, люди, товары и т. п.). Фактами называются данные, отражающие сущность события (например, количество проданного товара, результаты эксперимента и т. п.). На основании детальных данных могут быть получены агрегированныеданные, которые хранятся в ХД и используются при выполнении аналитических запросов. Эти данные получают путем суммирования числовых фактических данных по определенным измерениям.

Для удобства работы с ХД необходима информация о содержащихся в нем данных. Такая информация называется метаданными(данные о данных).