МЕТОДОЛОГИЯ ОРГАНИЗАЦИИ БАЗ ДАННЫХ

В области обработки информации на ЭВМ можно выделить две основных разновидности: числовая и нечисловая. Современная фоннеймановская архитектура ЭВМ ориентирована на числовую обработку, в связи с чем существует семантический разрыв с современными языками программирования.

Данные - в числовой и нечисловой обработке это разные понятия. Во-первых, данные как объекты, отличные от команд. Во-вторых, в контексте отдельной программы, входные данные. В-третьих, нечто отличное от текста, речи, изображений. В последнем случае отличительным признаком является высокая форматированность данных. Три уровня представления данных о реальном объекте.

1-й уровень - концептуальный, связан с частным представлением данных группы пользователей в виде внешней схемы, объединяемых общностью используемой информации. Каждый конкретный пользователь работает с частью БД и представляет ее в виде внешней модели. Характеризуется разнообразием используемых моделей (модель “сущность - связь” (ER-модель, модель Чена), бинарные и инфологические модели, семантические сети). Концептуальные модели подробно изложены в кн. Цикритзис Д., Лоховски Ф. Модели данных. М:.Финансы и статистика, 1985г.

2-й уровень - логический, является обобщенным представлением данных всех пользователей в абстрактной форме. Используется три вида моделей: иерархические, сетевые и реляционные.

Сетевая модель является моделью объектов-связей, допускающей только бинарные связи “многие к одному” и использует для описания модель ориентированных графов.

Иерархическая модель является разновидностью сетевой, являющейся совокупностью деревьев (лесом).

Реляционная модель использует представление данных в виде таблиц (реляций), в основе лежит математическое понятие теоретико-множественного отношения, базируется на реляционной алгебре и теории отношений.

3-й уровень - физический (внутренний), связан со способом фактического хранения данных в физической памяти ЭВМ. Во многом определяется конкретным типом СУБД.

Основные проблемы физической организации: зависимость данных, жесткость, статичность, отсутствие интеграции, дублирование данных, противоречивость, невозможность совместного использования, неэффективность, невозможность обработки нетипичных запросов.

Термин “база данных” (БД) обозначает способ организации данных, и в отличие от другого способа, файловых структур, БД содержит не только сами данные, но и их описания, а также связи между ними.

БД используются обычно не самостоятельно, а являются компонентой различных информационных систем: банков данных, информационно-поисковых и экспертных систем, систем автоматизированного проектирования, автоматизированных рабочих мест и др.

На рис.1 представлена многоуровневая структура системы баз данных.