КОНЦЕПТУАЛЬНАЯ ОРГАНИЗАЦИЯ ДАННЫХ
Рис.4
Этап расчленения БД связан с разбиением ее на разделы и синтезом различных приложений на основе модели. Основными факторами, определяющими методику расчленения, помимо указанных на рис.4 являются: размер каждого раздела (допустимые размеры); модели и частоты использования приложений; структурная совместимость; факторы производительности БД. Связь между разделом БД и приложениями характеризуется идентификатором типа приложения, идентификатором узла сети, частотой использования приложения и его моделью.
Модели приложений могут быть классифицированы следующим образом:
1. Приложения, использующие единственный файл.
2. Приложения, использующие несколько файлов, в том числе:
· допускающие независимую параллельную обработку;
· допускающие синхронизированную обработку.
Сложность реализации этапа размещения БД определяется многовариантностью. Поэтому на практике рекомендуется в первую очередь рассмотреть возможность использования определенных допущений, упрощающих функции СУРБД, например, допустимость временного рассогласования БД, осуществление процедуры обновления БД из одного узла и др. Такие допущения оказывают большое влияние на выбор СУРБД и рассматриваемую фазу проектирования.
Средства проектирования и оценочные критерии используются на всех стадиях разработки. Любой метод проектирования (аналитический, эвристический, процедурный), реализованный в виде программы, становятся инструментальным средством проектирования практически не подверженным влиянию стиля проектирования.
В настоящее время неопределенность при выборе критериев являются наиболее слабым местом в проектировании БД. Это связано с трудностью описания и идентификации бесконечного числа альтернативных решений. При этом следует иметь в виду, что существует много признаков оптимальности, являющихся неизмеримыми свойствами, которые трудно выразить в количественном представлении или в виде целевой функции. Поэтому оценочные критерии принято делить на количественные и качественные. Наиболее часто используемые критерии оценки БД, сгруппированные в такие категории, представлены ниже.
Количественные критерии: время ответа на запрос, стоимость модификации, стоимость памяти, время на создание, стоимость на реорганизацию.
Качественные критерии: гибкость, адаптивность, доступность для новых пользователей, совместимость с другими системами, возможность конвертирования в другую вычислительную среду, возможность восстановления, возможность распределения и расширения.
Трудность в оценке проектных решений связана также с различной чувствительностью и временем действия критериев. Например, критерий эффективности обычно является краткосрочным и чрезвычайно чувствительным к проводимыми изменениям, а такие понятия, как адаптируемость и конвертируемость, проявляются на длительных временных интервалах и менее чувствительны к воздействию внешней среды.
Информационные требования оказывают наиболее существенное воздействие на этап концептуального проектирования, хотя проходят через весь процесс разработки БД. Принято разделять информационные требования на информацию, формирующую концептуальное структурное представление и информацию, формирующую концептуальное прикладное представление.
Информация типа описывает естественные концептуальные связи всех данных, не связана с конкретным способом обработки и конкретным приложением. - информация отображает объекты реального мира в сущности и атрибуты, а взаимосвязи между объектами - во взаимосвязи между элементами данных.
Этап концептуального проектирования является специфическим, так как здесь требуется одновременно знание особенностей предметной области и методологии проектирования. Характерным является использование различных моделей (модель “сущность - связь”, бинарные модели данных, семантически сети, инфологические модели данных и др.). Отрицательным моментом является неадекватность получаемых результатов как при использовании различных моделей, так и в рамках коллектива исполнителей.
Одной из распространенных моделей является модель “сущность - связь” (entity - relationship), в литературе наряду с этим используется термин “ER - модель” или “модель Чена”. Базовыми структурами в ER - модели являются “типы сущностей” и “типы связей”.
Отличие от типа связи от типа сущности - в установлении зависимости существования реализации одного типа от существования реализации другого.
Пример: ЛИЧНОСТЬ - тип сущности, тип СОСТОИТ В БРАКЕ - нет, т.к. реализация последнего типа не существует, если не существует двух личностей. Поэтому, тип связи может рассматриваться как агрегат двух или более типов сущностей.
ER-модель может быть представлена ER-диаграммой (ERD) состоящей из следующих элементов.
Выделяют три типа связи: связь “один к одному” (1:1), связь “один ко многим” (1:M), связь “многие ко многим” (M:N).
Примеры этих связей: 1:1
больной койка M:1
больной палата M:N
больной врач
Выделение этих связей является крайне важным, т.к. связи 1:M и M:N имеют внутреннюю неопределенность, что сказывается при операциях модификации. Для преодоления неопределенности на этапе реализации логической модели требуется вводить избыточную информацию.
Рассмотрим фрагмент концептуальной модели предметной области “Больница”(рис.5).
1 N
Больница
Е
Больничная штатные больнич.
палата врачи лаборатории
N N M
Палата Врач Лаборатория
Персональ- Размеще- Паци- Направ-
ные пала- ние ент врача ленный ана-
ты лиз
N N M N
Персонал Пациент Анализ
1 1 N
ID ID
диагноз паци- анализ пациен-
та та
N
Диагноз
Рис.5
Следует отметить следующие возможности ER-модели:
а) рекурсивное множество связей
1 Руководитель
Управление
N Подчиненный
Рис.6
б) два множества связей между одними и теми же множествами сущностей
Лечащий
врач
1 N
N M
Консультант
Рис.7
в) множество n-арных связей, например тернарных
|
|
Лечащий
врач
M
|
Рис.8
Рассмотрим пример представления атрибутов для конкретного объекта.
Рис.9
Выделяют следующие типы атрибутов:
а) многозначный атрибут
N
Рис.10
б) атрибут множества связей
Размещение N койки
N
Рис.11
В общем случае атрибуты отображаются либо на самой ERD(в случае небольшого количества объектов), либо в виде отдельных приложений по каждому объекту.
При построении ER моделей в ряде случаев целесообразно выделять ряд ограничений:
а) ограничение целостности применительно к атрибутам
Например: N койки - целое, положительное, число коек - диапазон от 1 до 100
б) ограничение по существованию сущностей
Е
больничные
палаты
Рис.12
в) ID-зависимость
В ряде случаев сущность не может быть идентифицирована по значениям собственных атрибутов
ID
Диагноз па-
циента
Рис.13
Кратко остановимся на других моделях.
Бинарные модели - это графовая модель, в которой вершины являются представлениями простых однозначных атрибутов, а дуги - представлениями бинарных отношений между атрибутами. Граф бинарной модели может рассматриваться как структура дуальная табличной структуре.