Этапы создания базы данных
Если определить понятие "база данных" как реализованное с помощью вычислительной техники структурированое хранилище информации, представляющее собой информационную модель объекта, процесса или явления, то вполне понятным становятся три уровня представления данных – уровень пользователя (предметная область), логический (конкретная форма представления данных) и физический (конкретная среда хранения данных).
Соответственно, процесс проектирования БД включает в себя следующие основные этапы
§ Информационно-логическое (инфологическое) проектирование
§ Выбор СУБД
§ Логическое проектирование БД (иногда этот этап называется даталогическим проектированием)
Инфологическое проектирование. Модель "сущность-связь"
Инфологический подход не содержит формальных способов моделирования реальности. Первой задачей инфологического проектирования является определение предметной области БД, позволяющее изучить информационные потребности будущих пользователей. Другая задача этого этапа – анализ предметной области, который призван сформировать взгляд на неё с позиций сообщества будущих пользователей БД, т.е. инфологической модели предметной области.
Таким образом, инфологическая модель предметной области включает описание структуры и динамики предметной области, характера информационных потребностей пользователей системы. Описание выполняется в терминах, понятных пользователю и независимых от реализации системы. Это описание называют концептуальной (инфологической) моделью данных, которая отражает предметную область в виде совокупности информационных объектов и структуры связей между ними.
Обратите внимание: инфологическая модель предметной области не должна зависеть от модели данных, которая будет использована при создании БД. Такая модель полностью независима от среды хранения данных.
Существуют разные подходы к инфологическому проектированию. Рассмотрим основные из них.
§ Функциональный подход к проектированию БД.
Этот метод реализует принцип "от задач" и применяется в том случае, когда известны функции некоторой группы лиц и/или комплекса задач, для обслуживания информационных потребностей которых создаётся рассматриваемая БД.
§ Предметный подход к проектированию БД.
Предметный подход применяется в тех случаях, когда у разработчиков есть чёткое представление о самой предметной области и о том, какую именно информацию они хотели бы хранить в БД, а структура запросов не определена или определена не полностью. Тогда основное внимание уделяется исследованию предметной области и наиболее адекватному её отображению в БД с учётом самого широкого спектра информационных запросов к ней.
§ Проектирование с использованием метода "сущность–связь".
Метод "сущность–связь" (Entity–Relation, ER–method) был разработан в 1976 г. П.Ченом (Chen P.P.). Он является комбинацией двух предыдущих и обладает достоинствами обоих.
ER-метод является наиболее распространённым методом проектирования БД. Для его реализации в предметной области необходимо выделить
§ сущности – любой различимый (отличный от другого) предмет, явление, событие, факт или личность информацию о котором необходимо хранить в БД. Так например, сущностями могут быть люди, города, автомобили, заявки, заказы, изобретения, покупки, продажи и т.д.
Необходимо различать такие понятия как тип сущности и экземпляр сущности. Тип сущности относится к совокупности однородных объектов, а экземпляр – это конкретный представитель данной совокупности. Например, типом сущности может быть ФРУКТ, а экземпляром – ЯБЛОКО, АПЕЛЬСИН, СЛИВА.
Сущности, существование которых не зависит от существования других сущностей, называются базовыми, остальные сущности – зависимыми. Например, сущность ОЦЕНКА зависит от базовых сущностей УЧЕНИК, ДИСЦИПЛИНА.
§ атрибуты – поименованные характеристики (свойства) сущности, значимые для рассматриваемой предметной области. Это любая информация, которая служит для идентификации, классификации, числовой характеристики или выражения состояния сущности. Атрибуты используются для определения того, какая информация должна быть собрана о сущности. Примерами атрибутов для сущности АВТОМОБИЛЬ являются ТИП, МАРКА, НОМЕРНОЙ ЗНАК, ЦВЕТ и т.д. Наименование атрибута должно быть уникальным для конкретного типа сущности, но может быть одинаковым для различного типа сущностей. Например, ЦВЕТ может быть определен для многих сущностей: СОБАКА, АВТОМОБИЛЬ, ДЫМ и т.д. Как и для сущностей здесь также существует различие между типом и экземпляром. Тип атрибута ЦВЕТ имеет много экземпляров (значений) – КРАСНЫЙ, СИНИЙ, БАНАНОВЫЙ, БЕЛАЯ НОЧЬ, однако каждому экземпляру сущности присваивается только одно значение атрибута. Спецификация атрибута состоит из его названия, типа данных и описания ограничений целостности – множества значений, которые может принимать данный атрибут.
Минимальный набор атрибутов, по значениям которых можно однозначно идентифицировать требуемый экземпляр сущности, называется ключом. Минимальность означает, что исключение из набора любого атрибута не позволяет идентифицировать сущность по оставшимся. Для сущности РАСПИСАНИЕ ключом является атрибут НОМЕР_РЕЙСА или набор: ПУНКТ_ОТПРАВЛЕНИЯ, ВРЕМЯ_ВЫПОЛНЕНИЯ и ПУНКТ_НАЗНАЧЕНИЯ.
§ связи – осмысленные ассоциации (соединения) между сущностями, при которых экземпляру одной сущности ставится в соответствие экземпляр другой сущности. Например, СТУДЕНТ учится в ГРУППЕ, ВОДИТЕЛЬ выполняет РЕЙС.
Необходимость устанавливать связи объясняется одним из основных требований к организации базы данных – обеспечить возможность отыскания одних сущностей по значениям атрибутов других.
В зависимости от количества экземпляров каждого типа ассоциированых между собой сущностей, например, А и Б возможны три вида связей:
§ "Один-к-одному" (1:1): в каждый момент времени каждому представителю (экземпляру) сущности А соответствует 1 или 0 представителей сущности Б. Например, студент может не получать стипендию, получать обычную или одну из повышенных стипендий. (рис.1.1)
§ "Один-ко-многим" (1:М): одному представителю сущности А соответствуют 0, 1 или несколько представителей сущности Б. Например, квартира может пустовать, в ней может жить один или несколько жильцов. (рис.1.2)
§ "Многие-ко-многим" (М:М): 0, 1 или нескольким представителям сущности А соответствует 0, 1 или несколько представителей сущности Б. Например, покупатели приобретают товары.
Характер связей между сущностями не ограничивается перечисленными. Существуют и более сложные связи:
§ множество связей между одними и теми же сущностями. Например, пациент, имея одного лечащего врача, может иметь также несколько врачей-консультантов; врач может быть лечащим врачом нескольких пациентов и может одновременно консультировать несколько других пациентов. (рис.2.а)
§ тренарные связи. Например, врач может назначить несколько пациентов на несколько анализов, анализ может быть назначен несколькими врачами нескольким пациентам и пациент может быть назначен на несколько анализов несколькими врачами. (рис.2.б)
Нередко при построении концептуальной модели выполняется такая операция как агрегация (объединение), что позволяет рассматривать сложный вид связи между элементами как новый элемент. Например, связь экзаменовать между сущностями ДИСЦИПЛИНА, ПРЕПОДАВАТЕЛЬ, СТУДЕНТ может быть представлена агрегированной сущностью ЭКЗАМЕН с атрибутами НАЗВАНИЕ ДИСЦИПЛИНЫ, ФАМИЛИЯ ПРЕПОДАВАТЕЛЯ, ФАМИЛИЯ СТУДЕНТА, ОЦЕНКА.
При построении инфологических моделей можно использовать язык ER-диаграмм. В нем предлагалось изображать сущности помеченными прямоугольниками, связи – помеченными ромбами, атрибуты – помеченными овалами. Над линиями, соединяющими прямоугольники, может проставляться степень связи (1 или буква М, заменяющая слово "много") и необходимое пояснение.
При таком способе отображения примеры различных типов связей будут иметь вид представленый на рис.1,2. Для повышения иллюстративности рассматриваемых связей в приведенных примерах не показаны атрибуты сущностей.
рис.1.1 рис.1.2
рис.2