Преимущества банков данных

Классификация СУБД

Классификация баз данных

Классификация банков данных

Банки данных, как целое, обычно классифицируют по экономико-правовым признакам:

1. По условиям предоставления услуг различают бесплатные и платные (коммерческие и бесприбыльные (научные, библиотечные или социально-значимые)) БнД.

Бесприбыльные БД функционируют на принципе самоокупаемости и не ставят своей целью получения прибыли.

Основной целью создания коммерческих БнД является получение прибыли от информационной деятельности.

2. По форме собственности БнД делятся на государственные и негосударственные(частные, групповые, личные).

3. По степени доступности различают общедоступные и с ограниченным кругом пользователей.

4. По охвату предметной области БнД могут классифицироваться в разных «разрезах»:

- территориальный (всемирный, страна, город и т.д.);

- временной (год, месяц, с начала века и т.п.);

- ведомственный;

- проблемный (тематический).

5. По характеру взаимодействия с пользователем БнД делятся на активные и пассивные. В пассивных БнД ведущая роль принадлежит пользователю. В активных – система может самостоятельно менять поведение.

Другие виды классификации связаны с отдельными компонентами БнД. Рассмотрим далее классификацию БнД по виду базы данных и по типу СУБД.

Классификация баз данных представлена на рис. 3.1.

1. По форме представления информации различают визуальные и аудио системы, а также системы мультимедиа. Эта классификация показывает, в каком виде информация хранится в БД и выдается пользователям: в виде изображения (символьный текст, рисунки, чертежи, фотографии и т.д.), звука или дается возможность использования разных форм отображения информации.

2. По характеру структуризации данных БД могут быть разделены на неструктурированные(например, семантические сети), частично структурированные(например, БД в виде обычного текста или гипертекстовые системы) и структурированные.

3. Структурированные БД по типу используемой моделиданных делятся на иерархические, сетевые, реляционные, смешанныеи мультимодельные. Развитие технологий обработки данных привело к появлению постреляционных, объектно-реляционных или гибридных, объектно-ориентированных, многомерных БД.

4. По характеру данных БД делятся на документальные и лексикографические. Среди документальных баз различают библиографические, реферативные и полнотекстовые.

К лексикографическим БД относятся различные словари, классификаторы, рубрикаторы и т. д. Они обычно используются в качестве справочных совместно с документальными или фактографическими БД.

В документальных БД единицей хранения является документ (например, текст закона или статьи). Поиск и выдача документов происходит по их содержанию. Простейший метод поиска базируется на использовании дескрипторов – ключевых слов из проблемной области, характеризующих содержание документа. Их совокупность, выделенная из запроса, сопоставляется с дескрипторами документа («поисковым образцом»). В ответ на запрос пользователя выдается либо ссылка на документ, либо сам документ, в котором он может найти интересующую его информацию.

В системах фактографического типа в БД хранится информация об интересующих пользователя объектах предметной области в виде «фактов» (например, биографические данные о сотрудниках, данные о выпуске продукции производителями и т.п.). В ответ на запрос пользователя выдается требуемая ему информация или сообщение о том, что искомая информация отсутствует в БД.

5. По характеру организации хранения данных и обращения к ним различают локальные (персональные), общие (интегрированные, централизованные) и распределенные БД.

Персональная БД – это БД, предназначенная для локального использования одним пользователем.

Интегрированные и распределенныеБД предполагают возможность одновременного обращения нескольких пользователей к одной и той же информации (многопользовательский, параллельный режим доступа).

В статических БД частота обновления данных много ниже частоты их считывания. Данные напрямую не связаны со временем. Например, анкетные данные, которые используются гораздо чаще, чем изменяются.

В последнее время все чаще обращаются к динамическим БД, в которых частоты считывания и обновления данных соизмеримы. В динамических БД время выступает явно в виде понятий момента времени (дата) или интервала времени (семестр, месяц, год). Например, данные об успеваемости студентов групп за время обучения (по семестрам). Для таких БД более характерно не изменение, а добавление данных.

6. По характеру преобладающей обработки информации различают OLTP - системы (On-Line Transaction Processing) –системы оперативной обработки транзакций (реализуют большое число достаточно простых запросов) и OLAP – системы (On-Line Analytical Processing)системы аналитической обработки данных (реализуют сложную аналитическую обработку данных) или системы поддержки принятия стратегических решений (СППР).

До середины 90-х годов ХХ в. под БД понимали статические БД (OLTP). К середине 90-х годов в БД класса OLTP скопилось столько хронологической информации, что объем БД резко возрос, а быстродействие начало падать. Например, в работе деканата чаще всего требуются детальные данные о текущем учебном годе. В то же время в БД хранятся ретроспективные данные и за предыдущие годы. Такие данные необходимы значительно реже и чаще всего в агрегированном виде. Например, выдать фамилии студентов, которые три последних семестра получали только отличные оценки.

7. По охвату предметной области. Отдельные БД могут объединять все данные, необходимые для решения одной или нескольких прикладных задач, или данные, относящиеся к какой-либо предметной области (например, финансам, студентам, преподавателям и т.п.). Первые обычно называют прикладными БД, а вторые - предметными БД (соотносящимся с предметами организации, а не с ее информационными приложениями).

Предметные БД позволяют обеспечить поддержку любых текущих и будущих приложений, поскольку набор их элементов данных включает в себя наборы элементов данных прикладных БД. Вследствие этого предметные БД создают основу для обработки неформализованных, изменяющихся и неизвестных запросов и приложений (приложений, для которых невозможно заранее определить требования к данным). Такая гибкость и приспособляемость позволяет создавать на основе предметных БД достаточно стабильные информационные системы, т.е. системы, в которых большинство изменений можно осуществить без вынужденного переписывания старых приложений.

Основывая же проектирование БД на текущих и предвидимых приложениях, можно существенно ускорить создание высокоэффективной информационной системы, т.е. системы, структура которой учитывает наиболее часто встречающиеся пути доступа к данным. Поэтому прикладное проектирование до сих пор привлекает некоторых разработчиков. Однако по мере роста числа приложений таких информационных систем быстро увеличивается число прикладных БД, резко возрастает уровень дублирования данных и повышается стоимость их ведения.

Таким образом, каждый из рассмотренных подходов к проектированию воздействует на результаты проектирования в разных направлениях. Желание достичь и гибкости, и эффективности привело к формированию методологии проектирования, использующей как предметный, так и прикладной подходы. В общем случае предметный подход используется для построения первоначальной информационной структуры, а прикладной - для ее совершенствования с целью повышения эффективности обработки данных.

Сведем представленную выше классификацию БД в единую схему (рис. 3.1):


 

Классификационный признак
Операционные (OLTP)

Форма представления
Вид данных
Структуризация данных
Модель данных
Характер данных
Изменение данных
Распределение данных
Количество пользователей
Характер хранения

рис. 3.1. Классификация баз данных.

1. По языкам общения СУБД делятся на открытые (используют универсальные языки программирования), замкнутые (собственные языки общения с пользователями).

2. По выполняемым функциям СУБД делятся на информационные и операционные. Информационные СУБД позволяют организовать хранение информации и доступ к ней. Операционные СУБД выполняют достаточно сложную обработку, например, автоматически позволяют получать агрегированные показатели, не хранящиеся непосредственно в БД, и т.д.

3. По сфере возможного применения различают универсальные и специализированные, обычно проблемно-ориентированные СУБД.

4. По «мощности» СУБД делятся на настольные и корпоративные.Характерными чертами настольных СУБД являются сравнительно невысокие требования к техническим средствам, ориентация на конечного пользователя, низкая стоимость.

Корпоративные СУБД обеспечивают работу в распределенной среде, высокую производительность, поддержку коллективной работы при проектировании систем, имеют развитые средства администрирования и более широкие возможности поддержания целостности. Эти системы сложны, дороги, требуют значительных вычислительных ресурсов.

5. По ориентации на преобладающую категорию пользователей можно выделить СУБД для разработчиков и для конечных пользователей.

Системы, ориентированные на разработчиков, должны:

- иметь качественные компиляторы;

- позволять создавать «отчуждаемые» программные продукты;

- обладать развитыми средствами отладки;

- включать средства документирования проекта;

- обладать возможностями, позволяющими создавать эффективные сложные системы.

Основными требованиями, предъявляемыми к системам, ориентированным на конечного пользователя, являются:

- удобство интерфейса;

- высокий уровень языковых средств;

- наличие интеллектуальных модулей подсказок;

- повышенная защита от непреднамеренных ошибок («защита от дурака») и т. д.

Основные требования, предъявляемые к БнД, выявили ряд преимуществ, способствующих широкому распространению этих систем. Рассмотрим эти преимущества:

1. Адекватность отображения предметной области:

a. Минимальное дублирование информации (интегрированность данных). Наличие функции контроля за избыточностью данных.

b. Полнота, целостность и непротиворечивость данных.

c. Актуальность информации, т. е. ее соответствие состоянию отображаемой реальной системы на данный момент времени.

d. Независимость данных от процесса обработки.

e. Хранение взаимосвязанных данных, что наиболее полно отражает сложную взаимосвязь объектов реальной предметной области.

f. Содержание большего объема полезной информации при том же объеме хранимых данных.

2. Возможность взаимодействия пользователей разных категорий, высокая эффективность доступа к данным.

3. Оперативность обработки запросов, поиск информации по произвольной совокупности признаков.

4. Дружелюбность интерфейсов, малое время на обучение.

5. Применение стандартов.

6. Повышение эффективности с ростом масштабов системы.

7. Возможность нахождения компромисса при противоречивых требованиях.

8. Надежность хранения и защита данных:

a. Защита данных от случайного и преднамеренного разрушения.

b. Обеспечение секретности и разграничение доступа к данным для разных пользователей.

c. Возможность быстрого и полного восстановления данных в случае их разрушения.

9. Упрощение сопровождения системы за счет независимости от данных.

10. Улучшенное управление параллельностью.