OLAP-технология и хранилище данных (ХД). Отличия ХД от базы данных. Классификация ХД. Технологические решения ХД. Программное обеспечение для разработки ХД.

OLAP (on-line analytical processing) — набор технологий для оперативной обработки информации, включающих динамическое построение отчётов в различных разрезах, анализ данных, мониторинг и прогнозирование ключевых показателей бизнеса. В основе OLAP-технологий лежит представление информации в виде OLAP-кубов.

Хранилище данных — предметно-ориентированная информационная база данных, специально разработанная и предназначенная для подготовки отчётов и бизнес-анализа с целью поддержки принятия решений в организации. Строится на базе систем управления базами данных и систем поддержки принятия решений. Данные, поступающие в хранилище данных, как правило, доступны только для чтения. Данные из OLTP-системы копируются в хранилище данных таким образом, чтобы построение отчётов и OLAP-анализ не использовал ресурсы транзакционной системы и не нарушал её стабильность.

Отличия: База данных

1. Предназначена для выполнения повседневной работы

2. Используется для онлайн обработки транзакций (OLTP), но могут быть использованы для других целей, таких как хранилища данных. Она записывает данные от пользователя для истории.

3. Данные часто подвергаются изменениям

4. Столы и соединения являются сложными, так как они нормированы (для RDMS). Это делается, чтобы снизить избыточность данных и сэкономить место для хранения.

5. Entity - Реляционные методы моделирования используются для проектирования баз данных RDMS.

6. Оптимизирован для операции записи.

7. Производительность низкая для анализа запросов.

ХД:

1. Предназначено для принятия решений

2. Используется для Online Analytical Processing (OLAP). Об этом говорится в исторических данных для пользователей для бизнес-решений.

3. Данные относительно стабильны

4. Столы и присоединяется к просты, поскольку они являются де-нормализуется. Это делается для уменьшения времени отклика для аналитических запросов.

5. Данные - Моделирование методы используются для проектирования хранилищ данных.

6. Оптимизированы для операций чтения.

7. Высокая производительность для аналитических запросов.

БД обычно являются источником данных, попадающих в ХД

Типы ХД:

· Финансовых ХД - создают в первую очередь - не будут с точностью до одного пенни совпадать с информацией в существующей финансовой среде.

· ХД в области страхования за небольшими исключениями похожи на другие Хранилища: продолжительностью существования таких Хранилищ, а также разнообразием дат и продолжительностью экономического цикла.

· ХД для управления человеческими ресурсами отличаются от других Хранилищ тем, что для них характерна только одна основная предметная область.

· ХД с возможностями Data Mining и Exploration, которые используются для выполнения мощной статистической обработки данных, являются гибридом классических Хранилищ.

· Отличительная особенность ХД в области телекоммуникаций состоит в том, что они в значительной степени определяются данными, сгенерированными в одной предметной области.

Вне всяких сомнений, помимо них существуют и другие типы Хранилищ, каждому из которых присущи свои яркие отличительные особенности.