Хранилища данных

Хранилища данных — это предметно-ориентированные, интегрированные, стабильные, поддерживающие хронологию наборы данных, используемые для поддержки принятия управленческих решений.

Данные поступают в хранилище из оперативных (трансакционных) систем и внешних источников. По аналогии с «материальными» хранилища данных предусматривают операции сбора данных (приход материалов на склад), хранения (складской запас), перемещения в витрины данных (отгрузка товаров в розничную сеть). С экономической точки зрения хранилище данных дает долгосрочный эффект, становится надежным механизмом доставки данных, существенных для анализа и принятия решений.

Высокая стоимость проектов создания хранилищ данных объясняется, прежде всего, необходимостью сбора, преобразования и обобщения данных из различных источников. При всей своей необходимости эта работа достаточно трудоемка и занимает много времени. Неоправданных затрат можно избежать на этапе проектирования хранилища в результате определения состава и структуры загружаемых в хранилище данных. Наиболее распространенные ошибки — недостаточное внимание к качеству хранимых данных, превалирование технологических соображений над экономическими.

В процессе проектирования хранилища очень сложно добиться сбалансированной структуры, т.е. определить, какие данные будут полезны для аналитика и менеджера, а какие нет. Большое значение имеют способ размещения данных в хранилище, а также процессы идентификации, анализа и преобразования данных перед их загрузкой в хранилище.

В качестве основы хранилища данных используют реляционную модель хранения данных, что существенно облегчает дальнейшее развитие такого хранилища. Однако существуют хранилища данных, реализованные с помощью применения оптимизированных структур, например многомерных, но такой подход имеет ряд недостатков (он не достаточно гибкий и универсальный). Если данные из хранилища поступают лишь в ограниченное количество витрин данных и аналитических приложений, то хранилище не должно поддерживать специализированные запросы. В этом случае использование реляционных баз данных экономичнее (без потери функциональности), следовательно, предпочтительнее.

После построения хранилища решают вопрос об использовании данных конечными пользователями. Для этого можно применять различные средства (от специализированных средств создания пользовательских запросов и отчетов до электронных таблиц) в зависимости от поставленных задач, предпочтений и опыта пользователей.

Таким образом, задача превращения разрозненных данных в структурированную информацию, которая описана в экономических терминах и обеспечивает поддержку принятия управленческих решений, — одна из самых актуальных. При этом обработка данных и принятие решений должны быть настолько оперативными, насколько этого требуют интересы бизнеса. Именно для этого предназначены специальные системы аналитической обработки данных в режиме реального времени — OLAP-системы, которые находят все большое применение в системах корпоративного управления.