Информационные потоки данных в хранилище

В технологии хранилищ данных можно выделить пять основных информационных потоков данных.

Входной поток представляет процессы извлечения, очистки и загрузки исходных данных в хранилище. Поступающие данные в хранилище подвергаются перестройке в соответствии с определенными требованиями. Перестройка может включать следующие действия:

• очистку данных;

• преобразование данных;

• проверку внутренней непротиворечивости данных и их непротиворечивости по отношению к данным хранилища.

Сложность процесса извлечения информации зависит от степени согласованности между различными источниками информации.

Восходящий поток связан повышением ценности сохраняемых в хранилище данных и включает следующие процессы:

• обобщение данных посредством, как реляционных операций, так и проведения сложного статистического анализа данных для получения удобных и полезных для пользователя представлений информации;

• упаковку данных с преобразованием в более удобный формат представления (электронные таблицы, диаграммы и многое другое);

• распределение исходных данных на соответствующие группы для повышения их подготовленности к использованию и доступности.

Нисходящий поток определяет архивирование и резервное копирование данных. Нисходящий поток включает также процедуры, обеспечивающие возможность восстановления текущего состояния хранилища в случае потери данных после сбоев в программном или аппаратном обеспечении.

Выходной поток — предоставление данных пользователям. Для его формирования

пользователю должна предоставляться среда с эффективно работающими инструментами,

позволяющими создавать разнообразные запросы, обеспечивая доступ к наиболее подходящим данным хранилища. Данный поток может содержать и публикации различных объектов, которые доставляются по рассылке на рабочие станции конечным пользователям.

Метапоток определяет управление метаданными. Он связан с перемещением самих

метаданных. Поскольку метаданные содержат описание информации хранилища данных, которое со временем меняется, то и сам метапоток должен соответственно обновляться во времени.