Информационные потоки данных в хранилище
В технологии хранилищ данных можно выделить пять основных информационных потоков данных.
Входной поток представляет процессы извлечения, очистки и загрузки исходных данных в хранилище. Поступающие данные в хранилище подвергаются перестройке в соответствии с определенными требованиями. Перестройка может включать следующие действия:
• очистку данных;
• преобразование данных;
• проверку внутренней непротиворечивости данных и их непротиворечивости по отношению к данным хранилища.
Сложность процесса извлечения информации зависит от степени согласованности между различными источниками информации.
Восходящий поток связан повышением ценности сохраняемых в хранилище данных и включает следующие процессы:
• обобщение данных посредством, как реляционных операций, так и проведения сложного статистического анализа данных для получения удобных и полезных для пользователя представлений информации;
• упаковку данных с преобразованием в более удобный формат представления (электронные таблицы, диаграммы и многое другое);
• распределение исходных данных на соответствующие группы для повышения их подготовленности к использованию и доступности.
Нисходящий поток определяет архивирование и резервное копирование данных. Нисходящий поток включает также процедуры, обеспечивающие возможность восстановления текущего состояния хранилища в случае потери данных после сбоев в программном или аппаратном обеспечении.
Выходной поток — предоставление данных пользователям. Для его формирования
пользователю должна предоставляться среда с эффективно работающими инструментами,
позволяющими создавать разнообразные запросы, обеспечивая доступ к наиболее подходящим данным хранилища. Данный поток может содержать и публикации различных объектов, которые доставляются по рассылке на рабочие станции конечным пользователям.
Метапоток определяет управление метаданными. Он связан с перемещением самих
метаданных. Поскольку метаданные содержат описание информации хранилища данных, которое со временем меняется, то и сам метапоток должен соответственно обновляться во времени.