Аналитическая платформа Cognos 8 BI

В состав Cognos 8 BI входят следующие компоненты:

- Cognos Connection - Интернет-портал для предоставления единого доступа ко всем компонентам системы;

- Cognos Query - конструктор отчетов для бизнес-пользователей, позволяющий строить сводные отчеты с помощью визуальных методов;

- Cognos Report Studio - инструмент создания профессиональных многостраничных отчетов с произвольной структурой представления информации;

- Cognos Analysis Studio - инструмент анализа данных, представленных в различных OLAP-системах;

- Cognos Metrics Manager - инструмент предоставления оперативной информации о показателях эффективности деятельности (KPI) и построения на их основе взаимосвязанной системы показателей эффективности (Balanced Scorecard);

- Cognos Event Studio - система контроля значений выбранных пользователем показателей с возможностями автоматической рассылки уведомлений;

- Cognos BI OLAP Modeling - компонент для создания OLAP-источников данных;

- Cognos Framework Manager - инструмент объединения источников информации и построения на их основе "метамодели", предоставляемой пользователю;

- Cognos Decision Stream - инструмент построения алгоритмов извлечения и преобразования информации, предназначенный в первую очередь для построения хранилищ данных (ETL-средство).

При просмотре или создании отчета происходит обращение к источникам данных организации, а затем осуществляется последовательность операций, обеспечивающая достижение тех или иных целей бизнес-анализа. На рис. 2.21 приведена диаграмма действий, которые выполняются при использовании Cognos/

В Framework Manager разработчик моделей обеспечивает представление метаданных в понятном для бизнес-пользователей виде. Разработчики моделей импортируют метаданные (1) из одной или нескольких баз данных, а затем добавляют их к модели с целью обеспечения соблюдения требований пользователя.

В Metric Designer (2) разработчик моделей определяет элементы данных и расчеты, формирующие конечные объекты и действительные результаты для каждой из метрик.

После этого разработчик моделей публикует и обновляет пакеты в Cognos Connection (3) с тем, чтобы авторы могли использовать их для создания отчетов, агентов и карт результатов.

Рис. 2.21. Последовательность действий по BI в Cognos 8 BI

Бизнес-пользователи и авторы отчетов используют опубликованные пакеты для интерпретации данных своего бизнеса. Пользователи запускают, просматривают и управляют своим содержимым в Cognos Connection (5). В зависимости от имеющихся у них разрешений безопасности пользователи могут иметь возможность либо просто запускать и просматривать отчеты, либо управлять расписаниями, макетами портала и другими разрешениями для пользователей.

Cognos Connection представляет собой Web-портал, который обеспечивает единую точку доступа ко всем корпоративным данным, доступным в Cognos 8, в том числе к:

- отчетам, созданным в Report Studio;

- запросам, созданным в Query Studio;

- аналитическим материалам, созданным в Analysis Studio и т.д.

Портал используется не только пользователями, но и системными администраторами для администрирования серверов, оптимизации производительности и назначения разрешений доступа.

Подсистема отчетности обеспечивает реализацию функций корпоративной отчетности в сочетании с функциями систем доступа к данным. Универсальность достигается использованием двух модулей (Report Studio и Query Studio), один из которых рассчитан на профессиональных разработчиков и позволяет создавать сложные отчетные формы, другой ориентирован на бизнес-пользователей для выполнения запросов и представления результатов в виде несложных отчетов.

Модуль Query Studio позволяет осуществлять:

- анализ доступной корпоративной информации;

- создание нерегламентированных отчетов, которые могут просматривать другие пользователи;

- настройку уже готовых нерегламентированных отчетов;

- сравнение и анализ данных;

- подсоединение к источнику данных для просмотра данных в древовидной иерархии;

- изменение внешнего вида отчетов;

- работу с данными в отчете.

При создании отчета в Query Studio по сути создается определение запроса, которое является специальным набором инструкций для получения необходимых данных. Отчет создается на основе бизнес-представления источника данных (пакета), что требует от администратора предварительного создания пакета в Framework Manager и публикации его на портале Cognos Connection.

Перед тем, как приступить к созданию отчета исследуются вопросы, связанные предметной областью анализа, что позволяет сформулировать задачи, решаемые при получении отчета. Процесс создания собственно отчета включает в себя следующие шаги:

1. Создание отчета.

2. Добавление данных.

3. Сохранение отчета.

4. Запуск и выполнение отчета.

Пример запуска отчета Продукты с низким доходом (Low Revenue Products) представлен на рис.2.22.

Рис. 2.22. Пример отчета в Cognos 8 BI

Для создания более сложных отчетов следует использовать Report Studio – профессиональный инструмент отчетности для Cognos 8. Report Studio предоставляет большую гибкость в вычислениях и форматировании результатов.

Приведем некоторые наиболее важные возможности, отличающие Report Studio от Query Studio с точки зрения подготовки отчета:

- Использование в отчетах произвольного количества запросов.Фактически, это означает, что отчет может быть информационно гораздо более насыщенным.

- Произвольное размещение элементов отчета на листе. Report Studio позволяет определять расстояния от границ листа и между объектами в точках и сантиметрах. Используя объект Таблицы, можно размещать объекты в ячейках строк и столбцов.

- Цвета, шрифты, толщина рамок, фон, заполнение и пр. Все эти параметры могут быть определены индивидуально для различных объектов.

- Использование специальных объектов. В отчеты Report Studio можно вставлять: текстовые блоки, графику, видео, ссылки, дату и время обновления, номера страниц, HTML-фрагменты, различные элементы для интерактивного взаимодействия с отчетом при его выполнении (prompts).

- Встроенный редактор выражений. Позволяет определять пользовательские объекты с помощью визуального программирования. Допускается использование функций и логических операторов.

- Произвольное количество логических страниц. Помимо отдельного заголовка можно создать любое количество различных по содержанию и форматированию разделов.

Как правило, приложения, функционирующие в Web, по своим возможностям и пользовательскому интерфейсу не могут конкурировать с программным обеспечением для Windows. Однако в Report Studio за счет применения новейших технологий реализованы мощные возможности для удобства разработчика отчетов. Фактически интерфейс Report Studio повторяет интерфейс обычных приложений: стандартное для Windows меню, инструментальные панели, закладки, контекстно-зависимые окна, техника Drug&Drop, Copy/Paste и т.д. – рис .2.23.

Рис. 2.23. Рабочее место разработчика отчетов ReportNet ReportStudio.

При создании отчета в Report Studio в рабочую область отчета перетаскиваются объекты, характеризующие способ представления информации или специальные элементы, и объекты модели метаданных, определяющих собственно содержимое документа – рис. 2.24.

Рис. 2.24. Объекты, используемые для определения внешнего вида отчета, контента и функционала

Как уже отмечалось ранее, в Report Studio существует большое количество разнообразных функций по работе с данными и их представлением, выполнение которых интуитивно понятно и прото.

Непосредственно перед выполнением отчетов Report Studio (как и Query Stiudio) пользователю может быть предложено определить параметры выполнения: выбрать интервал значений, определить оператор и значение, выбрать из списка имеющихся значений. В рамках одного отчета может определяться любое количество параметров. Для придания отчету интерактивности в Report Studio удобно использовать специальные страницы (prompt pages), на которых можно расположить в нужном порядке фильтры и кнопки перехода между страницами. Все эти операции также выполняются с помощью визуальных объектов.

После того как отчетная форма спроектирована следует провести его проверку на корректность, в течение которой выявляются некорректные ссылки между элементами отчета, ошибки в формулах и пр.

Отчет Report Studio можно сохранять в форматах HTML, PDF, Excel, CSV. В соответствии с правами доступа к функциям системы любые созданные или измененные отчеты могут быть сохранены на сервере в общих или персональных папках. Пользователь может также самостоятельно создавать дополнительные папки, чтобы разместить документы в более удобной для него структуре.

В рамках единой платформы модуль Analysis Studio обеспечивает решение задач по оперативному анализу информации OLAP в Web-среде. С его помощью менеджер может очень быстро получать необходимую ему информацию по предварительно подготовленному источнику данных. Analysis Studio предоставляет богатый набор функций для выполнения различных аналитических операций.

Cognos Analysis Studio обеспечивает удобную навигацию по многомерному кубу и построение отчетов по необходимым срезам информации. Отчет может быть представлен в виде таблиц, кросстаблиц, различных диаграмм и графиков (рис.2. 25).

Рис. 2.25. Интерфейс модуля Cognos Analysis Studio

Среди операций вычисления, доступных пользователю Cognos Analysis Studio: сложение, вычитание, умножение, деление, вычисление процента, вычисление процента от базы, вычисление процента по накопительным итогам, накопительный итог, возведение в степень, свертка, а также прогноз. Помимо вычислений аналитик может использовать такие полезные функции как сортировки, ранжирование, подавление нулевых строк/столбцов, предупреждения, применять правило «80/20».

Модуль Cognos Analysis Studio состоит из меню и панелей инструментов, панели навигации по измерениям, окна представления выборок и окна структуры куба.

Структура многомерного куба представлена в виде иерархического справочника, в котором доступны все имеющиеся категории и показатели. Используя стандартную технику Windows drag & drop, аналитик может перетаскивать нужные объекты в окно выборок. Для удобства многомерного оперативного анализа данных имеется возможность отображать выборки в нескольких представлениях одновременно, а для ускорения построения выборок пользователь может использовать заранее подготовленные фильтры. Панель навигации предназначена для быстрого перехода по иерархиям измерения.

OLAP-отчеты достаточно жестко структурированы: структура документа одинакова для всех категорий. Наличие в Analysis Studio режима работы с отчетами Reporter позволяет снять многие ограничения: например, развернуть иерархию только для определенной категории или по некоторым категориям показывать не только «Объем продаж», но и «Прибыль» и т.д.

Для Analysis Studio в качестве источника данных используется специально подготовленная многомерная структура, куда могут загружаться данные из самых разнообразных источников. Analysis Studio позволяет работать как с собственной многомерной структурой Cognos, так и кубами SAP, MS AS, IBM OLAP DB, ROLAP-источниками IBM DB2 Cube Views, Oracle Materialized Views, Teradata Aggregate Join Indexes.

Аналитические инструменты IBM® SPSS® Statistics

SPSS Statistics ‒ пакет для статистического анализа данных и управления данными, предназначенный для аналитиков и ученых, является мощным аналитическим инструментом для решения задач бизнеса и выполнения научных исследований.

Основу программы SPSS Statistics составляет SPSS Base (базовый модуль), предоставляющий разнообразные возможности доступа к данным и управления данными. Он содержит методы анализа, которые применяются чаще всего.

Модуль IBM SPSS Statistics Base включает все процедуры ввода, отбора и корректировки данных, а позволяет получить общее представление о ваших данных, сформулировать гипотезы для дополнительной проверки, а также выполнить статистические и аналитические процедуры, помогающие прояснить отношения между переменными, создать кластеры, выявить тенденции и сделать прогнозы.

SPSS Statistics Base интегрируется с дополнительными модулями и другим программным обеспечением SPSS Statistics для реализации работы по планированию сбора данных, сбору данных, а также внедрению и распространению полученных результатов. Кроме того, дополнительные модули и программное обеспечение расширяют возможности анализа данных, создания отчетов, а также управления данными и подготовки данных к анализу.

Как и в других статистических пакетах или системах анализа, для начала работы данные, необходимо подготовить к анализу. В SPSS Statistics Base есть целый ряд возможностей и функций, обеспечивающих быструю и эффективную подготовку данных.

Когда свойства переменных заданы, их можно скопировать при помощи инструмента Копировать свойства данных. Свойства переменных используются в качестве шаблонов, которые можно применять как к переменным в другом файле, так и к другим переменным в том же файле. SPSS Statistics Base позволяет производить поиск дублирующихся наблюдений для устранения их перед началом анализа.

Еще один инструмент ‒ Визуальная категоризация ‒ облегчает подготовку количественных данных к анализу. Удобный интерфейс позволяет разбивать количественные данные на интервалы, изменяя границы интервалов в наглядном графическом режиме на гистограмме (рис.2.26).

Система позволяет реструктурировать файлы данных для подготовки их к анализу. Например, файл, в котором одно наблюдение представлено в нескольких строках, можно реструктурировать таким образом, чтобы каждое наблюдение представляло бы собой одну единственную строку. Можно проделать и обратную операцию ‒ файл, в котором в каждой строке записано по несколько наблюдений, реструктурировать так, чтобы каждому наблюдению соответствовала одна строка.

При необходимости строить прогностические модели используется модуль IBM SPSS Regression. Применение сложных моделей при помощи большого набора процедур нелинейного моделирования. SPSS Regression Models используется в:

- Маркетинговых исследованиях для изучения поведения покупателей.

- Медицинских исследованиях для изучения реакций на изменение дозировки.

- Анализе кредитов и кредитных рисков.

- Образовательных исследованиях для измерения успеваемости и других областях.

 

Рис. 2.26. Диалоговое окно инструмента Визуальная категоризация

Например, прогнозирование категориальных исходов с числом категорий более двух Мультиномиальная логистическая регрессия позволяет освободиться от ограничений в виде ответов да/нет и моделировать факторы, предсказывающие покупку клиентами товара А, товара B или товара C. Бинарная логистическая регрессия используется для прогнозирования значений дихотомических переменных (например, купил / не купил, проголосовал / не проголосовал). В процедуре имеется несколько пошаговых методов для отбора существенных непрерывных либо категориальных ковариат, которые наилучшим образом предсказывают значения переменной отклика.

Значительно расширяют возможности моделирования нелинейная регрессия с ограничениями и нелинейная регрессия без ограничений, реализованные в модуле SPSS Regression Models. В этих процедурах есть два метода для оценивания параметров нелинейных моделей. Модели без ограничений анализируются алгоритмом Левенберга-Марквардта. Алгоритм последовательного квадратичного программирования позволяет задавать ограничения на оценки параметров, использовать собственную функцию потерь и получать бутстреп0оценки стандартных ошибок. Кроме перечисленных методов модуль реализует и другие функции, расширяющие возможности моделирования.

Анализ данных станет более точным при помощи процедур, лучше учитывающих свойства исследуемых данных. В IBM SPSS Advanced Statistics имеется мощный набор методов одномерного и многомерного анализа. Например, процедура Общая линейная модель (ОЛМ) предоставляет большую гибкость в описании взаимосвязей между зависимой переменной и набором независимых переменных. Среди имеющихся моделей: линейная регрессия, одномерный дисперсионный анализ, одномерный ковариационный анализ, многомерный дисперсионный анализ и многомерный ковариационный анализ. В процедуре ОЛМ предусмотрена также возможность работы с повторными измерениями, смешанными моделями, апостериорными критериями, апостериорными критериями для повторных измерений, четырьмя видами сумм квадратов, парными сравнениями ожидаемых маргинальных средних; специальные методы обработки пропущенных значений и возможность сохранения матрицы плана и файла эффектов.

Использование более точных прогностических моделей при работе с данными иерархической структуры Процедура Смешанные линейные модели расширяет возможности общей линейной модели, используемой в процедуре ОЛМ, предоставляя возможности анализа коррелированных данных и данных с непостоянной дисперсией. Например, корректное использование данных о студентах в студенческих группах или о потребителях в домашних хозяйствах позволяет повысить точность моделей. Смешанная линейная модель позволяет моделировать не только средние значения, но также дисперсии и ковариации. Гибкость этой процедуры позволяет проверять широкий спектр моделей. Имеется возможность использования моделей повторных измерений, включая неполные повторные измерения, когда число наблюдений для разных объектов наблюдения различно.

В процедуре Смешанной линейной модели можно использовать самые разнообразные модели, включая модель однофакторного дисперсионного анализа (ANOVA) с фиксированными эффектами, модель рандомизированных полных блоков, модель только случайных эффектов, модель случайных коэффициентов, многоуровневый анализ, безусловная модель линейного роста, модель линейного роста с ковариатами, модель повторных измерений, с ковариатами, зависящими от времени.

Даже этот краткий обзор процедур модуля SPSS Advanced Models наглядно свидетельствует о значительных вычислительных возможностях модуля.

При помощи SPSS Categories можно вводить в анализ дополнительные данные путем включения дополнительных точек.

Дополнительные модули SPSS для Windows, такие как SPSS Regression Models, SPSS Advanced Models, SPSS Categories и другие позволяют задействовать еще больше аналитических процедур и, глубже проникая в структуру данных, извлекать полезную информацию для принятия точных решений. В табл.2.2 приведены основные модули системы IBM SPSS Statistics и дана их краткая характеристика.

Таблица 2.2⎼ Модули системы SPSS

Наименование модулей Назначение
Regression Models Модуль включает в себя различные методы регрессионного анализа, такие как: бинарная и мультиномиальная логистическая регрессия, нелинейная регрессия и пробит-анализ.
Advanced Models В модуль входят различные методы дисперсионного анализа (многомерный, с учетом повторных измерений), общая линейная модель, анализ выживания, включая метод Каплана-Майера и регрессию Кокса и др.
Tables Модуль Tables служит для создания презентационных таблиц. Здесь предоставляются более широкие возможности по сравнению со упрощенными частотными таблицами и таблицами сопряженности, которые строятся в SPSS Base (базовом модуле).
Amos Amos (Analysis of moment structures — анализ моментных структур) включает методы анализа с помощью линейных структурных уравнений. Целью программы является проверка сложных теоретических связей между различными признаками случайного процесса и их описание при помощи подходящих коэффициентов. Проверка проводится в форме причинного анализа и анализа траектории. При этом пользователь в графическом виде должен задать теоретическую модель, в которую вместе с данными непосредственных наблюдений могут быть включены и так называемые скрытые элементы. Программа Amos включена в состав модулей расширения SPSS, как преемник L1SREL (Linear Structural RELationships — линейные структурные взаимоотношения).  
AnswerTree AnswerTree (дерево решений) включает четыре различных метода автоматизированного деления данных на отдельные группы (сегменты). Деление проводится таким образом, что частотные распределения целевой (зависимой) переменной в различных сегментах значимо различаются. Типичным примером применения данною метода является создание характерных профилей покупателей при исследовании потребительского рынка. AnswerTree является преемницей программы Chi squared interaction Detector — детектор взаимодействий на основе хи-квадрата).
Categories Модуль содержит различные методы для анализа категориальных данных, а именно: анализ соответствий и три различных метода оптимального шкалирования (анализ однородности, нелинейный анализ главных компонент, нелинейный канонический корреляционный анализ).
Clementine Clementine — это программа для data mining (добычи знаний), в которой пользователю предлагаются многочисленные подходы к построению моделей, к примеру, нейронные сети, деревья решений, различные виды регрессионного анализа. Clementine представляет собой "верстак" аналитика, при помощи которого можно визуализировать процесс моделирования, перепроверять модели, сравнивать их между собой. Для удобства пользования программой имеется вспомогательная среда внедрения результатов.
Conjoint (совместный анализ) Совместный анализ применяется при исследовании рынка для изучения потребительских свойств продуктов на предмет их привлекательности. При этом опрашиваемые респонденты по своему усмотрению должны расположить предлагаемые наборы потребительских свойств продуктов в порядке предпочтения, на основании которого можно затем вывести так называемые детализированные показатели полезности отдельных категорий каждого потребительских свойства.
Data Entry (ввод данных)   Программа Data Entry предназначена для быстрого составления вопросников, а также ввода и чистки данных. Заданные на этапе создания вопросника вопросы и категории ответов потом используются в качестве меток переменных и значений.
Exact Tests (Точные тесты) Данный модуль служит для вычисления точного значения вероятности ошибки (величины р) в условиях ограниченности данных при проверке по критерию х2 (Chi-Quadrat-Test) и при непараметрических тестах. В случае необходимости для этого также может быть применен метод Монте-Карло (Monte-Carlo).
GOLDMineR   Программа содержит специальную регрессионную модель для регрессионного анализа упорядоченных зависимых и независимых переменных.
SamplePower При помощи SamplePower может быть определен оптимальный размер выборки для большинства методов статистического анализа, реализованных в SPSS.
SPSS Missing Value Analysis Модуль служит для анализа и восстановления закономерностей, которым подчиняются пропущенные значения. Он предоставляет различные варианты замены недостающих значений.
Trends Модуль Trends содержит различные методы для анализа временных рядов, такие как: модели ARIMA, экспоненциальное сглаживание, сезонная декомпозиция и спектральный анализ.

Вопросы для самопроверки

1. Что вы понимаете под термином «инструментальные средства анализа данных»?

2. Дайте общую характеристику функциональным возможностям современных аналитических систем.

3. Проанализируйте и оцените достоинства и недостатки следующих вариантов архитектуры информационно-аналитических систем:

4. Функциональная ИАС.

5. На базе независимых витрин данных.

6. На базе двухуровневого хранилища данных.

7. На базе трехуровневого хранилища данных.

8. Что, на Ваш взгляд, сегодня является движущий силой, или предпосылкой, для создания хранилищ данных в организациях?

9. В чем состоит различие между виртуальным и физическим Хранилищами данных?

10. «Построение хранилища данных — задача только информационных технологий» - опровергните или подтвердите данный тезис.

11. Дайте описание модели данных, используемой большинством ХД. Приведите примеры схем данных.

12. Охарактеризуйте алгоритмы извлечения знаний, поддерживаемые системой SPSS.

13. Приведите основные функциональные возможности системы IBM SPSS Statistics.

14. Сформулируйте типовые виды интеллектуального анализа данных, реализованные на базе аналитической платформы IBM Cognos.

15. Сформулируйте типовые виды интеллектуального анализа данных, реализованные на базе аналитической платформы Deductor.