Від переробки даних до аналізу

Природно, що не всі потрібні дані присутні в ИС в "чистому" виді. Корисну інформацію доводиться виловлювати з великої кількості додаткових даних, і цей процес називається добуванням даних (Data Mining - DM).

Корисна інформація може бути захована дуже глибоко; ИС витягає правдоподібні дані, але вони можуть не відбивати її суть, може виникнути небезпека одержання зміщених оцінок (Biased Estimator), коли виявляється не зовсім той фактор, що впливав на досліджуваний об'єкт або систему. Інформація практично завжди буває "зашумлена", при цьому часто амплітуда корисного сигналу порівнянна з амплітудами побічних явищ. Реальну інформацію в такій ситуації витягти важко, і це може привести до помилкових оцінок і прогнозів.

Користувачі можуть одержувати повноцінну віддачу від інформації тільки в тому випадку, якщо ця інформація точна, повна, з її нескладно витягати знання. Інформація зі сховищ і вітрин даних може бути об'єднана з інформацією з неструктурованих джерел, з наступним наданням доступу до неї різним групам користувачів, причому кожна з подібних груп може мати свої очікування щодо того, яким образом їм повинна бути надана інформація.

Деякі керівники просто хочуть, щоб звіти надавалися щоранку, іншим потрібно мати перед собою інструментальну панель керівника, що відображає критично важливі бізнеси-показники. Хтось із менеджерів хоче виконувати ускладнені запити з ієрархічною деталізацією даних або ж робити зрізи й маніпулювати своїми даними.

Знання мають невелику цінність, якщо вони не є керівництвом до дії або не намечаются до використання в бізнес-процесах! Користувачі мають потребу в такому поданні інформації, яке б відповідало їхній унікальним бізнес-процесам. На ринку пропонується багато програмних продуктів для рішення різноманітних загальних і часток проблем. Серед них:

  • системи генерації звітів для формального подання інформації (наприклад, програмний продукт Crystal Reports компанії Crystal Decisions, призначений для створення корпоративної звітності);
  • аналітичні системи для складного динамічного аналізу даних;
  • системи генерації персональних запитів, аналізу й створення звітів для індивідуальних користувачів, що мають різноманітні потреби по поданню й аналізу інформації;
  • рішення по розробці Киснув-Додатків (Enterprise Information System Applications - EISA), призначені для створення інструментальних панелей керівника й аналітичних додатків для видобутку даних.

У самому загальному виді завдання менеджменту можна звести до п'яти ключових питань:

  • Де ми перебуваємо?
  • Чого ми хочемо досягти?
  • Як ми туди потрапимо?
  • Скільки часу й ресурсів на це буде потрібно?
  • Скільки це буде коштувати?

Для складних систем характерно те, що управляти ними доводиться, як правило, в умовах неповної інформації, відсутності знання закономірностей функціонування й постійної зміни зовнішніх факторів. Тому процеси керування й прийняття рішень мають ітераційний характер. Після ухвалення рішення й застосування керуючого впливу необхідно знову оцінити стан, у якому перебуває система, і вирішити питання про те, чи правильно ми рухаємося по наміченому шляху. Якщо відхилення нас не задовольняють, то необхідно перевизначити набори даних, скорегувати рішення й "запустити знову" процес керування.

Сучасні інформаційні технології при пошуку відповідей на поставлені питання дозволяють аналітикові формулювати й вирішувати завдання нижченаведених класів.

Аналітичні - обчислення заданих показників і статистичних характеристик бізнес-діяльності на основі ретроспективної інформації з баз даних.

Візуалізація даних - наочне графічне й табличне подання наявної інформації.

Добування (видобуток) знань (Data Mining) - визначення взаємозв'язків і взаимозависимостей бізнес-процесів на основі існуючої інформації. До даного класу можна віднести завдання перевірки статистичних гіпотез, кластеризации, знаходження асоціацій і тимчасових шаблонів. Наприклад, шляхом аналізу економічних і фінансових показників діяльності компаній, які потім збанкрутували, банк може виявити деякі стереотипи, які можна буде врахувати при оцінці ступеня ризику кредитування.

Імітаційні - проведення на ЕОМ експериментів з формалізованими (математичними) моделями, що описують поводження складних систем протягом заданого або формованого інтервалу часу. Завдання цього класу застосовуються для аналізу можливих наслідків прийняття того або іншого управлінського рішення (аналіз "що, якщо?...").

Синтез керування - використовується для визначення припустимих керуючих впливів, що забезпечують досягнення заданої мети. Завдання цього типу застосовуються для оцінки досяжності намічених цілей, визначення безлічі можливих керуючих впливів, що приводять до потрібного результату.

Оптимизационные - засновані на інтеграції імітаційних, управлінських, оптимизационных і статистичних методів моделювання й прогнозування. Разом з постановкою завдання синтезу керування дозволяють вибрати на безлічі можливих керувань ті з них, які забезпечують найбільш ефективне (з погляду певного критерію) просування до поставленої мети.


Рис. 1.6. Категорії ИС для обробки різних типів даних

У цей час існують певні категорії інформаційних систем (або відповідні модулі інтегрованих ИС), які обслуговують кожний організаційний рівень і допомагають успішно вирішувати зазначені вище класи завдань із обробкою відповідного типу даних (мал. 1.6 і 1.7).


Рис. 1.7. Категорії ИС, що підтримують різні типи рішень

Сучасна компанія з розгалуженим бізнесом, як правило, має: