Архитектура типичной Data Mining системы. Главные проблемы Data Mining. История развития Data Mining.
Архитектура типичной Data Mining системы
Главные проблемы Data Mining
Методологии добычи знаний
· Добыча различных видов знаний от разнообразных типов данных, например, био, потоки, Веб
· Выполнение: эффектность, эффективность, и масштабируемость
· Оценка паттерна: проблема интересности
· Объединение фонового знания
· Обработка шумовых и неполных данных
· Параллельные, распределенные и инкрементные методы
· Интеграция обнаруженного знания с существующим: сплав знания
· Взаимодействие пользователей
· Языки запросов интеллектуального анализа данных
· Выражение и визуализация результатов поиска данных
· Интерактивная добыча знаний на многократных уровнях абстракции
· Особенности приложений
· Проблемно-ориентированный поиск данных и невидимый поиск данных
· Защита безопасности данных, целостности, и частной жизни
История развития Data Mining
1989 Семинар IJCAI об открытии знаний в базах данных
Поиск знаний в базах данных (Г.Пятецкий-Шапиро и В.Фроли, 1991)
1991-1994 Семинары о поиске знаний в базах данных
Поиск знаний и интеллектуальный анализ данных (У. Фэйяд, Г.Пятецкий-Шапиро, П. Смит, и Р. Утерузэми, 1996)
1995-1998 Международная конференция по вопросам поиска знаний в базах данных и интеллектуального анализа данных (KDD ’95-98)
Журнал интеллектуального анализа данных и поиска знаний (1997)
С 1998 проводятся ACM SIGKDD-конференции и исследования SIGKDD
Увеличивается количество конференций по поиску данных
PAKDD (1997), PKDD (1997), SIAM-Data Mining (2001), (IEEE) ICDM (2001) и т.д.
С 2007 – разработки в области интеллектуального анализа знаний