Самообучающиеся системы
Самообучающиеся интеллектуальные системы основаны на методах автоматической классификации ситуаций из реальной практики, или на методах обучения на примерах. Примеры реальных ситуаций составляют так называемую обучающую выборку, которая формируется в течение определенного исторического периода. Элементы обучающей выборки описываются множеством классификационных признаков.
Стратегия «обучения с учителем» предполагает задание специалистом для каждого примера его принадлежность к определенному классу ситуаций. При обучении «без учителя» система должна самостоятельно выделять классы ситуаций. Обучение методом критики является промежуточным между первыми двумя. Предполагается, что имеется возможность только оценивать правильность работы сети и указывать желаемое направление обучения. Подобная ситуация часто встречается в системах, связанных с оптимальным управлением.
В процессе обучения проводится автоматическое построение обобщающих правил или функций, описывающих принадлежность ситуаций к классам, которыми система впоследствии будет пользоваться при интерпретации незнакомых ситуаций. В свою очередь, из обобщающих правил автоматически формируется ба за знаний, которая периодически корректируется.
Построенные в соответствии с этими принципами самообучающиеся системы имеют следующие недостатки:
• относительно низкую адекватность баз знаний возникающим реальным проблемам из-за неполноты и/или зашумленности обучающей выборки;
• низкую степень объяснимости полученных результатов;
• поверхностное описание проблемной области и узкую направленность применения.
Нейронные сети представляют собой классический пример технологии, основанной на примерах. Нейронные сети – обобщенное название группы математических алгоритмов, обладающих способностью обучаться на примерах, «узнавая» впоследствии черты встреченных образцов и ситуаций. Благодаря этой способности нейронные сети используются при решении задач обработки сигналов и изображений, распознавания образов, а также для прогнозирования.
В системах, основанных на прецедентах, БЗ содержит описания конкретных ситуаций (прецеденты). Поиск решения осуществляется на основе аналогий и включает следующие этапы:
• получение информации о текущей проблеме;
• сопоставление полученной информации со значениями признаков прецедентов из базы знаний;
• выбор прецедента из базы знаний, наиболее близкого к рассматриваемой проблеме;
• адаптация выбранного прецедента к текущей проблеме;
• проверка корректности каждого полученного решения;
• занесение детальной информации о полученном решении в БЗ.
Прецеденты описываются множеством признаков, по которым строятся индексы быстрого поиска. В системах, основанных на прецедентах, до пускается нечеткий поиск с получением множества допустимых альтернатив,каждая из которых оценивается некоторым коэффициентом уверенности. Наиболее эффективные решения адаптируются к реальным ситуациям с помощью специальных алгоритмов. Системы, основанные на прецедентах, применяются для распространения знаний и в системах контекстной помощи.
Информационные хранилища – это предметно-ориентированное, интегрированное, привязанное ко времени, неизменяемое собрание данных, применяемых для поддержки процессов принятия управленческих решений. Предметность означает, что данные объединены в категории и хранятся в соответствии с теми областями, которые они описывают, а не с приложениями, которыеих используют. Данные в хранилище интегрируются в целях удовлетворения требований предприятия в целом, а не отдельного подразделения. Привязанность данных ко времени выражает их «историчность», т.е. атрибут времени всегда явно присутствует в структурах хранилища данных. Неизменяемость означает,что, попав однажды в хранилище, данные уже не изменяются.
Технологии извлечения знаний из хранилищ данных основаны на методах статистического анализа и моделирования, ориентированных на поиск моделей и отношений, скрытых в совокупности данных. Эти модели могут в дальнейшем использоваться дляоптимизации деятельности предприятия или фирмы.
Для извлечения значимой информации из хранилищ данных имеются специальные методы (OLAP-анализа, Data Mining или Knowledge Discovery), основанные на применении методов математической статистики, нейронных сетей, индуктивных методов построения деревьев решений и др.