Модели представления знаний
Данные и знания
При изучении интеллектуальных систем традиционно возникает вопрос – что же такое знания и чем они отличаются от данных.
Данные – это отдельные факты, характеризующие объекты, процессы и явления предметной области, а также их свойства.
При обработке на ЭВМ данные трансформируются, проходя этапы:
1. Данные как результат измерений и наблюдений;
2. Данные на материальных носителях информации;
3. Модели данных в виде диаграмм, графиков;
4. Данные в компьютере на языке описания данных;
5. Базы данных на машинных носителях информации.
Знания основаны на данных. Они представляют собой результат мыслительной деятельности человека.
Знания – это закономерности предметной области (связи, законы), полученные в результате практической деятельности и профессионального опыта.
Знания трансформируются аналогично данным:
1. Знания в памяти человека как результат мышления;
2. Материальные носители знаний (учебники, методические пособия);
3. Поле знаний – условное описание основных объектов предметной области, их атрибутов и закономерностей, их связывающих;
4. Знания, описанные на языке представления знаний (продукционные модели, семантические сети, фреймы);
5. База знаний на машинных носителях информации.
Знания – это хорошо структурированные данные, или данные о данных, или метаданные.
Для хранения данных используются базы данных, для хранения знаний – базы знаний. База знаний – основа любой интеллектуальной системы.
Существуют десятки моделей (или языков) представления знаний для различных предметных областей. Большинство из них может быть сведено к следующим классам:
• продукционные модели;
• семантические сети;
• фреймы;
• формальные логические модели.
Продукционная модель
Продукционная модель или модель, основанная на правилах, позволяет представить знания в виде предложений типа «Если (условие),
то (действие)».
Под «условием» понимается некоторое предложение – образец, по которому осуществляется поиск в базе знаний, а под «действием» – действия, выполняемые при успешном исходе поиска.
Чаще всего вывод на такой базе знаний бывает прямой (от данных к поиску цели) или обратный (от цели для ее подтверждения – к данным).
Продукционная модель чаще всего применяется в промышленных экспертных системах. Она привлекает разработчиков своей наглядностью, легкостью внесения дополнений изменений и простотой механизма логического вывода.
Имеется большое число программных средств, реализующих продукционный подход (язык OPS 5; «оболочки» или «пустые» ЭС – EXSYS Professional, Kappa, ЭКСПЕРТ и др; инструментальные системы ПИЭС и СПЭИС и др.), а также промышленных ЭС на его основе.
Семантические сети
Термин семантическая означает «смысловая».
Семантическая сеть – это ориентированный граф, вершины которого – понятия, а дуги – отношения между ними.
В качестве понятий обычно выступают абстрактные или конкретные объекты, а отношения – это связи типа: «это», «имеет частью», «принадлежит», «любит». Обязательно в семантической сети наличие трех типов отношений:
• класс – элемент класса (цветок – роза);
• свойство – значение (цвет – красный);
• пример элемента класса (роза – голландская).
Пример семантической сети (см. рис. 5.7). В качестве вершин выступают понятия «человек», «Иванов», «Волга», «автомобиль», «вид транспорта» и «двигатель».
Рис. 5.7. Семантическая сеть
Данная модель представления знаний была предложена американским психологом Куиллианом.
Недостатком этой модели является сложность организации процедуры поиска вывода на семантической сети.
Для реализации семантических сетей существуют специальные сетевые языки, например NET, язык реализации систем SIMER+MIR и др. Известны ЭС, использующие семантические сети в качестве языка представления знаний – PROSPECTOR, CASNET, TORUS.
Фреймы
Термин фрейм (от англ. Frame, что означает «каркас» или «рамка») был предложен Марвином Минским, одним из пионеров искусственного интеллекта в 70-е годы.
Фрейм – это абстрактный образ для представления некоего стереотипа восприятия.
Например, произнесение слова «комната» порождает образ комнаты: «жилое помещение с четырьмя стенами, полом, потолком, окнами и дверью, площадью 6 – 20 м2». Из этого описания ничего нельзя убрать (например, убрав окна, мы получим уже чулан, а не комнату), но в нем есть «дырки» или «слоты» - это незаполненные значения некоторых атрибутов, например, количество окон, цвет стен, высота потолка, покрытие пола и др.
В теории фреймов такой образ комнаты называется фреймом комнаты. Фреймом также называется и формализованная модель для отображения
объекта.
Пример фреймов (рис. 5.8).
Рис. 5.8. Сеть фреймов
Различают фреймы-образцы, или прототипы, хранящиеся в базе знаний, и фреймы-экземпляры, которые создаются для отображения реальных фактических ситуаций на основе поступающих данных.
Важнейшим свойством теории фреймов является заимствование из теории семантических сетей – так называемое наследование свойств. Наследование происходит по АКО-связям (A-Kind-of = это). Слот АКО указывает на фрейм более высокого уровня иерархии, откуда неявно наследуются значения слотов.
В сети фреймов понятие «ученик» наследует свойства фреймов «ребенок» и «человек», которые находятся на более высоком уровне иерархии. Так, на вопрос «любят ли ученики сладкое» следует ответ «да», так как этим свойством обладают все дети, что указано во фрейме «ребенок». Наследование свойств может быть частичным, так как возраст для учеников не наследуется из фрейма «ребенок», поскольку указан явно в своем собственном фрейме.
Специальные языки представления знаний в сетях фреймов FRL (Frame Representation Language), KRL, фреймовая «оболочка» Кара [Стрельников, Борисов] и др., фрейм-ориентированные ЭС – ANALYST, TRISTAN, МОДИС.
Формальные логические модели
Традиционно в представлении знаний выделяют формальные логические модели, основанные на классическом исчислении предикатов 1-го порядка,
когда предметная область или задача описывается в виде набора аксиом.
Исчисление предикатов 1-го порядка в промышленных ЭС практически не используется. Эта логическая модель применима в основном в исследовательских системах, так как предъявляет очень высокие требования и ограничения к предметной области.
В промышленных ЭС используются различные ее модификации
и расширения.
Несмотря на все недостатки, наибольшее распространение получила продукционная модель представления знаний. При использовании продукционной модели база знаний состоит из набора правил. Программа, управляющая перебором правил, называется машиной вывода(интерпретатор правил).