InteRRaP-архитектура

 

Основная идея этой архитектуры [36] в том, чтобы представить агента как множество уровней, которые связаны через управляющую структуру и используют общую

 
 

 


Рис.14. InteRRaP-архитектура агента

 

базу знаний. Эта архитектура представлена на рис.14. Она состоит из пяти основных частей: интерфейса с внешним миром; компоненты, основанной на поведении; планирующей компоненты; компоненты, ответственной за кооперацию с другими агентами и базы знаний агента.

Интерфейс с внешним миром содержит возможности агента по восприятию событий внешнего мира, воздействия на него и средства коммуникации.

Компонента, ответственная за реактивное поведение, использует базовые возможности агента по реактивному поведению, а также частично использует знания агента процедурного характера. Она базируется на понятии “фрагмента поведения” как некоторой заготовки реакции агента на некоторые стандартные ситуации. Это позволяет агенту в стандартных ситуациях не обращаться к планированию на основе знаний и реализовывать значительную часть своего поведения рутинным образом с хорошей эффективностью. Из базы знаний ей доступны только знания нижнего уровня абстракции, где содержится информация о фрагментах поведения.

Компонента, ответственная за планирование, содержит механизм планирования, позволяющий строить локальные планы агента, т.е. планы, не связанные с кооперативным поведением. План представляется в виде графа, узлами которого могут быть либо конкретные наборы действий вплоть до элементарных шагов поведения, либо новые субпланы, подлежащие дальнейшей конкретизации. Таким образом, планирующая компонента активирует поведение (через нижележащую компоненту), направляемое целями. Она же участвует и в планировании, связанном с кооперативным поведением агентов. Эта компонента может использовать знания двух нижних уровней абстракции.

Компонента, ответственная за кооперацию агентов, участвует в конструировании планов совместного поведения агентов для достижения некоторых общих целей или выполнения своих обязательств перед другими агентами, а также выполнения соглашений. Этой компоненте доступны знания всех трех уровней абстракции.

База знаний агента имеет трехуровневую структуру и построена по принципу доски объявлений. Уровни базы знаний фактически отвечают уровням абстракции знаний в соответствии со структурой управляющих компонент. Модель мира агента содержит убеждения агента в соответствии с уровнем, ориентированным на поведение. Второй уровень соответствует модели ментальных знаний агента и знаниям о текущем ментальном состоянии агента (намерения, цели, планы). Наконец, третий уровень содержит знания и убеждения агента о других агентах, информацию о совместных планах, целях и намерениях, т.е. то, что связано с “общественным контекстом”. Внутри базы знаний, как уже отмечалось, возможен доступ с верхних уровней к нижним. Например, компонента, ответственная за поведение, не имеет доступа к знаниям о ментальной модели и к знаниям о кооперативном поведении.

Общее управление поведением осуществляется путем коммуникаций между уровнями. При некотором входном событии агент пытается распознать ситуацию во внешнем мире и управление постепенно сдвигается снизу вверх до тех пор, пока не достигнет уровня, способного справиться с возникшей ситуацией.

Очевидно, существует три варианта реакции агента на внешние события:

-реакция с использованием только поведенческого уровня, когда этот уровень находит фрагмент поведения, адекватный ситуации, без явного привлечения локального планирования;

-реакция с использованием локального планирования, когда задача перемещается с нижнего уровня на уровень локального планирования, где и конструируется план;

-реакция с использованием уровня кооперативного планирования, когда поиск плана с уровня локального планирования перемещается дальше на уровень планирования кооперативного поведения.

Конечно, существуют и более сложные варианты построения плана, когда, например, протокол взаимодействия между уровнем локального планирования и планирования кооперативного поведения предусматривает сложную схему обмена информацией, например, для построения оценок возможности решения некоторых задач многоагентной системы за заданное время.