Основная теорема (принцип максимума)

 

Пусть u(t) – управление, переводящее изображающую точку из положения x(t0) в положение x(t1), t0tt1, а x(t) – соответствующая этому управлению траектория, переводящая фазовую точку х системы (9.75) из заданного начального положения х0 в заданное конечное положение х1,.где x(t0) = х0, x(t1) =х1.Если управление u(t) и х(t) – оптимальное управление и оптимальная траектория, то найдется такая непрерывная вектор-функция ψ(t), удовлетворяющая уравнениям

(9.86)

что:

1) в каждый момент времени t, t0tt1, функция H(ψ(t), x(t), u), рассматриваемая как функция переменного u, достигает в точке u =u(t) максимума

H[(ψ(t), x(t), u(t)] = М[(ψ(t), x(t)];

2) выполнено условие нетривиальности решения системы уравнений (9.86)

ψ(t) ≠0;

3) в конечный момент времени t1

 

Для задачи о максимальном быстродействии, когда функционалом, минимум которого отыскивается, является время

 

 

(9.69)

 

уравнение для переменного ψ0 отпадает и функция принимает вид

 

Оказывается, что при оптимальном управлении функции H(t) и ψ0(t) остаются постоянными и принимают значения:

 

H(t), a ψ0(t) ≤ 0. (9.70)

 

Сформулированное условие является лишь необходимым, а не достаточным. Принцип максимума устанавливает связь между управлением и координатами прямой и сопряженных систем. В связи с этим решение задачи сводится к выбору таких начальных значений сопряженной системы, при которых фазовая траектория управляемой системы будет переходить из начального xi(t0) в требуемое конечное положение xi(t1).

Заметим, что задачу о минимуме любого функционала (9.62) можно свести к задаче о быстродействии, введя новую переменную и дополнительное уравнение

Пользуясь теоремой о максимуме, можно фактически определять оптимальные уравнения uj(t), доставляющие минимум функционалу (9.62) при учете уравнений связи (9.61). Действительно, для определения 2n+k неизвестных функций x1, x2,…, xn, ψ1, ψ2,…, ψn, u1, u2,…, uk имеем уравнений (9.65) и (9.66) и k уравнений следуют из условия максимума гамильтониана H (9.64) по управлениям u1, u2,…, uk. Отметим, что, используя теорему о максимуме, мы отыскиваем решение не в классе кусочно-гладких функций, а в более обширном классе – классе кусочно-непрерывных функций.

Пример 9.6. Найти для объекта = х2, = u управление, которое переводит объект из состояния х(0) = (1;1) в состояние покоя за 5 секунд, затратив минимум энергии. Функционал качества , множество цели – точка х(5) = (0;0).

Решение.Составим функцию Гамильтона (9.81)

H(х, u, ψ) =-u2 + ψ1х22u.

Максимизируем функцию Гамильтона по управлению и найдем оптимальное управление:

Получаем значение оптимального управления u* = 0,5 ψ2(t).

Каноническая система будет представлена уравнениями:

= х2; = 0,5 ψ2(t);

х1(0) = х2(0) = 1; х1(5) = х2(5) = 0;

Используя (9.83), получаем

Из канонической системы следует:

Постоянные интегрирования находим из краевых условий:

t = 0 С3 = С4 = 0; С1 = -0,67; С2 = -2,079.

Оптимальное управление u* = (0,67t – 2,08)/2.

 

.