Основная теорема (принцип максимума)
Пусть u(t) – управление, переводящее изображающую точку из положения x(t0) в положение x(t1), t0 ≤ t ≤ t1, а x(t) – соответствующая этому управлению траектория, переводящая фазовую точку х системы (9.75) из заданного начального положения х0 в заданное конечное положение х1,.где x(t0) = х0, x(t1) =х1.Если управление u(t) и х(t) – оптимальное управление и оптимальная траектория, то найдется такая непрерывная вектор-функция ψ(t), удовлетворяющая уравнениям
(9.86)
что:
1) в каждый момент времени t, t0 ≤ t ≤ t1, функция H(ψ(t), x(t), u), рассматриваемая как функция переменного u, достигает в точке u =u(t) максимума
H[(ψ(t), x(t), u(t)] = М[(ψ(t), x(t)];
2) выполнено условие нетривиальности решения системы уравнений (9.86)
ψ(t) ≠0;
3) в конечный момент времени t1
Для задачи о максимальном быстродействии, когда функционалом, минимум которого отыскивается, является время
(9.69)
уравнение для переменного ψ0 отпадает и функция принимает вид
Оказывается, что при оптимальном управлении функции H(t) и ψ0(t) остаются постоянными и принимают значения:
H(t), a ψ0(t) ≤ 0. (9.70)
Сформулированное условие является лишь необходимым, а не достаточным. Принцип максимума устанавливает связь между управлением и координатами прямой и сопряженных систем. В связи с этим решение задачи сводится к выбору таких начальных значений сопряженной системы, при которых фазовая траектория управляемой системы будет переходить из начального xi(t0) в требуемое конечное положение xi(t1).
Заметим, что задачу о минимуме любого функционала (9.62) можно свести к задаче о быстродействии, введя новую переменную и дополнительное уравнение
Пользуясь теоремой о максимуме, можно фактически определять оптимальные уравнения uj(t), доставляющие минимум функционалу (9.62) при учете уравнений связи (9.61). Действительно, для определения 2n+k неизвестных функций x1, x2,…, xn, ψ1, ψ2,…, ψn, u1, u2,…, uk имеем уравнений (9.65) и (9.66) и k уравнений следуют из условия максимума гамильтониана H (9.64) по управлениям u1, u2,…, uk. Отметим, что, используя теорему о максимуме, мы отыскиваем решение не в классе кусочно-гладких функций, а в более обширном классе – классе кусочно-непрерывных функций.
Пример 9.6. Найти для объекта = х2, = u управление, которое переводит объект из состояния х(0) = (1;1) в состояние покоя за 5 секунд, затратив минимум энергии. Функционал качества , множество цели – точка х(5) = (0;0).
Решение.Составим функцию Гамильтона (9.81)
H(х, u, ψ) =-u2 + ψ1х2 +ψ2u.
Максимизируем функцию Гамильтона по управлению и найдем оптимальное управление:
Получаем значение оптимального управления u* = 0,5 ψ2(t).
Каноническая система будет представлена уравнениями:
= х2; = 0,5 ψ2(t);
х1(0) = х2(0) = 1; х1(5) = х2(5) = 0;
Используя (9.83), получаем
Из канонической системы следует:
Постоянные интегрирования находим из краевых условий:
t = 0 С3 = С4 = 0; С1 = -0,67; С2 = -2,079.
Оптимальное управление u* = (0,67t – 2,08)/2.
.