Основная теорема (принцип максимума)

Пусть u(t) – управление, переводящее изображающую точку из положения x(t₀) в положение x(t₁), t₀ ≤ t ≤ t₁, а x(t) – соответствующая этому управлению траектория, переводящая фазовую точку х системы (9.75) из заданного начального положения х⁰ в заданное конечное положение х¹,.где x(t₀) = х⁰, x(t₁) =х¹.Если управление u(t) и х(t) – оптимальное управление и оптимальная траектория, то найдется такая непрерывная вектор-функция ψ(t), удовлетворяющая уравнениям

(9.86)

что:

1) в каждый момент времени t, t₀ ≤ t ≤ t₁, функция H(ψ(t), x(t), u), рассматриваемая как функция переменного u, достигает в точке u =u(t) максимума

H[(ψ(t), x(t), u(t)] = М[(ψ(t), x(t)];

2) выполнено условие нетривиальности решения системы уравнений (9.86)

ψ(t) ≠0;

3) в конечный момент времени t₁

Для задачи о максимальном быстродействии, когда функционалом, минимум которого отыскивается, является время

(9.69)

уравнение для переменного ψ₀ отпадает и функция принимает вид

Оказывается, что при оптимальном управлении функции H(t) и ψ₀(t) остаются постоянными и принимают значения:

H(t), a ψ₀(t) ≤ 0. (9.70)

Сформулированное условие является лишь необходимым, а не достаточным. Принцип максимума устанавливает связь между управлением и координатами прямой и сопряженных систем. В связи с этим решение задачи сводится к выбору таких начальных значений сопряженной системы, при которых фазовая траектория управляемой системы будет переходить из начального x_i(t₀) в требуемое конечное положение x_i(t₁).

Заметим, что задачу о минимуме любого функционала (9.62) можно свести к задаче о быстродействии, введя новую переменную и дополнительное уравнение

Пользуясь теоремой о максимуме, можно фактически определять оптимальные уравнения u_j(t), доставляющие минимум функционалу (9.62) при учете уравнений связи (9.61). Действительно, для определения 2n+k неизвестных функций x₁, x₂,…, x_n, ψ₁, ψ₂,…, ψ_n, u₁, u₂,…, u_k имеем уравнений (9.65) и (9.66) и k уравнений следуют из условия максимума гамильтониана H (9.64) по управлениям u₁, u₂,…, u_k. Отметим, что, используя теорему о максимуме, мы отыскиваем решение не в классе кусочно-гладких функций, а в более обширном классе – классе кусочно-непрерывных функций.

Пример 9.6. Найти для объекта = х₂, = u управление, которое переводит объект из состояния х(0) = (1;1) в состояние покоя за 5 секунд, затратив минимум энергии. Функционал качества , множество цели – точка х(5) = (0;0).

Решение.Составим функцию Гамильтона (9.81)

H(х, u, ψ) =-u² + ψ₁х₂ +ψ₂u.

Максимизируем функцию Гамильтона по управлению и найдем оптимальное управление:

Получаем значение оптимального управления u* = 0,5 ψ₂(t).

Каноническая система будет представлена уравнениями:

= х₂; = 0,5 ψ₂(t);

х₁(0) = х₂(0) = 1; х₁(5) = х₂(5) = 0;

Используя (9.83), получаем

Из канонической системы следует:

Постоянные интегрирования находим из краевых условий:

t = 0 С₃ = С₄ = 0; С₁ = -0,67; С₂ = -2,079.

Оптимальное управление u* = (0,67t – 2,08)/2.