Аналитическое конструирование регуляторов по принципу максимума
Рассмотрим решение задачи АКР с помощью принципа максимума Понтрягина. Пусть линейный нестационарный объект описывается уравнением состояния (8.1)
.
Необходимо определить оптимальное управление, для которого критерий качества имеет вид (8.5):
.
Согласно методике решения задач по принципу максимума (см. п.6.1) введём новую переменную
, (8.36)
удовлетворяющую условию , и переменную , определяемую выражением (6.3) .
В соответствии с общей идеологией метода поиск решения начинаем с составления функции Гамильтона (6.21) для модифицированного вектора :
, (8.37)
где ; .
Компоненты , , функции можно найти из уравнений (6.4), (8.1) и (6.3) соответственно.
В результате подстановки (8.36) в (6.4) получим
(8.38)
при условии , где - начальное состояние объекта.
Для линейного нестационарного объекта (8.1) . В дальнейшем для компактности не будем записывать зависимость от времени . Тогда
. (8.39)
С учётом (8.39) и (8.1) функцию Гамильтона (8.37) перепишем следующим образом
. (8.40)
Так как на управление ограничений не наложено, то оптимальное управление находится из условия , которое можно записать в развёрнутой форме
; (8.41)
.
Откуда следует, что
. (8.42)
Таким образом, для определения оптимального управления необходимо знать переменные и . Как отмечалось в п.6.3 компоненты вектора можно найти из системы сопряженных уравнений (6.26):
.
, так как , и согласно (6.4), (6.1) и (6.3) не зависят от переменной , а является функцией от переменных , и .
, .
.
Из первого уравнения следует, что
Используя граничное условие (6.15) , получаем, что . Так как , то , следовательно, последнее слагаемое во втором и третьем уравнениях тоже равно нулю. Учитывая, что в выражении для оптимального управления (8.42), кроме , присутствует вектор с компонентами, то для определения компонент , достаточно уравнений. Тогда систему сопряженных уравнений можно записать в виде:
,
или в векторной форме
. (8.43)
Найдем первое и второе слагаемые (8.43) с учётом (8.39):
.
Из (8.1) следует, что .
Тогда сопряженная система примет вид:
, (8.44)
где , так как .
Для линейного объекта связь между и также должна быть линейной. Для этого введём пока не известную матрицу и запишем, что
. (8.45)
С учётом (8.45) оптимальное управление , а систему (8.44) перепишем в форме:
, (8.46)
где можно определить из уравнения состояния (8.1):
. (8.47)
В результате подстановки выражения (8.47) в (8.46), получим:
.
Откуда следует, что
.
В результате получаем, что
(8.48)
Полученное уравнение (8.48) с точностью до знаков совпадает с уравнением Риккати (8.34).
Поскольку для задачи со свободным правым концом траектории и фиксированным временем , то, согласно (8.45) , получаем граничное условие
. (8.49)
В итоге, выражение для оптимального управления примет вид:
,
где определяется из уравнения Риккати (8.48) при граничном условии (8.49).