Аналитическое конструирование регуляторов методом динамического программирования
Рассмотрим решение задач АКР методом динамического программирования на примере задачи о регуляторе состояния.
Пусть линейный нестационарный объект описывается уравнением состояния (8.1)
.
В качестве критерия качества используем (8.5):
.
По стандартной методике (см. п.5.3) записываем уравнение Беллмана (5.21):
.
Обозначим через минимальное значение критерия качества :
, (8.27)
где - подынтегральная функция.
С учётом этого уравнение Беллмана примет вид:
. (8.28)
Дальнейшая техника поиска оптимального управления для уравнения Беллмана в форме (8.28) полностью совпадает с методикой (см. п.5.3) для уравнения Беллмана (5.21).
1. Так как на управление ограничений не наложено, оптимальное управление ищем из условия равенства нулю частной производной по от выражения в фигурных скобках уравнения (8.28):
.
Откуда определяем, что
. (8.29)
2. Чтобы найти функцию , подставим (8.29) в выражение в фигурных скобках уравнения Беллмана (8.28) и получим уравнение типа Гамильтона-Якоби, независящее от управления :
.
В итоге, уравнение Гамильтона-Якоби примет вид:
. (8.30)
3. Выберем граничные условия. Из (8.27) видно, что при
. (8.31)
При введём пока неизвестную симметричную нестационарную матрицу , при которой выполняется равенство:
, (8.32)
причём .
Так как , а , то, подставив (8.32) в уравнение Гамильтона-Якоби (8.30), получим:
. (8.33)
В дальнейшем для простоты не будем записывать зависимость от времени .
Так как , то уравнение (8.33) запишем в форме:
.
Это условие выполняется при любых состояниях , если выражение в скобках равно нулю, т.е. если
.
Откуда следует, что
. (8.34)
В результате получили нелинейное квадратичное относительно матрицы дифференциальное уравнение, называемое матричным уравнением Риккати.
Уравнение Риккати в основном решается с помощью ЭВМ, начиная с и полагая, что . Для этого приближённо принимают, что
,
где - малое приращение времени.
Это позволяет представить уравнение Риккати (8.34) в следующей форме:
.
4. Найдя матрицу , можно по формуле (8.32) определить и, подставив его в выражение (8.29), найти оптимальное управление .
В работах Калмана доказано, что для стационарных объектов можно ввести матрицу , где - постоянная симметричная положительно определённая матрица. Эта матрица определяется из уравнения Риккати, в котором следует положить . Тогда нелинейное матричное уравнение Риккати примет вид:
. (8.35)