Аналитическое конструирование регуляторов методом динамического программирования

Рассмотрим решение задач АКР методом динамического программирования на примере задачи о регуляторе состояния.

Пусть линейный нестационарный объект описывается уравнением состояния (8.1)

.

В качестве критерия качества используем (8.5):

.

По стандартной методике (см. п.5.3) записываем уравнение Беллмана (5.21):

.

Обозначим через минимальное значение критерия качества :

, (8.27)

где - подынтегральная функция.

С учётом этого уравнение Беллмана примет вид:

. (8.28)

Дальнейшая техника поиска оптимального управления для уравнения Беллмана в форме (8.28) полностью совпадает с методикой (см. п.5.3) для уравнения Беллмана (5.21).

1. Так как на управление ограничений не наложено, оптимальное управление ищем из условия равенства нулю частной производной по от выражения в фигурных скобках уравнения (8.28):

.

Откуда определяем, что

. (8.29)

2. Чтобы найти функцию , подставим (8.29) в выражение в фигурных скобках уравнения Беллмана (8.28) и получим уравнение типа Гамильтона-Якоби, независящее от управления :

.

В итоге, уравнение Гамильтона-Якоби примет вид:

. (8.30)

3. Выберем граничные условия. Из (8.27) видно, что при

. (8.31)

При введём пока неизвестную симметричную нестационарную матрицу , при которой выполняется равенство:

, (8.32)

причём .

Так как , а , то, подставив (8.32) в уравнение Гамильтона-Якоби (8.30), получим:

. (8.33)

В дальнейшем для простоты не будем записывать зависимость от времени .

Так как , то уравнение (8.33) запишем в форме:

.

Это условие выполняется при любых состояниях , если выражение в скобках равно нулю, т.е. если

.

Откуда следует, что

. (8.34)

В результате получили нелинейное квадратичное относительно матрицы дифференциальное уравнение, называемое матричным уравнением Риккати.

Уравнение Риккати в основном решается с помощью ЭВМ, начиная с и полагая, что . Для этого приближённо принимают, что

,

где - малое приращение времени.

Это позволяет представить уравнение Риккати (8.34) в следующей форме:

.

4. Найдя матрицу , можно по формуле (8.32) определить и, подставив его в выражение (8.29), найти оптимальное управление .

В работах Калмана доказано, что для стационарных объектов можно ввести матрицу , где - постоянная симметричная положительно определённая матрица. Эта матрица определяется из уравнения Риккати, в котором следует положить . Тогда нелинейное матричное уравнение Риккати примет вид:

. (8.35)