Динамическое программирование в задаче о максимальном быстродействии
Задачу о максимальном быстродействии можно представить как задачу с закреплённым правым концом траектории (задано), нефиксированным временем и критерием оптимальности
. (7.3)
При сравнении критериев (6.2) и (7.3) видно, что для максимального быстродействия . Если в уравнении Беллмана (5.21) положить, что , , а заменить на , то получится уравнение Беллмана в задаче о максимальном быстродействии:
(7.4)
или в скалярной форме
, (7.5)
где - непрерывная функция, которая имеет непрерывные частные производные по переменной .
Рассмотрим методику определения оптимального управления методом динамического программирования в задаче о максимальном быстродействии. Как и в случае динамического программирования (см. п.5.3), из условия минимума выражения в фигурных скобках находится оптимальное управление . Потом, подставив полученное оптимальное управление в уравнение Беллмана (7.5), получаем дифференциальное уравнение первого порядка в частных производных типа Гамильтона-Якоби для задачи о максимальном быстродействии (см. методику определения оптимального управления с помощью уравнения Беллмана, п.5.3). С учётом граничного условия находим и, подставив его в выражение для оптимального управления , получаем искомое оптимальное управление .
Наиболее часто для решения таких задач используются численные методы, реализуемые с помощью ЭВМ.
Для простоты рассмотрим задачу о максимальном быстродействии для линейного объекта, описываемого уравнением состояния:
, (7.6)
или в векторной форме
, (7.7)
где - матрица с элементами , ;
- матрица с элементами , , .
Область допустимых управлений наиболее часто задаётся системой неравенств
, (7.8)
где .
С учётом того, что , то уравнение Беллмана (7.4) для линейного объекта примет вид:
.
Так как первое слагаемое не зависит от , то его можно вынести за знак операции минимизации, что приведёт к уравнению
(7.9)
или в скалярной форме
. (7.10)
Чтобы слагаемое в фигурных скобках было минимальным необходимо, чтобы оно было отрицательным и принимало наибольшее значение по модулю. Это условие выполняется, если в (7.8) положить, что . Чтобы при отрицательном множителе выражение в фигурных скобках (7.10) было отрицательным необходимо, чтобы было положительным или наоборот. Учитывая это, можно записать, что
, , (7.11)
где при при *.
Из (7.11) следует, что оптимальные управления в задаче о максимальном быстродействии являются кусочно-постоянными функциями, принимающими дискретные значения: либо , либо в зависимости от множителя (рис. 7.2).
Рисунок 7.2 – График изменения оптимального управления в задаче о максимальном быстродействии
* Свойства функции сигнум приведены в приложении А
Учитывая, что и, подставив оптимальное управление (7.11) в уравнение Беллмана (7.10), получим:
;
. (7.12)
Решив уравнение (7.12), можно найти и, подставив его в (7.11), определяем оптимальное управление , .