Динамическое программирование в задаче о максимальном быстродействии
Задачу о максимальном быстродействии можно представить как задачу с закреплённым правым концом траектории (задано), нефиксированным временем
и критерием оптимальности
. (7.3)
При сравнении критериев (6.2) и (7.3) видно, что для максимального быстродействия
. Если в уравнении Беллмана (5.21)
положить, что
,
, а
заменить на
, то получится уравнение Беллмана в задаче о максимальном быстродействии:
(7.4)
или в скалярной форме
, (7.5)
где - непрерывная функция, которая имеет непрерывные частные производные по переменной
.
Рассмотрим методику определения оптимального управления методом динамического программирования в задаче о максимальном быстродействии. Как и в случае динамического программирования (см. п.5.3), из условия минимума выражения в фигурных скобках находится оптимальное управление . Потом, подставив полученное оптимальное управление
в уравнение Беллмана (7.5), получаем дифференциальное уравнение первого порядка в частных производных типа Гамильтона-Якоби для задачи о максимальном быстродействии (см. методику определения оптимального управления с помощью уравнения Беллмана, п.5.3). С учётом граничного условия
находим
и, подставив его в выражение для оптимального управления
, получаем искомое оптимальное управление
.
Наиболее часто для решения таких задач используются численные методы, реализуемые с помощью ЭВМ.
Для простоты рассмотрим задачу о максимальном быстродействии для линейного объекта, описываемого уравнением состояния:
,
(7.6)
или в векторной форме
, (7.7)
где - матрица
с элементами
,
;
- матрица
с элементами
,
,
.
Область допустимых управлений наиболее часто задаётся системой неравенств
,
(7.8)
где .
С учётом того, что , то уравнение Беллмана (7.4) для линейного объекта примет вид:
.
Так как первое слагаемое не зависит от
, то его можно вынести за знак операции минимизации, что приведёт к уравнению
(7.9)
или в скалярной форме
. (7.10)
Чтобы слагаемое в фигурных скобках было минимальным необходимо, чтобы оно было отрицательным и принимало наибольшее значение по модулю. Это условие выполняется, если в (7.8) положить, что . Чтобы при отрицательном множителе
выражение в фигурных скобках (7.10) было отрицательным необходимо, чтобы
было положительным или наоборот. Учитывая это, можно записать, что
,
, (7.11)
где при
при
*.
Из (7.11) следует, что оптимальные управления в задаче о максимальном быстродействии являются кусочно-постоянными функциями, принимающими дискретные значения: либо
, либо
в зависимости от множителя
(рис. 7.2).
![]() |
Рисунок 7.2 – График изменения оптимального управления в задаче о максимальном быстродействии
* Свойства функции сигнум приведены в приложении А
Учитывая, что и, подставив оптимальное управление
(7.11) в уравнение Беллмана (7.10), получим:
;
. (7.12)
Решив уравнение (7.12), можно найти и, подставив его в (7.11), определяем оптимальное управление
,
.