Динамическое программирование

Задача быстродействия для линейного объекта

Качественное исследование оптимального управления

Расщепление краевой задачи

Задача Больца с нефиксированным правым концом и неограниченным временем

Задача Больца с подвижным правым концом

Задача Больца

 

Преобразуем в задачу терминального управления.

.

 

Задача превращается в такую:

 

 

План решения.

 

4) используем принцип максимума

 

План решения.

 

4) используем принцип максимума

5)

В частном случае решение краевой задачи несложно.

 

План решения.

 

линейно относительно .

 

4) используем принцип максимума

5) сформулируем двухточечную граничную задачу

 

Задача распадается на две задачи Коши. Начинаем решать со второй, затем подставляем полученную в первую задачу Коши.

Значение принципа максимума для задач оптимального управления определяется не только теми случаями, когда оптимальное управление полностью построено. Часто не менее важно исследовать задачу качественно. Несложный анализ может точно указать тип оптимального управления для систем вида:

 

Здесь

 

Максимум достигается при , если . В некоторых задачах можно сделать вывод о числе переключений (случаев, когда управление изменяется).

Рассмотрим систему

 

Здесь

 

Точки, в которых управление меняет знак, называются точками переключения.

Если векторы линейно независимы, то на конечное число переключений и на всем отрезке.

Пусть управляемая система описывается дифференциальными уравнениями с постоянными коэффициентами.

 

Или, что то же самое:

 

Полагаем, что система полностью управляема по отношению к каждому . Назовем такую систему «нормальной».

Для нормальности необходимо и достаточно, чтобы были линейно независимы векторы .

Отметим, что каждая нормальная система есть полностью управляемая. Обратное неверно.

Пусть область управления - -мерный куб .

 

Или, что то же самое:

 

Т.к. от зависит только , то максимизировать нужно только это слагаемое.

(7)

Каждая составляющая изменяется независимо от остальных. Поэтому максимально при .

Т.о., оптимальное управление – кусочно-постоянная функция времени со значениями, принадлежащими вершинам -мерного куба. Каждая есть кусочно-постоянная функция времени, принимающая значения в зависимости от знака . Если система нормальна, то (7) однозначно определяет управляющие функции , причем они имеют на конечное число переключений.

Аналогично определяется оптимальное по быстродействию управление и для случая, когда область допустимого управления есть выпуклый многогранник. Оптимальное управление будет кусочно-постоянной функцией времени со значениями, принадлежащими вершинам многогранника.

В общем, число переключений оптимального управления конечно и зависит от положения начальной и конечной точек, характеристических чисел матрицы и вида многогранника .

Пример.

 

Вводим новые переменные.

 

Ищем быстрейший перевод из начального в конечное положение .

1)

 

2)

 

 

- это прямая. может менять знак не более одного раза, поэтому тоже меняет знак не более одного раза.

Случай 1.

 

(7)

 

(8)

Здесь , т.е. постоянная.

x1
x2

При управлении точка движется вверх.

Случай 2.

 

Аналогично рассуждая, получим

(9)

x1
x2

При управлении точка движется вниз.

Итак, на плоскости в каждом из случаев траектории оптимального управления будут параболами.

В общем случае оптимальное управление следующее: начинаем движение по параболе из одного семейства, а заканчиваем параболой другого семейства. Пример изображен на рисунке.

x1
x2
u=–A
u=A