You are here

Динамическое программирование и процессы управления

Преподаватель: 
Семестр: 
7-8
Нагрузка: 
2 лекции в неделю
Форма отчетности: 
экзамены в 7 и 8 семестрах
Аннотация: 

Рассматривается применение метода динамического программирования и теории уравнения Гамильтона-Якоби-Беллмана к задачам синтеза управления для систем обыкновенных дифференциальных уравнений. Теория рассматривается как в "классическом" так и в неклассическом, «негладком», варианте. Приводятся примеры линейных и нелинейных процессов. Рассматриваются системы с неопределённостью в задании дифференциальных уравнений, а также системы с неполной априорной и текущей информацией о процессе. Обсуждаются вычислительные методы решения и пути изображения решения при помощи средств компьютерной графики.

Теоретический курс сопровождается вычислительным практикумом в 7-ом семестре.

Программа курса: 
  1. Введение. Вариационное исчисление. Гамильтонов формализм. Задачи управления. Программное и позиционное управление. Примеры.
  2. Задача динамического программирования для гладкого интегрального функционала на конечном интервале времени. Функция цены. Принцип оптимальности. Уравнение Беллмана.
  3. Уравнение Гамильтона-Якоби.
  4. Условия гладкости. Условия единственности решения.
  5. Достаточные условия оптимальности. Теорема о верификации. Связь с Принципом Максимума Понтрягина.
  6. Прямое и попятное уравнения Беллмана. Достижимость и разрешимость.
  7. Линейно-квадратичные задачи. Минимизация квадратичных функционалов. Единственность решения. Уравнение Риккати. Аналитический регулятор.
  8. Линейно-квадратичная задача гарантированного оценивания. Информационная функция. Информационное множество.
  9. Минимизация интегральных функционалов на бесконечном интервале времени. Автономные системы. Задачи с дисконтированием. Экономическая интерпретация.
  10. Теория стабилизации.
  11. Задачи с фазовым ограничением и свободным моментом окончания процесса. Принцип оптимальности. Уравнение Беллмана. Граничные условия. Примеры.
  12. Геометрические ограничения. Принцип встречных пучков. Два подхода к изучению пучков траекторий-динамическое программирование и многозначный анализ. Задача о выживаемости. Дифференциальные включения для выживающих систем.
  13. Теоремы о минимаксе.
  14. Линейно-выпуклые задачи. Геометрические ограничения. «Целевое управление». Задача синтеза на конечном промежутке времени. Достижимость и разрешимость. Трубки достижимости и трубки разрешимости. Динамическое программирование и метод экстремального прицеливания. Вычисление функций цены посредством решения двойственных задач выпуклого программирования.
  15. Чебышёвские функционалы. Задача оценивания с геометрическими ограничениями.
  16. Задача о быстродействии.
  17. Линейно-выпуклые задачи с фазовыми ограничениями. Невыпуклые фазовые ограничения.
  18. Линейные системы с неопределённостью. Программный и позиционный минимакс и максимин.
  19. Задача о коррекции движения. Конечное число коррекций.
  20. Игровой синтез в линейно-выпуклых системах. Уравнение Беллмана-Айзекса. Альтернированный интеграл Понтрягина. Мосты Красовского. Примеры из теории управления движением.
  21. Эволюционные уравнения для трубок достижимости и разрешимости. Достижимость в условиях противодействия.
  22. Импульсные управления. Оптимизация линейных систем в классе обобщённых функций. Двойственные задачи. Функция цены. Принцип оптимальности. Теорема о числе импульсов. Задача синтеза. Управление в классе обобщённых функций высоких порядков. Примеры.
  23. Нелинейные системы. Обобщённые решения уравнения Гамильтона-Якоби. Неединственность решения. Примеры.
  24. Вязкостные решения. Субрешения и суперрешения. Единственность вязкостных решений. Минимаксные решения. Примеры.

Дополнительный материал

  1. Метод характеристик для УЧП первого порядка. Интегрирования уравнений Гамильтона-Якоби. Обобщение метода характеристик для «негладких» уравнений Гамильтона-Якоби.
  2. Максимальные алгебры в задачах интегрирования уравнений Гамильтона-Якоби. Идемпотентное исчисление Маслова.
Рекомендованная литература: 
  1. Kurzhanski A., Valyi I. Ellipsoidal Calculus for Estimation and Control. — Birkhäuser, Boston, 1997.
  2. Kurzhanski A., Varaiya P. Dynamics and Control of Trajectory Tubes. — Birkhäuser, Basel, 2014.