Оптимальный синтез в задачах управления нелокальным уравнением неразрывности

КАРТОЧКА ПРОЕКТА ФУНДАМЕНТАЛЬНЫХ И ПОИСКОВЫХ НАУЧНЫХ ИССЛЕДОВАНИЙ,
ПОДДЕРЖАННОГО РОССИЙСКИМ НАУЧНЫМ ФОНДОМ

Информация подготовлена на основании данных из Информационно-аналитической системы РНФ, содержательная часть представлена в авторской редакции. Все права принадлежат авторам, использование или перепечатка материалов допустима только с предварительного согласия авторов.

ОБЩИЕ СВЕДЕНИЯ

Номер проекта 24-21-00373

НазваниеОптимальный синтез в задачах управления нелокальным уравнением неразрывности

Руководитель Авербух Юрий Владимирович, Доктор физико-математических наук

Организация финансирования, регион Федеральное государственное бюджетное учреждение науки Институт математики и механики им.Н.Н.Красовского Уральского отделения Российской академии наук , Свердловская обл

Конкурс №89 - Конкурс 2023 года «Проведение фундаментальных научных исследований и поисковых научных исследований малыми отдельными научными группами»

Область знания, основной код классификатора 01 - Математика, информатика и науки о системах; 01-204 - Математические проблемы теории управления

Ключевые слова игровые задачи управления, управление нелокальным уравнением неразрывности, негладкий анализ в пространстве мер, позиционные стратегии

Код ГРНТИ27.37.17

ИНФОРМАЦИЯ ИЗ ЗАЯВКИ

Аннотация
Нелокальное уравнение неразрывности появилось как идеализированная модель системы, состоящей из множества однотипных взаимодействующих объектов, и находит широкое применение как в задачах статистической физики, так и при исследовании поведения стад животных, больших групп беспилотных аппаратов, динамике общественного мнения и многих других задачах. Возможное исчезновение/появление объектов приводит к добавлению в математическом описании члена, описывающего сток/источник. В проекте изучается уравнение неразрывности в случае, когда на систему воздействует некоторое внешнее управление, или когда элементы системы могут самостоятельно выбирать свое поведение. При этом будут допускаться как наличие помех, так и источников/стоков. Такие модели изучаются в рамках теории управлении уравнением неразрывности, включающей в себя задачи управления средним полем, в которой предполагается, что все элементы системы выбирают свое управление индивидуально, лишь стремясь к общей цели. Несмотря на активный прогресс в области управления уравнением неразрывности, в настоящий момент основное внимание исследователей сосредоточено вокруг вопросов, касающихся существования оптимального управления и построения необходимых условий оптимальности. В частности, получены варианты необходимых условий оптимальности в форме принципа максимума Л.С. Понтрягина и показано, что функция цены задачи управления уравнением неразрывности удовлетворяет уравнению Гамильтона-Якоби в пространстве вероятностных мер. В настоящем проекте мы предполагаем изучить достаточное условие оптимальности: по заданному решению уравнению Гамильтона-Якоби в пространстве вероятностных мер, мы предполагаем построить оптимальную стратегию для исходной задачи управления. Кроме того, мы планируем построить приближенно оптимальную стратегию для управляемой системы, состоящей из большого, но конечного числа однотипных элементов. Также мы хотим распространить полученные результаты на случай задач управления уравнением неразрывности при наличии источников/стоков. Постановка, рассматриваемая в проекте, является принципиально новой и ранее не рассматривалась. Более того, в существующей литературе преимущественно рассматриваются необходимые условия оптимальности для задач управления уравнением неразрывности. В то же время ответы на поставленные вопросы позволят не только построить теорию достаточных условий оптимальности для нелокального уравнения неразрывности, но и установить двустороннюю связь между этими задачами управления и соответствующими уравнениями Гамильтона-Якоби в пространстве мер. Поскольку в проекте будут рассматриваться позиционные стратегии, предлагаемые нами конструкции могут быть использованы при исследовании конкретных управляемых мультиагентных систем, содержащих конечное, но большое число элементов.

ОТЧЁТНЫЕ МАТЕРИАЛЫ

Аннотация результатов, полученных в 2024 году
Классические результаты теории оптимального управления конечномерными системами включают характеризацию функции цены как обобщенного (вязкостного) решения уравнения Беллмана и вопросы построения оптимальных стратегий по заданному решению уравнения Беллмана. Получение аналогов этих результатов для случая управляемого нелокального уравнения неразрывности было целью работ в 2024 году. Отметим, что для нелокального уравнения неразрывности фазовым пространством является пространство вероятностных мер. Последнее снабжается метрикой Канторовича, которая появляется как цена задачи оптимальной транспортировки. Поскольку определение вязкостного решения и конструкции почти оптимальных стратегий используют понятия негладкого анализа, в ходе работ над проектом исследовались различные формы производных по направлению и суб-/супердифферениалов: в смысле Фреше, Адамара и проксимальные. Отметим, что направление в пространстве вероятностных мер может пониматься либо как функция, интерпретируемая как поле скоростей, либо как распределение скоростей. Это приводит к двум параллельным вариантам определений понятий негладкого анализа – барицентрическим и распределенным. Эти две теории связаны. В частности, барицентрические суб-/супердифференциалы вкладываются (при действии операции вычисления поточечного барицентра) в барицентрические. Мы дали определениетрешения уравнение Беллмана для задачи оптимального управления нелокальным уравнением неразрывности используя понятия барицентрических суб-/супердифференциалов в смысле Адамара и показали, что функция цены задачи оптимального управления нелокальным уравнением неразрывности с критерием типа Майера является решением этого уравнения Беллмана. Далее мы исследовали вопрос о построении почти оптимальных позиционных стратегий по заданному вязкостному решению уравнения Беллмана. Для этого мы построили аналог преобразования Иосиды-Моро функции, определенной на произведении промежутка времени и пространства вероятностных мер, и показали, что направление, разрешающее это преобразование, лежит в распределенном проксимальном субдифференциале. Предложенная нами конструкция почти оптимальной стратегии реализует метод экстремального сдвига вдоль этого направления. На основе полученных вложений распределеных проксимальных субдифференциалов и определения вязкостного решения, мы вывели оценки погрешности этого метода управления. Наконец отметим работы в области переноса полученных результатов на случай наличия источников/стоков абсолютно непрерывных относительно текущей меры. В этом случае фазовым пространством является пространство неотрицательных мер. Мы исследовали конструкции негладкого анализа для этого пространства. Прежде всего мы определили понятие сдвига в пространстве неотрицательных мер и, доказав теоремы о выживаемости, проверили корректность этого определения. На этой основе были введены понятия производных по направлению и суб-/супердифференциалов по Фреше и Адамару.

Публикации

1. Авербух Ю.В. Nagumo-type viability theorem for nonlocal balance equation Известия Института математики и информатики Удмуртского государственного университета, 2024, том 64, страницы 3–16 (год публикации - 2024)
110.35634/2226-3594-2024-64-01

Аннотация результатов, полученных в 2025 году
В этом году мы рассматривали управляемое уравнение баланса, которое описывает систему многих частиц, в которой частицы могут появляться и/или исчезать. Рассматривался случай, когда на все частицы действует одно внешнее управление. Целью управления является минимизация интегро-дифференциального показателя качества на конечном промежутке времени. Первая часть работ по проекту в этом году была связана с качественными свойствами исследуемой управляемой системы и со свойствами функции гарантированного результата – функции цены. Оказалось, что ранее рассматривавшаяся метрика на пространстве неотрицательных мер, основанная на выравнивании двух мер и поиске плана между «срезками», не позволяет доказать качественные свойства управляемых систем. Была предложена метрика, основанная на представлении неотрицательной меры в виде проекции вероятностной меры на пространстве с дополнительной переменной, играющей роль веса частицы. С использованием этой метрики были исследованы вопросы непрерывной зависимости траекторий, порождаемых нелокальным уравнением баланса. Это привело нас к доказательству теоремы о непрерывной зависимости функции цены от начального момента времени и начального распределения. Второй блок исследуемых вопросов связан с уравнением Беллмана как необходимым условием оптимальности. Уравнение Беллмана – это дифференциальное уравнение в частных производных, описывающее функцию цены. Формально оно получается из принципа динамического программирования дифференцированием. Отличительной его чертой является недифференцируемость функции цены, что приводит к необходимости определить понятие вязкостного решения, сводящегося к выполнению двух неравенств на элементах суб- и супердифференциалов функции цены. Мы определили понятия суб- и супердифференциала функции, зависящей от момента времени и неотрицательной меры. Это определение основано на понятии сдвига в пространстве неотрицательных мер, согласованного с введенной нами индуцированной метрикой. Кроме того, мы получили и более сильное условие – функция цены удовлетворяет вязкостным неравенствам для элементов эпсилон-суб- и супердифференциалов. Рассматривалась и обратная задача. А именно построение приближенно оптимальной стратегии по заданной функции, являющейся вязкостным решением уравнения Беллмана. Для этого мы изучали специальное преобразование этой функции и строили элемент, который задает в некотором смысле наилучшее направление. Такой метод построения стратегий следует принципу экстремального сдвига. Он существенно основан на результатах исследования обобщенных производных и суб-/супердифференциалов. Наконец, мы рассматривали вопрос об использовании стратегий, оптимальных для предельных систем, в случае систем, состоящих из конечного числа частиц, на которых действует некоторое общее внешнее управление. Оказалось, что в случае, когда число частиц сохраняется, стратегия, оптимальная в предельной системе, будет оптимальной и в системе с конечным числом частиц. Если частицы могут исчезать/появляться, то стратегия является лишь приближенно оптимальной.