КАРТОЧКА ПРОЕКТА ФУНДАМЕНТАЛЬНЫХ И ПОИСКОВЫХ НАУЧНЫХ ИССЛЕДОВАНИЙ,
ПОДДЕРЖАННОГО РОССИЙСКИМ НАУЧНЫМ ФОНДОМ

Информация подготовлена на основании данных из Информационно-аналитической системы РНФ, содержательная часть представлена в авторской редакции. Все права принадлежат авторам, использование или перепечатка материалов допустима только с предварительного согласия авторов.

 

ОБЩИЕ СВЕДЕНИЯ


Номер 21-71-00144

НазваниеУправление ансамблями мобильных роботов в условиях коммуникационных ограничений на основе машинного обучения и пассификации

РуководительЛипкович Михаил , Кандидат физико-математических наук

Организация финансирования, регион федеральное государственное бюджетное учреждение науки Институт проблем машиноведения Российской академии наук, г Санкт-Петербург

Период выполнения при поддержке РНФ 07.2021 - 06.2023 

Конкурс№60 - Конкурс 2021 года «Проведение инициативных исследований молодыми учеными» Президентской программы исследовательских проектов, реализуемых ведущими учеными, в том числе молодыми учеными.

Область знания, основной код классификатора 01 - Математика, информатика и науки о системах, 01-316 - Методы математического моделирования, оценивания и управления механическими и биомеханическими системами

Ключевые словаадаптивное управление, пассификация, машинное обучение, мобильные роботы, футбол роботов, мультиагентные робототехнические системы

Код ГРНТИ28.19.00


СтатусУспешно завершен


 

ИНФОРМАЦИЯ ИЗ ЗАЯВКИ


Аннотация
Цель проекта - разработка математических моделей и эффективных алгоритмов управления движением мобильных роботов и их мультиагентных ансамблей в условиях неопределенности. Проблемы мультиагентного управления систематически возникают на практике при поиске предметов или людей на большой территории, транспортировке большого количества грузов, мониторинге больших территорий и акваторий, перемещении большого числа объектов в складских помещениях и т.д. Разработанные модели и алгоритмы могут быть использованы при создании различных роботизированных производств, и важны для развития передовых цифровых технологий в промышленности и на транспорте, что обосновывает актуальность тематики проекта. Планируется также рассмотреть задачи организации коллективного поведения роботов в условиях командного противодействия на примере игры роботов в футбол. Исследования предполагается вести по нескольким направлениям: 1. Разработка алгоритмов управления передвижением роботов в целевые локации на сценах с подвижными препятствиями. 2. Метод адаптивной абсолютной стабилизации нелинейных систем на основе пассификации, предложенный ранее в работе [1] для случая кругового критерия, будет обобщен на случай критерия Попова, являющегося более мощным, чем круговой критерий. Кроме того, планируется обобщить предложенный подход на задачи слежения, а также на мультиагентные механические системы, описывающие динамику коллективов мобильных роботов. 3. Применение методов пассификации к стабилизации искусственных нейронных сетей 4. Планируется разработка нового подхода к обучению стандартных моделей, применяемых в интеллектуальных системах управления, на основе метода рекуррентных неравенств, предложенного В.А. Якубовичем. Этот подход позволит получить алгоритмы обучения с конечным временем сходимости и, более того, априори известным количеством шагов обучения, необходимым для получения желаемого качества модели. 5. Полученные алгоритмы будут применены на практике для управления командой игроков в футбол роботов RoboCup в лиге SSL Значимость результатов определяется их применимостью к сложным мультиагентным механическим системам и ансамблям мобильных роботов. Планируемые к разработке модели и алгоритмы могут быть использованы при создании различных роботизированных производств, систем транспортировки, складирования и мониторинга, которые важны для развития передовых цифровых технологий в промышленности и на транспорте. [1] Fradkov A.L., Lipkovich M.M. Adaptive Absolute Stability. IFAC-PapersOnLine, V. 48, Is. 11, 2015, pp. 258-263.

Ожидаемые результаты
1. Будут разработаны и исследованы алгоритмы автономной навигации робота в целевую локацию на сценах, насыщенных произвольно перемещающимися и деформирующимися препятствиями. 2. Будут получены алгоритмы стабилизации искусственных нейронных сетей на основе метода пассификации и комплекснозначного критерия Попова 3. Метод адаптивной абсолютной стабилизации будет распространен на случай критерия Попова и на задачи слежения для механических объектов и их ансамблей. 4. Будет разработан новый подход к обучению стандартных моделей применяемых в интеллектуальных системах управления на основе метода рекуррентных неравенств. 5. Будет выполнено применение полученных методов для управления командой игроков в футбол роботов RoboCup в лиге SSL Значимость результатов определяется их применимостью к сложным мультиагентным механическим системам и ансамблям мобильных роботов. Планируемые к разработке модели и алгоритмы могут быть использованы при создании различных роботизированных производств, систем транспортировки, складирования и мониторинга, которые важны для развития передовых цифровых технологий в промышленности и на транспорте.


 

ОТЧЁТНЫЕ МАТЕРИАЛЫ


Аннотация результатов, полученных в 2021 году
Наиболее значимые результаты, полученные в ходе выполнения гранта: 1. Получены достаточные условия адаптивной абсолютной стабилизируемости для нелинейных систем с одной секторной нелинейностью и одним входом на основе кругового критерия. Параметры рассматриваемой системы неизвестны и принимают значения из известного множества. Нелинейность и вход принадлежат разным уравнениям. Условия стабилизируемости получены исходя из критерия пассифицируемости относительно заданных входов и выходов 2. Доказано, что условия адаптивной абсолютной стабилизации являются не только достаточными, но и необходимыми для существования функции Ляпунова вида "квадратичная форма плюс квадратичная форма от ошибок параметров". Таким образом, показано, что ослабление условий стабилизируемости требует рассмотрения другого класса функций Ляпунова 3. Получены достаточные условия адаптивной абсолютной стабилизируемости для нелинейных систем с одной секторной нелинейностью и одним входом на основе критерия Попова. Параметры рассматриваемой системы неизвестны и принимают значения из известного множества. Нелинейность и вход принадлежат разным уравнениям. Условия стабилизируемости получены исходя из критерия пассифицируемости относительно заданных входов и выходов. Полученные условия позволили ослабить ограничение на относительную степень передаточной функции 4. На основе алгоритма "Полоска" В.А. Якубоврича были разработаны различные варианты сведения минимизации квадратичного функционала ошибки в задаче классификации к решению системы бесконечного числа линейных неравенств. Было проведено экспериментальное сравнение разработанных алгоритмов классификации со стандартными методами, такими как логистическая регрессия, обученная градиентным спуском и логистическая регрессия, обученная стохастическим градиентным спуском. Сравнение показало, что предложенные на основе "Полоски" алгоритмы могут обладать более высокой скоростью сходимости, что позволяет применять их к задачам онлайнового машинного обучения

 

Публикации

1. Липкович М.М. Adaptive Absolute Stabilization of SISO Systems Based on Circle Criterion IEEE Control Systems Letters, vol. 6, p. 2353-2358 (год публикации - 2022) https://doi.org/10.1109/LCSYS.2022.3153454

2. Липкович М.М., Миронов Д.В. Применение алгоритма "Полоска" в задаче онлайнового машинного обучения Интеллектуальные системы. Теория и приложения, том 25, номер 4, стр. 231-234 (год публикации - 2021)


Аннотация результатов, полученных в 2022 году
Были получены следующие научные результаты: 1. Получен алгоритм синхронизации двух нелинейных систем на основе метода адаптивной абсолютной стабилизации. Нелинейные системы содержат неизвестные параметры, принимающие значения из известного множества. Предполагается, что разность правых частей этих систем представима в виде линейной части с неизвестными параметрами, ненаблюдаемой нелинейности, удовлетворяющей секторному условию, и наблюдаемых нелинейностей, входящих в уравнения с неизвестными коэффициентами. Синхронизация рассматривается в смысле адаптивной абсолютной стабилизируемости: цель управления должна достигаться для любых нелинейностей, удовлетворяющих секторному условию и для любых значений неизвестных параметров, принимающих значения из известного множества. Показано, что условия усиленной пассифицируемости являются достаточными для синхронизации исходных систем 2. Доказано, что полученные условия синхронизации являются не только достаточными, но и необходимыми для существования функции Ляпунова вида "квадратичная форма плюс квадратичная форма от ошибок параметров". Таким образом, показано, что ослабление условий синхронизации требует рассмотрения другого класса функций Ляпунова 3. Получено расширение результатов по адаптивной абсолютной стабилизируемости на случай систем с несколькими входами и выходами. Предполагается, что система содержит один управляемый вход и несколько нелинейностей. Алгоритм стабилизации представляет из себя модификацию алгоритма скоростного градиента. 4. Разработан новый алгоритм машинного обучения на основе С-системы алгоритма "Полоска". Полученный алгоритм обладает высокой скоростью сходимости и малым числом операций, требуемых для совершения одного шага обучения. Алгоритм оказывается хорошо подходящим для работы с данными высокой размерности, в частности с разреженными данными. Полученный алгоритм может быть применен как в задаче классификации, так и в задаче регрессии 5. Были разработаны вариации алгоритмов "Полоска" на основе С-системы и L1-системы с дополнительными слагаемыми регуляризации. Получены условия сходимости алгоритмов в случае L1 и L2 регуляризаций. Добавление регуляризации позволяет бороться с переобучением. Использование L1 регуляризации, как и в случае традиционных моделей, приводит к занулению коэффициентов модели, что может быть использовано с целью отбора признаков 6. Было предложено решение задачи онлайнового декодирования ЭЭГ-паттернов, где требуется в реальном времени подстраивать параметры модели под определение какой рукой испытуемый намеревается осуществить движение на основе сигналов электроэнцефалограммы. Было произведено сравнение двух разработанных алгоритмов с алгоритмом логистической регрессии, обученной стохастическим градиентным спуском. Показано, что в рассматриваемой задаче алгоритм на основе L1-системы обладает самой высокой скоростью сходимости по сравнению с другими алгоритмами, тогда как алгоритм на основе C-системы, уступая L1-системе в скорости сходимости, опережает логистическую регрессию по скорости сходимости и опережает все рассмотренные алгоритмы по скорости выполнения каждого шага обучения

 

Публикации

1. Липкович М.М., Сагатдинов А.Р. Применение алгоритма "Полоска" для онлайнового декодирования ЭЭГ паттернов Мехатроника, автоматизация, управление, - (год публикации - 2023)

2. Липкович М.М. Метод рекуррентных целевых неравенств Якубовича в современном машинном обучении Материалы конференции «Математическая теория управления и ее приложения» (МТУИП-2022), - (год публикации - 2022)


Возможность практического использования результатов
не указано