КАРТОЧКА
ПРОЕКТА ФУНДАМЕНТАЛЬНЫХ И ПОИСКОВЫХ НАУЧНЫХ ИССЛЕДОВАНИЙ,
ПОДДЕРЖАННОГО РОССИЙСКИМ НАУЧНЫМ ФОНДОМ
Информация подготовлена на основании данных из Информационно-аналитической системы РНФ, содержательная часть представлена в авторской редакции. Все права принадлежат авторам, использование или перепечатка материалов допустима только с предварительного согласия авторов.
ОБЩИЕ СВЕДЕНИЯ
Номер 16-19-00057
НазваниеАдаптивное управление с прогнозирующими моделями при переменной структуре пространства состояний с приложением к системам сетевого управления движением и автоматизации медицинского оборудования
РуководительГраничин Олег Николаевич, Доктор физико-математических наук
Организация финансирования, регион федеральное государственное бюджетное учреждение науки Институт проблем машиноведения Российской академии наук, г Санкт-Петербург
Период выполнения при поддержке РНФ | 2019 г. - 2020 г. |
Конкурс Конкурс на продление сроков выполнения проектов, поддержанных грантами Российского научного фонда по приоритетному направлению деятельности Российского научного фонда «Проведение фундаментальных научных исследований и поисковых научных исследований по приоритетным тематическим направлениям исследований» (11).
Область знания, основной код классификатора 09 - Инженерные науки, 09-604 - Проблемы теории управления техническими системами
Ключевые словаадаптивное управление, прогнозирующая модель, переменная структура пространства состояний, мультиагентные системы, распределенные вычисления, автоматизация медицинского оборудования
Код ГРНТИ28.15.23
СтатусУспешно завершен
ИНФОРМАЦИЯ ИЗ ЗАЯВКИ
Аннотация
Новый проект направлен на практическую реализацию методов и подходов, разработанных в ходе выполнения Проекта 2016-18 гг., в таких областях, как авиация, робототехника, медицина.
Планируется дальнейшая разработка самолета с перьями, апробация алгоритмов коллективного управления для роя из 100 роботов, применение разработанных алгоритмов для сжатия и обработки изображений УЗИ томографа с 1024 датчиками.
В ходе работ по Проекту 2016-18 гг. продемонстрированы новые возможности интеллектуального управления сложными мехатронными системами, открывающиеся благодаря достигнутому в последнее время существенному прогрессу в миниатюризации электронных устройств, с одной стороны, и достижениям в понимании сложных структур и динамики, с другой. Фактическая динамика сложных крупномасштабных систем (групп роботов, роботизированных устройств, агентов), работающих в нестабильной окружающей среде, слишком сложна, чтобы ей можно было управлять традиционными методами, так как она не может быть удовлетворительно аппроксимирована классическими моделями, описываемыми ОДУ. В то же время, эта сложность может быть резко сокращена быстрыми процессами, организующими элементы системы (роботов, микроактуаторы, клетки, частицы и т.п.), называемые агентами, в относительно небольшое количество кластеров. Кластеры возникают и разрушаются в ответ на быстрые изменения в окружающей среде, и эти переходные процессы намного быстрее, чем время существования кластеров. В течение времени существования кластеров динамика системы по существу малоразмерна, поскольку переменные состояния агентов, составляющих каждый кластер, являются синхронными. Чрезвычайно сложная система, таким образом, сводится к конечномерной модели с изменяющейся во времени структурой вектора состояния. Такой малоразмерной моделью можно эффективно управлять с помощью классических методов адаптивного управления с прогнозирующими моделями.
Формирование кластеров показывает принципиальную возможность представления большой сложной и многомерной системы в разреженном виде в некотором фазовом пространстве. Проект 2019 является логическим продолжением и развитием проведенных ранее исследований. В ходе выполнения проекта предполагается продолжить изучение для сложных сетевых систем роботов (роботизированных устройств, агентов) условий формирования кластеров (подгрупп роботов), динамически возникающих/изменяющихся в "быстром" времени за счет локальных обратных связей между роботами на микро-уровне и не разрушающихся при некоторых общих (макро) воздействиях на подгруппы роботов, и описать класс макро-управлений (общих для некоторых подгрупп роботов), которые не приводят к быстрым разрушениям кластеров и зависят от интегральных характеристик кластеров (подгрупп роботов), например, положения и скорости центра масс, скорости вращения. Возможности использования введенных макро-управлений в рамках выполненного проекта существенно ограничены трудностями формирования адекватных наблюдателей для образующихся новых кластеров, т.к. формировать в реальном времени огромный набор актуальных данных о всех агентах практически нереализуемо. Для получения в "медленном" времени информации о возникающих кластерах без фиксации состояний всех агентов в сети предлагается исследовать возможности методологии опознания по сжатию (Compressive Sensing). Предполагается разработка таких новых методов получения интегрированных наблюдений, которые применимы для синтеза адаптивного макро-управления робототехническими системами на основе прогнозирующих моделей при переменной структуре пространства состояний в условиях неопределенностей и существенных внешних возмущений.
Исследование возможностей формирования обратной связи для макро-управлений по этим наблюдениям позволит продвинуться далее в решении задачи о полете самолета в турбулентной среде, которая активно изучалась в Проекте 2016 года. Планируется исследование применимости разработанных методов в приложении к модели самолета типа летающее крыло с управляемыми гибридными аэродинамическими рулями управления (элевонами) и двигателем с переменным по мощности вектором тяги, обеспечивающими управление на макро-уровне, и с сетевым микро-управлением массивом миниатюрных роботизированных элементов из датчиков и исполнительных механизмов, распределенных по поверхности.
Апробация разработанных новых методов коллективного управления и формирования наблюдений будет проведена с помощью экспериментального стенда "Рой из 100 роботов" и при решении задачи УЗИ томографии с аппаратом из 1024 датчиков, соединенных в кольцо, для определения характерных патологий внутренних органов при медицинских исследованиях.
Научная значимость и новизна сформулированных конкретных задач Проекта 2019 года непосредственно определяются результатами выполнении Проекта 2016 и недостаточным в настоящее время уровнем теоретических и практических исследований вопросов адаптивного управления робототехническими системами в изменяющейся динамической среде при переменной структуре пространства состояний. Масштабность предлагаемого исследования обоснована широким спектром возможных приложений как в робототехнике, так и в экономике, физике, биологии, социологии и др. науках.
Ожидаемые результаты
1. Описание классов моделей сетевых систем (состоящих из роботизированных устройств, агентов) и вывод условий, при которых в "быстром" времени за счет локальных обратных связей между роботами на микро-уровне динамически возникают/изменяются кластеры (подгруппы роботов) и не разрушаются при некоторых общих (макро) воздействиях на подгруппы роботов.
2. Описание класса макро-управлений (общих для некоторых подгрупп роботов) в "медленном" времени, которые не приводят к быстрым разрушениям кластеров и зависят от таких интегральных характеристик кластеров (подгрупп роботов), как положения в пространстве, скорости центра масс и скорости вращения.
3. Новые методы получения интегрированных наблюдений о кластерах в "медленном" времени без наблюдения состояний всех агентов в сети, применимые для синтеза адаптивного макро-управления робототехническими системами на основе прогнозирующих моделей при переменной структуре пространства состояний в условиях неопределенностей и существенных внешних возмущений.
4. Отчет о применимости разработанных методов в приложении к модели самолета типа летающее крыло с управляемыми гибридными аэродинамическими рулями управления (элевонами) и двигателем с переменным по мощности вектором тяги, обеспечивающими управление на макро-уровне, и с сетевым микро-управлением массивом миниатюрных роботизированных элементов из датчиков и исполнительных механизмов, распределенных по поверхности.
5. Отчет о проведенной апробации разработанных новых методов коллективного управления и формирования наблюдений с помощью экспериментального стенда "Рой из 100 роботов" и в применении к задаче УЗИ томографии с аппаратом из 1024 датчиков, соединенных в кольцо, для определения характерных патологий внутренних органов.
Научная значимость и новизна ожидаемых результатов непосредственно определяются итогами выполнении Проекта 2016 и недостаточным в настоящее время уровнем теоретических и практических исследований вопросов адаптивного управления робототехническими системами в изменяющейся динамической среде. Ожидаемые результаты соответствуют мировому научному уровню, что будет подтверждено публикациями в ведущих рецензируемых научных журналах. Масштабность предлагаемого исследования обоснована широким спектром возможных приложений как в робототехнике, так и в экономике, физике, биологии, социологии и др. науках. Результаты проекта можно будет использовать на практике в экономике при анализе и управлении в условиях быстрых изменений и моделях социальной динамики.
ОТЧЁТНЫЕ МАТЕРИАЛЫ
Аннотация результатов, полученных в 2019 году
В отчетном году основные усилия исполнителей были направлены на практическую реализацию методов и подходов, разработанных в ходе выполнения Проекта 2016-2018 гг. в таких областях как авиация, медицина, робототехника. Были продолжены работы по разработке «самолета с перьями», для апробации алгоритмов коллективного управления роботами были сконструированы и собраны 10 небольших роботов с реализацией функций коллективного поведения через программно-аппаратную организацию взаимодействия между собой, начаты работы по исследованию применимости разработанных подходов в сложной задаче извлечения информации о плотности различных специфических областей при обработке реальных потоковых данных, получаемых одновременно с 2048 датчиков УЗИ томографа с частотой 25 МГц.
Результаты проекта опубликованы в 2019 г. в индексируемых в БД Web of Science и Scopus журналах "IEEE Transactions on Automatic Control", "International Journal of Bifurcation and Chaos", "Автоматика и телемеханика", "Cybernetics and Physics", а также в периодических изданиях "Proceedings of the IEEE Conference on Decision and Control", "Proceedings of the European Control Conference", "Proceedings of the IEEE Conference on Control Technology and Applications", "Proceedings of the Mediterranean Conference on Control & Automation".
С точки зрения развития технологий основой мотивации для исследований являются миниатюризация и увеличение быстродействия вычислителей, датчиков и исполнительных устройств, что позволяет по-новому взглянуть на многие традиционные подходы теории управления, идентификации и оценивания на практике при управлении большими группами роботов (роботизированных устройств, агентов). При этом появляются возможности интеллектуального управления сложными мехатронными системами на переходных процессах и в условиях турбулентности. В системе, состоящей из большого числа агентов, с одной стороны, при наличии согласованности в поведении некоторых групп агентов (кластеров) общая размерность пространства состояний снижается. С другой стороны, действие возмущений может приводить к нарушению согласованности поведения агентов в некоторой группе, что соответствует повышению размерности пространства состояний.
В отчетном периоде теоретические исследования были сфокусированы на задачах синтеза адаптивного макро-управления робототехническими системами на основе прогнозирующих моделей при переменной структуре пространства состояний в условиях неопределенностей и существенных внешних возмущений, изучении для сложных сетевых систем роботов (роботизированных устройств, агентов) условий формирования кластеров (подгрупп роботов), динамически возникающих/изменяющихся в "быстром" времени за счет локальных обратных связей между роботами на микро-уровне и не разрушающихся при некоторых общих (макро) воздействиях на подгруппы роботов, а также на исследовании класса макро-управлений (общих для некоторых подгрупп роботов), которые не приводят к быстрым разрушениям кластеров и зависят от интегральных характеристик кластеров (подгрупп роботов), например, положения и скорости центра масс, скорости вращения. В ходе работ была предложена и обоснована схема синтеза адаптивного макро-управления на основе робастного метода, использующего прогнозирующие модели, который подстраивается за конечное (малое) число наблюдений к сформировавшейся быстро (на коротком интервале времени) новой структуре объекта и потом на конечном интервале времени позволяет оптимизировать характеристики динамики объекта. Исследование возможностей синтеза обратной связи для макро-управлений, неразрушающих образующиеся кластеры, основывается на выведенных оценках скорости формирования кластеров и полученных условиях на «запас прочности» при формировании кластеров за счет выбора параметров (коэффициентов) в алгоритме. Этот запас прочности позволяет выписать ограничения на класс макро-управлений, в которые должны «укладываться» нелинейности в макро-модели для сохранения структуры кластеров неизменной. При разрушении кластеров фактически происходит формирование нового макро-окружения и перезапускается процесс образования новых кластеров. В рамках развития соответствующих теоретических вопросов был проведен анализ устойчивости осцилляторов и сетей осцилляторов, описываемых моделью Лурье с бесконечномерной линейной частью и периодической нелинейностью, получены условия глобальной "устойчивости" таких систем, понимаемой как сходимость каждого решения к одному из положений равновесия (как правило, система имеет бесконечную последовательность равновесий). Критерий устойчивости сформулирован в "частотно-алгебраической" форме и включает в себя частотное условие, близкое по форме к обычным условиям абсолютной устойчивости нелинейных систем (круговой критерий, критерий Попова и др.), а также ряд нелинейных алгебраических условий. Получен также ослабленный вариант критерия устойчивости: именно, показано, что при выполнении частотного неравенства лишь в некотором диапазоне частот система не имеет периодических решений с частотами из этого диапазона. Показано, что оба критерия робастны по отношению к затухающим возмущениям (принадлежащим классу L_1 или L_2), а также сингулярным возмущениям, меняющим структуру системы.
Серьезной проблемой организации коллективной работы большой группы робототехнических устройств, цель которых мониторинг состояния и перемещений окружающих объектов, является задача распределения объектов (целей) между наблюдателями. В ходе выполнения проекта предложен и обоснован новый способ оптимизации назначений наблюдателей на объекты, основанный на решении системы линейных матричных неравенств для оптимизационной задачи L_1-оптимизации специального вида. Этот новый способ позволяет перейти к мультиагентным технологиям вместо традиционных централизованных решений. Существенное внимание было уделено решению задачи о наблюдении за системами сложной структуры при наличии коммуникационных ограничений, а именно, оценке наименьшей скорости передачи информации, при которой можно построить наблюдатель для состояния системы. Известно, что эта скорость совпадает с характеристикой динамической системы, называемой топологической энтропией. Явные формулы топологической энтропии известны лишь для линейных систем и некоторых специальных нелинейных систем малого порядка. В ходе работы получены конструктивные оценки топологической энтропии для нелинейных систем с сетевой структурой в предположении, что агенты являются диссипативными по Виллемсу системами, а также выполнено некоторое ограничение на связи между агентами, которые должны быть достаточно "слабыми".
Важным направлением исследований является разработка новых методов машинного обучения по малому количеству данных. Был предложен и обоснован новый метод, в котором классификатор обучается таким образом, чтобы успешно адаптироваться к новым классам, которых не было в тренировочных данных. Кроме того, рассмотрен случай, когда только небольшое количество примеров каждого класса доступно при классификации. Одной из проблем в алгоритмах обучения этого типа является неопределенность, возникающая из-за небольшого количества примеров на класс. Для решения этой проблемы предложен новый подход, основанный на стохастической аппроксимации с рандомизацией на входе, для оптимизации многозадачной функции потерь при обучении по малому количеству данных.
В отчетном периоде были продолжены эксперименты на экспериментальном стенде - крыле самолета с сетевым микро-управлением массивом миниатюрных роботизированных элементов из датчиков и исполнительных механизмов, распределенных по поверхности. . Для повышения эффективности его работы было предложено существенно модернизировать аппаратные и программные модули, отвечающие за взаимодействие автономных робототизированных элементов между собой. В отчетном году наиболее активно проводились эксперименты с блоками взаимодействия разрабатываемого нового стенда «Рой из 100 роботов», на котором предполагается апробация новых алгоритмов группового адаптивного управления. Для передачи данных в сети робототехнических комплексов предложен принцип обновления и анализа данных во всей системе путем стремления компонентов системы к достижению консенсуса на основе протокола локального голосования, работоспособного в сети с помехами и задержками в передаче данных. В качестве тестовой площадки для предложенных методов изготовлен и собран комплекс группы из 10 колесных роботов, выполняющих групповое движение к источнику света в условиях возникновения препятствий, загораживающих прямую видимость источника света для членов группы при их движении. Каждый колесный робот состоит из платформы с двумя ведущими двигателями для привода основных колес и одним свободновращающимся, аккумуляторным модулем, шестью датчиками освещенности по кругу, инерциальной системой MPU 6050. Размеры роботов 10*10*13 см. Аккумулятор Li-Ion 2s 18650 c напряжением 7,4 V и токоотдачей в 10 A. В качестве ведущих двигателей используются бесколлекторные двигатели с внутренним ротором, для управления используются контроллеры оборотов с сигналом управления ШИМ. Корпус и крепление деталей изготавливались на 3D принтере из пластика ABS. Каждый робот имеет два микрокомпьютера. Один микрокомпьютер отвечает за управление роботом. Второй вычислительный блок отвечает за обмен данными в группе роботов. В качестве основного микрокомпьютера применяется плата Arduino. Микрокомпьютер для передачи данных в децентрализованной сети построен на основе модуля ESP8266.
В последнее время повышенный интерес к ультразвуковой томографии вызван неинвазивностью метода и повышением точности оборудования. Для УЗИ томографии с аппаратом из 2048 датчиков, соединенных в кольцо, для определения характерных патологий внутренних органов при медицинских исследованиях описаны подходы к решению следующих ключевых подзадач: расчет времени прохождения сигнала (Time of flight, TOF), обнаружение особых областей, расчет плотности особых областей. Повышение точности расчета времени прихода сигнала позволяет повысить качество определения плотности тканей в выявленных особых областях, которое проводится с помощью решения сложных нелинейных оптимизационных задач. Для решения оптимизационных задач большой размерности в условиях поступления на вход интенсивных потоков входных данных в ходе выполнения проекта был предложен и обоснован новый алгоритм, совмещающий рандомизированный алгоритм стохастической аппроксимации и алгоритм консенсуса.
Научная значимость и новизна полученных результатов подтверждаются публикациями в ведущих научных журналах. Масштабность предлагаемого исследования обоснована широким спектром возможных приложений как в робототехнике, так и в экономике, физике, биологии, социологии и др. науках.
Публикации
1. Амелин К., Амелина Н. Передача информации через достижение консенсуса в децентрализованной сети робототехнических комплексов Стохастическая оптимизация в информатике, Том 15, вып. 2, стр. 3-12. (год публикации - 2019)
2. Амелин К., Амелина Н., Граничин О., Граничина О., Иванский Ю. Synchronization of multi-agent system of "feathers" on the surface of the wing in a turbulent airflow Proc. of the 2019 IEEE Conference on Control Technology and Applications (CCTA), August 19-21, 2019, Hong Kong, China, pp. 355-359. (год публикации - 2019)
3. Амелин К., Амелина Н., Граничин О., Иванский Ю. Синхронизация мультиагентной системы «перьев» на поверхности крыла в турбулентном воздушном потоке сб. трудов XIII Всероссийского совещания по проблемам управления, ВСПУ-2019, Москва 17-19 июня 2019 г.,, с. 652-656 (год публикации - 2019)
4. Амелина Н.О., Граничин О.Н., Фрадков А.Л. The method of averaged models for discrete adaptive systems Automation and Remote Control, Vol. 80, No. 10, pp. 345–372. (год публикации - 2019) https://doi.org/10.1134/S0005117919100011
5. Бояров А.А., Граничин О.Н. Stochastic approximation algorithm with randomization at the input for unsupervised parameters estimation of Gaussian mixture model with sparse parameters Automation and Remote Control, Vol. 80, No. 8, pp. 1391–1406 (год публикации - 2019) https://doi.org/10.1134/S0005117919080034
6. Ерофеева В., Граничин О., Амелина Н., Иванский Ю., Джанг Ю. Distributed tracking via simultaneous perturbation stochastic approximation-based consensus algorithm Proc. of the 2019 IEEE 58th Conference on Decision and Control (CDC). December 11-13, 2019, Nice, France, - (год публикации - 2019)
7. Ерофеева В., Граничин О., Галясмна В., Гонта К., Панков В., Турсунова М., Динг М., Ючи М., Фенг К. Detection of specific areas with ultrasound tomography Cybernetics and Physics, Vol. 8. No. 3. 2019, pp. 121-127. (год публикации - 2019)
8. Ерофеева В., Граничин О., Граничина О., Сергеенко А., Трапицын С Sensor selection under unknown but bounded disturbances in multi-target tracking problem Proc. of the 27th Mediterranean Conference on Control & Automation. July 1-4, 2019, Akko, Israel, pp. 219-214 (год публикации - 2019) https://doi.org/10.1109/MED.2019.8798526
9. Ерофеева В., Граничин О., Леонова А. Распределение целей слежения в сенсорной сети при неизвестных но ограниченных помехах в измерениях Сб. трудов XIII Всероссийского совещания по проблемам управления, ВСПУ-2019, Москва 17-19 июня 2019 г., с. 669-673 (год публикации - 2019)
10. Калмук А., Тюшев К., Граничин О., Динг М., Ючи М. Randomized MPC with model uncertainties based on LSCR approach Proc. of the 2019 European Control Conference, June 25-28, 2019, Napoli, Italy, pp. 4307-4312. (год публикации - 2019) https://doi.org/10.23919/ECC.2019.8796223
11. Матвеев А.С. , Проскурников А.В. , Погромский А., Фридман Э. Comprehending Complexity: Data-Rate Constraints in Large-Scale Networks IEEE Transactions on Automatic Control, VOL. 64, NO. 10, pp. 4252 - 4259 (год публикации - 2019) https://doi.org/10.1109/TAC.2019.2894369
12. Пилюгин С., Кампи М. Opinion formation in voting processes under bounded confidence Networks and Heterogeneous Media, Том: 14 Выпуск: 3 Стр.: 617-632 (год публикации - 2019) https://doi.org/10.3934/nhm.2019024
13. Смирнова В.Б., Проскурников А.В. Volterra equations with periodic nonlinearities: multistability, oscillations and cycle slipping International Journal of Bifurcation and Chaos, Vol. 29, No. 5, 1950068 (год публикации - 2019) https://doi.org/10.1142/S0218127419500688
Аннотация результатов, полученных в 2020 году
В ходе выполнения проекта получены теоретические и экспериментальные результаты, показывающие, что мультиагентный подход позволяет более гибко управлять сложными системами в сравнении с традиционными подходами. Исследования теоретических вопросов адаптивного управления в изменяющейся динамической среде актуализируют развитие методов адаптивного мультиагентного управления в условиях неопределенностей и существенных внешних возмущений. Проблемы управления сетевой системой осложняются динамическим изменением ее характеристик из-за наличия внутренних процессов взаимодействия. Современные технологии позволяют наблюдать и управлять процессами внутри сетевой системы. Появление/изменение кластеров (подгрупп агентов) привносит дополнительные факторы неопределенности в систему управления группами роботов, определяемые динамическими и пространственными характеристиками образующихся/изменяющихся кластеров. В опубликованной в рамках выполнения проекта коллективной монографии дан всесторонний анализ современного состояния и перспектив исследований по теме «Самоорганизация и искусственный интеллект в группах автономных роботов: методология, теория, практика». Мультиагентные технологии предоставляют возможности и методы искусственного интеллекта, программные средства поддержки распределенности и открытости. Такие системы часто применяются для управления ансамблями (роями, стаями) динамических объектов, выполняющих общую задачу или задачу с разделяющимися целями в условиях неопределенностей. В качестве исполнительных элементов таких систем используются роботизированные устройства различного назначения, которые могут действовать одновременно в трех средах: на земле (стационарные, колесные и гусеничные устройства), под водой (автономные необитаемые подводные аппараты) и в воздухе (беспилотные летательные аппараты). Один из новых подходов – роевое управление – изучает возможности построения системы из совокупности автономных интеллектуальных агентов (роботов) для достижения коллективных целей, которые не могут быть достигнуты отдельным роботом или для которых коллективное выполнение поставленной задачи более эффективно. Основополагающей идеей роевого управления является «эмерджентный (роевой) интеллект», широко наблюдаемый в природном мире: косяки рыб, колонии пчел, муравьев и прочее. Эмерджентный (роевой) интеллект – это подход, в котором реализуется управление коллективным поведением децентрализованной самоорганизующейся совокупности однородных объектов. Агенты очень похожи на членов команды, которые могут соревноваться друг с другом или сотрудничать в процессе принятия решения. Ключевая особенность эмерджентного интеллекта — динамика и непредсказуемость процесса принятия решений. На практике это означает, что решение достигается за счет сотен и тысяч взаимодействий, которые почти невозможно отследить. Эти сценарии формируются и исполняются агентами самостоятельно. Эмерджентный интеллект — это не какой-либо один новый и специально сконструированный уникальный «блок», добавленный к системе. Напротив, это результат самоорганизации, который возникает за счет множества скрытых или явных условий, сложившихся в ситуации, спонтанно и в заранее непредвиденный момент времени, и так же неожиданно исчезает, но в процессе своего существования определяющим образом руководит работой всей системы.
Возможности использования самоорганизации при прохождении миссий в условиях существенных неопределенностей группой из 100 достаточно дешевых роботов без централизованного управления и без составления «карты мира» продемонстрированы на созданном в рамках выполнения проекта стенде «Рой 100 роботов». Самоорганизация обеспечивается вычислительно сверхэкономными алгоритмами автономной навигации (типа протокола локального голосования), следующих парадигме непосредственной реакции каждого робота (агента) на свои сенсорные данные о текущей ситуации и на соответствующие данные от ограниченного числа его соседей (локальные коммуникации). Вместе с тем на макроуровне эти алгоритмы обеспечивают определенные гарантии достижения поставленной общей цели.
Другой важный пример использования самоорганизации для решения сложных задач исследован при сравнении различных подходов к одной из важных комбинаторных задач - проблеме поиска гамильтонова пути в графе. При определенных степенях разреженности графа использование наиболее популярного метода ветвей и границ, реализуемого на классическом компьютере, становится невозможным из-за его экспоненциально растущей сложности. Основанные на присущих природе принципах самоорганизации ДНК-вычисления требуют только линейно растущего времени. Благодаря усовершенствованиям в методах биофизики, которые необходимы при ДНК-вычислениях, в ходе выполнения проекта обоснована и реализована более быстрая модернизированная процедура, в которую добавлены некоторые новые этапы ДНК-вычислений.
Ранее при выполнении проекта было показано, что локальные взаимодействия между агентами часто приводят к их групповой синхронизации, также именуемой кластеризацией. Важно отметить, что сама кластеризация представляет из себя часто более быстрый процесс, чем изменения в окружающей (систему) среде. При этом, как правило, цели управления определяются поведением системы на больших временных интервалах. Если рассматриваемый временной интервал намного больше, чем время, в течение которого формируются кластеры, то в таком случае образовавшиеся кластеры можно считать «новыми переменными» в модели “медленного” времени. Такие переменные называют “мезоскопическими”, поскольку их масштаб находится между уровнем всей системы (макро-уровень) и уровнем отдельных агентов (микро-уровень). Детализированные модели сложных систем, состоящих из большого числа элементарных компонентов (миниатюрных агентов), очень сложны для управления из-за технологических барьеров и колоссальной сложности задач ввиду их огромной размерности. На уровне элементарных компонентов систем во многих приложениях невозможно верифицировать модели движения агентов с традиционно высокой степенью точности из-за их миниатюризации и высокой частоты управляющих воздействий. Использование новых мезоскопических переменных может позволить синтезировать меньше разных управляющих входов, чем при рассмотрении системы как совокупности большого количества агентов, поскольку такие входы будут общими для целых кластеров. Для реализации этой идеи в ходе выполнения проекта формализован фреймворк «потоки кластеров», который для примера используется при анализе нелинейной системы взаимодействующих осцилляторов – модели Курамото - сложной системы с эффектами возможностей возникновения кластеров. При этом установлены достаточные условия возникновения в системе кластерной синхронизации (разбиение всей системы на кластеры, в которых поведение осцилляторов синхронизировано) и получены ограничения на класс мезоскопических управлений, при которых установившаяся в системе кластерная синхронизация сохраняется. Показано, что кластеризация приводит к разреженному представлению динамических траекторий системы, что позволяет применить метод опознания по сжатию (compressive sensing) для получения динамических характеристик образовавшихся кластеров. Суть метода заключается в следующем. При размерности N общего пространства состояний всей системы и априорном задании верхней оценки для количества кластеров s формируется только m интегральных рандомизированных наблюдений общего вектора состояний всей большой системы, где m пропорционально числу s, умноженному на логарифм N/s. В проекте предложен двухэтапный алгоритм наблюдений: сначала пространство состояний ограничивается и дискретизируется, а затем происходит непосредственно сжатие, по которому далее делается реконструкция, позволяющая получить интегральные характеристики кластеров. На основании этих полученных характеристик далее с помощью общих методов управления с прогнозирующими моделями при заданной цели управления в пространстве размерности не более s можно синтезировать мезоуправления для каждого из кластеров, учитывая ограничения, полученные на управления. Работоспособность нового фреймворка иллюстрируется примерами имитационного моделирования.
Кластеризация данных – типичная задача машинного обучения. В условиях изменения структуры пространства состояний актуально развитие методов кратковременного обучения, в которых классификатор должен быть обучен таким образом, чтобы он мог адаптироваться к новым классам, которых не было в тренировочных данных. Кроме того, важны случаи, когда только небольшое количество примеров каждого класса доступно при классификации. Для решения таких задач предложен новый рандомизированный алгоритм стохастической аппроксимации на основе новой многозадачной функции потерь, подобной используемой в методе сетей прототипов, дано теоретическое обоснование алгоритма и приведен анализ экспериментов. Результаты экспериментов с эталонным набором данных демонстрируют, что предлагаемый алгоритм превосходит оригинальный метод сетей прототипов.
Для решения проблемы кластеризации в системах с моделями данных типа разреженной смеси гауссовых распределений при значительных неопределенностях в модели данных и измерениях штрафных функций предложена модифицированная версия алгоритма на основе рандомизированного алгоритма стохастической аппроксимации, для которой дано математическое обоснование и доказана устойчивость к внешним воздействиям. Алгоритм обрабатывает данные последовательно, «на лету». Его работоспособность иллюстрируется примерами его использования для кластеризации в различных сложных условиях.
Для решения задач многомерной оптимизации исследована применимость нового подхода последовательной оптимизации на подпространствах, при котором исходная задача оптимизации последовательно сводится к задачам оптимизации в низкоразмерных подпространствах. Разработан новый метод, основанный на комбинации шагов квазиньютоновского метода и метода сопряженных градиентов, для которого установлены некоторые теоретические оценки. В частности, для задачи квадратичного программирования доказывается линейная сходимость за конечное число шагов. Превосходство предлагаемого алгоритма над обычными современными методами демонстрируется как на синтетических (смоделированных) данных, так и для реальных задач оптимизации.
В модели динамики мнений со случайным внешним воздействием изучены механизмы образования кластеров. Рассмотрена модель, являющаяся обобщением модели Хегсельманна-Краузе (динамики мнений с ограниченным доверием) на случай агентов, описываемых стохастическими уравнениями в непрерывном времени. Кроме того, в отличие от классических моделей, в рассмотренной модели присутствуют «радикально настроенные» индивидуумы, не поддающиеся влиянию окружающих, однако транслирующих им свое мнение. В предположении, что число агентов велико, их распределение можно аппроксимировать решением нелинейного уравнением Фоккера-Планка, для которого получены математические условия разрешимости, а также численные методы решения. С помощью этих методов, получены эмпирические результаты о зависимости образующихся кластеров мнений от дисперсии случайного внешнего воздействия и относительной массы «радикальных» агентов.
Для нелинейной системы с множественными положениями равновесия установлены критерии устойчивости. Уравнения такого типа описывают широкий класс систем (маятник, электрическая машина, вибрационные установки, фазовые системы автоподстройки частоты). Критерии получены соединением двух методов: метода нелокального сведения Леонова и процедуры Бакаева-Гужа (сведение к случаю нелинейности с нулевым средним) и формулируются в частотно-алгебраической форме. Частотное условие устойчивости типично для критериев устойчивости нелинейных систем (кругового критерия, критерия Попова и др.), однако содержит набор скалярных параметров, которые должны удовлетворять алгебраическим условиям. Рассмотрен случай обыкновенных дифференциальных уравнений, для которых критерий устойчивости можно сделать более точным за счет использования ляпуновских методов. Этот результат распространен на системы с распределенными параметрами, для вывода критериев устойчивости при этом используется метод Попова. Также разработаны численные процедуры для проверки устойчивости на примере задачи оценки полосы захвата в системе автоподстройки частоты.
Для предотвращения возрастающих колебаний крыла самолета при изгибно-крутильном флаттере представлен новый мультиагентный метод управления крылом самолета, предполагающий, что поверхность крыла состоит из контролируемых «перьев» (агентов). Теоретическая оценка метода демонстрирует его высокую способность предотвращать изгибно-крутильные колебания крыла самолета. Модель расширяет возможности демпфирования колебаний крыла, что потенциально позволяет увеличить скорость самолета, не опасаясь возникновения флаттера. Исследование показывает, что основным ограничением является время, в течение которого система способна гасить вибрации до безопасного уровня и удерживать их. Актуальность этого показателя важна из-за довольно быстрого процесса увеличения колебаний крыла при флаттере. С использованием предлагаемого метода теоретически становится возможным увеличить максимальную скорость полета самолета без возникновения флаттера. Представлена математическая модель изгибно-крутильных колебаний крыла самолета с управляемыми перьями на его поверхности. На основе метода скоростного градиента синтезированы новые законы управления.
Проведено исследование эффективности метода скоростного градиента в задаче синтеза стабилизирующего управления при условии шоковой кратковременной нагрузки системы.. Взаимосвязи пространственно-временных корреляций в интегральных термодинамических соотношениях между силами и потоками и внутренней структурой системы позволили описать самоорганизацию новых динамических структур в открытой системе. Предлагаемый подход к эволюции структуры позволяет по-новому взглянуть на устойчивость состояния системы. Явные приближенные решения задачи показывают, что устойчивое чисто сдвиговое течение вдали от равновесия теряет устойчивость из-за эволюции динамической структуры. Вблизи границ появляются слои, в которых механика сплошной среды становится недействительной, а неравновесное межфазное взаимодействие со стенками формирует вихревые структуры. В переходных режимах может возникнуть метастабильное состояние, когда эволюция системы может изменить свое направление из-за любого слабого воздействия.
Публикации
1. Амелин К.С., Амелина Н.О. Проект "Рой из 100 роботов" Стохастическая оптимизация в информатике, Том: 16, Номер: 1, Стр.: 48-57 (год публикации - 2020)
2. Бояров А.А., Граничин О.Н. Sparse Gaussian mixture model clustering via simultaneous perturbation stochastic approximation IFAC-PapersOnLine, vol. 53 (год публикации - 2020)
3. Бояров А.А., Граничин О.Н., Граничина О.А. Simultaneous perturbation stochastic approximation for few-shot learning 2020 European Control Conference (ECC), May 2020, 9143831, Pages 350-355 (год публикации - 2020) https://doi.org/10.23919/ECC51009.2020.9143831
4. Граничин О.Н. Круглый стол "Cамоорганизация и искусственный интеллект в группе автономных роботов: методология, теория, практика" Стохастическая оптимизация в информатике, Том. 16. Номер 1. Стр. 5-12. (год публикации - 2020)
5. Граничин О.Н., Ужва Д.Р. Invariance preserving control of clusters recognized in networks of kuramoto oscillators Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics), Volume 12412, LNAI, 2020, Pages 472-486 (год публикации - 2020) https://doi.org/10.1007/978-3-030-59535-7_35
6. Граничин О.Н., Ужва Д.Р., Волькович В.И. Cluster flows and multiagent technology Mathematics, 2020 (год публикации - 2020)
7. Колариджани М.А.С., Проскурников А.В., Мохаджерин Эсфахани П. Macroscopic noisy bounded confidence models with distributed radical opinions IEEE Transactions on Automatic Control, - (год публикации - 2020) https://doi.org/10.1109/TAC.2020.2994284
8. Проскурников А.В., Смирнова В.Б. Constructive estimates of the pull-in range for synchronization circuit described by integro-differential equations 2020 IEEE International Symposium on Circuits and Systems (ISCAS), Sept. 2020 (год публикации - 2020) https://doi.org/10.1109/ISCAS45731.2020.9180519
9. Сенов А.А., Граничин О.Н., Граничина О.А. A sequential subspace quasi-Newton method for large-scale convex optimization Proceedings of the American Control Conference, Volume 2020-July, July 2020, 9147989, Pages 3627-3632 (год публикации - 2020) https://doi.org/10.23919/ACC45564.2020.9147989
10. Сергеенко А.Н., Граничин О.Н., Якунина М.В. Hamiltonian path problem: The performance comparison deoxyribonucleic acid computing and the branch-and-bound method Journal of Physics: Conference Series, Volume 1536, Issue 1, 21 May 2020, 012003 (год публикации - 2020) https://doi.org/10.1088/1742-6596/1536/1/012003
11. Смирнова В.Б., Проскурников А.В. Leonov's nonlocal reduction technique for nonlinear integro-differential equations IFAC-PapersOnLine, vol. 53 (год публикации - 2020)
12. Смирнова В.Б., Проскурников А.В., Пак Е.Е., Титов Р.В. New criteria for gradient-like behavior of synchronization systems with distributed parameters Proceedings of 2020 15th International Conference on Stability and Oscillations of Nonlinear Control Systems (Pyatnitskiy's Conference), STAB 2020, June 2020, 9140672 (год публикации - 2020) https://doi.org/10.1109/STAB49150.2020.9140672
13. Смирнова В.Б., Проскурников А.В., Утина Н.В. Leonov's method of nonlocal reduction for pointwise stability of phase systems Proceedings of 2020 15th International Conference on Stability and Oscillations of Nonlinear Control Systems (Pyatnitskiy's Conference), STAB 2020, June 2020, 9140629 (год публикации - 2020) https://doi.org/10.1109/STAB49150.2020.9140629
14. Хантулева Т.А., Шалымов Д.С. Nonlocal hydrodynamic modeling high-rate shear processes in condensed matter Journal of Physics: Conference Series, Volume 1560, Issue 1, 24 June 2020, 012057 (год публикации - 2020) https://doi.org/10.1088/1742-6596/1560/1/012057
15. Шалымов Д.С., Граничин О.Н., Волькович З., Вебер Г. Multi-agent control of airplane wing stability under the flexural torsion flutter Optimization, - (год публикации - 2020)
16. Граничин О.Н., Сергеев С.Ф. Самоорганизация и искусственный интеллект в группах автономных роботов: методология, теория, практика Издательство ВВМ, Санкт-Петербург, 124 с. (год публикации - 2020)
Возможность практического использования результатов
Результаты проекта могут быть практически использованы как в робототехнике и медицине, так и в экономике, физике, биологии, социологии и др. науках. В ходе выполнения проекта получены новые научные результаты, соответствующие мировому уровню исследований в области управления большими группами роботизированных устройств в условиях неопределенностей. Предложенные в проекте методы и подходы могут позволить перейти на новую ступень развития технологий в управлении группами роботов.