Появление роботов дает возможность освободить человека от выполнения утомительных рутинных действий, например на конвейере. Но как научить робота совершенствовать выполнение таких процедур? Эту задачу решает управление с итеративным обучением.
Его особенность в том, что оно использует как текущую информацию, так и информацию с предыдущего повторения. С этих позиций оно является простейшей формой интеллектуального управления. В этом случае естественным образом выделяется два процесса: повторяющееся выполнение однородных действий и их последовательная корректировка. Так, баскетболист многократно бросает мяч в корзину, наблюдает за его полетом, и с каждым разом точность попадания увеличивается. Математические модели, описывающие такие процессы, получили название 2D-моделей. Они появляются и в задачах обработки изображений (модель Роессера), и в задачах построения электрических фильтров и сетей (модель Форназини – Маркезини). Таким образом, 2D-модели достаточно универсальны.
«Важнейшей характеристикой работоспособности системы любой природы является ее устойчивость. Применительно к системам управления с итеративным обучением это означает, что с увеличением числа повторений уменьшается ошибка. Общим методом исследования устойчивости является метод функций Ляпунова, однако, в своей классической версии он не применим к исследованию 2D-систем. Из-за этого возникает необходимость развития новой теории, которая, в частности, должна служить основой построения эффективных алгоритмов управления с итеративным обучением», — рассказывает Павел Пакшин, доктор физико-математических наук, профессор Нижегородского государственного технического университета имени Р.Е. Алексеева.
В этой работе авторы предложили рассматривать энергетические составляющие системы в виде векторного поля – пространства со «стрелками», указывающими, каково направление каждой силы. Для удобства расчетов использовали аналогию с хорошо изученными физическими полями. Представим, что система – бочка с дырявыми стенками, наполненная водой. В этом случае векторное поле имеет только стоки, но не источники. Рано или поздно уровень жидкости сравняется с самым нижним отверстием, и течение прекратится – система придет в равновесное устойчивое состояние. Аналогичный исход событий ученые ожидали и для своей «сточной» системы. Предположение подтверждается точными расчетами, свойства векторного поля определяются на основе анализа его дивергенции – способности векторов расходиться из конкретной точки пространства. Для 2D-систем она определяется без нахождения их решений. Таким образом, математики предложили метод исследования устойчивости различных классов 2D-систем общего вида, что дает возможность конструктивного подхода к проектированию их управления.
Одной из наиболее важных областей применения полученных теоретических результатов станет управление с итеративным обучением роботами в промышленных конвейерных системах, в индустрии наносистем, в медицине, в транспорте и других приоритетных областях науки и техники. Алгоритмы управления, полученные на основе разработанной теории, позволили существенно увеличить скорость обучения при относительной простоте их реализации, что подтверждено недавними результатами, опубликованными в статье в журнале Systems & Control Letters.