Обучение с подкреплением с использованием сетевых векторно-символьных представлений в задаче интеллектуальной навигации когнитивных агентов

КАРТОЧКА ПРОЕКТА ФУНДАМЕНТАЛЬНЫХ И ПОИСКОВЫХ НАУЧНЫХ ИССЛЕДОВАНИЙ,
ПОДДЕРЖАННОГО РОССИЙСКИМ НАУЧНЫМ ФОНДОМ

Информация подготовлена на основании данных из Информационно-аналитической системы РНФ, содержательная часть представлена в авторской редакции. Все права принадлежат авторам, использование или перепечатка материалов допустима только с предварительного согласия авторов.

ОБЩИЕ СВЕДЕНИЯ

Номер проекта 20-71-10116

НазваниеОбучение с подкреплением с использованием сетевых векторно-символьных представлений в задаче интеллектуальной навигации когнитивных агентов

Руководитель Панов Александр Игоревич, Кандидат физико-математических наук

Организация финансирования, регион федеральное государственное учреждение "Федеральный исследовательский центр "Информатика и управление" Российской академии наук" , г Москва

Конкурс №50 - Конкурс 2020 года «Проведение исследований научными группами под руководством молодых ученых» Президентской программы исследовательских проектов, реализуемых ведущими учеными, в том числе молодыми учеными

Область знания, основной код классификатора 01 - Математика, информатика и науки о системах; 01-201 - Искусственный интеллект и принятие решений

Ключевые слова Обучение с подкреплением, иерархическое обучение с подкреплением, распределенные представления, каузальная семиотическая сеть, навигация, локализация, картирование, мобильный робот, когнитивный агент

Код ГРНТИ28.23.25

ИНФОРМАЦИЯ ИЗ ЗАЯВКИ

Аннотация
Одной из фундаментальных проблем в области искусственного интеллекта является проблема построения общих универсальных интеллектуальных систем управления поведением как программных, так и робототехнических агентов. К основным результатам в этой области можно отнести ряд когнитивных архитектур (ACT-R, Soar и др.), использующих модели когнитивной психологии при построении подсистем памяти и использования знаний; интеллектуальные динамические системы, основанные на правилах; программные пакеты по автоматизации ряда задач управления мобильными робототехническими платформами и беспилотными транспортом (ROS, Apollo и др.); архитектуры агентов, взаимодействующих с игровой средой, на основе методов обучения с подкреплением и другие; системы общего искусственного интеллекта (AGI, AIXI, OpenCog и др.), предлагающих различные варианты системной интеграции имеющихся методов представления знаний и подсистем вывода на их основе. Однако, несмотря на большое количество предложенных концепций и методов, синтез сложного поведения в широком спектре динамических сред с учетом взаимодействия с активными участниками совместной деятельности до сих пор является нерешенной задачей. К основным фундаментальным барьерам на данном пути необходимо отнести проблему интеграции субсимвольных (в том числе нейросетевых) методов приобретения и обработки первичной информации, получаемой от среды (сенсорных данных), и символьных методов представления концептуальных знаний и вывода на их основе (моделирование рассуждений и планирование поведения). В зарубежной литературе эта проблема известна как проблема привязки символов (symbol grounding problem). Настоящий проект посвящен разработке новых методов и алгоритмов, позволяющих продвинутся в решении этой фундаментальной научной проблемы в контексте синтеза и управления поведением когнитивного агента в задаче интеллектуальной навигации. Разрабатываемый подход к нейросимвольной интеграции позволит включить в общую систему управления ключевую подсистему пополнения концептуальных знаний и использование результатов рассуждений и планирования в решении таких важнейших базовых поведенческих задач в робототехнике, как картирование, локализация и передвижение в сложной человеко-ориентированной среде. Актуальность решения обозначенной проблемы заключается в том, что в конечном счете данная подсистема позволит существенно повысить степень автономности как программных, так и робототехнических агентов. При проведении научно-исследовательских и конструкторских работ на основе разрабатываемых методов и технологий возможно получение новых программных пакетов в составе робототехнических операционных систем, используемых в бытовых, промышленных роботах, беспилотных летательных аппаратах, автономном транспорте и других мобильных робототехнических системах, автономно работающих в сложных динамических условиях. В ходе выполнения проекта планируется получение следующих основных научных и практических результатов. Будут разработаны новые методы и алгоритмы, направленные на решение проблемы привязки символов в контексте задачи приобретения знаний и синтеза поведения по перемещению в человеко-ориентированной среде на основе оригинального подхода каузальных семиотических сетей. С целью применения разрабатываемых методов в реальных робототехнических системах будут созданы новые быстрые нейросетевые методы восстановления сцены и карты местности и локализации на ней с возможностью сегментации объектов и препятствий. Будут предложены новые методы рассуждения и вывода на основе пространственных знаний c использованием распределенных векторно-символьных представлений, расширяющих возможности каузальной семиотической сети. Будет разработан новый алгоритм иерархического обучения с подкреплением, использующий подсистему генерации подцелей, обеспечивающий эффективное исследование и перемещение к целевой области в сложной динамической среде. В рамках проекта планируется создать экспериментальное программное обеспечение, реализующее все основные методы и алгоритмы. Будет проведена экспериментальная проверка эффективности и работоспособности предложенных подходов для когнитивных агентов, работающих как в симуляционных средах (NVIDIA Isaak, V-REP, Habitat), так и на реальных робототехнических платформах (серии МПРМ Зарница, Clearpath Husky).

ОТЧЁТНЫЕ МАТЕРИАЛЫ