Исследование и разработка методов и инструментальных программных средств конструирования интеллектуальных систем поддержки принятия решений реального времени с применением распределенной обработки информации

КАРТОЧКА ПРОЕКТА ФУНДАМЕНТАЛЬНЫХ И ПОИСКОВЫХ НАУЧНЫХ ИССЛЕДОВАНИЙ,
ПОДДЕРЖАННОГО РОССИЙСКИМ НАУЧНЫМ ФОНДОМ

Информация подготовлена на основании данных из Информационно-аналитической системы РНФ, содержательная часть представлена в авторской редакции. Все права принадлежат авторам, использование или перепечатка материалов допустима только с предварительного согласия авторов.

ОБЩИЕ СВЕДЕНИЯ

Номер проекта 24-11-00285

НазваниеИсследование и разработка методов и инструментальных программных средств конструирования интеллектуальных систем поддержки принятия решений реального времени с применением распределенной обработки информации

Руководитель Еремеев Александр Павлович, Доктор технических наук

Организация финансирования, регион Федеральное государственное бюджетное образовательное учреждение высшего образования "Национальный исследовательский университет "МЭИ" , г Москва

Конкурс №92 - Конкурс 2024 года «Проведение фундаментальных научных исследований и поисковых научных исследований отдельными научными группами»

Область знания, основной код классификатора 01 - Математика, информатика и науки о системах; 01-512 - Информационные технологии интеллектуальной поддержки принятия решений

Ключевые слова искусственный интеллект, интеллектуальная система, поддержка принятия решений, реальное время, распределенная обработка информации

Код ГРНТИ28.23.00

ИНФОРМАЦИЯ ИЗ ЗАЯВКИ

Аннотация
Целью проекта является исследование и разработка методов, моделей и инструментальных программных средств конструирования интеллектуальных систем поддержки принятия решений реального времени (ИСППР РВ) с применением распределенной обработки информации, предназначенных для помощи лицу, принимающему решения (ЛПР) при мониторинге, диагностике и управлении сложными техническими/технологическими, транспортными, организационными и другими объектами и процессами в условиях наличия в исходной информации неточности, неопределённости, противоречивости и т.п. (наличии так называемых "зашумленных" данных), а также при достаточно жестких ограничениях на время поиска решения. В настоящее время в плане перехода к цифровой экономике интеллектуальные методы поиска решений активно применяются в ИС и, что особенно актуально, в ИС/ИСППР РВ в условиях жестких временных ограничений и зашумленной исходной информации, что существенно усложняет поиск решения. Планируемые в проекте исследования и разработки с применением и развитием подходов на основе глубокого обучения и анализа зашумленных данных, являются важными и актуальными. При выполнении проекта планируется разработка интегрированной инструментальной среды, включающей методы поиска решений с использованием различных подходов интеллектуального анализа данных (ИАД), методы машинного обучения с применением обучения с подкреплением (reinforcement learning, RL), методы глубокого обучения на основе искусственных нейронных сетей (ИНС), гибкие (anytime) алгоритмы, алгоритмы классификации проблемных ситуаций на объекте (деревья решений, алгоритм k-средних, метод опорных векторов (SVM) и др.). Для обработки многомерных массивов больших и зашумленных данных (big data) будет разработан подход к реализации темпоральных баз данных и знаний на основе NoSql концепции, что позволит обрабатывать значительные объемы информации, и проводить анализ временных (темпоральных) зависимостей в данных и знаниях. Предлагается повысить качество работы метода опорных векторов (SVM) за счёт использования свойств предметной области. Планируется разработать параллельную модификации алгоритма SVM, что позволит ускорить его работу и получить более быстрое универсальное решение. Для сложных распределенных комплексов интеллектуального контроля и диагностики сложных технических/технологических объектов (систем) большинство задач необходимо решать в режиме РВ. В связи с этим весьма актуальна задача построения адаптируемых к решаемой задачи ветвящихся временных моделей, без которых невозможно реализовать глубокую диагностику и поиск аномалий в работе сложных объектов, а также спрогнозировать последствия от принимаемых/рекомендуемых решений. Планируется развитие и интеграция методов машинного обучения и алгоритмов обучения с подкреплением (reinforcement learning, RL), реализующих обучение без учителя за счет подбора эффективной стратегии «состояние – действие - вознаграждение» совместно с нейросетевыми методами и алгоритмами для организации глубокого обучения. Преимуществом такого подхода является возможность получать необходимый опыт (знания) непосредственно в процессе взаимодействия агента и окружающей среды, что позволит реализовать глубокое обучение ИНС в режиме РВ. Будут созданы методы и алгоритмы обобщения для формирования обобщенных описаний ситуаций на сложном объекте управления. Алгоритмы обобщения должны строить описания классов динамически развивающихся ситуаций на основе реальных данных, часто содержащих шум. Полученные обобщенные описания позволят прогнозировать развитие ситуации на объекте управления. Планируется разработка методов и алгоритмов снятия противоречий, возникающих при обработке зашумлённых данных, методов и алгоритмов многоуровневой распределенной обработки динамических данных, которые позволят осуществить комплексный анализ таких данных с целью разносторонней оценки текущей ситуации.

ОТЧЁТНЫЕ МАТЕРИАЛЫ

Аннотация результатов, полученных в 2024 году
1. Исследованы возможности интеграции методов обучения с подкреплением и нечеткой логики в плане повышения эффективности алгоритмов обучения с подкреплением. Основное внимание уделено применению таких интегрированных методов в интеллектуальных системах реального времени (ИС РВ), особенно в ИС РВ поддержки принятия решений для мониторинга и управления сложными техническими объектами. В качестве основы использовался алгоритм Q-learning. Как правило, данный алгоритм применяется для решения задач с дискретным состоянием малой размерности и дискретным пространством действий. Когда состояния или действия указываются непрерывно, применение метода существенно усложняется. Разработан алгоритм нечеткого Q-обучения (FQL) — расширение алгоритма Q-обучения. FQL позволяет инкапсулировать экспертные знания в систему и ускорить таким образом процесс обучения. В FQL принятие решений представлено нечеткой системой логического вывода (FIS), которая рассматривает большие дискретные или непрерывные состояния в качестве входных данных. Выбор нечетких правил имеет определяющее значение при обучении агента. Модель тестировалась на задачах CartPole и MountainCar. Проведенный сравнительный анализ на модельных задачах CartPole и MountainCar продемонстрировал эффективность предложенного подхода для ИС/ИСППР РВ. 2 Разработан алгоритм, основанный на предложенной модификации метода опорных векторов - алгоритм FS-SVM для решения задачи классификации с использованием свойств предметной области. Доказаны преимущества предложенного метода: высокая точность работы при решении практических задач классификации, которая не ниже точности классического алгоритма SVM; меньшая вычислительная сложность, чем классический алгоритм SVM, которая позволяет использовать меньшее количество вычислительных ресурсов, и обеспечивает возможность практического применения алгоритма на относительно недорогом аппаратном обеспечении при решении задач в условиях реального времени. Выполнен сравнительный анализ предложенного метода FS-SVM с другими методами классификации. Поскольку методы на основе ИНС позволяют решать рассматриваемую задачу с высокой точностью, было проведено сравнение работы предложенного метода и методов на основе различных архитектур ИНС. Для сравнения использовались варианты нейронных сетей глубокого обучения с одним скрытым слоем, с несколькими скрытыми слоями, сверточных нейронных сетей, рекуррентных нейронных сетей и других. Проведено исследование вариантов каждой из типов архитектур ИНС. Обоснована предпочтительность использования алгоритма FS-SVM по сравнению с нейросетевым подходом. 3. Разработана параллельная модификация алгоритма SVM. Для выполнения параллельной обработки была использована модель с общей памятью. При разработке была применена одна из наиболее используемых и положительно себя зарекомендовавших технологий, реализующих модель вычислений с общей памятью, OpenMP. При реализации алгоритма была использована библиотека SciPy, предназначенная для выполнения научных и инженерных расчётов и обладающая возможностями для работы с OpenMP. Разработанная параллельная модификация алгоритма обеспечивает существенное ускорение работы по сравнению с последовательным алгоритмом, поскольку при вычислении опорных векторов осуществляется много однотипных действий, поддающихся распараллеливанию. Для полноценного тестирования предложенного алгоритма необходим современный вычислительный сервер, закупка которого запланирована на следующем этапе. 4. В плане практического применения в ИС/ИСППР РВ выделена группа темпоральных моделей, построенных на основе парадигмы согласования темпоральных ограничений. Определена задача согласования темпоральных ограничений (ЗСТО) как ветвящаяся ЗСТО (ВЗСТО). На каждой ветви ВЗСТО ставятся задачи проверки согласованности и поиска минимального представления и сценария. Для их решения определены подзадачи: проверка согласованности – существования как минимум одного терминального согласованного сценария; проверка истинности каких-либо утверждений для конкретного терминального сценария; преобразование всех ЗСТО, соответствующих согласованным сценариям, к минимальному виду; проверка истинности каких-либо утверждений для всех или хотя бы одного терминальных сценариев. Для ускорения поиска (вывода) решения ВЗСТО при наличии дизъюнктивных ограничений, порождающих ветвления сценариев, предложен подход на основе независимой достройки сценариев, когда каждый сценарий достраивается и разветвляется, исходя из решаемой задачи. Предложены эвристики, значительно сокращающие число сценариев и соответственно требуемые объемы памяти и вычислений. Проанализированы структуры ряда сверточных нейронных сетей в плане их применения в ИС/ИСППР РВ с достаточно жесткими временными ограничениями: сетей с ранними выходами, ветвящейся структурой и пропуском слоёв. Приведены формулы функций потерь для обучения сетей. Предложена и реализована гибкая (anytime) модификация нейросети с ранними выходами на примере задачи классификации изображений. Сеть подобного типа может быть использована в ИСППР РВ для решения задач компьютерного зрения, например, для генерации быстрых прогнозов и, при необходимости, последующего их уточнения. Разработана и обучена на множестве CIFAR-10 anytime-нейросеть Early-Exit Resnet с помощью фреймворков Keras и TensorFlow языка программирования Python. Сеть с предложенной структурой хорошую точность на промежуточных прогнозах без ущерба для итогового прогноза сети. 5. Предложена модель динамического описания ситуации, которая решает проблему непрерывного поступления больших массивов информации, что затрудняет хранение прецедентов в базе прецедентов (БП), а также выбор управляющих воздействий, так как на развитие ситуации могут влиять сразу несколько динамических параметров. Для оптимизации хранения динамических данных предлагается использовать метод преобразования таких данных в набор качественных, или обобщённых значений. При этом динамический параметр (временной ряд)заменяется на несколько параметров, не представляющих время явно, но отражающих наиболее важные закономерности, свойственные временному ряду. Обоснован выбор нереляционной СУБД для организации и хранения прецедентов. Главное отличие двух моделей заключается в том, что нереляционная графовая модель для узлов-сущностей и ребер-отношений использует явно определенные правила. Поскольку все отношения между сущностями в графовой модели определяются явно, отсутствует необходимость моделирования внешних ключей, а также не нужно прописывать всю логику их хранения. Достаточно определить схему сущностей и отношений между ними. Наибольшая эффективность такого подхода хранения возникает в задачах моделирования сильно связанных данных.

Публикации

1. Еремеев А.П., Панявин Н.А., Фомина М.В. Representation and Processing of Temporal Cases in Real-Time Intelligent Systems Pattern Recognition and Image Analysis, Vol. 34, No. 3, pp. 702–709. © Pleiades Publishing, Ltd., 2024 (год публикации - 2024)
10.1134/S105466182470055X

2. Еремеев А.П., Панявин Н.А., Маренков М.А. Реализация темпоральной базы данных для интеллектуальных систем поддержки принятия решений реального времени на примере образовательного процесса вуза Программные продукты и системы, Т. 37. № 4. С. 197–206 (год публикации - 2024)
10.15827/0236-235X.148.197-206

Аннотация результатов, полученных в 2025 году
1. Предложен метод интеграции искусственных нейронных сетей и методов нечеткой логики, а также RL-обучения с использованием темпоральных различий для глубокого машинного обучения и гибких алгоритмов поиска решения. Реализован характеризующийся новизной гибридный подход, объединяющего методы глубокого обучения с подкреплением (Deep Reinforcement Learning, DRL) и нечёткую логику. Данное направление является перспективным для создания объяснимого искусственного интеллекта (Explainable Artificial Intelligence, XAI). Разработана оригинальная модель, сочетающая высокую эффективность DRL-алгоритмов с интерпретируемостью и устойчивостью к неопределённости, характерной для нечётких систем, с целью их последующего применения в ИСППР РВ для мониторинга и управления сложными техническими системами. Разработана оригинальная гибридная модель ANFIS-DQN, в которой адаптивная нейро-нечёткая система вывода ANFIS (Adaptive Neuro-Fuzzy Inference System) используется в качестве аппроксиматора функции ценности (Q-функции) в алгоритме Deep Q-Network (DQN). Разработана для обработки темпоральных зависимостей оригинальная нейронная anytime сеть с архитектурой Progressive LSTM (Long Short-Term Memory) - многоэтапная anytime-система на основе LSTM нейронных сетей с механизмом раннего выхода и оценкой уверенности предсказаний. Программно реализована система Progressive LSTM для классификации и прогнозирования временных рядов в реальном времени на примере задачи классификации аварийных ситуаций на АЭС. 2. Разработан оригинальный алгоритм FS-SVM, который планируется использовать для решения задачи диагностики сложных технических объектов. Разработана оригинальная модификация метода опорных векторов, ориентированная на обработку больших объёмов информации, позволяющая ускорить обработку и получить оценку степени принадлежности конкретного элемента определённому классу на основе анализа степени удалённости элемента от разделяющей гиперплоскости. 3. Предложена оригинальная параллельная модификация алгоритма SVM, обеспечивающая параллельную ускоренную обработку данных в модели распределенной памяти, а также надёжное функционирование в условиях реального времени при решении задачи диагностики сложного технологического объекта. Результаты тестирования показали существенное ускорение вычислений с ростом числа процессоров. 4. Предложены параллельные модификации алгоритмов вывода в ветвящихся временных логиках, обеспечивающих анализ разных ветвей модели на разных узлах. Разработаны и протестированы библиотеки параллельных алгоритмов для анализа ветвящихся временных моделей и параллельные модификации алгоритмов минимизации и дедубликации для применения в составе алгоритмов вывода в ветвящихся временных логиках. Исследованы возможности применения нейросетевого подхода и параллельной обработки информации для определения выполнимости формул логики ветвящегося времени на структурах Крипке. Предложен новый подход к задаче проверки выполнимости формул темпоральной вычислительной древовидной логики CTL на структурах Крипке с использованием графовых нейронных сетей. Для сокращения времени поиска решения и организации параллельного поиска предложено аппроксимировать проверку выполнимости формул с помощью машинного обучения, предсказывая выполнимость формулы как задачу бинарной классификации. Разработана архитектура графовой нейронной сети (GNN) с визуализацией процесса поиска решения. 5. Разработан метод и алгоритм классификации, реализующий стратегию снятия противоречий на основе комплексной оценки результатов, показанных несколькими алгоритмами, образующими ансамбль. Создана улучшенная версия алгоритма кластеризации MAXMIN, где используется дополнительно двухуровневая процедура слияния кластеров. Разработанный алгоритм кластеризации объектов обучающих выборок предлагается использовать для кластеризации Базы прецедентов, что ускорит получение результатов и рекомендаций для оценки динамически развивающихся ситуаций.

Публикации

1. Еремеев А.П., Сергеев М.Д. Применение нейронных сетей для аппроксимации Q-функции в методах обучения с подкреплением Вестник Московского энергетического института (Вестник МЭИ), № 5. С. 160—166. (год публикации - 2025)
10.24160/1993-6982-2025-5-160-166

2. Михайлов И.С., Фоминых И.Б., Фомина М.В., Сидоров К.О. Data mining methods for classifying complex objects on example of oil well production flow regimes Lecture Notes in Networks and Systems (год публикации - 2025)

3. Еремеев А.П., Филинов Н.Ю. ПРИМЕНЕНИЕ НЕЙРОСЕТЕВОГО ПОДХОДА И ПАРАЛЛЕЛЬНОЙ ОБРАБОТКИ ИНФОРМАЦИИ ДЛЯ ОПРЕДЕЛЕНИЯ ВЫПОЛНИМОСТИ ФОРМУЛ ЛОГИКИ ВЕТВЯЩЕГОСЯ ВРЕМЕНИ НА СТРУКТУРАХ КРИПКЕ Двадцать вторая Национальная конференция по искусственному интеллекту с международным участием, КИИ-2025 (Санкт-Петербург, 6-10 октября 2025 г.). Труды конференции. В 3-х томах., Т. 1. – С. 181-191 (год публикации - 2025)
10.15622/rcai.2025.017

4. Еремеев А.П., Петров В.С. МОДЕЛЬ ОБУЧЕНИЯ С ПОДКРЕПЛЕНИЕМ С ПРИМЕНЕНИЕМ АДАПТИВНОЙ СЕТИ И НЕЧЕТКОГО ВЫВОДА Двадцать вторая Национальная конференция по искусственному интеллекту с международным участием, КИИ-2025 (Санкт-Петербург, 6-10 октября 2025 г.). Труды конференции. В 3-х томах. , Т. 3. – С. 62-73 (год публикации - 2025)
10.15622/rcai.2025.069

5. Еремеев А.П., Плесневич Г.С. Boolean and metric extensions of Allen's interval logic Lecture Notes in Networks and Systems (год публикации - 2025)

6. Фоминых И.Б., Михайлов И.С. , Сидоров К.О., Мьо Хлайн Вин ИССЛЕДОВАНИЕ И РЕАЛИЗАЦИЯ МЕТОДОВ ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА ДАННЫХ ДЛЯ ПРОГНОЗИРОВАНИЯ ОБВОДНЁННОСТИ ПРОДУКЦИИ НЕФТЯНЫХ СКВАЖИН Двадцать вторая Национальная конференция по искусственному интеллекту с международным участием, КИИ-2025 (Санкт-Петербург, 6-10 октября 2025 г.). Труды конференции. В 3-х томах. , Т. 1. – С. 152-162 (год публикации - 2025)
10.15622/rcai.2025.014

7. Фомина М.В., Швец Г.В. ИСПОЛЬЗОВАНИЕ МЕТОДОВ АНСАМБЛИРОВАНИЯ ДЛЯ ПОВЫШЕНИЯ ТОЧНОСТИ КЛАССИФИКАЦИИ ОБЪЕКТОВ, СОДЕРЖАЩИХ ШУМ Двадцать вторая Национальная конференция по искусственному интеллекту с международным участием, КИИ-2025 (Санкт-Петербург, 6-10 октября 2025 г.). Труды конференции. В 3-х томах., Т. 3. – С.175-185 (год публикации - 2025)
10.15622/rcai.2025.080