КАРТОЧКА ПРОЕКТА ФУНДАМЕНТАЛЬНЫХ И ПОИСКОВЫХ НАУЧНЫХ ИССЛЕДОВАНИЙ,
ПОДДЕРЖАННОГО РОССИЙСКИМ НАУЧНЫМ ФОНДОМ

Информация подготовлена на основании данных из Информационно-аналитической системы РНФ, содержательная часть представлена в авторской редакции. Все права принадлежат авторам, использование или перепечатка материалов допустима только с предварительного согласия авторов.

 

ОБЩИЕ СВЕДЕНИЯ


Номер проекта 22-71-10067

НазваниеРазработка методов минимизации неопределённости в моделировании динамики эпидемических ОРВИ на основе комплекса моделей варьируемой структурной сложности

Руководитель Леоненко Василий Николаевич, Кандидат физико-математических наук

Организация финансирования, регион федеральное государственное автономное образовательное учреждение высшего образования "Национальный исследовательский университет ИТМО" , г Санкт-Петербург

Конкурс №71 - Конкурс 2022 года «Проведение исследований научными группами под руководством молодых ученых» Президентской программы исследовательских проектов, реализуемых ведущими учеными, в том числе молодыми учеными

Область знания, основной код классификатора 01 - Математика, информатика и науки о системах; 01-205 - Математические модели в науках о живом

Ключевые слова математическая эпидемиология, COVID-19, грипп, имитационное моделирование, структурная сложность, анализ неопределённости

Код ГРНТИ28.17.19


 

ИНФОРМАЦИЯ ИЗ ЗАЯВКИ


Аннотация
Эпидемии острых респираторных вирусных инфекций, таких как грипп и СOVID-19, представляют серьезную угрозу общественному здравоохранению. Для контроля распространения инфекций и планирования мер сдерживания заболеваемости необходима оценка эпидемических показателей, получаемая с помощью статистических методов и математических моделей. При расчёте данных показателей возникает неопределенность, связанная как с погрешностями в исходных данных, использованных для калибровки моделей, так и с неточным воспроизведением механики эпидемического процесса моделью. Зависимость прогнозов и расчётов производных показателей от структуры модели может быть велика, и отсутствие её учёта, характерное для большинства работ по моделированию распространения эпидемических ОРВИ, затрудняет корректный прогноз эффективности противоэпидемических мероприятий. В рамках настоящего проекта предполагается разработка методов и алгоритмов расчёта неопределённости оценки эпидемических показателей при моделировании динамики эпидемических ОРВИ, а также методов минимизации неопределённости путём выбора подкласса моделей, наилучших в плане «компромисса отклонения-дисперсии» для расчёта эпидемических показателей на рассматриваемых наборах данных заболеваемости. В результате решения поставленных в проекте задач появится возможность осуществлять комплексное моделирование динамики эпидемической заболеваемости COVID-19 и гриппа с минимально достижимой неопределённостью для имеющихся данных. Полученная оценка оптимальной структурной сложности моделей и уровня неопределённости прогнозов позволит дать рекомендации о том, какая номенклатура и периодичность собираемых данных, связанных с динамикой ОРВИ, является необходимой и достаточной для ретроспективного анализа и прогнозирования заболеваемости с заданным уровнем точности. Подходы, разработанные в результате выполнения проекта, будут допускать обобщение для решения широкого круга проблем, связанных с моделированием процессов распространения в неоднородных средах, включая ко-циркуляцию и взаимодействие различных инфекций, динамику распространения информации, диффузионные и перколяционные процессы.


 

ОТЧЁТНЫЕ МАТЕРИАЛЫ


 

 

Аннотация результатов, полученных в 2025 году
В ходе работ по третьему этапу проекта были выполнены следующие задачи. Разработаны и реализованы два алгоритма генерации сетей контактов: генерация сетей стандартных топологий, по своим характеристикам соответствующих структурам сетей контактов в человеческих популяциях, и генерация сетей контактов на основе конвертации данных синтетических популяций, которые по агрегированным характеристикам соответствуют реальную популяцию города. Реализация алгоритмов позволила применять контактные сети в качестве входных данных эпидемических моделей. Разработаны и реализованы дополнительные аппроксимационные модели и алгоритмы калибровки для них, заполняющие разрыв по структурной сложности между компартментальными моделями типа SEIR и мультиагентными моделями на основе детальных синтетических популяций. В качестве дополнительных алгоритмов калибровки были реализованы алгоритмы на основе приближенного байесовского вывода (ABC – Approximate Bayes Computation), а также на основе методов Монте-Карло с марковскими цепями (MCMC). Сформулирована обобщённая характеристики структурной сложности моделей разных классов в виде формулы показателя числа степеней свободы через число параметров МС=f(n_param) с функцией f(x), тождественно равной х. Было установлено, что в ряде практических случаев сравнительной оценки структурной сложности моделей недостаточно для их чёткой дифференциации, поэтому в дополнение к структурной сложности k и качеству калибровки на данные с поправкой на сложность (AIC) использовалась оценка вычислительной сложности в смысле быстродействия (среднее время расчётов) и дополнительные метрики качества результирующих данных (RMSE, R2, абсолютная ошибка расчёта пиковой заболеваемости, относительная ошибка расчёта момента пиковой заболеваемости). Проводились численные эксперименты с моделями на реальных данных, в том числе оценка среднего времени моделирования и точности оценки пиковой заболеваемости при использовании мультиагентной модели в сэмплированных популяциях Самары и Челябинска, оценка ошибки воспроизводства синтетической эпидкривой суррогатной моделью по метрикам RMSE и R2, а также по пиковой заболеваемости (высота и день пика), калибровка аппроксимационной SEIR-модели среднего поля по синтетическим данным сетевой SEIR-модели, сравнение выходных данных заболеваемости SEIR-модели среднего поля (форма эпидкривой, пиковая и суммарная заболеваемость) при фиксированных наборах параметров на сэмплированных сетях стандартной топологии (Барабаши-Альберт, Уоттса-Строгаца), сравнение формы эпидкривых аппроксимационной модели SEIR-EBCM с кривыми исходной сетевой модели в случае моделирования заболеваемости на сетях стандартных топологий (Барабаши-Альберт) и двух вариантах сетей, полученных конвертированием синтетической популяции на примере Челябинска. Установлено, что сетевые модели стандартных топологий лучше аппроксимируются дифференциальными моделями, а также лучше масштабируются, что является их достоинством по сравнению с детальными мультиагентными моделями на базе синтетических популяций. Были получены и сравнены следующие оценки неопределенности для моделей разной структурной сложности: сравнительная оценка качества интервального прогнозирования для мультиагентной модели по сравнению с эталонной моделью COVASIM, оценка качества моделирования с учётом структурной сложности в разных модификациях входных демографических данных, сравнительная оценка быстродействия прогнозирования на основе моделей с разной структурной и вычислительной сложностью, сравнительная оценка качества воспроизведения синтетической эпидкривой (RMSE, отклонение пиковой заболеваемости) гибридной моделью на основе моделей предсказания трансмиссивности заболевания с разной структурной и вычислительной сложностью. Сформулирован качественный метод выделения подклассов моделей, оптимальных для расчёта эпидпоказателей, для выбора лучшей модели или класса моделей, которые в дальнейшем могут использоваться в рамках ансамблевого подхода. Приведены примеры оценок непределенности расчёта показателей с помощью интервального оценивания для моделей разной структурной сложности и различных эпидиндикаторов. Для формулировки рекомендаций по сбору данных в рамках проекта решена задача поиска количественной связи между неточностью во входных данных и неточностью расчёта эпидемических индикаторов с помощью статистической и объясняющей моделей ошибок в данных. Применение математической модели ошибок позволяет измерять ширину интервальных оценок эпидемических индикаторов после калибровки эпидмоделей динамики заболеваемости и оценивать зависимость метрик ошибки от ошибок в данных. Таким образом, в ходе данного этапа получены следующие результаты. Разработаны дополнительные модели и алгоритмы калибровки к ним (упрощённая мультиагентная модель для моделирования эпидемий на контактных сетях, SEIR-модель среднего поля и SEIR-модель, основанная на рёбрах, гибридные модели, суррогатная аппроксимация мультиагентной модели). Реализованы дополнительные методы калибровки моделей с интервальной оценкой неопределенности выходных данных моделей на основе подходов ABC и MCMC. Модели протестированы на синтетических данных и реальных данных заболеваемости по Санкт-Петербургу, Челябинску и Самаре. Произведено сравнение моделей между собой на одинаковых наборах данных, оценены отличия в структурной и вычислительной сложности, а также точности расчётов эпидемических индикаторов. Реализован метод сравнения структурной сложности на основе оценки степеней свободы модели (MC) и подсчёта количества переменных (k). Установлено, что с увеличением сложности моделей, возникновения нелинейных процессов в них, отхода от математического описания в пользу алгоритмического, а также перехода к индивидуум-ориентированному описанию эпидемических процессов прямое сравнение моделей на основе структурной сложности становится более затруднительным. Предложены дополнительные метрики сравнения, отражающие быстродействие работы моделирующих программ, и альтернативные показатели точности расчётов в дополнение к AIC (RMSE, абсолютная ошибка времени пика, относительная ошибка момента пика). Сформулированы рекомендации к совместному применению моделей, близких к оптимуму, в составе ансамбля, а также метод оценки качества сбора эпидемических данных на основе объясняющей модели данных.

 

Публикации

1. Сеничев С.Д., Фандеев А.А., Леоненко В.Н. Accelerating Multiagent Epidemic Modeling with Surrogate-Based Methods 2024 IEEE International Multi-Conference on Engineering, Computer and Information Sciences (SIBIRCON), 2024 IEEE International Multi-Conference on Engineering, Computer and Information Sciences (SIBIRCON) (pp. 220-223). IEEE. (год публикации - 2024)
10.1109/SIBIRCON63777.2024.10758463

2. Корзин А.И., Капарулин Т.И., Леоненко В.Н. Assessing the Applicability of the Multiagent Modeling Approach to the Epidemic Surveillance of COVID-19 in Russian Cities 2024 IEEE International Multi-Conference on Engineering, Computer and Information Sciences (SIBIRCON), 2024 IEEE International Multi-Conference on Engineering, Computer and Information Sciences (SIBIRCON) (pp. 237-242). IEEE. (год публикации - 2024)
10.1109/SIBIRCON63777.2024.10758442

3. Корзин А.И., Леоненко В.Н. Lightweight Models for Influenza and COVID-19 Prediction in Heterogeneous Populations: A Trade-Off Between Performance and Level of Detail Mathematics, Mathematics 2025, 13(9), 1385 (год публикации - 2025)
10.3390/math13091385

4. Кошкарёва М.П., Гусева Э.И., Шарова А.В., Леоненко В.Н. Predicting disease transmission rates for hybrid modeling of epidemic outbreaks: statistical and machine learning approaches Lecture Notes in Computer Science (год публикации - 2025)

5. Корзин А.И., Леоненко В.Н. Lightweight heterogeneous SEIR models for epidemic surveillance in Russian cities: turning synthetic populations into equations Lecture Notes in Computer Science (год публикации - 2025)

6. Корзин А. И., Чичкова Н. А., Капарулин Т. И., Леоненко В. Н. Индивидуум-ориентированное моделирование эпидемических ОРВИ в городах РФ: методы реализации и оценки применимости Сибирский журнал индустриальной математики, Сибирский журнал индустриальной математики, 28, 4(104), 108-129 (2025) (год публикации - 2025)
10.33048/SIBJIM.2025.28.408


Возможность практического использования результатов
Результаты проекта могут быть использованы для реализации системы поддержки принятия решений в рамках работы органов эпиднадзора для предотвращения и контроля заболеваемости эпидемическими ОРВИ