КАРТОЧКА ПРОЕКТА ФУНДАМЕНТАЛЬНЫХ И ПОИСКОВЫХ НАУЧНЫХ ИССЛЕДОВАНИЙ,
ПОДДЕРЖАННОГО РОССИЙСКИМ НАУЧНЫМ ФОНДОМ

Информация подготовлена на основании данных из Информационно-аналитической системы РНФ, содержательная часть представлена в авторской редакции. Все права принадлежат авторам, использование или перепечатка материалов допустима только с предварительного согласия авторов.

 

ОБЩИЕ СВЕДЕНИЯ


Номер проекта 23-71-01084

НазваниеПерспективные методы и средства генерации синтетических и суррогатных данных

Руководитель Копец Екатерина Евгеньевна, Кандидат технических наук

Организация финансирования, регион Федеральное государственное автономное образовательное учреждение высшего образования "Санкт-Петербургский государственный электротехнический университет "ЛЭТИ" им. В.И. Ульянова (Ленина)" , г Санкт-Петербург

Конкурс №84 - Конкурс 2023 года «Проведение инициативных исследований молодыми учеными» Президентской программы исследовательских проектов, реализуемых ведущими учеными, в том числе молодыми учеными

Область знания, основной код классификатора 01 - Математика, информатика и науки о системах; 01-112 - Обыкновенные дифференциальные уравнения и теория динамических систем

Ключевые слова хаос, нелинейная динамика, суррогатные данные, синтетические данные, энтропия, генератор сигналов, управление хаосом, динамические системы, дискретные отображения, идентификация

Код ГРНТИ27.35.00


 

ИНФОРМАЦИЯ ИЗ ЗАЯВКИ


Аннотация
Во многих областях науки и техники при обработке результатов измерений используется подход, известный как суррогатный анализ. Тестирование реальных выборок с помощью суррогатных данных позволяет определить наличие и тип нелинейности в исследуемых последовательностях. Актуальны также задачи генерации биологически инспирированных сигналов - синтетических кардио- и энцефалограмм, используемых при создании и настройке медицинских приборов, а также вокализации морских млекопитающих, применяемых при проектировании перспективных гидроакустических систем локации и связи. Наблюдаемый переход от линейных моделей объектов исследования к нелинейным и сопутствующее усложнение объектов проектирования, связанное с широким использованием нелинейных эффектов в технике, порождают потребность в новых методах синтеза суррогатных и синтетических данных с использованием нелинейных генераторов временных рядов. В настоящее время при суррогатном анализе в основном используются линейные суррогатные данные, позволяющие статистически достоверно ответить на вопрос является ли процесс, порождающий исследуемую выборку, нелинейным и обладающие рядом недостатков: высокой вероятностью ошибочного отклонения гипотезы при идентификации систем по зашумленным сигналам, высоким процентом ошибок при проверке факта синхронизации хаотических систем, сложностями при разделении смешанных сигналов, образованных несколькими нелинейными системами. Ввиду того, что подавляющее большинство реальных систем являются нелинейными, представляется перспективным использование подхода на основе суррогатных данных нелинейного типа для одновременного уточнения типа нелинейности и оценки фрактальной размерности аттрактора. Настоящий проект предлагает новые методы и средства генерации суррогатных и синтетических данных, основанные на авторском подходе к управлению хаотическим поведением нелинейных динамических систем и генеративных нейронных сетях. Предлагаемые алгоритмы позволят эффективнее решать значительное число теоретических и прикладных задач исследования в естественных, технических и социальных науках. В настоящем проекте предлагается расширить класс нулевых гипотез при использовании суррогатных данных до гипотез о различных хаотических свойствах процесса, включая фрактальную размерность, гиперхаотичность и ляпуновский спектр. Для этого предлагается новая архитектура генераторов суррогатных и синтетических данных на основе управляемых нелинейных отображений. Данный тип отображений позволяет гибко управлять их свойствами: энтропией, фазовым объемом, спектральными характеристиками и др., без разрушения хаотического режима колебаний. Отдельный интерес представляет подлежащая разработке процедура тонкой настройки генераторов суррогатных данных за счет применения синхронизации порождающей модели с реальными исследуемыми данными, а также сигнала, генерируемого нейронной сетью, с сигналом, генерируемым детерминированной моделью. Перспективным подходом является недавно предложенный прием адаптивной симметрии, успешно используемый при генерации псевдослучайных данных в криптографических приложениях и при синтезе новых метрик оценки хаоса в динамических системах. Научная новизна проекта заключается в предлагаемом новом математическом обеспечении нелинейных генераторов суррогатных данных с заданными свойствами, а также использовании для решения задач генерации суррогатов инструментария современной нелинейной динамики и вычислительной математики: адаптивных дискретных отображений с управляемым хаосом, синхронизации с реальными данными для уточнения характеристик синтетических данных по реальным образцам и элементов искусственного интеллекта в форме генеративных нейронных сетей.


 

ОТЧЁТНЫЕ МАТЕРИАЛЫ


 

Публикации

1. Копец Е.Е., Шпилевая Т.А., Васильченко О.В., Каримов А.И., Бутусов Д.Н. Generating synthetic sperm whale voice data using StyleGAN2-ADA Big Data and Cognitive Computing, 8(4), 40 (год публикации - 2024)
10.3390/bdcc8040040

2. Копец Е.Е., Рыбин В.Г., Васильченко О.В., Бутусов Д.Н., Федосеев П.А., Каримов А.И. Fractal Tent Map with Application to Surrogate Testing Fractal and Fractional , Kopets, E., Rybin, V., Vasilchenko, O., Butusov, D., Fedoseev, P., & Karimov, A. (2024). Fractal Tent Map with Application to Surrogate Testing //Fractal and Fractional. – 2024. – Т. 8. – №. 6. – С. 344 (год публикации - 2024)
10.3390/fractalfract8060344

3. Копец Е.Е., Рыбин В.Г., Васильченко О.В., Куртова К.А., Каримов Т.И., Каримов А.И.,Бутусов Д.Н. Memristor-based Chaotic Dynamical Model for Generating Electrocardiogram Signal Известия высших учебных заведений. Прикладная нелинейная динамика, Копец Е. Е., Рыбин В. Г., Васильченко О. В., Куртова К. А.,Каримов Т. И., Каримов A. И., Бутусов Д. Н. Хаотический генератор электрокардиограммы на основе электронной цепи с мемристором // Известия вузов. ПНД. 2025. T. 33 (год публикации - 2025)
10.18500/0869-6632-003176

4. Раят Райориа, Балмукунд Канодиа, Дебам Саха, Копец Е.Е., Вознесенcкий А.А. , Каплун Д.И., Паван Кумар Сингх Attention-based Deep Neural Networks for Automatic Organ Classification from 2D CT Scan images AI and ML Techniques in Image Processing and Object Detection (год публикации - 2025)


Аннотация результатов, полученных в 2025 году
Ключевым направлением исследований второго года проекта стало создание гибридного генератора синтетических биоподобных сигналов. В качестве тестовой модели был выбран сигнал электрокардиограммы (ЭКГ), а основным требуемым свойством синтетических данных — RR-интервал между пиками. В рамках проекта создан гибридный генератор синтетических сигналов ЭКГ, основанный на модифицированной модели МакШерри с использованием четырехмерной мемристивной хаотической системы в качестве генератора частоты появления PQRST комплекса. В исходной модели МакШерри частота осцилляций задается предельным циклом, описываемым первыми двумя уравнениями системы. В гибридной модели этот генератор заменен на хаотический, что позволило внести вариативность в частоту появления RR-пиков. Эти пики, определяемые как расстояния между наибольшими пиками сигнала, являются важной метрикой для оценки состояния пациента. Предлагаемая хаотическая система имеет шесть настраиваемых параметров (a, b, d, n, m0, m1), изменение которых позволяет получать различные картины распределения RR-интервалов, что позволяет имитировать различные картины заболеваний, связанные с RR-пиками. Для анализа влияния этих параметров были построены одномерные и двумерные бифуркационные диаграммы, подтвердившие характеристики модели. Следующей решенной задачей второго этапа была генерация синтетических данных на основе ансамблей связанных осцилляторов и выявления новой динамики таких ансамблей при изменении коэффициента симметрии узла. В качестве генератора синтетических данных использовался разработанный в ходе выполнения проекта генератор синтетической ЭКГ. Для реализации подхода была синтезирована система из девяти связанных осцилляторов, организованных в топологию королевского графа, при этом синхронизация между элементами ансамбля достигалась с помощью метода Пекоры-Кэролла, примененного к двум из пяти переменных состояния. Анализ синхрограмм показал, что изменение коэффициента симметрии системы позволяет эффективно управлять динамикой ансамбля и свойствами генерируемых данных, включая возможность получения режимов частичной синхронизации ансамбля. Описан способ генерации синтетической ЭКГ с применением принципа обобщенной амплитудной и частотной синхронизации модели с реальными биологическими данными, что позволяет перенести в математическую модель информацию о частотных свойствах из исходной последовательности. Для подстройки частоты генератора к частоте исходных данных, в исходную систему дифференциальных уравнений добавляется новая переменная w, которая зависит от значений осциллятора модели и исходного реального сигнала. Таким образом можно сгенерировать новую синтетическую последовательность, подстроенную под частоту и амплитуду реального сигнала. Проведено исследование полученной последовательности с анализом синхросигнала по всем переменным состояния. Следующей решенной задачей проекта стала разработка методики суррогатного тестирования данных на предмет проверки нулевой гипотезы о нелинейности исследуемой системы на основе анализа временных рядов. Программное обеспечение, созданное в рамках выполнения проекта, предоставляет возможность выбора методов генерации суррогатных данных (RP, AR, FT, AAFT, iAAFT, iAAFTn) и различных возвратных хаотических отображений для задания случайной компоненты. Экспериментальное сравнение показало, что предложенное в проекте фрактальное отображение обеспечивает наивысшую точность при подтверждении гипотезы суррогатного тестирования, особенно в сочетании с методами AR, FT и AAFT, что подчеркивает его эффективность для задач анализа временных рядов. Так же в ходе проекта был предложен алгоритм и создано программное обеспечение для построения синхрограмм с оценкой различий динамики нелинейных систем. Разработанная программа визуализирует ошибку синхронизации при обратном ходе решения, и предоставляет численные метрики, коррелирующие с ошибкой синхронизации, что подтверждает корректность подхода. Разработка применима для анализа нелинейных систем и сравнения их моделей с реальными данными.

 

Публикации

1. Копец Е.Е., Шпилевая Т.А., Васильченко О.В., Каримов А.И., Бутусов Д.Н. Generating synthetic sperm whale voice data using StyleGAN2-ADA Big Data and Cognitive Computing, 8(4), 40 (год публикации - 2024)
10.3390/bdcc8040040

2. Копец Е.Е., Рыбин В.Г., Васильченко О.В., Бутусов Д.Н., Федосеев П.А., Каримов А.И. Fractal Tent Map with Application to Surrogate Testing Fractal and Fractional , Kopets, E., Rybin, V., Vasilchenko, O., Butusov, D., Fedoseev, P., & Karimov, A. (2024). Fractal Tent Map with Application to Surrogate Testing //Fractal and Fractional. – 2024. – Т. 8. – №. 6. – С. 344 (год публикации - 2024)
10.3390/fractalfract8060344

3. Копец Е.Е., Рыбин В.Г., Васильченко О.В., Куртова К.А., Каримов Т.И., Каримов А.И.,Бутусов Д.Н. Memristor-based Chaotic Dynamical Model for Generating Electrocardiogram Signal Известия высших учебных заведений. Прикладная нелинейная динамика, Копец Е. Е., Рыбин В. Г., Васильченко О. В., Куртова К. А.,Каримов Т. И., Каримов A. И., Бутусов Д. Н. Хаотический генератор электрокардиограммы на основе электронной цепи с мемристором // Известия вузов. ПНД. 2025. T. 33 (год публикации - 2025)
10.18500/0869-6632-003176

4. Раят Райориа, Балмукунд Канодиа, Дебам Саха, Копец Е.Е., Вознесенcкий А.А. , Каплун Д.И., Паван Кумар Сингх Attention-based Deep Neural Networks for Automatic Organ Classification from 2D CT Scan images AI and ML Techniques in Image Processing and Object Detection (год публикации - 2025)


Возможность практического использования результатов
Результаты проекта имеют значительный потенциал для практического применения в экономике и социальной сфере, формируя научные и технологические заделы, способствующие экономическому росту и социальному развитию Российской Федерации. Разработанные методики генерации синтетических и суррогатных данных, а также созданные программные инструменты анализа временных рядов, могут быть использованы в медицине для моделирования синтетических сигналов ЭКГ реальных пациентов, что позволит улучшить диагностику заболеваний и разработать новые подходы к анализу состояния пациентов. Важной областью применения математических моделей ЭКГ является тестирование и верификация кардиографов с использованием синтетически сгенерированных сигналов, что обеспечивает точность и воспроизводимость результатов. Типичные приложения предлагаемой модели могут включать тестирование устройств мониторинга ЭКГ без контакта с реальными пациентами. Внедрение предложенного фрактального отображения Тента и связанных с ним алгоритмов генерации случайных чисел открывает возможности для создания более надежных систем шифрования и защиты данных, что особенно актуально для цифровой экономики. Кроме того, разработанные методы аугментации данных и генерации синтетических сигналов могут быть применены в экологии и биологии для анализа поведения животных (например, вокализаций кашалотов) и прогнозирования изменений в экосистемах. Создание гибридных генераторов синтетических данных и инструментов управления динамикой ансамблей осцилляторов может найти применение в области искусственного интеллекта, робототехники и систем автоматического управления. Таким образом, результаты проекта создают базу для разработки новых технологий и усовершенствования существующих решений в различных отраслях.