КАРТОЧКА ПРОЕКТА ФУНДАМЕНТАЛЬНЫХ И ПОИСКОВЫХ НАУЧНЫХ ИССЛЕДОВАНИЙ,
ПОДДЕРЖАННОГО РОССИЙСКИМ НАУЧНЫМ ФОНДОМ

Информация подготовлена на основании данных из Информационно-аналитической системы РНФ, содержательная часть представлена в авторской редакции. Все права принадлежат авторам, использование или перепечатка материалов допустима только с предварительного согласия авторов.

 

ОБЩИЕ СВЕДЕНИЯ


Номер проекта 24-22-00436

НазваниеРазвитие управляемого данными подхода к анализу ионосферных данных, получаемых на декаметровых радарах когерентного рассеяния

Руководитель Бернгардт Олег Игоревич, Кандидат физико-математических наук

Организация финансирования, регион Федеральное государственное бюджетное учреждение науки Ордена Трудового Красного Знамени Институт солнечно-земной физики Сибирского отделения Российской академии наук , Иркутская обл

Конкурс №89 - Конкурс 2023 года «Проведение фундаментальных научных исследований и поисковых научных исследований малыми отдельными научными группами»

Область знания, основной код классификатора 02 - Физика и науки о космосе; 02-503 - Ионосферная и космическая плазма

Ключевые слова управляемый данными подход, декаметровые радары когерентного рассеяния, автоматическая интерпретация данных

Код ГРНТИ37.15.29


 

ИНФОРМАЦИЯ ИЗ ЗАЯВКИ


Аннотация
В последнее время популярным в бизнесе, промышленности и науке является управляемый данными подход (Data driven approach), основанный на анализе, прогнозе и принятии решений с широким использованием автоматических систем анализа данных, работа которых основана на глубоком анализе экспериментальных данных, а модели хорошо обоснованы со статистической точки зрения. Метод лежит на пересечении машинного обучения, искусственного интеллекта, анализа больших данных и методов проверки статистических гипотез. Наиболее близким существующим подходом в анализе окружающей среды является построение всевозможных адаптивных эмпирических моделей экспериментальных данных. Однако полномасштабное развитие и применение этого набора подходов в анализе геофизических данных зачастую ограничено. В проекте планируется развитие такого подхода к некоторым задачам анализа данных декаметровых радаров когерентного рассеяния СЕКИРА и SuperDARN. Декаметровые импульсные радары когерентного рассеяния – многофункциональные установки, позволяющие проводить диагностику процессов в верхней атмосфере Земли на большой территории, порядка 1 млн.кв.км. каждый. В мире существует более 35 радаров, объединенных в международную сеть радаров SuperDARN, обеспечивающую круглосуточный мониторинг высокоширотной ионосферной конвекции, и попутно решающей дополнительные задачи, включая мониторинг перемещающихся ионосферных неоднородностей, поглощение в нижней части ионосферы и нейтральные ветра в области высот 70-90км. Сложность интерпретации данных этих радаров связана с коротковолновым диапазоном их рабочих частот, с одной стороны вызывающей существенное влияние ионосферы на траекторию распространения и интерпретацию данных, с другой стороны – большим количеством различных типов неоднородностей, приводящих к возникновению и искажению рассеянных сигналов, принимаемых радаром. Задача автоматизации исследований ионосферы с помощью декаметровых радаров когерентного рассеяния чрезвычайно сложна, что связано с многими причинами: - необходимостью учета траектории распространения радиоволны, что в свою очередь требует совершенствования ионосферных моделей, численных методов расчета траектории распространения радиоволны и методов зондирования; - необходимостью автоматической интерпретации принятых сигналов и разделения их на классы в зависимости от физических механизмов их формирования; - необходимостью обеспечения высокой точности угломестных наблюдений, требуемой для обеспечения необходимой точности интерпретации данных. В проекте предполагается улучшить качество интерпретации данных радаров российской сети СЕКИРА (включающей в себя радары MAGW и EKB ИСЗФ СО РАН), а также некоторых радаров SuperDARN за счет использования управляемого данными подхода (Data-driven approach), основанного на современных методах анализа и моделирования, хорошо зарекомендовавшего себя в последнее время при решении различных практических задач. В результате выполнения проекта ожидается улучшение качества интерпретации сигналов радаров, облегчение получения новой информации исследователями (геофизиками и специалистами по физике плазмы) и проведение детального статистического анализа большого массива данных, накопленных на радарах СЕКИРА и SuperDARN.


 

ОТЧЁТНЫЕ МАТЕРИАЛЫ


Аннотация результатов, полученных в 2024 году
В течение этапа 2024 года развит самосогласованный, управляемый данными подход к классификации обработанных данных, получаемых на среднеширотных радарах когерентного рассеяния ИСЗФ СО РАН (СЕКИРА). На этом этапе получены следующие результаты. Проведен предварительный анализ данных радаров СЕКИРА и публично доступных обработанных данных радаров SuperDARN для выявления возможностей их совместного использования для автоматической классификации. На основе анализа данных двух радаров когерентного рассеяния ИСЗФ СО РАН показано, что эти радары регистрируют значительное (до 35%) количество сигналов, поступающих из заднего лепестка диаграммы направленности антенны, которые ранее не учитывались при автоматической обработке данных и существенно ухудшали качество автоматической идентификации сигналов. На основе моделирования и байесовского подхода рассчитан оптимальный пороговый угол места, минимизирующий ошибки разделения сигналов на главный и задние лепестки. Для радара EKB он равен 28 градусам, для радара MAGW - 38 градусам. Оптимальность порогового угла места была доказана анализом трассировки лучей всех сигналов, наблюдаемых радарами EKB и MAGW в 2021 году. Для преемственности моделей как для радаров СЕКИРА (использующих различные типы сигналов от короткого 7-импульсного до длинного 16-импульсного), так и для радаров SuperDARN (использующих в основном только 7- и 8-импульсные последовательности) был предложен метод загрубления данных о спектральной ширине принятого сигнала, определены характеристики такого загрубления (аугментации). Использование аугментации привело к успешному построению модели, не зависящей от типа используемых зондирующих сигналов. На основе данных 2021 года решена задача автоматической классификации данных без их разметки экспертом и без постулирования количества классов. Алгоритм самостоятельно размечает данные, определяет оптимальное количество классов сигналов, наблюдаемых радарами, и обучает двухслойную классифицирующую нейронную сеть предельно простой структуры. При траекторных расчетах используется метод волновой оптики и международные ссылочные модели ионосферы и магнитного поля Земли. Задача поиска числа классов сведена к задаче поиска нейронной сети с минимальным количеством нейронов в слое. Было обнаружено, что задача поиска числа классов в данных имеет множество вариантов решений в зависимости от используемых методов и критериев. Для устойчивого решения этой задачи был разработан алгоритм поиска минимального количества нейронов в полносвязных слоях произвольной сети [http://idstu.irk.ru/ru/system/files/materialy_konferencii_lyapunovskie_chteniya_2024.pdf; https://www.arxiv.org/abs/2405.14147], не требующий многократного обучения сети с различным количеством нейронов и устойчивый к увеличению объема данных. Кроме использования этого метода для анализа данных радаров, метод был апробирован также на нескольких стандартных задачах классификации и регрессии и показал свою эффективность и в других задачах, требующих создания полносвязных нейронных сетей минимальной ширины. В результате выполнения этапа было показано, что количество классов в данных радаров СЕКИРА, принимаемых с главного лепестка диаграммы направленности, составляет от 23 до 35, в зависимости от требований к разделимости этих классов, для удобства интерпретации исследователями было выбрано 35, из которых 13 являются сигналами, рассеянными от ионосферных неоднородностей, 6 - от земной поверхности, а интерпретация остальных затруднена, возможно это шумовые сигналы. При построении итогового классификатора везде использовались абсолютные функции активации. Этот подход позволил эффективно обучить нейронную сеть (с качеством 92%) и найти минимальное число классов в данных. Полученная нейронная сеть имеет очень малое для нейронных сетей число параметров (2240), и позволяет представить результат не только в виде нейронной сети, но и в виде сравнительно простой формулы. Алгоритм запущен и работает в настоящее время в реальном масштабе времени для автоматической классификации сигналов радаров СЕКИРА [http://sdrus.iszf.irk.ru/node/107]. Каждый класс сигнала, определенный нейронной сетью, был проинтерпретирован с физической точки зрения исходя из статистических характеристик сигналов, принадлежащих ему. Проведена оценка значимости различных параметров входных данных. Показано что наиболее важными для классификации параметрами являются расчетные высота рассеяния и наклон траектории в точке рассеяния, а наименее важными - спектральная ширина принятого сигнала и расчетное количество отражений от нижележащей поверхности. Проведенный анализ позволил показать, что для среднеширотных радаров траекторные расчеты исключительно важны, и данные о высоте рассеяния и форме траектории в точке рассеяния и посередине траектории, а также угол с магнитным полем в точке рассеяния действительно позволяют наиболее уверенно разделять рассеянные сигналы на классы.

 

Аннотация результатов, полученных в 2025 году
В проекте на основе десяти радаров SuperDARN, двух радаров СЕКИРА, и управляемого данными подхода впервые построена самообученная универсальная модель для классификации данных, полученных на радарах когерентного рассеяния. Модель основана на данных этих радаров, без привлечения экспертов к любому этапу обучения модели или подготовки данных. Этот классификатор – это нейронная сеть, обученная на данных, полученных с 12 радаров в течение двух лет (года высокой и года низкой солнечной активности) для каждого радара. Построенная нейросетевая классифицирующая модель имеет 2669 коэффициентов. Для классификации модель использует как рассчитанные параметры распространения радиоволн в модельной ионосфере (используется международная ссылочная модель ионосферы IRI и международная модель магнитного поля Земли IGRF), так и параметры, непосредственно измеренные радаром. Для определения оптимального количества классов в данных использовалась оригинальная методика определения минимально необходимого числа нейронов в полносвязном слое нейронной сети, разработанная в проекте ранее. Обучение нейронной сети выявило 37 оптимальных классов, 25 из которых наблюдались часто, Анализ позволил выбрать из них 14 классов, которые уверенно разделяются при других вариантах обучения модели. Проведена предварительная интерпретация 10 из этих классов. Проанализирована статистика наблюдения различных классов и их зависимость от географической широты радаров при разных уровнях солнечной и геомагнитной активности. Результат согласуется с известными физическими механизмами. Получены оценки по влиянию качества ионосферной модели и угломестной калибровки радара на результаты классификации. Получены оценки значимости различных параметров на качество классификации. Анализ показал, что важнейшими параметрами для идентификации классов являются форма траектории радиоволны (луча) во второй ее половине, высота рассеяния радиоволны и доплеровская скорость, измеренная радаром. Полученная модель слабо чувствительна к спектральной ширине принятого сигнала, в отличие от большинства традиционных методов классификации. Это дает ей в будущем преимущества при использовании на радарах когерентного рассеяния с более совершенными зондирующими последовательностями и методами обработки принятых сигналов. Результат опубликован в журнале первого квартиля [https://doi.org/10.1016/j.asr.2025.11.074]. Использованные для построения классификатора радары расположены от средних широт до географического полюса и охватывают практически весь широтный и долготный диапазон расположения радаров сетей SuperDARN и СЕКИРА и различные уровни солнечной активности. Это дает основания использовать полученную модель классификации данных на любом из радаров этих сетей.

 

Публикации

1. Бернгардт О.И., Фёдоров Р.Р. СИГНАЛЫ, РАССЕЯННЫЕ В ГЛАВНОМ И ЗАДНЕМ ЛЕПЕСТКАХ ДИАГРАММЫ НАПРАВЛЕННОСТИ АНТЕНН РАДАРОВ КОГЕРЕНТНОГО РАССЕЯНИЯ ИСЗФ СО РАН Известия ВУЗов. Радиофизика, No 4, T.68, c.320-335 (год публикации - 2025)
10.52452/00213462_2025_68_04_320

2. Бернгардт О.И., Лавыгин И.А. Self-learning signal classifier for HF coherent scatter radars Advances in Space Research (год публикации - 2025)
10.1016/j.asr.2025.11.074

3. БЕРНГАРДТ О.И. ИСПОЛЬЗОВАНИЕ УПРАВЛЯЕМОГО ДАННЫМИ ПОДХОДА ДЛЯ АВТОМАТИЧЕСКОЙ КЛАССИФИКАЦИИ СИГНАЛОВ, ПРИНИМАЕМЫХ СРЕДНЕШИРОТНЫМИ РАДАРАМИ КОГЕРЕНТНОГО РАССЕЯНИЯ Труды конференции РРВ–29, 30.06 – 04.07.2025, Казань, c.364-367 (год публикации - 2025)
10.26907/rwp29.2025.364-367

4. Бернгардт О.И. УПРАВЛЯЕМЫЙ ДАННЫМИ ПОДХОД К КЛАССИФИКАЦИИ ДАННЫХ СРЕДНЕШИРОТНЫХ РАДАРОВ КОГЕРЕНТНОГО РАССЕЯНИЯ Солнечно-земная физика, No 2, Т. 11. с.22-44 (год публикации - 2025)
10.12737/szf-112202503


Возможность практического использования результатов
не очевидно