КАРТОЧКА ПРОЕКТА ФУНДАМЕНТАЛЬНЫХ И ПОИСКОВЫХ НАУЧНЫХ ИССЛЕДОВАНИЙ,
ПОДДЕРЖАННОГО РОССИЙСКИМ НАУЧНЫМ ФОНДОМ

Информация подготовлена на основании данных из Информационно-аналитической системы РНФ, содержательная часть представлена в авторской редакции. Все права принадлежат авторам, использование или перепечатка материалов допустима только с предварительного согласия авторов.

 

ОБЩИЕ СВЕДЕНИЯ


Номер 17-72-20291

НазваниеСоздание системы машинного обучения для анализа больших объемов данных астрофизики элементарных частиц

РуководительРубцов Григорий Игоревич, Доктор физико-математических наук

Организация финансирования, регион Федеральное государственное бюджетное учреждение науки Институт ядерных исследований Российской академии наук, г Москва

Период выполнения при поддержке РНФ 07.2017 - 06.2020  , продлен на 07.2020 - 06.2022. Карточка проекта продления (ссылка)

Конкурс№24 - Конкурс 2017 года по мероприятию «Проведение исследований научными группами под руководством молодых ученых» Президентской программы исследовательских проектов, реализуемых ведущими учеными, в том числе молодыми учеными.

Область знания, основной код классификатора 02 - Физика и науки о космосе, 02-101 - Физика элементарных частиц

Ключевые словаСистемы машинного обучения, системы обработки больших объемов данных, астрофизика частиц, космические лучи ультравысоких энергий, гамма-астрономия, модели адронных взаимодействий, радио-тихие пульсары

Код ГРНТИ29.05.00


СтатусУспешно завершен


 

ИНФОРМАЦИЯ ИЗ ЗАЯВКИ


Аннотация
Так называемый “информационный взрыв”, лавинообразное нарастание объема разнообразной доступной информации, коснулся многих современных областей знания, в числе которых не последнее место занимает астрономия и астрофизика. Анализ больших данных был назван “четвертой парадигмой” научного подхода, наряду с хорошо известными первыми двумя “экспериментом” и “теорией” и сравнительно недавно сформулированной третьей парадигмой “численного эксперимента”. Целью нового подхода является по возможности автоматическое структурирование больших объемов данных, и в конечном счете выделение ценной информации. Бурное развитие методов машинного обучения вместе с экспоненциальным ростом производительности современных вычислительных систем открывают без преувеличения колоссальные перспективы для исследований в области астрофизики. Потенциал нового подхода еще не до конца осознан в научном сообществе, хотя уже сейчас можно привести десятки успешных примеров применения алгоритмов машинного обучения для анализа астрофизических данных. Весьма показателен пример обработки результатов наблюдений обзора SDSS (Sloan Digital Sky Survey). В обзоре было проведено картографирование более 35 % небесной сферы с фотометрическими наблюдениями порядка 500 миллионов объектов и получением спектров более чем 3 миллионов объектов. Для решения одной из научных задач, морфологической классификации галактик по снимкам, в 2007 году был создан краудсорсинг-проект Galaxy Zoo, в ходе которого для классификации около 900 тысяч снимков галактик привлекалось свыше 100 тысяч волонтеров. Но уже в 2014 году на основе сверточной нейронной сети был предложен эффективный алгоритм, позволяющий выполнить классификацию снимков со сравнимой точностью. Объем доступных для анализа экспериментальных данных в астрофизике растет экспоненциально, подобно ситуации во многих других областях знаний. Ожидается, что телескопы следующего поколения, такие как, LSST (Large Synoptic Survey Telescope), будут генерировать порядка петабайт данных ежегодно. Манипулирование такими объемами данных невозможно без использования новых подходов. В астрофизике частиц высоких энергий, которой посвящен настоящий проект, накопленное количество данных пока исчисляется лишь терабайтами, отчасти, в силу сравнительной малости потока частиц высоких энергий. Так, при энергии 10 ЭэВ поток составляет порядка 1 частицы на квадратный километр на стерадиан в год. По этой причине, во всех существующих экспериментах свойства космических лучей сверхвысоких энергий (КЛСВЭ) определяются косвенным образом по характеристикам широких атмосферных ливней (ШАЛ), инициированных космическими лучами в атмосфере Земли. Анализ наблюдений включает моделирование взаимодействий КЛСВЭ в атмосфере, а также отклика детекторов. Часть работ по данному проекту относится к анализу данных одного из двух крупнейших современных экспериментов, работающим в области КЛСВЭ, Telescope Array (TA). Эксперимент использует гибридный метод регистрации космических лучей, то есть как детекторы наземной решетки, так и флуоресцентные детекторы. В качестве детекторов наземной решетки используются двухслойные сцинтилляторы площадью 3 квадратных метра. В состав установки в настоящее время входит более 500 детекторов, расположенных на квадратной сетке с шагом 1200 метров, покрывающей площадь около 700 кв. км. Фактической наблюдаемой величиной на каждом из поверхностных детекторов является временная развертка сигнала. События детектируются по совпадению сигналов на группе смежных детекторов, поскольку ливень, инициированный КЛСВЭ имеет характерный поперечный размер в несколько километров. Сопоставляя временную развертку на соседних детекторах, восстанавливают направление прихода первичной частицы и другие вторичные наблюдаемые, такие как кривизна фронта ШАЛ. Моделирование ливней, инициированных ядрами различной массы, а также фотонами и нейтрино, позволило выделить часть вторичных наблюдаемых, наиболее чувствительных к природе первичной частицы. В частности, удается довольно надежно отличить ливни, инициированные фотонами или нейтрино от адронных ШАЛ, что позволило поставить ограничение сверху на поток фотонов и нейтрино ультравысоких энергий. В виду похожести ливней, инициированных ядрами различной массы пока не удается точно измерить массовый состав КЛСВЭ. В то же время существующий анализ использует вторичные наблюдаемые, число которых ограничено текущим объемом научных знаний о структуре ШАЛ. В рамках проекта планируется разработать алгоритм анализа данных, использующий непосредственно временные развертки сигнала на группе смежных детекторов, для выявления паттернов, соответствующих ШАЛ, оценки энергии и природы первичной частицы. Для этого планируется использовать имеющийся набор данных наземной решетки Telescope Array. Для тренировки алгоритма будут использованы наборы Монте-Карло событий, записанные в том же формате, что и данные установки. На вход сверточной нейронной сети будут подаваться сигналы от группы смежных детекторов, скомбинированные в изображение. Такой алгоритм позволит существенно повысить чувствительность эксперимента к компонентному составу первичных частиц, фотонам и нейтрино ультравысоких энергий. Планируется построить алгоритм регрессии для оценки плотности мюонов ШАЛ, что позволит получить количественное свидетельство об избытке или недостатке мюонов в данных Telescope Array по сравнению с предсказаниями адронных моделей. Кроме того для возможной идентификации источников планируется разработать алгоритм кластеризации, позволяющий осуществлять поиск искаженных в галактических и внегалактических полях изоборажений источников космических лучей. Создаваемые в рамках проекта методы машинного обучения будут иметь астрофизические приложения вне предметной области космических лучей. Так, в рамках проекта будет разработана сверточная нейронная сеть для поиска событий скачкообразного увеличения частоты (глитчей) гамма-пульсаров. Кроме того, коллективом будет разработан метод регрессии для уточненной фотометрической оценки красного смещения блазаров.

Ожидаемые результаты
Ожидается получение данных о химическом составе космических лучей с использованием полного набора данных наземной решетки Telescope Array. Предложенный метод сверточных нейронных сететй потенциально обладает рекордной чувствительностью. Ожидается получение рекордных в северном полушарии ограничений на поток фотонов ультравысоких энергий и сопоставимых с мировым уровнем ограничений на поток нейтрино. Результаты данной задачи могут дать указания на возможные источники и методы ускорения космических лучей ультравысоких энергий. Ожидается получение вывода о присутствии или отстутствии мюонного избытка в данных наземной решетки Telescope Array и архивных данных крупнейшей в истории решетки мюонных детекторов SUGAR. Ожидается, что за счет использования астрофизических данных во всех доступных энергетических диапазонах, будет достигнута лучшая точность определения красного смещения блазаров. Ожидается, что поиск изображений источников космических лучей, искаженных магнитными полями, будет выполнен с более высокой чувствительностью, чем существующие на сегодня исследования. Ожидается, что за счет использования сверточных нейронных сетей может достигнута повышенная чувствительность к глитчам гамма-пульсаром по сравнению с традиционными методами. Как следствие, ожидается обнаружение ранее неизвестных глитчей. Ожидается, что результаты будут соответствовать мировому уровню и использоваться научным сообществом. Результаты проекта будут внедрены в образовательный процесс в рамках спецкурса для магистров и аспирантов Физического факультета МГУ им. М.В. Ломоносова. Разработанные архитектуры систем машинного обучения смогут найти применение при проектировании и построении астрофизических экспериментов нового поколения, а также в других областях исследований.


 

ОТЧЁТНЫЕ МАТЕРИАЛЫ


Аннотация результатов, полученных в 2017 году
Разработана архитектура нейросетевого алгоритма анализа данных наземной решетки обсерватории Telescope Array, впервые использующего полный набор наблюдаемых данных - временную развертку сигнала на каждом из детекторов. Используя Монте-Карло моделирование событий показано, что алгоритм дает более точную оценку зенитного угла, чем стандартная реконструкция. Построен алгоритм анализа химического состава по данным наземной решетки Telescope Array на базе усиленных деревьев решений. Получена величина средней массы космических лучей <ln A> = 1.52 в диапазоне энергий от 10^18 до 10^20 эВ по данным Обсерватории Telescope Array. По данным Telescope Array о распределении глубины максимума ШАЛ получено ограничение снизу на величину отношения числа протонов к числу ядер гелия в диапазоне энергий от 10^18.3 до 10^19.3 эВ, p/He > 0.43. Получены ограничения на диффузный поток фотонов и поток фотонов от точечных источников с энергией от 1 ЭэВ по данным наземной решетки Telescope Array. Проведено моделирование событий, вызванных в атмосфере первичными нейтрино, в условиях установки Telescope Array. Проведен предварительный анализ мюонных данных, зарегистрированных установкой SUGAR. Показано, что в эксперименте SUGAR наблюдается избыток мюонов по сравнению с предсказанием адронных моделей в 1.67 и в 1.28 раз для моделей с первичными протонами и железом соответственно. Разработана процедура построения карт неба, искаженных в галактических и внегалактических магнитных полях, соответствующих сценарию близкого источника космических лучей ультравысоких энергий. Разработан алгоритм регрессии для определения красного смещения блазаров по данным фотометрических наблюдений в различных частотных диапазонах. Точность первой версии алгоритма составляет ~30%. Разработан код для Монте-Карло моделирования фотонов от пульсаров с глитчами. Разработан код быстрого вычисления H-статистики на видеокартах.

 

Публикации

1. Беллидо Дж.А., Клэй Р.В., Калмыков Н.Н., Карпиков И.С., Рубцов Г.И., Троицкий С.В., Улрихс Дж. Muon content of extensive air showers: comparison of the energy spectra obtained by the Sydney University Giant Air-shower Recorder and by the Pierre Auger Observatory Physical Review D, - (год публикации - 2018)

2. Карпиков И.С., Рубцов Г.И., Жежер Я.В. Lower limit on the ultra-high-energy proton-to-helium ratio from the measurements of the tail of Xmax distribution Направлена в Physical Review D, - (год публикации - 2018)

3. - Игры разумов. РНФ подключился к борьбе за научную грамотность. Газета Поиск, Газета Поиск № 7(2018) (год публикации - )


Аннотация результатов, полученных в 2018 году
Разработан нейросетевой алгоритм анализа данных наземной решетки детекторов Telescope Array, выполняющий функцию более точной реконструкции зенитного угла (на 20% для первичных протонов и ядер, на 30-50% для первичных фотонов в зависимости от энергии) и энергии (на 20-40%) по сравнению со стандартной реконструкцией коллаборации Telescope Array. Результаты представлены в пленарном докладе на межународной конференции ACAT'2019. Результаты определения средней массы космических лучей в диапазоне энергий от 10^18 до 10^20 эВ методом усиленных деревьев опубликованы в Phys.Rev.D в статье от имени коллаборации Telescope Array, ответственным автором которой является участник проекта. Построен алгоритм оценки массы первичного ядра по данным наземной решетки Telescope Array, принципиально позволяющий отличить однородный состав космических лучей от смешанного при одинаковой средней массе. Коллективом проведен первичный анализ имеющегося в коллаборации Telescope Array набора ШАЛ, смоделированного с раздельной записью сигналов от электромагнитной, мюонной и адронной компонент и соответствующего программного обеспечения. Выполнено полное моделирование ШАЛ в условиях установки SUGAR. Получены предварительные результаты сравнения параметров наблюдавшейся в эксперименте функции пространственного распределения мюонов в ШАЛ с результатом моделирования. Результаты готовятся к публикации. Получено ограничение на поток астрофических нейтрино с энергией выше 1 ЭэВ по данным наземной решетки Telescope Array. Статья от имени коллаборации, ответственным автором которой является участник проекта, направлена в ЖЭТФ. По данным наземной решетки Telescope Array получены ограничения на поток фотонов от точечных источников с произвольных направлений, и отдельно от лацертид и карликовых галактик. Выполнено моделирование рождения гамма-квантов протонами, приходящими с различных расстояний. Результаты представлены на конференции Кварки'2018. Статья от имени коллаборации, ответственным автором которой является основной исполнитель проекта, направлена в MNRAS. Полученные в первый год проекта ограничения на диффузный поток гамма-квантов опубликованы от имени коллаборации в Astroparticle Physics; ответственным автором статьи является руководитель проекта. Выполнено моделирование карт космических лучей уьтравысоких энергий в предположении присутствия ближайшего источника. Разработана архитектура сверточной нейронной сети на основе пакета DeepSphere, позволяющего выполнять сверточные преобразования на пикселизованной карте HEALPix. Предварительные результаты тренировки нейронной сети для идентификации ближайшего источника будут представлены на CRA'2019 в октябре 2019 г. Оптимизирован набор входных данных и разработана архитектура многослойной нейронной сети прямого распространения, что позволило определять неизвестные красные смещения активных ядер галактик класса лацертид по их наблюдениям в радио-, оптическом, рентгеновском и гамма-диапазонах c относительной точностью 27%. Изготовлены наборы гамма-квантов от модельных гамма-пульсаров в условиях наблюдения космической обсерватории Fermi LAT. Построен алгоритм поиска глитчей на базе сверточной нейронной сети, точность которого превышает 85%.

 

Публикации

1. Аббаси Р.У., Абе М., Абу-Заяд Т., ..., Калашев О.Е., Кузнецов М.Ю., Пширков М.С., Рубцов Г.И., Жежер Я.В., ..., Зундель Z., коллаборация Telescope Array Mass composition of ultrahigh-energy cosmic rays with the Telescope Array Surface Detector data Physical Review D, 99, 022002 (год публикации - 2019) https://doi.org/10.1103/PhysRevD.99.022002

2. Аббаси Р.У., Абе М., Абу-Заяд Т., ..., Калашев О.Е., Кузнецов М.Ю., Пширков М.С., Рубцов Г.И., Жежер Я.В., ..., Зундель Z., коллаборация Telescope Array Constraints on the diffuse photon flux with energies above 10^18 eV using the surface detector of the Telescope Array experiment Astroparticle Physics, 110, 8-14 (год публикации - 2019) https://doi.org/10.1016/j.astropartphys.2019.03.003

3. Жежер Я.В. Ultra-high-energy cosmic rays mass composition studies with the Telescope Array Surface Detector data EPJ Web of Conferences, 191, 08007 (год публикации - 2018) https://doi.org/10.1051/epjconf/201819108007

4. Жежер Я.В. Composition studies with the Telescope Array surface detector data Известия Российской академии наук. Серия физическая, - (год публикации - 2019)

5. Г.И. Рубцов, Я.В. Жежер Программа определения масс первичных частиц космических лучей регистрируемых в эксперименте Telescope Array (mva_pFe_ds8) -, заявка на регистрацию программы для ЭВМ направлена в Роспатент 30.04.2019 (год публикации - )

6. - Представлены результаты изучения космических лучей сверхвысоких энергий в атмосфере Земли Газета.ру, 24.04.2019 13:00 (год публикации - )

7. - Машинное обучение улучшит поиск космических лучей Индикатор, Астрономия, 24.04.2019 (год публикации - )


Аннотация результатов, полученных в 2019 году
Разработанная в рамках проекта архитектура сверточной нейронной сети для анализа полного набора данных наземной решетки Telescope Array адаптирована для оценки логарифма массы первичной частицы, инициирующей ливень. В работе (Калашев О.Е., Кузнецов М.Ю., Proceedings of Science 358, 304, 1-8, 2019) соответствующая модель обучена на данных Монте-Карло моделирования ливней, инициированных протонами, ядрами гелия, азота и железа и применена для анализа данных наземной решетки Telescope Array за 9 лет наблюдений. Выполнено сравнение чувствительность метода с ранее разработанным анализом, основанным на усиленных деревьях решений и использующим 14 синтетических наблюдаемых, чувствительных к массовому составу. Новый метод показал совместимый результат и позволил уменьшить статистическую ошибку определения среднего логарифма массы в два раза до 0.05, а систематическую ошибку, не связанную с выбором модели адронных взаимодействий при ультравысоких энергиях в три раза, то есть до 0.14. Сделан вывод о том, что основным препятствием для надежного определения массового состава остается неопределенность, связанная с моделированием нуклон-нуклонных взаимодействий, которая для обоих методов составляет 0.75 в единицах среднего логарифма атомной массы. Разработанная сеть использована для поиска наблюдаемых различий неоднородного по массовому составу набора от набора, состоящего из событий с одинаковой массой. Было показано, что предсказания сети чувствительны к однородности массового состава тестового набора событий. Результаты представлены на международной конференции ICRC'2019. Исследовано распределение по небу параметра усиленных деревьев xi, используемого для определения массы первичных частиц в методе, разработанном участниками гранта для анализа данных наземной решетки эксперимента Telescope Array. Основываясь на распределении параметра xi для модельных Монте-Карло событий, в данных наземной решетки эксперимента выделены события, которые с заранее определенной степенью достоверности, являются первичными протонами, и построено распределение этих событий по небу, которое будет в дальнейшем использовано в анализе анизотропии направлений прихода. Разработана сверточная нейронная сеть для анализа полного набора данных наземной решетки Telescope Array. Установлено, что она позволяет улучшить реконструкцию направления прихода ШАЛ. Использование этой новой реконструкция событий позволило уменьшить ошибку определения направления прихода примерно на четверть для ядер и на треть для фотонов, причем точность практически не зависит от выбора адронной модели взаимодействий при симуляции ШАЛ. Результаты опубликованы в виде препринта статьи (https://arxiv.org/pdf/2005.07117.pdf). Выполнен анализ мюонной компоненты широких атмосферных ливней в диапазоне первичных энергий от 10^17 эВ до 10^18.5 эВ по данным эксперимента SUGAR (The Sydney University Giant Air-shower Recorder). Восстановлена функция поперечного распределения мюонов - зависимость плотности мюонов от расстояния от оси ливня. Сравнение наблюдаемого распределения мюонов в ШАЛ с предсказаниями Монте-Карло моделирования показывает, что при малых расстояния от оси ливня модельная мюонная плотность ниже экспериментально измеренной, причем различие растет с энергией. Как следствие, интегральное число мюонов в экспериментальных данных превышает предсказание моделирования в ~1.5 раза. Результат указывает на то, что "мюонный избыток" определяется различием формы функции поперечного распределения в данных и моделировании. В отличие от результатов SUGAR, зависимость мюонной плотности от расстояния в данных Telescope Array на более высоких энергиях (выше 10^19 эВ), показывает "мюонный избыток" на больших расстояниях от оси. Для более детального исследования мюонной плотности в Telescope Array построен набор наблюдаемых, определяемых подетекторно. Подготовлен программный комплекс для Монте-Карло моделирования событий в условиях установки Telescope Array с помощью новой в этих исследованиях модели URQMD. В рамках международной рабочей группы по исследованию адронных взаимодействий WHISP проведен сравнительный анализ зависимости мюонного избытка от расстояния и энергии в различных экспериментах. На базе сверточной нейронной для анализа полного набора данных наземной решетки Telescope Array построена сеть дискриминирующая фотонные и протонные ШАЛ. Установлено, что для фотонов c энергией выше 10^19 эВ уровень чувствительности к фотонному сигналу на протонном фоне, оцениваемый как отношение сигнала к корню из шума, даваемый этой сетью в 2.6 раз превышает соответствующий уровень чувствительности алгоритма усиленных деревьев решений. В рамках поиска фотонов от крупномасштабной структуры Вселенной для улучшения геометрической реконструкции фотонных событий использована сверточная нейронная сеть. Угловое разрешение эксперимента по отношению к фотонам улучшено на 15% при энергии фотонов более 3х10^19 эВ. С учетом этого улучшения и на основе сделанного ранее моделирования распространения фотонного сигнала, следующего распределению массы в крупномасштабной структуре Вселенной, получена оценка чувствительности эксперимента к фотонному сигналу этого типа. По сравнению с анализом диффузного фотонного сигнала чувствительность выросла в 1.5 раза. Результат представлен в докладе (М.Кузнецов, Winter workshop, Прага, Чехия 2019). Опубликованы ограничения на поток фотонов от точечных источников с энергиями выше 10^18 эВ со всех направлений в Северном полушарии, полученные с помощью протон-фотонного классификатора основанного на алгоритме деревьев решений (Abbasi et al, MNRAS 492 (2020) 3984). Полученные ограничения на поток фотонов от карликовых галактик (гипотеза распадающейся темной материи) опубликованы в работе (Кузнецов, Калашев, Рубцов, PoS ICRC2019 326). Разработан метод анализа направлений прихода событий с помощью классификатора, основанного на сверточной нейронной сети. В основе метода лежит обучение нейросетевой модели отличать карты направлений прихода событий, сгенерированные для нулевой и альтернативной гипотез происхождения КЛСВЭ. Классификатор выделяет характерные патерны, возвращает вероятность присутствия источника, которая затем используется как тестовая статистика. Подход оказался удачным, позволив уменьшить число событий, требуемое для проверки ряда гипотез в 5-8 раз, по сравнению с анализом, основанным на угловом спектре мощности. Проведено исследование устойчивости метода по отношению к вариациям параметров модели, таких как конфигурация галактического магнитного поля, массовый состав космических лучей, относительный вклад различных источников в полный наблюдаемый поток. Сделан вывод о применимости метода для анализа данных в таких экспериментах как Pierre Auger и Telescope Array. Результаты представлены на международном рабочем совещании по анизотропии космических лучей CRA 2019, а также на семинаре лаборатории астрофизики частиц Университета Парижа. Статья опубликована в электронном архиве (Калашев, Пширков, Зотов, arXiv:1912.00625), направлена в JCAP. Разработанный программный код публично доступен на GitHub (https://github.com/okolo/ml_cr_aniso). Используемые данные в алгоритме анализа красных смещений дополены наблюдениями в радио, оптическом, рентгеновском, и гамма диапазонах, взятыми из каталога ROMABZCAT. Добавление новых данных привело к улучшению относительной точности определения красных смещений на несколько процентов  до уровня ~25%. Этот уровень точности, к сожалению, не превосходит аналогичные современные методы. Например, в конце 2019 появилась работа, где заявляется точность определения красного смещения в 18% при использовании методов МО на данных наблюдений в диапазоне высоких и очень высоких энергий (Singh et al, "An artificial intelligence based approach for constraining the redshift of blazars using γ–ray observations", Experimental Astronomy, 48,  297–311 (2019)). Возможно, улучшение метода может быть достигнуто при более широком использовании данных наблюдений в рентгеновском диапазоне, которое станет возможным после проведения телескопом eROSITA на борту спутника Спектр-РГ полного обзора неба в мягком рентгеновском диапазоне. В рамках проекта выполнено использование методов машинного обучения для обработки наблюдательных данных радиотелескопа БСА ПРАО АКЦ ФИАН. Этот радиотелескоп с эффективной площадью 35 000 м2, работающий на частоте 111 МГц, является мощным инструментом для наблюдений на низких частотах. Основной целью наблюдений являются пульсары, прежде всего такие нестационарные явления как мерцания в межзвёздной и межпланетной среде и гигантские импульсы (ГИ) - импульсы на порядок и более мощные, чем средний. Наиболее известным представителем класса пульсаров с ГИ является пульсар в Крабовидной туманности. Выделение ГИ из шума является непростой задачей, в том числе и из-за сложной помеховой обстановки в месте расположения телескопа - 100 км к югу от Москвы. Для решения этой задачи был построен классификатор на основе метода леса случайных деревьев. Были отобраны 2271 события с отношением сигнала к дисперсии шума вышк 10. После визуальной инспекции, события были разделены на классы (“импульс”, “шум”) и искусственно размножены. Тренировка классификатора была выполнена на обучающем наборе из 20247 событий. Точность классификатора на тестовом наборе достигла 97.8%. Также мы проверили альтернативные методы с использованием нейронных сетей, которые дали на этих наборах сравнимую точность (97.4%). Применение классификатора на полном наборе событий с отношением сигнала к дисперсии шума более 4 позволило отобрать 10441 событий за 2085 наблюдательных сессий. Применение метода попозволило изучить генерацию мощных ГИ (флюэнс более 50 000 Ян*мс) (Казанцев, Потопов, Пширков, arXiv:1905.05261). Разработана сверточная нейронная сеть, предназначенная для поиска глитчей гамма-пульсаров. Для обучения сети, а также оценки точности её работы, были использованы данные Монте-Карло моделирования пульсаров. Выполнены работы по оптимизации архитектуры сети и метода подготовки входных данных, в результате чего точность обнаружения глитчей с амплитудой выше 10^-8 достигла 90%. Для этого, во-первых, был уменьшен размер входного массива данных до 131x131, что стало возможным благодаря применению процедуры сглаживания --- свертки оригинальных данных с функцией Гаусса. Во-вторых, мы применили технику аугментации тренировочных данных, заключающуюся в произволной сдвижке, обрезании, сжатию и растяжению массива. Это позволило увеличить число тренировочных данных в несколько раз. Разработанный алгоритма поиска глитчей примен к данным космической обсерватории Fermi LAT. В результате были найдены новые гличи, неизвестне в литературе. В процессе работы выяснилось, что полномасштабный поиск глитчей маленькой амплитуды потребует уточнения координат пульсаров по сравнению с каталогом 3FGL. Погрешность в определении координат у радио-тихих пульсаров оказывает негативное влияние на чувствительность метода. Результаты работы подготовлены к публикации.

 

Публикации

1. Аббаси Р.У., Абе М., Абу-Заяд Т., ..., Калашев О.Е., Кузнецов М.Ю., Пширков М.С., Рубцов Г.И., Жежер Я.В., ..., Зундель Z., коллаборация Telescope Array Search for point sources of ultra-high-energy photons with the Telescope Array surface detector Monthly Notices of the Royal Astronomical Society, 492,3 (год публикации - 2020) https://doi.org/10.1093/mnras/stz3618

2. Аббаси Р.У., Абе М., Абу-Заяд Т., ..., Калашев О.Е., Кузнецов М.Ю., Пширков М.С., Рубцов Г.И., Жежер Я.В., ..., Зундель Z., коллаборация Telescope Array Поиск нейтрино ультравысоких энергий по данным наземной решетки эксперимента Telescope Array Журнал Экспериментальной и Теоретической Физики, 157,5,1-13 (год публикации - 2020) https://doi.org/10.31857/S0044451020050000

3. Иванов Д., Калашев О.Е., Кузнецов М.Ю., Рубцов Г.И., Сако Т., Цунесада Й., Жежер Я.В. Using Deep Learning to Enhance Event Geometry Reconstruction for the Telescope Array Surface Detector arXiv, - (год публикации - 2020)

4. Казанцев А.Н., Потапов В.А., Пширков М.С. Irregularities in the rate of generation of giant pulses from the Crab pulsar observed at 111 MHz arXiv, - (год публикации - 2019)

5. Калашев О.Е. Using Deep Learning in Ultra-High Energy Cosmic Ray Experiments Journal of Physics: Conference Series, 1525 (ACAT 2019) (год публикации - 2020)

6. Калашев О.Е., Кузнецов М.Ю. Study Cosmic Ray Mass Composition using Deep Learning in Telescope Array Surface Array Detector Proceedings of Science, 358, 304, 1-8 (год публикации - 2019)

7. Калашев Олег, Пширков Максим, Зотов Михаил Identifying nearby sources of ultra-high-energy cosmic rays with deep learning arXiv, - (год публикации - 2019)

8. Карпиков И.С.,Беллидо Дж.А.,Клэй Р.В.,Калмыков Н.Н.,Рубцов Г.И.,Троицкий С.В. Muon Content of Extensive Air Showers: Comparison of the Energy Spectra Obtained by the Sydney University Giant Air-Shower Recorder and by the Pierre Auger Observatory Physics of Atomic Nuclei, 82, 6, 601–605 (год публикации - 2019) https://doi.org/10.1134/S1063778819660256

9. Кузнецов М.Ю.,Калашев О.Е.,Рубцов Г.И. Telescope Array search for EeV photons Proceedings of Science, 358, 326, 1-8 (год публикации - 2019)

10. Рубцов Г.И., Сокольский П.,Троицкий С.В., Жежер Я.В. Anisotropy in the mass composition from the Telescope Array Surface Detector data Proceedings of Science, 358, 494,1-7 (год публикации - 2019)

11. Панин А.Г., Соколова Е.В. Программа по поиску глитчей у гамма-пульсаров (gray_glitches) -, 2019663337 (год публикации - )

12. - Представлены результаты изучения космических лучей сверхвысоких энергий в атмосфере Земли Газета.ру, 24.04.2019 13:00 (год публикации - )

13. - Машинное обучение улучшит поиск космических лучей Indicator, 24.04.2019 05:48 (год публикации - )


Возможность практического использования результатов
Созданные в результате проекта методы опубликованы, 2 программы для ЭВМ зарегистрированы, 1 программа размещена открыто на GitHub. Спектр возможных применений разработанных методов не ограничен задачами, выполненными в рамках проекта, а может быть расширен на существующие и планируемые эксперименты в области астрофизики высоких энергий. Методы могут использоваться как для значительного увеличения эффективности работы существующих экспериментов, так и для проектирования экспериментов следующего поколения, в том числе космического базирования. Результаты внедрены в образовательный процесс, разработан и читается на физическом факультете МГУ им М.В. Ломоносова спецкурс для магистратуры и аспирантуры "Дополнительные главы статистической обработки данных: методы машинного обучения", прочитан курс лекций и проведен хакатон на Баксанской школе "Частицы и космология" (2019).