КАРТОЧКА ПРОЕКТА ФУНДАМЕНТАЛЬНЫХ И ПОИСКОВЫХ НАУЧНЫХ ИССЛЕДОВАНИЙ,
ПОДДЕРЖАННОГО РОССИЙСКИМ НАУЧНЫМ ФОНДОМ

Информация подготовлена на основании данных из Информационно-аналитической системы РНФ, содержательная часть представлена в авторской редакции. Все права принадлежат авторам, использование или перепечатка материалов допустима только с предварительного согласия авторов.

 

ОБЩИЕ СВЕДЕНИЯ


Номер 17-72-20045

НазваниеИсследование свойств кварк-глюонной среды в экспериментах по ядро-ядерным столкновениям путем обработки больших объемов данных методами машинного обучения

РуководительАлцыбеев Игорь Геннадьевич, Кандидат физико-математических наук

Организация финансирования, регион федеральное государственное бюджетное образовательное учреждение высшего образования "Санкт-Петербургский государственный университет", г Санкт-Петербург

Период выполнения при поддержке РНФ 07.2017 - 06.2020  , продлен на 07.2020 - 06.2022. Карточка проекта продления (ссылка)

Конкурс№24 - Конкурс 2017 года по мероприятию «Проведение исследований научными группами под руководством молодых ученых» Президентской программы исследовательских проектов, реализуемых ведущими учеными, в том числе молодыми учеными.

Область знания, основной код классификатора 02 - Физика и науки о космосе, 02-102 - Физика ядра

Ключевые словарелятивистская ядерная физика, критическая точка ядерной материи, кварк-глюонная плазма, угловые корреляции вылета частиц, флуктуации событие-за-событием, большие данные, анализ данных, машинное обучение, обучение без учителя, байесовский анализ, монте-карловские симуляции

Код ГРНТИ29.05.29, 29.05.81, 29.03.77


СтатусУспешно завершен


 

ИНФОРМАЦИЯ ИЗ ЗАЯВКИ


Аннотация
Проблема поиска критической точки ядерной материи и изучение коллективных эффектов на сегодняшний день являются основными задачами релятивистской ядерной физики. В настоящем проекте предлагается применение новых наблюдаемых для анализа данных по столкновениям протонов и ядер в экспериментах ALICE на Большом адронном коллайдере и NA61/SHINE на Протоном суперсинхроторне в ЦЕРН. Предложенные наблюдаемые устойчивы к тривиальным объемным флуктуациям и обладают большой чувствительностью к эффектам начальных состояний системы после соударения. Также для анализа свойств кварк-глюонной среды в проекте будут применены современные методы машинного обучения. В частности, будет выполнено поисковое исследование по применению алгоритмов обучения без учителя к анализу данных по ядро-ядерным столкновениям, позволяющее находить в данных закономерности, которые не выявляются традиционными методами анализа. Методы машинного обучения будут применены к решению проблемы определения центральности соударений в эксперименте, а также к оптимизации параметров моделей, описывающих начальные состояния и эволюцию кварк-глюонной среды, образующейся после соударения ядер. Проведенные исследования позволят получить новые знания о об экстремальных состояниях ядерной материи. Кроме того, в рамках проекта на базе ресурсов СПбГУ будет создана локальная система обработки и хранения данных эксперимента ALICE на БАК.

Ожидаемые результаты
Будут получены результаты расчетов новых наблюдаемых, нечувствительных к тривиальным эффектам и обладающим большой чувствительностью к эффектам начальных состояний, в анализе данных с экспериментов ALICE и NA61/SHINE в ЦЕРН. В проекте будут получены результаты анализа экспериментальных данных по ядро-ядерным соударениям на основе алгоритмов машинного обучения, в частности обучения без учителя. Применение методов машинного обучения к анализу данных по ядро-ядерным соударениям является новым подходом, позволяющим выявить закономерности в поведении кварк-глюонной среды, которые не улавливаются традиционными методами анализа. К проблемам прецизионного определения центральности в экспериментах по ядро-ядерным соударениям впервые будут применены классификаторы, основанные на методах машинного обучения. Будет достигнуто повышение разрешения отобранных классов в терминах прицельного параметра, что позволит извлечь более точные величины различных наблюдаемых в классах центральности. Проведенное исследование свойств кварк-глюонной материи с помощью новых наблюдаемых и методов машинного обучения внесет ощутимый вклад в фундаментальные знания об экстремальных состояниях ядерной материи при сверхвысоких температурах и давлениях, по положению критической точки и коллективным эффектам в кварк-глюонной среде. Разработанные методики могут быть применены в других существующих и планируемых экспериментах по столкновениям релятивистских ядер. Также в проекте на базе существующих ресурсов СПбГУ будет создана локальная система обработки и хранения данных эксперимента ALICE на БАК, которая будет интегрирована в существующие глобальные системы (AliEN, WLCG) для возможности запуска задач напрямую из этих систем.


 

ОТЧЁТНЫЕ МАТЕРИАЛЫ


Аннотация результатов, полученных в 2017 году
За отчетный год в рамках данного проекта были изучены недавно предложенные новые характеристики столкновений тяжелых ионов на ускорителях высоких энергий, а именно, особые типы флуктуаций, которые могут давать более чистые сигналы коллективных эффектов в ядро-ядерных соударениях, а также свидетельствовать о критическом поведении ядерной среды. Для этого был написан программный код, с помощью которого в распределенной системе вычислительных ресурсов были проанализированы десятки миллионов соударений ядер свинца, накопленных в эксперименте ALICE на LHC, а также просканированы данные по соударениям ядер бериллия, аргона и скандия в эксперименте NA61/SHINE на SPS. В данных ALICE изучались корреляции между усредненными импульсами сотен частиц, вылетающих при каждом столкновении ядер из точки взаимодействия и попадающих в два различных диапазона телесных углов. Численной характеристикой в этом анализе служил коэффициент корреляций Пирсона. Было показано, что эта наблюдаемая нечувствительна к некоторым тривиальным эффектам, в частности, результаты согласуются при различных способах определения центральности соударений. Была получена нетривиальная зависимость коэффициента корреляций между средними импульсами в двух угловых интервалах от степени перекрытия ядер (центральности) при их столкновении, эта зависимость не описывается большинством существующих моделей. Также были получены первые результаты по анализу корреляций между другими наблюдаемыми величинами – отношениями сортов частиц в каждом из двух угловых диапазонов. Были взяты, например, отношения заряженных каонов к пионам, протонов к пионам, и др. Для интерпретации этих первых экспериментальных результатов потребуется ввести коррекции на эффекты, связанные с несовершенством экспериментальной установки, это предполагается выполнить на дальнейших этапах реализации проекта. При анализе центральных Be+Be и Ar+Sc столкновений в эксперименте NA61/SHINE для частиц, родившихся посредством электромагнитного и сильного взаимодействий в передней полусфере, были рассчитаны новые так называемые сильно-интенсивные наблюдаемые, Δ и Σ, независящие от тривиальных эффектов. Сравнение результатов для разных типов сталкивающихся систем не показало немонотонного поведения этих переменных, которое можно было бы отнести к критическому поведению. Вариации данного анализа в зависимости от псевдобыстротного диапазона позволили также расширить сканирование фазовой диаграммы сильно взаимодействующей материи, так как изменение псевдобыстротной координаты соответствует изменению усредненного по быстроте барионного химического потенциала. Проведено сравнение с моделями. С точки зрения физического анализа, для многих наблюдаемых важно как можно точнее знать центральность соударения ионов, в терминах так называемого прицельного параметра либо числа нуклонов, которые участвовали в столкновении. В проекте была исследована возможность применения методов машинного обучения для определения центральности ядро-ядерных столкновений на основе машинного обучения путем использования информации («признаков») сразу с нескольких детекторных систем. Для этого на симулированных событиях по столкновениям ядер, в которых также есть эмуляция полного отклика детектирующей установки, были обучены специальные классификаторы, которые на основе информации с детектирующих систем позволяют восстановить прицельный параметр либо число нуклонов-участников. Для применения предложенной методики к анализу реальных данных, симулированные пособытийные распределения «признаков», используемые при обучении классификаторов/регрессоров, были приведены в соответствие с распределениями в реальных экспериментальных данных с помощью методики перераспределения весов (reweighting). Обученные на симуляциях регрессоры были затем применены к реальным данным, путем использования тех же признаков с реального детектора, что и при обучении. С помощью сторонних (контрольных) наблюдаемых было показано, что достигается улучшение качества отбора самых центральных соударений свинца. Для дальнейшего повышения качества отбора, для обучения классификаторов/регрессоров потребуется использование монте-карловских генераторов событий, дающих лучшее описание экспериментальных данных, а также использование в машинном обучении дополнительной информации (большего количества признаков) с экспериментальной установки. В проекте было проведено также поисковое исследование возможностей применения машинного обучения без учителя к анализу данных по столкновениям протонов и ядер с целью извлечения новой информации о кварк-глюонной среде. Выработаны рекомендации по перспективному применению некоторых методов к анализу ядро-ядерных соударений, в частности, применение метода главных компонент к выявлению истинных размерностей совокупностей наблюдаемых в данных эксперимента, сравнению с размерностями в моделях, уменьшению размерности данных для классификаторов соударений по классам центральности. Поставлены задачи по применению кластерного анализа, «самоорганизующихся карт» в анализе экспериментальных данных, подготовлен соответствующий код. Современные монте-карловские генераторы ядро-ядерных столкновений требуют больших вычислительных ресурсов из-за сложности процесса эволюции системы в процессе столкновения и необходимости иметь большую статистику событий, с учетом сканирования по большему количеству параметров. В данной работе, с целью сокращения вычислительного времени, для интерполяции расчетов монте-карловской модели со слиянием кварк-глюонных струн на промежуточные значения параметров, был применен метод гауссовских процессов. С его помощью оптимизирован ряд параметров модели для соответствия экспериментальным данным по множественности в протон-протонных, протон-ядерных и ядро-ядерных столкновениях при энергиях LHC. Результаты показали, что в достаточно широком диапазоне вариации параметров удается произвести интерполяцию результатов модели с низкой ошибкой интерполяции. Для определения области допустимых (на основе имеющихся экспериментальных данных) параметров модели с учетом возможных корреляций между параметрами был применен Байесовский подход. В результате, были выявлены допустимые области вариации параметров, при которых предсказания модели хорошо описывают экспериментальные данные в трех сталкивающихся системах, и оценены их значения и погрешности. В частности, в результате данного анализа получена оценка на поперечный радиус кварк-глюонный струны. Также начата работа по Байесовской оптимизации параметров модели, связанных с азимутальной анизотропией рождающихся частиц. В рамках монте-краловской модели со слиянием струн были проведены расчеты коэффициентов корреляций между интенсивными переменными (средними поперечными импульсами) для столкновений ядер свинца и ксенона при нескольких энергиях. Произведено сравнение с экспериментальными данными ALICE. Получено, что модель правильно описывает рост коэффициента корреляции с энергией и качественно описывает форму его зависимости от центральности. Показано, что абсолютный масштаб коэффициента корреляций средних поперечных импульсов может зависеть от ограничений на диапазоны поперечного импульса и быстротных интервалов, а также от учета распада резонансов и перерассеяния. Предварительные оценки показывали, что с учетом данных эффектов коэффициент корреляции уменьшается на ~40%, и приближается к экспериментальным данным. При этом форма зависимости коэффициента корреляции от центральности не меняется. Также в рамках данного проекта на ресурсах СПбГУ были успешно развернуты компоненты систем хранения данных CERNBox и интерактивного анализа данных SWAN, используемые в ЦЕРН. Системы были адаптированны к конкретной задаче – работе с локальным хранилищем и системой авторизации. Конечные работающие системы CERNBox и SWAN были протестированы запуском макросов ROOT (работа с графикой) и запуском базовых задач по машинному обучению из пакета scikit-learn. Организован доступ пользователи к этой системе, создана необходимая документация.

 

Публикации

1. Алцыбеев И.Г. Forward-backward correlations between mean transverse momenta in Pb-Pb collisions with ALICE KnowledgeE Publishing Platform, The 3rd International Conference on Particle Physics and Astrophysics, KnE Energy & Physics, pages 304–312 (год публикации - 2018) https://doi.org/10.18502/ken.v3i1.1759

2. Андронов Е.В. N−N, PT−N and PT−PT fluctuations in nucleus-nucleus collisions at the NA61/SHINE experiment KnowledgeE Publishing Platform, - (год публикации - 2018) https://doi.org/10.18502/ken.v3i1.1748

3. Серяков А. Ю. Rapid change of multiplicity fluctuations in system size dependence at SPS energies KnowledgeE Publishing Platform, - (год публикации - 2018) https://doi.org/10.18502/ken.v3i1.1740

4. Серяков А. Ю. Multiplicity and forward energy fluctuations from the NA61/SHINE experiment at CERN Proceeding of science (PoS), PoS (CPOD2017) 050 (год публикации - 2017) https://doi.org/10.22323/1.311.0050


Аннотация результатов, полученных в 2018 году
За отчетный период в рамках данного проекта был продолжен анализ данных по протон-протонным и ядро-ядерным соударениям в экспериментах ALICE на БАК и NA61/SHINE на SPS с помощью новых предложенных наблюдаемых величин. Одной из таких величин является коэффициент корреляции Пирсона между средними поперечными импульсами частиц, испущенных в каждом событии в два разделенных угловых интервала. Значения коэффициента были рассчитаны для столкновений ядер ксенона (Xe-Xe, данные накоплены в эксперименте ALICE в октябре 2017 г.), было показано, что плотность среды, образующейся в самых центральных Xe-Xe столкновениях, недостаточна для получения эффекта падения корреляций, который наблюдается при столкновении более тяжелых ядер (Pb-Pb). Также был проведен анализ этой наблюдаемой в новых данных по соударениям Pb-Pb, накопленных в ноябре-декабре 2018 г. Были исследованы аналитические свойства другой новой переменной - коэффициента корреляций между пособытийно измеренными отношениями числа частиц различных сортов в двух угловых интервалах, в частности, было показано, что к данной наблюдаемой может быть применен так называемый метод Identity, основанный на приписывании каждой частице вероятности принадлежности к какому-либо сорту на основе измеренных потерь энергии во времяпроекционной камере. Также был проведен расчет другой сильноинтенсивной (т.е. устойчивой к тривиальным эффектам) наблюдаемой (Σ) в данных по протон-протонным соударениям. Расчеты значений этих новых наблюдаемых были выполнены в событиях, симулированных в монте-карловских генераторах, а также в реальных данных, продолжается процесс введения коррекций и оценки систематических неопределенностей, подготовка публикации. На эксперименте NA61/SHINE был продолжен анализ интенсивных и сильноинтенсивных флуктуационных величин ω[N], Δ[Pt, N], Σ[Pt, N], Σ[NF,NB]. Изучено влияние неэффективностей адронного калориметра PSD установки NA61/SHINE (сэндвич-структура, утечка энергии с поверхности), используемого для определения центральности, на измеряемые величины. Было продемонстрировано, что наибольшее влияние эти неэффективности оказывают на интенсивную величину ω[N]. Была предложена процедура коррекции на неэффективность PSD, а также протестирована дополнительная процедура коррекции - Unfolding - на неэффективности регистрации первичных треков. К данным по соудерениям Pb-Pb были применены методы поиска скрытых закономерностей (так называемое обучение без учителя, unsupervised learning, а также байесовская сортировка событий), в частности, было показано, что метод разложения на главные компоненты (Principal Component Analysis, PCA) автоматически выявляет оптимальный базис в виде Фурье-гармоник для разложения азимутальных распределений треков в событиях, без каких бы то ни было указаний со стороны исследователя. Было показано, что кластеризация и поиск многообразий на основе коэффициентов PCA-разложения позволяют разделять события на классы с максимальным отличием по доминирующим признакам. Известно, что в анализе данных по соударениям малых ядер существует проблема выделения классов центральности столкновения. Для определения центральности в эксперименте NA61/SHINE существует Передний адронный калориметр (PSD). В рамках данного проекта, классификация событий по классам центральности в калориметре (т.е. совокупности сигналов, поступающих с его модулей) была проведена на основе сверточной нейронной сети на основе монте-карловских данных. Нейронная сеть показала точность определения класса с малым числом нуклонов-спектаторов 93%, что значительно выше, чем в традиционном cut-based методе (87%). Данный результат открывает возможность использование сверточных нейронных сетей для определения центральности в столкновениях ядера на будущем ускорителях NICA (Россия) и FAIR (Германия). На данном этапе проекта был проведено исследование возможностей применения машинного обучения для реализации процедуры оптимизации критериев отбора треков с целью нахождения кинематической области установки NA61/SHINE с наибольшей эффективностью регистрации заряженных частиц. Для этого был проведена классификация реконструированных треков на первичные и вторичные в генераторе событий EPOS на основе их сопоставления с сгенерированными треками. Это позволило решить задачу классификации треков методами машинного обучения с учителем: массив свойств треков вместе с информацией об их типе был использован для настройки параметров различных классификаторов. На основе анализа полученных ROC-кривых для этих классификаторов показано, что применение любого из них позволяет значительно увеличить эффективность отбора истинных первичных треков по сравнению с используемыми в настоящее время критериями отбора. При этом наилучшие результаты достигнуты при классификации с помощью однослойной нейронной сети и алгоритма бустинга AdaBoost. Методики мультивариативного байесовского подхода и гауссова процесса были применены к расширенной мульти-померонной модели (EPEM). Особенностью данной модели является эффективный учет коллективных эффектов взаимодействия струн, позволяя таким образом описывать множественность и ее корреляцию с поперечным импульсом в широком диапазоне энергии pp столкновений. В качестве оптимизируемых параметров выступали: натяжение одиночной струны (t) и параметр струнной коллективности (beta). В широком диапазоне энергий (17 ГэВ - 13 ТэВ) построена аппроксимация предсказаний модели в зависимости от ее параметров. Применен метод главных компонент к корреляционной функции между средним поперечным импульсом и множественностью. Определение главных компонент производилось на основе модельных предсказаний. Установлено, что для описания экспериментальных данных достаточно трех компонент. Исследована зависимость параметров модели от энергии pp-взаимодействия. Получены предсказания для pt-Nch корреляционной функции при энергии планируемого коллайдера FCC (100 ТэВ). Результаты показали, что в событиях большой множественности можно ожидать, что средний поперечный импульс достигнет 1 ГэВ, что вплотную подходит к области применимости пертурбативных КХД-расчетов. На базе ресурсов СПбГУ была создана локальная система обработки и хранения данных эксперимента БАК “ALICE”. Организован доступ сотрудников СПбГУ к ресурсам системы - вычислительным и файловым - через локальную реализации комплекса CERNBox на платформе ресурсов СПбГУ. Доступ обеспечен как с персональных компьютеров, так и с мобильных устройств через браузер и через приложения. Также вместо классического Jupyter Notebook в СПбГУ был развернут новый пользовательский интерфейс JupyterLab, т.к. он намного более удобен для в использовании. В JupyterLab был реализован просмотрщик ROOT-файлов на основе JSROOT, а также реализована возможность доступа через браузер к графическим приложениям, запущенным на сервере. Начато использование системы JupyterLab в учебном процессе: студенты обучаются работе с пакетом ROOT, запуску симуляций в PYTHIA, выполняют учебные проекты по анализу данных. Результаты работ были представлены на конференциях и в опубликованных статьях.

 

Публикации

1. Алцыбеев. И.Г. Recent developments in particle yield fluctuation measurements EPJ Web Of Conferences, EPJ Web Conf. 204, 03003, 2019 (год публикации - 2019) https://doi.org/10.1051/epjconf/201920403003

2. Андронов Е.В. Search for the critical point by the NA61/SHINE experiment Nuclear Physics A, Nuclear Physics A 982, pages 835-838 (2019) (год публикации - 2019) https://doi.org/10.1016/j.nuclphysa.2018.09.019

3. Ерохин А.А., Зароченцев А.К. Эксперименты с JupyterHub в Санкт-Петербургском государственном университете CEUR Workshop Proceedings, CEUR WS, Vol. 2267, 252-256 (2018) (год публикации - 2018)

4. Прохорова Д.С. Pseudorapidity dependence of multiplicity and transverse momentum fluctuations at the SPS energies EPJ Web Of Conferences, EPJ Web of Conferences 204, 07013 (2019) (год публикации - 2019) https://doi.org/10.1051/epjconf/201920407013


Аннотация результатов, полученных в 2019 году
На третьем этапе выполнения задач данного проекта был продолжен анализ данных по протон-протонным и ядро-ядерным соударениям в экспериментах ALICE на БАК и NA61/SHINE на SPS с помощью новых предложенных наблюдаемых величин, а также с применением методов машинного обучения. На данных ALICE были получены финальные результаты по анализу корреляций между средними поперечными импульсами частиц, рожденных в соударениях ядер свинца и вылетающих в два разделенных угловых интервала. Было показано, что монте-карловские модели описывают наблюдаемое нетривиальное поведение корреляций с центральностью соударения в лучшем случае качественно, но не количественно. Также для этих соударений был продолжен анализ корреляций между отношениями количества частиц разного сорта, вылетающих под разными углами из вершины взаимодействия (например, отношения заряженных пионов к каонам и др.). Для этого был применен так называемый метод Identity, позволяющий скорректировать результаты на неточную идентификацию сортов частиц во времяпроекционном детекторе TPC, получены предварительные результаты. Еще одной изучаемой наблюдаемой являлась так называемая сильноинтенсивная величина Σ, для которой в данных ALICE по соударениям протонов при пяти энергиях (0.9, 2.76, 5, 7, 13 ТэВ) были введены коррекции на неэффективность детектирования треков и на вторичные частицы, а также оценены статистические и систематические погрешности. Эта наблюдаемая нечувствительна к тривиальным объемным флуктуациям, поэтому её изменение с энергией соударений может быть индикаторов коллективных эффектов в адронной материи. Произведена оценка влияния распадов резонансов на форму такой корреляционной наблюдаемой, как зарядовая балансная функция, которая, согласно некоторым моделям, чувствительна к диффузии заряда в адронной среде. Предложен подход, позволяющий вычитать вклад резонансов из балансной функции, если известны их спектры и кинематика распада. Роль нейтральных резонансов была также аналитически исследована для кумулянтов, характеризующих флуктуации связанного заряда (net-charge) для системы источников, порождающих пары частица-античастица. В рамках этой модели были выведены аппроксимирующие выражения, которые предложено рассматривать как базу для сравнения с кумулянтами связанного заряда, анализ которых проводится в реальных экспериментах. Проведено изучение возможности коррекций экспериментальных распределений для ряда интенсивных и сильноинтенсивных флуктуационных наблюдаемых в данных эксперимента NA61/SHINE различными методами деконволюции (Unfolding) на игрушечных моделях и данных генератора EPOS. Разработаны алгоритмы для одномерной деконволюции множественности и двумерной деконволюции корреляционных облаков пар различных наблюдаемых итеративным байесовским методом. Опробована коррекция спектра импульсов частиц с дополнительным условием соответствия симулированных и реконструированных треков. С помощью данной методики скорректированы экспериментальные результаты для ряда наблюдаемых. Подход, альтернативный методу деконволюции, состоит в коррекции непосредственно моментов флуктуирующих величин. В этом проекте этот метод был успешно протестирован, к его преимуществом относится возможность коррекции моментов для многомерных распределений. Ведутся работы по созданию нового набора симулированных методом Монте-Карло и реконструированных в NA61/SHINE данных для p+p и Be+Be реакций. Проведено поисковое исследование возможностей применения машинного обучения к поиску аномальных событий в данных эксперимента NA61/SHINE. Был проведен анализ неупругих p+p столкновений при импульсе 158 ГэВ/с, в результате которого было составлено дерево с основными событийными характеристиками (множественность, положение вершины, средняя псевдобыстрота треков в событии и тд). Применение алгоритмов машинного обучения по поиску аномалий не выявило статистически значимых отклонений. Метод главных компонент позволил выявить малочисленную группу событий, в которых произошла ошибка реконструкции, присвоившая некоторым трекам неправильное значение энерговыделения во время-проекционных камерах. Таким образом, исследуемый набор данных практически не содержал аномальных событий. Разработанная методика может применяться к другим наборам данных NA61/SHINE. На данном этапе выполнения проекта было продолжено исследование возможностей такого метода машинного обучения без учителя (unsupervised learning) как метод главных компонент (Principal Component Analysis, PCA) к угловым распределениям выходов частиц в каждом событии в столкновениях A-A. На основе расчетов в различных моделях было показано, что PCA позволяет установить оптимальный базис для исследований анизотропного потока частиц на основе самих данных, в отличие от “ручного” выбора базисных функций. В частности, было продемонстрировано, что пары коэффициентов PCA-разложения азимутальных распределений частиц идентичны коэффициентам Фурье. Была предложена и применена к моделям математическая процедура коррекции коэффициентов потоков на статистические флуктуации. Также на примере соударений ядер свинца было показано, что скорректированные амплитуды азимутальных гармоник, полученные на основе PCA, совпадают с расчетами традиционными методами. Было показано также, что PCA, примененный в продольном (быстротном) измерении, выявляет оптимальный базис, аналогичный полиномиальному ряду Лежандра, но не совпадающий с ним. Анализ в обоих измерениях (азимутальном и продольном) одновременно позволяет изучить связь продольной структуры событий с азимутальной анизотропией излучения частиц. На данном этапе работ по Проекту было выполнено поисковое исследование возможностей применения машинного обучения для выбора оптимальных критериев отбора треков заряженных частиц во времяпроекционных камерах установки NA61/SHINE. С помощью обученных на Монте-Карло данных алгоритмов-классификаторов из пакета scikit-learn были составлены карты аксептансов экспериментальной установки NA61/SHINE. Было показано, что применение однослойной нейросети и алгоритма AdaBoost (в отличие от применения стандартных критериев отбора треков) позволяет удалить из анализируемого аксептанса участки с большой долей непервичных треков и добавить участки за счет уменьшения требований к трекам в этих регионах с сохранением их качественной реконструкции. При исследовании образующейся в столкновениях релятивистских ядер первичной материи важным является понимание, насколько центральным было столкновение, сколько протонов и нейтронов (нуклонов) провзаимодействовало, а сколько пролетело насквозь. Для определения центральности в экспериментах на фиксированной мишени используются модульные адронные калориметры, расположенные непосредственно за точкой столкновения и улавливающие непровзаимодействовавшие нуклоны. Разрешающая способность калориметра, как правило, не позволяет точно определить количество прилетевших нуклонов, в том числе из-за рожденных в столкновении частиц, которые также попадают в калориметр. В данном проекте было предложено рассматривать модульный калориметр как 3D изображение, и использовать сверточную нейронную сеть для классификации столкновений по количеству попавших в калориметр нуклонов. Сеть была апробирована на столкновениях легких ядер (Be+Be) и показала более высокую точность, чем классический метод анализа суммарного энерговыделения в калориметре. Моделирование взаимодействия высокоэнергетичных частиц с измеряющими их энергию калориметрами может быть очень ресурнозатратным. Для примера, расчет энерговыделения ядра свинца в калориметре PSD эксперимента NA61/SHINE может занимать до десятка минут на одном CPU, а эксперименту требуются расчеты десятков миллионов таких столкновений. Для ускорения процедуру нами был создан “быстрый симулятор” PSD, базирующийся на заранее измеренных распределениях энерговыделения отдельных протонов и нейтронов. В созданном симуляторе при прохождении частицы через калориметр происходит не расчет образующегося ливня частиц, а случайным образом разыгрывается уже финальная измеренная калориметром энергия по известному распределению. Таким образом, созданный “быстрый симулятор” позволяет ускорить моделирование адронного калориметра в десятки тысяч раз и активно используется в коллаборации NA61/SHINE. В данном отчетном году было расширено применение методик мультивариантного байесовского подхода и гауссова процесса к модели мультипомеронного обмена (EPEM). На основе данных по распределению множественности произведена альтернативная настройка параметров в широком диапазоне энергий, что улучшило описание экспериментальных данных. Также, с помощью методов машинного обучения, таких как символьная регрессия и генетические алгоритмы, была попутно решена важная теоретическая задача, а именно, были полученные новые рекуррентные соотношения, связывающие матричные элементы уравнения Дирака в кулоновском поле. Эти соотношения необходимы для точного суммирования бесконечных рядов теории возмущений, возникающих в ряде задач, в том числе связанных со столкновениями ионов на строящемся ускорителе FAIR в GSI. В рамках проекта была также произведена интеграция вычислительных ресурсов СПбГУ с распределенной вычислительной средой ALIEN/ALICE, что даёт возможность пользователям СПбГУ, являющимися членами коллаборации ALICE, удобно использовать ресурсы обеих систем для обработки экспериментальных данных.

 

Публикации

1. Алцыбеев И.Г. On Resonance Contribution to Balance Functions Acta Physica Polonica B, Acta Physica Polonica B, Vol. 50, 981 (2019). (год публикации - 2019) https://doi.org/10.1051/epjconf/201920403003

2. Алцыбеев И.Г. Application of Principal Component Analysis to Establish a Proper Basis for Flow Studies in Heavy-Ion Collisions Physics of Particles and Nuclei, - (год публикации - 2020)

3. Ерохин А.А., Зароченцев А.К. JupyterLab at Saint Petersburg State University Journal of Physics: Conference Series, - (год публикации - 2020)

4. Коваленко В.Н. Determination of the quark-gluon string parameters from the data on pp, pA and AA collisions at wide energy range using Bayesian Gaussian Process Optimization Proceedings of Science, PoS (Confinement2018) 235 (год публикации - 2019) https://doi.org/10.22323/1.336.0235

5. Прохорова Д.С. Search for critical behavior of strongly interacting matter in the NA61/SHINE experiment Journal of Physics: Conference Series, 1390 (2019) 012016 (год публикации - 2019) https://doi.org/10.1088/1742-6596/1390/1/012016

6. Прохорова Д.С. Fluctuations and correlations study at NA61/SHINE Acta Physica Polonica B Proceedings Supplement, - (год публикации - 2020)

7. Серяков А.Ю. Convolutional Neural Network for Centrality Determination in Fixed Target Experiments Physics of Particles and Nuclei, - (год публикации - 2020)

8. Серяков А.Ю. Influence of Backside Energy Leakages from Hadronic Calorimeters on Fluctuation Measures in Relativistic Heavy-Ion Collisions Universe, Universe 5 (2019) no.5, 126 (год публикации - 2019) https://doi.org/10.3390/universe5050126


Возможность практического использования результатов
Проведенное исследование свойств кварк-глюонной материи с помощью новых наблюдаемых и методов машинного обучения внесло ощутимый вклад в фундаментальные знания об экстремальных состояниях ядерной материи при сверхвысоких температурах и давлениях, по положению критической точки и коллективным эффектам в кварк-глюонной среде. Полученные результаты можно будет применить для совершенствования физических программ современных и перспективных ускорительных экспериментов, таких как ALICE на БАК, NA61/SHINE на SPS, CBM на FAIR, STAR на RHIC. Особенно важно, что разработанные в данном проекте методики применения алгоритмов машинного обучения могут использоваться в экспериментах на коллайдере NICA, готовящемся к запуску в г. Дубна (Россия), в частности на эксперименте MPD, членами которого являются участники коллектива. Разработанные монте-карловские модели можно будет использовать для моделирования эффектов установок, совершенствования и планирования методик анализа. В т.ч. разработанные модели можно будет включить в инфраструктуру распределенных вычислений данных экспериментов. Также в проекте на базе существующих ресурсов СПбГУ создана локальная система обработки и хранения данных эксперимента ALICE на БАК, которая интегрируется в существующие глобальные системы (AliEN, WLCG) для возможности запуска задач напрямую из этих систем. Результаты данной НИР войдут в магистерские и кандидатские диссертации исполнителей проекта, а также будут использованы в учебном процессе на кафедрах физики высоких энергий и элементарных частиц СПбГУ и ядерно-физических методов исследования СПбГУ. Результаты данных исследований будут также использованы для модернизации учебных курсов СПбГУ, разработанных и читаемых руководителем и исполнителями данного гранта: “Дополнительные главы релятивистской ядерной физики” и “Физика элементарных частиц” (ДОП Инновационные подходы к преподаванию естественнонаучных дисциплин в высшей школе 21-ого века). В СПбГУ начато использование в учебном процессе системы JupyterLab, развернутой на вычислительных ресурсах СПбГУ в рамках данного проекта: студенты обучаются работе с пакетом ROOT, запуску симуляций в PYTHIA, выполняют учебные проекты по анализу данных. Развернутая система JupeterLab может быть адаптирована для проведения мастер-классов по физике элементарных частиц для старшеклассников, которые регулярно проводят участники коллектива на площадке СПбГУ.