КАРТОЧКА ПРОЕКТА ФУНДАМЕНТАЛЬНЫХ И ПОИСКОВЫХ НАУЧНЫХ ИССЛЕДОВАНИЙ,
ПОДДЕРЖАННОГО РОССИЙСКИМ НАУЧНЫМ ФОНДОМ

Информация подготовлена на основании данных из Информационно-аналитической системы РНФ, содержательная часть представлена в авторской редакции. Все права принадлежат авторам, использование или перепечатка материалов допустима только с предварительного согласия авторов.

 

ОБЩИЕ СВЕДЕНИЯ


Номер проекта 22-71-10056

НазваниеМоделирование и анализ генетического перемешивания популяций

Руководитель Щур Владимир Львович, Доктор физико-математических наук

Организация финансирования, регион федеральное государственное автономное образовательное учреждение высшего образования "Национальный исследовательский университет "Высшая школа экономики" , г Москва

Конкурс №71 - Конкурс 2022 года «Проведение исследований научными группами под руководством молодых ученых» Президентской программы исследовательских проектов, реализуемых ведущими учеными, в том числе молодыми учеными

Область знания, основной код классификатора 01 - Математика, информатика и науки о системах; 01-205 - Математические модели в науках о живом

Ключевые слова Популяционная генетика, геномика, перемешивание популяций, древняя интрогрессия, популяционные модели, скрытая марковская модель, неандертальцы, ДНК, геном, доли примешивания, коалесцентная теория, эволюция

Код ГРНТИ27.35.43


 

ИНФОРМАЦИЯ ИЗ ЗАЯВКИ


Аннотация
Научная проблема проекта состоит в математическом моделировании влияния процессов перемешивания в разных масштабах времени на генетическое разнообразие популяции, а также в разработке методов и анализе экспериментальных генетических данных для изучения этих процессов. Актуальность исследований обусловлена их важностью для изучения генетической истории человеческой популяции, эволюции и естественного отбора. Так, например, изучение путей примешивания неандертальской ДНК в геномы современных мексиканцев через европейскую и коренную американскую историю позволит не только детально изучить историю взаимодействия наших предков с неандретальцами, но и может помочь определить участки геномов, прошедшие через естественный отбор после перемешивания в постколумбовую эпоху. Также наше исследование позволит изучить генетическое разнообразие неандертальской популяции во время примешивания к популяции анатомически современного человека. Научная новизна проекта состоит в исследовании процессов генетического перемешивания популяций, разработке математической теории, методов, алгоритмов и программного обеспечения для анализа экспериментальных данных, а также непосредственно в анализе генетических данных разработанными методами. Теоретическая часть будет заключаться в разработке математической модели для долей примешивания, а также в изучении теоретических свойств для распределения доли древней примешанной компоненты вдоль генома в современной популяции. Методологическая часть будет заключаться в разработке архитектуры скрытой марковской модели, позволяющей одновременно моделировать древнее и недавнее перемешивание популяций, и как следствие определять участки древней ДНК и пути их примешивания в популяции, появившейся вследствие недавнего перемешивания. Также будет разработан метод оценки распределения древней компоненты вдоль генома по популяции и генетического разнообразия примешанной древней популяции. Далее, будет разработан метод оценки популяционных параметров при помощи метода моментов для долей примешивания. Значимость прикладных результатов будет заключаться в исследовании неандертальской компоненты в современной популяции при помощи разработанных в рамках проекта методов.


 

ОТЧЁТНЫЕ МАТЕРИАЛЫ


 

 

Аннотация результатов, полученных в 2025 году
За прошедший год проведено комплексное исследование идентификации древних геномных сегментов и анализа их эволюционного значения, включающее в себя шаги от разработки математических и вычислительных методов до анализа полногеномных данных. Были объединены три версии метода DAIseg (базовой, для множественного примешивания и для древнего и современного примешивания) в единый программный пакет MixDAIseg, доступный на GitHub (https://github.com/spirinvadim/MixDAIseg). Разработан сопутствующий пакет для визуализации результатов, включая построение кариограмм с выделением древних участков. Кроме того, метод адаптирован для работы с геномами разной сборки GRCh37/GRCh38. Методологические наработки включают: а) создание и тестирование метода вычисления правдоподобия найденных участков древнего происхождения на основе коалесцентной; б) разработку прототипа метода оценки эффективного размера примешанной древней популяции; в) проведение сравнительного анализа DAIseg и базового метода hmmix, выявившего преимущества DAIseg в точности определения границ сегментов, склонность hmmix к "склеиванию" соседних участков и важность использования древних геномов в референсных панелях; г) анализ древних геномов анатомически современного человека с низким покрытием с импользованием импьютации; д) введено понятие предкового неравновесного сцепления (ALD) и разработан метод его аналитического вычисления, кроме того, установлена связь с классическим LD; е) исследована точность приближения секвенциальной марковской коалесцентной моделью модели коалесценции с рекомбинацией в случае двух популяций с миграцией. Практические научные результаты заключаются в следующем: а) выявлены 22 геномных участка, в которых неандертальская компонента находится под положительным или отрицательным отбором в мексиканской популяции; найденные участки содержат гены иммунного ответа (IL17B, TLR6), гены нейроразвития (TCF12, UNC13C), гены, связанные с метаболическими нарушениями; б) обнаружены свидетельства двух эпизодов примешивания денисовцев в популяцию Папуа Новой Гвинеи, в) обнаружены неандертальские сегменты в азиатских популяциях (например, сегмент, содержащий ген SLC13A3), которые могут быть свидетельством повторного неандертальского примешивания. Проведенное исследование вносит значительный вклад в понимание генетической истории человечества и предоставляет новые инструменты для эволюционно-генетических исследований. Все запланированные работы выполнены, результаты достигнуты.

 

Публикации

1. Планш Л.Б., Ильина А.В., Авила-Аркос М.С., Джей Ф., Хуэрта-Санчес Е., Щур В.Л. An archaic reference-free method to jointly infer1 Neanderthal and Denisovan introgressed segments in modern human genomes bioRxiv (год публикации - 2025)
10.1101/2025.03.17.643330

2. Лианг М., Шишкин М.А., Щур В.Л., Нильсен Р. Understanding admixture fractions: theory and estimation of gene-flow Journal of mathematical biology, J. Math. Biol. 89, 47 (2024). https://doi.org/10.1007/s00285-024-02146-0 (год публикации - 2024)
https://doi.org/10.1007/s00285-024-02146-0

3. Дудковская А.В., Шишкин М.А. Evaluating the Accuracy of Sequentially Markov Coalescent Approximations for Structured Population Models Lobachevskii Journal of Mathematics (год публикации - 2025)

4. Ильина А.В, Планш Л.Б., Щур В.Л. How much can we trust the inferred Neanderthal segments? Lobachevskii Journal of Mathematics (год публикации - 2025)


Возможность практического использования результатов
Разработанный нами метод DAIseg для поиска участков древнего происхождения может использоваться для исследований в области популяционной и эволюционной генетике. Результаты анализа поиска естественного отбора на неандертальскую компоненту могут быть важны для понимания взаимодействий генотип-среда и поиска вариантов, дифференциально влияющих на здоровье в разных популяциях человека, что может помочь в переходе к персонализированной медицине. Метод QuAP может быть использован в геномных исследованиях по сохранению биологического разнообразия.