КАРТОЧКА ПРОЕКТА ФУНДАМЕНТАЛЬНЫХ И ПОИСКОВЫХ НАУЧНЫХ ИССЛЕДОВАНИЙ,
ПОДДЕРЖАННОГО РОССИЙСКИМ НАУЧНЫМ ФОНДОМ

Информация подготовлена на основании данных из Информационно-аналитической системы РНФ, содержательная часть представлена в авторской редакции. Все права принадлежат авторам, использование или перепечатка материалов допустима только с предварительного согласия авторов.

 

ОБЩИЕ СВЕДЕНИЯ


Номер проекта 24-44-00099

НазваниеСоздание базы данных траекторий специализации клеток в эволюции и индивидуальном развитии

Руководитель Любецкий Василий Александрович, Доктор физико-математических наук

Организация финансирования, регион Федеральное государственное бюджетное учреждение науки Институт проблем передачи информации им. А.А. Харкевича Российской академии наук , г Москва

Конкурс №86 - Конкурс 2023 года «Проведение фундаментальных научных исследований и поисковых научных исследований международными научными коллективами» (NSFC)

Область знания, основной код классификатора 04 - Биология и науки о жизни; 04-105 - Эволюционная биология

Ключевые слова эволюция клетки, тип клетки, клеточная дифференцировка, траектории специализации клеток, клеточная транскриптомика, филогенез, Metazoa, база данных

Код ГРНТИ34.15.29


 

ИНФОРМАЦИЯ ИЗ ЗАЯВКИ


Аннотация
Способность генома реализовать различные состояния фенотипа через специализацию типов клеток для выполнения ими различных функций в составе единого организма явилось основой эволюционного перехода к многоклеточности. Стабильность и координация процесса клеточной дифференцировки необходимы для целостности организма и избегания ущерба выживанию от клеток с изменённой программой развития, например, раковых клеток. Молекулярные системы управления дифференцировкой имеют древнее происхождение и связаны с регуляцией экспрессии (транскрипции) генов. При этом важную роль играют локальные генные синтении. Многочисленными экспериментами установлено, что в филогенезе и индивидуальном развитии переход от одного типа клеток к другому определяется изменением состава активных белковых факторов, а зарождающаяся теория клеточного типа пытается характеризовать тип клетки как набор белковых регуляторов, их нуклеотидных мишеней и регулируемых генов. С развитием клеточной транскриптомики (single-cell transcriptomics) открываются возможности связать функциональную специализацию клеток или клеточную патологию (например, раковую трансформацию) с активностью не только отдельных генов, но комплексов совместно экспрессирующихся генов. Однако для достижения этой актуальной и масштабной научной цели нужно решить ряд задач, как в области экспериментальной биологии (например, получение более качественных клеточных транскриптомов), так и вычислительной математики. Последнее включает, прежде всего, определение и вычисление объектов, которые компьютерно описывают изменение клеток в ходе дифференцировки и в филогенезе. А также – создание инструментов в форме компьютерных программ для работы с этими понятиями на больших молекулярных данных. Проект формулирует конкретные шаги в области вычислительной математики (с опорой на оригинальные биологические данные китайского партнёра) для получения первых систематических оценок изменчивости основных молекулярных компонент типа клетки на широкой эволюционной шкале, как в составе транскриптома (динамика регуляторов и регулируемых генов), так и генома (динамика мишеней связывания регуляторов и совместная эволюция отдельно для генов регуляторов и функционально важных генов). Будут получены численные оценки, необходимые для установления родства типов клеток. Будут получены траектории формирования, дивергенции и смены типов клетки у животных в эволюции и в ходе клеточной дифференцировки (второе – на модели специализации стволовых клеток). Для этих целей будут созданы оригинальные алгоритмы и их параллельные компьютерные реализации для распределённой вычислительной системы (суперкомпьютера). Экспериментальные данные, полученные от китайского партнёра, будут объединены в интегрированную динамическую базу данных с нашими интерактивными программами и вычислительными результатами (характеристики типов клеток, их траектории для царства животных и др.). Такая интегрированная база будет первым общедоступным ресурсом для изучения формирования типов клеток у животных. Созданные оригинальные алгоритмы и их параллельные компьютерные реализации будут интегрированы в Базу как исполняемые модули. База данных будет использовать HDF5 как систему управления Базой и как формат данных. Проект охватывает следующие эволюционные стволы животных: губки, гребневики, пластинчатые, кишечнополостные, бескишечные турбеллярии, плоские черви, кольчатые черви, членистоногие, круглые черви, иглокожие, оболочники и позвоночные, включая костистых рыб, амфибий, рептилий, птиц и млекопитающих.


 

ОТЧЁТНЫЕ МАТЕРИАЛЫ


Аннотация результатов, полученных в 2024 году
I) Алгоритм кластеризации. Разработан алгоритм на основе идеологии Seurat, который описан в статье, представленной в журнал «Проблемы передачи информации» РАН, и изложен в курсе на механико-математическом факультете МГУ. Алгоритм содержит ряд улучшений, в том числе: замена лог-нормирования матрицы долей чтения гена на линейное и гиперболо-арксинусное преобразование; введение кубической регрессии для подсчёта "средней дисперсии генов"; использование сингулярного разложения матрицы экспрессий; новое определение графа в методе k-соседей; новую комбинацию статистических критериев при определении дифференциально экспрессируемых генов; упрощение процесса понижения размерности. Улучшения прошли проверку на реальных биологических данных, включая образцы клеток животных, данные доступны в таблице Info (http://188.93.104.165/results/info.xlsx). Планируется расширение компьютерного инструмента кластеризации и типирования, добавление новых данных в базу проекта. II) Типирования клеток и кластеров. 1. Компьютерно представлены (для последующего включения в pipeline) следующие методики определения типов клеток и кластеров: на основе ортологичных генов (при оригинальном понимании ортологичности); программы SingleR; больших языковых нейростей и оргинальной нейросети как примеров использования искусственного интеллекта. 2. Предложен принцип минимальности, основанный на расстоянии между синтеничными блоками-кластерами. Разработаны соответствующие программы. III) Поиск высококонсервативных элементов. Разработана оригинальная программа для поиска высококонсервативных элементов (ВКЭ) в наборе нуклеотидных последовательностей, включая даже полные геномы различных видов. Программа использует синтеничные блоки набора видов, и в результате избегает слияния подграфов на заключительном этапе её работы (по сравнению с другими нашими более ранними вариантами поиска ВКЭ). В пределах этих ВКЭ будут искаться сайты связывания факторов транскрипции различных типов, включая сложные кооперативные сайты с вариацией расположения субсайтов. На первом году проекта нами создана оригинальная программа поиска в пределах ВКЭ участков с палиндромной структурой. Таким образом, были найдены тысячи ВКЭ и сотни участков с палиндромной структурой. Среди них оказались десятки участков с регуляторной функцией, связанных с известными некодирующими РНК, примеры которых приведены в отчёте по гранту. IV) Поиск сайтов связывания и регулонов транскрипционных факторов. Разработана программа для поиска сайтов связывания транскрипционных факторов (ТФ) в геномах эукариот за пределами человека и мыши. Использованы данные из GTRD и Hocomoco, но код переписан для интеграции в новый pipeline. Исследованы геномы макака-крабоеда, свиньи, курицы и данио-рерио и ряда других видов. Программа выделяет регуляторные области вблизи транскрипционных стартов, объединяет пересекающиеся области и ищет предполагаемые мотивы ТФ с помощью SPRY-SARUS. Программа находит сайты связывания и регулоны многих ТФ в перечисленных выше видах, например, для «хранителя генома» TF P53, и демонстрирует пересечения регуляторных сетей помянутых видов. Этой программой найдены регулоны и других ТФ, которые приведены в отчёте.

 

Публикации

1. Байрамов А.В., Ермакова Г.В., Любецкий В.А., Зарайский А.Г. Поиск генетических основ появления и развития парных конечностей у челюстноротых путем исследования современных представителей эволюционно древних групп Сборник тезисов Всероссийской научной конференции с международным участием, посвященной юбилею академика Б.Л. Астаурова «Генетика и индивидуальное развитие» 29–31 октября 2024 г. и Школы-конференции «Генетические модификации и анализ генома клеток» 31 октября – 1 ноября 2024 г. Москва, ИБР РАН. – М.: Издательство «Перо», 2024. – Мб. [Электронное издание]., стр. 27. (год публикации - 2024)

2. Кановей В.Г., Любецкий В.А. Jensen Δ1n reals by means of ZFC and second-order Peano arithmetic Axioms, Vol. 13, No. 2, Art. 96. (год публикации - 2024)
10.3390/axioms13020096

3. Кановей В.Г., Любецкий В.А. A good lightface Δ1n well-ordering of the reals does not imply the existence of boldface Δ1n-1 well-orderings Annals of Pure and Applied Logic, Vol. 175, Iss. 6, Art. 103426. (год публикации - 2024)
10.1016/j.apal.2024.103426

4. Кановей В.Г., Любецкий В.А. Независимость схемы свертки в арифметике второго порядка от счетного выбора без параметров Математические заметки (год публикации - 2025)

5. Зверков О.А., Селиверстов А.В. On binary solutions to a system of linear equations modulo three Programming and Computer Software (год публикации - 2025)

6. Селиверстов А.В., Зверков О.А. О системах нескольких уравнений по модулю три XIV Белорусская математическая конференция, посвященная 65-летию Института математики ПАН Беларуси : материалы Международной научной конференции, Минск, 28 октября - 1 ноября 2024 г. В трех частях. Часть 3. - Минск: Беларуская навука, 2024. - 163 с., Часть 3, стр. 152–154. (год публикации - 2024)

7. Зверков О.А., Селиверстов А.В., Шиловский Г.А. Alignment of a hidden palindrome Mathematical Biology and Bioinformatics, Vol. 19, No. 2, P. 427–438 (год публикации - 2024)
10.17537/2024.19.427

8. Горбунов К.Ю., Любецкий В.А. An exact quadratic algorithm for the shortest tree transformation Doklady Mathematics (год публикации - 2024)
10.1134/S1064562424702259

9. Виджаявардене Н.Н., Хайд К.Д., Михайлов К.В., ..., Зверков О.А., Тинес М., Карпов С.А. Classes and phyla of the kingdom Fungi Fungal Diversity, Vol. 128, P. 1–165. (год публикации - 2024)
10.1007/s13225-024-00540-z

10. Шиловский Г.А. p62: Intersection of antioxidant defense and autophagy pathways Molecular Biology (год публикации - 2024)
10.1134/S0026893324700390

11. Горбунов К.Ю., Любецкий В.А. Algorithms for the reconstruction of genomic structures with proofs of their low polynomial complexity and high exactness Mathematics, Vol. 12, No. 6, Art. 817. (год публикации - 2024)
10.3390/math12060817

12. Любецкий В.А., Шиловский Г.А., Ян Цз.-Ж., Селиверстов А.В., Зверков О.А. The change rate of the Fbxl21 gene and the amino acid composition of its protein correlate with the species-specific lifespan in placental mammals Biology, Vol. 13, No. 10, Art. 792. (год публикации - 2024)
10.3390/biology13100792