КАРТОЧКА ПРОЕКТА ФУНДАМЕНТАЛЬНЫХ И ПОИСКОВЫХ НАУЧНЫХ ИССЛЕДОВАНИЙ,
ПОДДЕРЖАННОГО РОССИЙСКИМ НАУЧНЫМ ФОНДОМ

Информация подготовлена на основании данных из Информационно-аналитической системы РНФ, содержательная часть представлена в авторской редакции. Все права принадлежат авторам, использование или перепечатка материалов допустима только с предварительного согласия авторов.

 

ОБЩИЕ СВЕДЕНИЯ


Номер проекта 24-14-20031

НазваниеВиртуальная клетка

Руководитель Колпаков Федор Анатольевич, Кандидат биологических наук

Организация финансирования, регион Автономная некоммерческая образовательная организация высшего образования "Научно-технологический Университет "СИРИУС" , Краснодарский край

Конкурс №91 - Конкурс 2024 года «Проведение фундаментальных научных исследований и поисковых научных исследований отдельными научными группами» (региональный конкурс)

Область знания, основной код классификатора 04 - Биология и науки о жизни; 04-207 - Системная биология; биоинформатика

Ключевые слова виртуальная клетка, математическая модель, BioUML, GTRD, регуляция транскрипции, регуляция трансляции, метаболические пути, пути передачи сигнала в клетке, транскриптом, протеом, метаболом

Код ГРНТИ34.03.23


 

ИНФОРМАЦИЯ ИЗ ЗАЯВКИ


Аннотация
С началом XXI века активное развитие получила системная биология - междисциплинарная наука, исследующая сложные взаимодействия в живых системах. В системной биологии предполагается определенный цикл проведения исследований, состоящий из теории, аналитического или компьютерного моделирования для формулировки гипотез о системе, экспериментальной проверки гипотез, и затем использование полученных данных для описания клеточных процессов, позволяющее улучшить компьютерную модель или уточнить теорию. Поскольку конечной целью является построение портретной модели взаимодействий в сложной системе, экспериментальные методики, которые используются в системной биологии, должны быть максимально детализированными. Для этого применяются такие экспериментальные подходы как транскриптомика, метаболомика, протеомика и другие высокопроизводительные омиксные технологии, используемые для получения численных данных. Таким образом, успех в развитии высокопроизводительных автоматизированных биомедицинских технологий привел к ренессансу моделирования биологических систем на молекулярно-клеточном уровне. Однако, в реальных исследованиях такой цикл реализуется крайне редко. В данном проекте предлагается новый подход, который можно представить в виде пирамиды (по убыванию объема данных): исходные омиксные данные --> их анализ и интеграция данных --> мета-анализ --> математическая модель (виртуальная клетка). В идеале, построенная модель виртуальной клетки должна с достаточной точностью воспроизводить полученные экспериментальные омиксные данные для заданного типа клетки (клеточной линии) человека: - уровень экспрессии генов (транскриптомика) - количество белков (протеомика) - количество метаболитов (метаболомика). Разработанная модель виртуальной клетки, верифицированная на таком разнообразии омиксных данных, послужит основой для проведения экспериментов in silico, направленных на создание современной рациональной стратегии по фундаментальному пониманию и улучшению целевых свойств исследуемых культур клеток и даже целых организмов.


 

ОТЧЁТНЫЕ МАТЕРИАЛЫ


Аннотация результатов, полученных в 2024 году
В своей лекции лауреат Нобелевской премии по химии 2024 г. Демис Хассабис (глава компании Google DeepMind, которая разработала AlphaFold) сказал: «Мы, вероятно, входим в новую эру того, что мне нравится называть цифровой биологией. Я всегда считал, что на самом фундаментальном уровне о биологии можно думать как о системе обработки информации, пускай и феноменально сложной и развитой. Мне кажется, что в такой сложной системе принципы биологии тяжело свести к нескольким математическим уравнениям. Математика была потрясающим инструментом для описания физических явлений, но в том же смысле ИИ может быть идеальным языком для описания биологии». Он также отметил, что "Моя мечта - построить модель виртуальной клетки» и "До этого еще лет десять". В данном проекте нами разработана архитектура модели виртуальной клетки, которая позволяет совместить ИИ и математические уравнения. Ее основные идеи: 1) Агентный подход - основные клеточные процессы (транскрипция, трансляция, метаболизм и т.д.) представлены агентами. Разные агенты используют разные подходы для моделирования их динамики. Например, нейронная сеть используется для предсказания уровня экспрессии генов на основе информации из баз данных GTRD и FANTOM5. Атлас метаболизма человека предоставляет полногеномную модель потоков метаболитов. Обыкновенные дифференциальные уравнения используются для моделирования клеточных путей передачи сигналов и энергетического метаболизма. 2) Определены 3 основных пула общих молекул: РНК, белки и их комплексы, а также метаболиты и другие малые молекулы. Они служат входом и выходом соответствующих агентов. 3) Итерационное развитие модели позволяет постепенно уточнять ее и добавлять новые агенты. 4) Существует несколько сборок виртуальной клетки, соответствующих различным типам клеток, а также различным итерациям проекта. Для построения модели виртуальной клетки используется отечественная биоинформатическая платформа BioUML - Biological Universal Modelling Language. Ее отличительной особенностью является то, что она позволяет представлять модели сложных биологических систем в виде диаграмм, по которым затем автоматически генерируется код для численного расчета динамики этих моделей. Для этой платформы разработан новый модуль и тип диаграмм, который позволяет собрать вариант виртуальной клетки из блоков (как конструктор Лего) двух основных типов: пулы молекул (множество молекул РНК, белков и метаболитов) и процессов (транскрипция, трансляция, распад РНК и белков, метаболизм). Построена первая сборка виртуальной клетки, включающей созданные в этом проекте модели: регуляции транскрипции - предсказывает количество молекул РНК, используя нейронные сети; регуляции трансляции и распада белков - используются обыкновенные дифференциальные уравнения и экспериментально определенные константы скоростей этих процессов; метаболизма - рассчитывает потоки метаболитов с помощью анализа баланса потоков. Разработанные модели показывают хорошее соответствие экспериментальным данным. Задачей следующего года будет построение новой версии виртуальной клетки, которая сможет предсказывать эффекты "выключения"/поломки отдельных генов, учитывать влияние экспрессии генов на метаболизм, а также сопряжение путей передачи сигнала в клетке с регуляцией транскрипции.

 

Публикации

1. Колпаков Ф.А., Акбердин И.Р., Кутумова Е.О. The virtual cell BGRS\SB-2024 Abstracts, Название сборника: BGRS\SB-2024 Abstracts Страницы: 2071–2073 Место публикации: Новосибирск, Россия (год публикации - 2024)
10.18699/bgrs2024-12.1-09

2. Колпаков Ф.А. Виртуальная клетка Биохимия человека 2024, Название сборника: Биохимия человека 2024 Страницы: 163 Место публикации: Москва, Россия (год публикации - 2024)

3. Колпаков Ф.А., Акбердин И.Р., Киселев И.Н., Колмыков С.К., Кондрахин П.Ю., Куляшов М.А., Кутумова Е.О., Новиков С.Н. THE VIRTUAL CELL VI Международная конференция ПОСТГЕНОМ’2024, Название сборника: VI Международная конференция ПОСТГЕНОМ’2024. Страницы: 23. Место публикации: Москва, Россия. (год публикации - 2024)

4. Воронцов И. Е., Козин И., Абрамов С., Бойцов А., Йолма А., Албу М., Амброзини Г., Фалтежскова К., Гралак А. Дж., Грызунов Н., Инукай С., Колмыков С., Кравченко П., Крибельбауэр-Свитек Дж. Ф., Лаверти К. У., Ноздрин В., Патель З. М., Пензар Д., Плешер М.-Л., Пуор С. Е., Разави Р., Янг Э. В. Х., Евшин И. В., Зинкевич А., Вейраух М. Т., Бухер Ф., Депланке Б., Форнес О., Грау Я., Гроссе И., Колпаков Ф. А., Консорциум Codebook/GRECO-BIT, Макеев В. Дж., Хьюз Т. Р., Кулаковский И. В. Cross-platform DNA motif discovery and benchmarking to explore binding specificities of poorly studied human transcription factors bioRxiv, Место публикации: bioRxiv (год публикации - 2024)
10.1101/2024.11.11.619379

5. Йолма А., Эрнандес-Корчадо А., Янг А.В.Х., Фати А., Лаверти К.У., Бречалов А., Разави Р., Албу М., Чжен Х., Консорциум Codebook, Кулаковский И.В., Наджафабади Х.С., Хьюз Т.Р. GHT-SELEX demonstrates unexpectedly high intrinsic sequence specificity and complex DNA binding of many human transcription factors bioRxiv, Место публикации: bioRxiv (год публикации - 2024)
10.1101/2024.11.11.618478

6. Граляк А.Й., Фалтейскова К., Янг А.В.Х., Штайнер К., Руссей Ж., Греннингло Н., Инукай С., Демир М., Дайнезе Р., Оуэн К., Панкевич Е., Консорциум Codebook/GRECO-BIT, Хьюз Т.Р., Кулаковский И.В., Крибельбауэр-Свитек Ю.Ф., ван Мирло Г., Депланке Б. Identification of methylation-sensitive human transcription factors 1 using meSMiLE-seq bioRxiv, Место публикации: bioRxiv (год публикации - 2024)
10.1101/2024.11.11.619598

7. Разави Р., Фати А., Йеллан И., Бречалов А., Лаверти К. У., Йолма А., Эрнандес-Корчадо А., Чжэн Х., Янг Э. В. Х., Албу М., Баразандех М., Ху Ч., Воронцов И. Е., Патель З. М., Консорциум Codebook, Кулаковский И. В., Бухер Ф., Моррис К., Наджафабади Х. С., Хьюз Т. Р. Extensive binding of uncharacterized human transcription factors to genomic dark matter bioRxiv, Место публикации: bioRxiv (год публикации - 2024)
10.1101/2024.11.11.622123

8. Кутумова Е., Акбердин И., Лаврик И., Колпаков Ф. Mathematical Modeling of Cell Death and Survival: Toward an Integrated Computational Framework for Multi-Decision Regulatory Dynamics Cells, Vol. 14, No. 22. Art. 1792. (год публикации - 2025)
10.3390/cells14221792

9. Пирчхадзе С.З., Колпаков Ф.А., Звягин А.В. Математическая модель транспорта и накопления доксорубицина в клетке Сборник тезисов 12-й Московской конференции по вычислительной молекулярной биологии (МССМВ) 31 июля - 3 августа, 2025., С. 512-515. (год публикации - 2025)

10. Кутумова Е., Мандрик Н., Шарипов Р., Пучич-Бакович М., Рапчан Б., Аульченко Ю., Лауц Г., Колпаков Ф. Quantitative Modeling of IgG N-Glycosylation Profiles from Population Data International Journal of Molecular Sciences, Vol. 26. Art. 11495. (год публикации - 2025)
10.3390/ijms262311495

11. Воронцов И.Е., Козин И., Абрамов С. и др. Cross-platform motif discovery and benchmarking to explore binding specificities of poorly studied human transcription factors. Сommunications biology, Vol. 8, No. 1. Art. 1545 (год публикации - 2025)
10.1038/s42003-025-08909-9

12. Грызунов Н., Пензар Д., Каменец В. и др. Inferring binding specificities of human transcription factors with the wisdom of crowds bioRxiv, Art. 2025.11.16.688692 (год публикации - 2025)
10.1101/2025.11.16.688692

13. Котельников А.А., Куляшов М.А., Колпаков Ф.А. Реконструкция контекст-зависимых потоковых моделей для клеточных линий NCI-60 с использованием транскриптомных и протеомных данных Сборник тезисов 12-й Московской конференции по вычислительной молекулярной биологии (МССМВ) 31 июля - 3 августа, 2025., С. 390-393. (год публикации - 2025)

14. Кондрахин П.Ю., Колпаков Ф.А. Модульная модель нейрональной активности, учитывающая динамику основных молекулярных мишеней противоэпилептических препаратов Сборник тезисов 12-й Московской конференции по вычислительной молекулярной биологии (МССМВ). 31 июля - 3 августа 2025., С. 369-372 (год публикации - 2025)

15. Колпаков Ф.А., Киселев И.Н., Новиков С.Н., Акбердин И.Р., Куляшов М.А. Виртуальная клетка - агентная модель Сборник тезисов 12-й Московской конференции по вычислительной молекулярной биологии (МССМВ). 31 июля - 3 августа 2025., С. 71-75. (год публикации - 2025)

16. Мелихова Е.В., Вертышев А.Ю., Колпаков Ф.А., Акбердин И.Р. Математическое моделирование адаптации скелетных мышц к физическим нагрузкам: от регуляции экспрессии к метаболизму Математическая биология и биоинформатика, Т. 20, № 2. С. 543-568. (год публикации - 2025)
10.17537/2025.20.543


Аннотация результатов, полученных в 2025 году
В результате выполненных работ: 1. Пополнена база данных GTRD: добавлено 24 744 эксперимента. 2. Существенно была расширена коллекция ChIP-seq-экспериментов, ориентированных на идентификацию районов связывания транскрипционных факторов: в базу данных добавлено 8 297 эксперимента, охватывающих 811 транскрипционных фактора и кофактора в 719 клеточных типах и тканях. 3. Были разработаны 2 модели нейронных сетей: - CNN - сверточная нейронная сеть; - FC - полносвязная нейронная сеть. Обе модели показали хорошую точность предсказания генной экспрессии на основе сайтов связывания транскрипционных факторов, однако при небольшой потере точности скорость обучения FC (r=0.919) в разы выше чем у CNN (r=0.928). 4. Было исследовано влияние дозы гена (количества хромосом) на предсказание уровня транскрипции. Для обучения мы использовали данные по экспрессии сайтов из FANTOM5 в 2 вариантах: - исходные нормализованные данные из FANTOM5; - исходные нормализованные данные из FANTOM5 разделенные на копийность соответствующего сайта инициации транскрипции в K562. Оказалось, что учет дозы гена фактически не улучшает качество предсказания. Увеличение коэффициента корреляции между логарифмами экспериментального и предсказанного уровня генной экспрессии не превышает 0.008. 5. Было исследовано предсказание выключения (knockdown/knockout) транскрипционных факторов на экспрессию генов. При использовании данных KnockTF, FANTOM5 и GTRD удалось достичь хорошего уровня точности предсказания с использованием полносвязаной нейронной сети, коэффициент корреляции между логарифмами экспериментального и предсказанного уровня генной экспрессии - на случайном тестовом наборе генов - r=0.974 - хромосомы 10, 11, которые не были включены в обучение - r=0.786 6. На базе BioUML реализован модуль регуляции транскрипции с учетом транспорта РНК из ядра в цитоплазму при использовании 3-ступенчатой (трансляция и деградация мРНК в цитозоле) и 4-ступенчатой (локализация мРНК на мембране эндоплазматического ретикулума или других мембраносвязанных органеллах, где она транслируется и затем деградирует) моделей Штейнбрехта и др. 7. Была пополнена и доработана специализированная база данных Virtual cell. - Мы произвели обзор математических моделей на основе ОДУ, описывающих различные способы клеточной смерти, и обобщили их характеристики в репозитории GitLab, доступном по ссылке: https://gitlab.sirius-web.org/virtual-cell/info/-/wikis/Cell%20fate/Home. На основе собранных моделей для следующей версии виртуальной клетки мы планируем построить модульную модель, которая интегрирует в себе основные пути клеточной гибели. - Разработана вычислительная модель N-гликозилирования IgG, которая охватывает реакции синтеза гликанов, катализируемые ферментами GnT I, GnT II, ​​GnT III, FucT, Man II, GalT и SiaT, в четырёх компартментах аппарата Гольджи. - Разработана модульная модель адаптации скелетных мышц человека к физической нагрузке. На уровне клетки мышцы разработаны и интегрированы два модуля, отражающие механизмы транскрипционной регуляции экспрессии генов, кодирующих ферменты энергетического метаболизма. Расширена структура модуля регуляции экспрессии за счет включения моделей синтеза транскрипционных факторов. Такой подход позволил учесть, что ферменты энергетического метаболизма в скелетной мышце не являются фиксированными по концентрации, а изменяются под влиянием тренировочной нагрузки и регуляции экспрессии соответствующих генов. 8. Построены контекст-специфические метаболические модели для 5 человеческих раковых клеточных линий: MCF7, HEK293, HeLa, HepG2, K562. Также мы реконструировали контекст-зависимые потоковые модели для клеточной линии MCF7, при обработке химиотерапевтическими агентами оксорубицином, палбоциклибом и цисплатином которые приводят к соответствующему типу сенесцентности и провели численный анализ особенностей обработки палбоциклибом. 9. Были реконструирован потоковые модели учитывающего ограничения на кинетические параметры ферментативных реакций на примере клеточных линий MCF7 и K562 с использованием данных протеомики на модели ecGEM. Дополнительно мы сопоставили полученные фермент-ограниченные модели с контекстными моделями, реконструированными с использованием METAFlux, что позволило оценить влияние учёта протеомных ограничений на предсказания метаболических потоков. 10. В этом году были сделаны сборки виртуальной клетки для мышечных клеток и 5 человеческих клеточных линий: MCF7, HEK293, HeLa, HepG2, K562, с учетом блоков, описанных выше. 11. Было проведено сравнение и анализ результатов численных расчетов новых версий (сборок) виртуальной клетки и соответствующих экспериментальных омиксных данных: - модель N-гликозилирования IgG была откалибрована и валидирована с использованием ранее опубликованных количественных данных N-гликозилирования IgG, полученных в двух независимых когортах: 915 человек с острова Корчула и 890 человек с острова Вис, Хорватия; - модульная модель адаптации скелетных мышц человека к физической нагрузке согласуется с экспериментальными данными: динамикой экспрессии белков в ответ на повторяющиеся тренировочные сессии умеренной интенсивности и изменением концентрации ферментов в течение месяца регулярных умеренных непрерывных нагрузок с восстановлением. - потоковые метаболические модели раковых клеточных линий достоверно воспроизводят экспериментальные потоки обмена метаболитов со средой (Коэффициент корреляции Спирмена: ρ = 0.63-0.79, pvalue < 0.01).

 

Публикации

1. Колпаков Ф.А., Акбердин И.Р., Кутумова Е.О. The virtual cell BGRS\SB-2024 Abstracts, Название сборника: BGRS\SB-2024 Abstracts Страницы: 2071–2073 Место публикации: Новосибирск, Россия (год публикации - 2024)
10.18699/bgrs2024-12.1-09

2. Колпаков Ф.А. Виртуальная клетка Биохимия человека 2024, Название сборника: Биохимия человека 2024 Страницы: 163 Место публикации: Москва, Россия (год публикации - 2024)

3. Колпаков Ф.А., Акбердин И.Р., Киселев И.Н., Колмыков С.К., Кондрахин П.Ю., Куляшов М.А., Кутумова Е.О., Новиков С.Н. THE VIRTUAL CELL VI Международная конференция ПОСТГЕНОМ’2024, Название сборника: VI Международная конференция ПОСТГЕНОМ’2024. Страницы: 23. Место публикации: Москва, Россия. (год публикации - 2024)

4. Воронцов И. Е., Козин И., Абрамов С., Бойцов А., Йолма А., Албу М., Амброзини Г., Фалтежскова К., Гралак А. Дж., Грызунов Н., Инукай С., Колмыков С., Кравченко П., Крибельбауэр-Свитек Дж. Ф., Лаверти К. У., Ноздрин В., Патель З. М., Пензар Д., Плешер М.-Л., Пуор С. Е., Разави Р., Янг Э. В. Х., Евшин И. В., Зинкевич А., Вейраух М. Т., Бухер Ф., Депланке Б., Форнес О., Грау Я., Гроссе И., Колпаков Ф. А., Консорциум Codebook/GRECO-BIT, Макеев В. Дж., Хьюз Т. Р., Кулаковский И. В. Cross-platform DNA motif discovery and benchmarking to explore binding specificities of poorly studied human transcription factors bioRxiv, Место публикации: bioRxiv (год публикации - 2024)
10.1101/2024.11.11.619379

5. Йолма А., Эрнандес-Корчадо А., Янг А.В.Х., Фати А., Лаверти К.У., Бречалов А., Разави Р., Албу М., Чжен Х., Консорциум Codebook, Кулаковский И.В., Наджафабади Х.С., Хьюз Т.Р. GHT-SELEX demonstrates unexpectedly high intrinsic sequence specificity and complex DNA binding of many human transcription factors bioRxiv, Место публикации: bioRxiv (год публикации - 2024)
10.1101/2024.11.11.618478

6. Граляк А.Й., Фалтейскова К., Янг А.В.Х., Штайнер К., Руссей Ж., Греннингло Н., Инукай С., Демир М., Дайнезе Р., Оуэн К., Панкевич Е., Консорциум Codebook/GRECO-BIT, Хьюз Т.Р., Кулаковский И.В., Крибельбауэр-Свитек Ю.Ф., ван Мирло Г., Депланке Б. Identification of methylation-sensitive human transcription factors 1 using meSMiLE-seq bioRxiv, Место публикации: bioRxiv (год публикации - 2024)
10.1101/2024.11.11.619598

7. Разави Р., Фати А., Йеллан И., Бречалов А., Лаверти К. У., Йолма А., Эрнандес-Корчадо А., Чжэн Х., Янг Э. В. Х., Албу М., Баразандех М., Ху Ч., Воронцов И. Е., Патель З. М., Консорциум Codebook, Кулаковский И. В., Бухер Ф., Моррис К., Наджафабади Х. С., Хьюз Т. Р. Extensive binding of uncharacterized human transcription factors to genomic dark matter bioRxiv, Место публикации: bioRxiv (год публикации - 2024)
10.1101/2024.11.11.622123

8. Кутумова Е., Акбердин И., Лаврик И., Колпаков Ф. Mathematical Modeling of Cell Death and Survival: Toward an Integrated Computational Framework for Multi-Decision Regulatory Dynamics Cells, Vol. 14, No. 22. Art. 1792. (год публикации - 2025)
10.3390/cells14221792

9. Пирчхадзе С.З., Колпаков Ф.А., Звягин А.В. Математическая модель транспорта и накопления доксорубицина в клетке Сборник тезисов 12-й Московской конференции по вычислительной молекулярной биологии (МССМВ) 31 июля - 3 августа, 2025., С. 512-515. (год публикации - 2025)

10. Кутумова Е., Мандрик Н., Шарипов Р., Пучич-Бакович М., Рапчан Б., Аульченко Ю., Лауц Г., Колпаков Ф. Quantitative Modeling of IgG N-Glycosylation Profiles from Population Data International Journal of Molecular Sciences, Vol. 26. Art. 11495. (год публикации - 2025)
10.3390/ijms262311495

11. Воронцов И.Е., Козин И., Абрамов С. и др. Cross-platform motif discovery and benchmarking to explore binding specificities of poorly studied human transcription factors. Сommunications biology, Vol. 8, No. 1. Art. 1545 (год публикации - 2025)
10.1038/s42003-025-08909-9

12. Грызунов Н., Пензар Д., Каменец В. и др. Inferring binding specificities of human transcription factors with the wisdom of crowds bioRxiv, Art. 2025.11.16.688692 (год публикации - 2025)
10.1101/2025.11.16.688692

13. Котельников А.А., Куляшов М.А., Колпаков Ф.А. Реконструкция контекст-зависимых потоковых моделей для клеточных линий NCI-60 с использованием транскриптомных и протеомных данных Сборник тезисов 12-й Московской конференции по вычислительной молекулярной биологии (МССМВ) 31 июля - 3 августа, 2025., С. 390-393. (год публикации - 2025)

14. Кондрахин П.Ю., Колпаков Ф.А. Модульная модель нейрональной активности, учитывающая динамику основных молекулярных мишеней противоэпилептических препаратов Сборник тезисов 12-й Московской конференции по вычислительной молекулярной биологии (МССМВ). 31 июля - 3 августа 2025., С. 369-372 (год публикации - 2025)

15. Колпаков Ф.А., Киселев И.Н., Новиков С.Н., Акбердин И.Р., Куляшов М.А. Виртуальная клетка - агентная модель Сборник тезисов 12-й Московской конференции по вычислительной молекулярной биологии (МССМВ). 31 июля - 3 августа 2025., С. 71-75. (год публикации - 2025)

16. Мелихова Е.В., Вертышев А.Ю., Колпаков Ф.А., Акбердин И.Р. Математическое моделирование адаптации скелетных мышц к физическим нагрузкам: от регуляции экспрессии к метаболизму Математическая биология и биоинформатика, Т. 20, № 2. С. 543-568. (год публикации - 2025)
10.17537/2025.20.543