КАРТОЧКА ПРОЕКТА ФУНДАМЕНТАЛЬНЫХ И ПОИСКОВЫХ НАУЧНЫХ ИССЛЕДОВАНИЙ,
ПОДДЕРЖАННОГО РОССИЙСКИМ НАУЧНЫМ ФОНДОМ

Информация подготовлена на основании данных из Информационно-аналитической системы РНФ, содержательная часть представлена в авторской редакции. Все права принадлежат авторам, использование или перепечатка материалов допустима только с предварительного согласия авторов.

 

ОБЩИЕ СВЕДЕНИЯ


Номер 20-14-00121

НазваниеСистемaтический анализ трансляции коротких Открытых Рамок Считывания (кОРC) и исследование свойств их пептидных продуктов.

РуководительАндреев Дмитрий Евгеньевич, Доктор химических наук

Прежний руководитель Баранов Павел Викторович, дата замены: 22.06.2021

Организация финансирования, регион Федеральное государственное бюджетное учреждение науки Институт биоорганической химии им. академиков М.М. Шемякина и Ю.А. Овчинникова Российской академии наук, г Москва

Период выполнения при поддержке РНФ 2020 г. - 2022 г.  , продлен на 2023 - 2024. Карточка проекта продления (ссылка)

Конкурс№45 - Конкурс 2020 года «Проведение фундаментальных научных исследований и поисковых научных исследований отдельными научными группами».

Область знания, основной код классификатора 04 - Биология и науки о жизни, 04-207 - Системная биология; биоинформатика

Ключевые словаКороткие открытые рамки считывания (кОРС), верхние открытые рамки считывания (вОРС), 5’ нетранслируемая область (5’ НТО), лидерная последовательность мРНК, трансляция мРНК, рибосомное профилирование, рибос-сек, микробелки, пептидомика, протеогеномика

Код ГРНТИ34.15.23


СтатусУспешно завершен


 

ИНФОРМАЦИЯ ИЗ ЗАЯВКИ


Аннотация
Несмотря на то, что секвенирование генома человека было завершено почти 20 лет назад, полный репертуар белков, кодируемых в геноме, остается невыясненным. Белковые молекулы играют ключевую функциональныю роль, обеспечивая структурную, ферментативную, двигательную функции, а также осуществляющие внутриклеточный транспорт, межклеточную коммуникацию и пр. Обнаружение участков генома, кодирующих гены крупных белков не составляет труда. Вероятность случайного эволюционного появления длинных открытых рамок считывания (ОРС) ничтожно мала. Кроме того, длинные последовательности предоставляют достаточно информации, чтобы с высокой вероятностью определять являются они белок-кодирующими или нет. Напротив, вероятность случайного появления коротких ОРС весьма высока и из-за их длины трудно достоверно оценить вероятность того, кодируют они белок или нет. До недавнего времени короткие рамки игнорировались при анализе геномных последовательностей. Однако появление метода рибосомного профилирования около десяти лет назад позволило детектировать трансляцию десятков тысяч коротких ОРС (кОРС) в клетках человека и других живых организмов. Более того, было показано, что некоторые из этих кОРС кодируют функциональные белковые молекулы. В настоящее время мы можем только догадываться о том, сколько биологически активных пептидов и микробелков кодируется в открывающейся «вселенной кОРС» и насколько важно их существование для функционирования клеток. Помимо кодирования функционально-значимых биологически активных белковых продуктов, кОРС, расположенные в последовательности мРНК перед ОРС основного продукта (upstream ORF - uORF), могут регулировать синтез последних. Кроме того, трансляция некоторых кОРС может быть функционально несущественной. Остается неизвестным, какое количество кОРС являются нефункциональными, сколько из них являются регуляторными и сколько из них кодируют биологически активные пептиды и микробелки. Этот проект направлен на классификацию и многостороннее изучение кОРС и их продуктов с использованием методов машинного обучения, общедоступных данных рибосомного профилирования и масс- спектрометрии, а также сравнительного анализа последовательностей. Результаты машинного обучения будут проверяться масс-спектрометрической идентификацией целевых продуктов кОРС в различных клеточных компартментах. Роль отдельных кОРС в определенных клеточных процессах будет определяться с помощью CRISPR-Cas9 скрининга.

Ожидаемые результаты
Ожидаемые результаты: Будет разработана предсказательная статистическая модель для обнаружения транслируемых кОРС в отсутствии экспериментального подтверждения их трансляции. Продукты предсказанных транслированных кОРС будут проанализированы с использованием инновационного подхода, основанного на комбинации молекулярной генетики и масс-спектрометрии, который будет разработан специально для этого проекта. Будет проанализированa локализация продуктов кОРС по клеточным компартментам и оценена их биохимическая стабильность в клетках. Полученные данные будут использованы для улучшения статистического прогноза биохимических свойств продуктов кОРС по их последовательности и контексту. С помощью CRISPR-Cas9 скрининга для созданной библиотеки транслируемых кОРС будут идентифицированы пептидные продукты, вовлеченные в ряд клеточных процессов, а именно в мезенхимально-эпителиальный переход, аутофагию и адипогенез. В результате работы будет создана база данных транслируемых человеческих кОРС и ряда характеристик их пептидных продуктов. Значимость: На данный момент очевидно, что транслируется большое количество кОРС, встречающихся в так называемых длинных некодирующих РНК (lncRNAs) и так называемых нетранслируемых областях (НТО) мРНК. Трансляция многих таких ОРС была обнаружена с помощью метода рибосомного профилирования. Однако для многих транскриптов отсутствует информация о реальных пептидных продуктах, что может быть связано как с ограничениями методов их детекции, так и с их биологическими свойствами, например, быстрой деградацией или какими-либо особенностями трансляции, снижающими количество конечного белковго продукта. Мы преодолеем эти ограничения, используя методы машинного обучения как на имеющихся данных, так и на новых данных, сгенерированных специально под задачи проекта. Результатом работы станет создание алгоритма детекции кОРС, кодирующих стабильные продукты, создание БД таких кОРС, а также биохимические и функциональные характеристики их продуктов.


 

ОТЧЁТНЫЕ МАТЕРИАЛЫ


Аннотация результатов, полученных в 2020 году
Идентификация полного набора генов человека и выявление их функций и взаимодействий является необходимым условием для понимания механизмов работы организма и разработки методов воздействия с учетом всех возможных побочных реакций. До недавнего времени считалось, что ученые идентифицировали все гены человека. Однако появление технологии рибосомного профилирования показало наличие коротких транслируемых участков ДНК в ранее считавшихся нетранслируемыми областях генома. Данное открытие положило начало изучению коротких Открытых Рамок Считывания (кОРС). При этом для некоторых новых микробелков и пептидов уже открыты важные регуляторные функции, т.е. продукты этих кОРС являеются функционально значимыми. Первый год реализации проекта по анализу кОРС и их продуктов был направлен на разработку критериев оценки потенциальной транслируемости кОРС и обладания ими функциональной активности. В качестве одного из потенциальных критериев оценки была исследована сила старт-кодона в контексте консенсусной последовательности Козак. Было показано, что в случае «слабого» окружения первого старт-кодона гена возможно проскакивание рибосом и начало трансляции со следующего старт кодона, что может потенциально приводить к синтезу альтернативных изоформ белка или появлению альтернативных ОРС. Также была исследована связь наличия трансляции кОРС по данным рибосомного профилирования с уровнем консервативности нуклеотидной последовательности кОРС на разных таксономических уровнях. Неожиданным результатом было то, что среди транслируемых по данным рибосомного профилирования кОРС, присутствуют как совершенно не консервативные последовательности вплоть до, например, отсутствия консервативности старт кодона в таксоне приматов, так и кОРС с уровнем консервативности, сравнимым с таковым для основным известных генов. При этом недавно открытые кОРС с функциональными продуктами обладают преимущественно высокой консервативностью. Данные результаты позволяют предложить уровень консервативности если не в качестве критерия оценки транслируемости, то в качестве критерия оценки потенциального наличия функции у пептидно-белкового продукта. Оценка уровня трансляции участков РНК осуществляется на основе данных рибосомного профилирования, которые, в свою очередь, требуют специализированные репозитории и программное обеспечение для агрегации данных большого количества экспериментов. Одним из таких репозиториев является RiboSeq.org. Для повышения эффективности работы c данными рибосомного профилирования, в рамках проекта было создано локальное российское зеркало данного репозитория с URL http:// trips.ibch.ru:5000.

 

Публикации

1. Бенитез-Кантос М.С., Иорданова М.М., О'Коннор П.Б., Жданов А.В., Ковальчук С.И., Папковский Д.Б., Андреев Д.Е., Баранов П.В. Translation initiation downstream from annotated start codons in human mRNAs coevolves with the Kozak context Genome Research, 30(7): 974–984. (год публикации - 2020) https://doi.org/10.1101/gr.257352.119


Аннотация результатов, полученных в 2021 году
Разработана новая платформа для изучения и анализа данных рибосомного профилирования TRIPS-VIZ. Данная платформа позволяет предсказывать транслируемые кОРС в данных пользователя, а также в большом массиве данных рибосомного профилирования из опубликованных ранее работ. В платформу интегрированы массовые протеомные данные из опубликованных ранее работ, которые позволяют подтверждать существование новых микробелков на уровне протеома. С помощью TRIPS VIZ была исследована трансляция в так называемых длинных некодирующих РНК. Результаты анализа данных позволяют сделать вывод о том, что некоторые некодирующие РНК на самом деле представляют из себя мРНК, кодирующие короткие белки меньше 100 аминокислот. В то же время трансляция в других длинных некодирующих РНК по всей видимости непродуктивна, поскольку транслируемые кОРС не являются консервативными у млекопитающих. Для систематического функционального анализа кОРС разрабатывается новый подход, основанный на модификации метода VAMP-seq. Получена библиотека из 2768 кОРС, которая будет использована для исследований. Из всего массива кОРС выбраны наиболее интересные консервативные кандидаты для изучения их функциональной роли. Получены генетические конструкции для экспрессии шести кОРС для идентификации их белковых партнеров. Разработан экспериментальный метод по идентификации белковых партнеров кОРС. Исследована регуляторная роль некоторых кОРС в регуляции трансляции при стрессе. Предложена математическая модель, обьясняющая регуляторную роль кОРС при стрессе за счет столкновения сканирующих и элонгирующих рибосом.

 

Публикации

1. Андреев Д.Е., Баранов П.В., Мирогородский А., Рачинский Д. A deterministic model for non-monotone relationship between translation of upstream and downstream open reading frames Mathematical Medicine and Biology, 15;38(4):490-515 (год публикации - 2021) https://doi.org/10.1093/imammb/dqab015

2. Захид О, Кинири С.Д., Баранов П.В., Дин К Exploring Evidence of Non-coding RNA Translation With Trips-Viz and GWIPS-Viz Browsers Frontiers in Cell and Developmental Biology, 12;9:703374 (год публикации - 2021) https://doi.org/10.3389/fcell.2021.703374

3. Кинири С.Д, Джажд К.Е, Мишель О.М, Баранов П.В. Trips-Viz: an environment for the analysis of public and user-generated ribosome profiling data Nucleic Acids Research, 49(W1): W662–W670 (год публикации - 2021) https://doi.org/10.1093/nar/gkab323

4. Сергей И. Ковальчук, Рустам Зиганшин, Ирина Шелухина Simple In-House Ultra-High Performance Capillary Column Manufacturing with the FlashPack Approach Journal of Visualized Experiments, 178, e62522 (год публикации - 2021) https://doi.org/10.3791/62522-v


Аннотация результатов, полученных в 2022 году
В 2022 году работа нашего коллектива была направлена на аннотацию и функциональное исследование кОРС человека. Крайне важным для данной области исследований результатом явилась первая аннотация транслируемых кОРС человека, которая основана на данных рибосомного профилирования. Эта база данных кОРС использовалась нами для углубленного биоинформатического анализа функциональных особенностей кОРС. В результате работы мы обнаружили три класса аминокислотных мотивов в кОРС, имеющие потенциальную функциональную роль. Предсказано, эти три класса мотивов могут быть вовлечены в a)-регуляцию трансляции за счет влияния на скорость транслирующих рибосом, б)- в специфический контроль трансляции своей собственной мРНК, в)- в регуляцию специфических белок белковых взаимодействий за счет конкуренции за сайты связывания полипептидами, закодированными в кОРС. Кроме того, нами был обнаружен загадочный случай, при котором проскальзывающее сканирование через стартовый кодон одного из цитокинов может приводить к синтезу короткого полипептида, который вследствие своих структурных особенностей может влиять на сигнальный путь цитокина. Эти результаты позволяют создать серьезный задел для дальнейшего экспериментального изучения классов кОРС человека.

 

Публикации

1. Акдел М., Пирес Д.Е.В., Пардо Е.П., Янс Ю., Залевский А.О., Мезарос Б., Брайант П., Гуд Л.Л., Ласковски Р.А., Позатти Г., Шеной А., Жу В., Кандротас П., Руис Сиерра В., Родригес К.Х.М., Данэм А.С., Бурке Д., Боркакотти Н., Веланкар С., и др A structural biology community assessment of AlphaFold2 applications Nature structural and molecular biology, 11:1056-1067 (год публикации - 2022) https://doi.org/10.1038/s41594-022-00849-w

2. Мадж Д.М.,Руис-Орера Д.,Преснер Д.Р., Брюне М.А., Кальвет Ф., Джунгреис И., Гонсалес Х.М., Магран М, Мартинес Т.Ф., Шульц Я.Ф., Янг Й.Т., Мар Альба М., Аспден Д.Л., Баранов П.В., Баззини А.А., Бруфольд Е., Мартин М.Д., Кальвиелло Л, Карвунис А.Р., и др. Standardized annotation of translated open reading frames Nature Biotechnology, 40(7):994-999 (год публикации - 2022) https://doi.org/10.1038/s41587-022-01369-0

3. Ученуну О, Жданов А.В., Хаттон Ф, Йованович П, Йе В, Андреев Д.Е., Хулеа Л., Пападополи Д.Ж., Авизонис Д, Баранов П.В., Поллак М.Н., Папковский Д.Б., Тописирович И. Mitochondrial complex IV defects induce metabolic and signaling perturbations that expose potential vulnerabilities in HCT116 cells FEBS Open Bio, 12(5):959-982 (год публикации - 2022) https://doi.org/10.1002/2211-5463.13398

4. Андреев Д.Е., Лофран Г, Федорова А.Д., Михайлова М.С., Шатский И.Н., Баранов П.В. Non-AUG translation initiation in mammals Genome Biology, Genome Biology volume 23,111 (2022) (год публикации - 2022) https://doi.org/10.1186/s13059-022-02674-2


Возможность практического использования результатов
не указано