КАРТОЧКА ПРОЕКТА ФУНДАМЕНТАЛЬНЫХ И ПОИСКОВЫХ НАУЧНЫХ ИССЛЕДОВАНИЙ,
ПОДДЕРЖАННОГО РОССИЙСКИМ НАУЧНЫМ ФОНДОМ
Информация подготовлена на основании данных из Информационно-аналитической системы РНФ, содержательная часть представлена в авторской редакции. Все права принадлежат авторам, использование или перепечатка материалов допустима только с предварительного согласия авторов.
ОБЩИЕ СВЕДЕНИЯ
Номер проекта 17-74-10188
НазваниеПоиск хрупких регуляторных районов - мишеней соматического мутагенеза в стволовых клетках
Руководитель Кулаковский Иван Владимирович, Доктор биологических наук
Организация финансирования, регион Федеральное государственное бюджетное учреждение науки Институт общей генетики им. Н.И. Вавилова Российской академии наук , г Москва
Конкурс №23 - Конкурс 2017 года по мероприятию «Проведение инициативных исследований молодыми учеными» Президентской программы исследовательских проектов, реализуемых ведущими учеными, в том числе молодыми учеными
Область знания, основной код классификатора 04 - Биология и науки о жизни; 04-207 - Системная биология; биоинформатика
Ключевые слова соматические мутации, паттерны мутагенеза, регуляторные районы генома, факторы транскрипции, сайты связывания, стволовые клетки
Код ГРНТИ34.03.23
ИНФОРМАЦИЯ ИЗ ЗАЯВКИ
Аннотация
Поиск каузальных генетических вариантов, осложняющих или существенно определяющих течение различных заболеваний с генетической компонентой, является устоявшимся трендом в медико-биологических исследованиях. Традиционный подход состоит в анализе ассоциации между фенотипом и генотипом (конкретными геномными вариантами). Лишь небольшая доля вариантов успешно проходит этап последующей функциональной аннотации, позволяющей выявить механизм, который связывает генотип с развитием заболевания.
В то же время стандартные ассоциативные исследования невозможны для анализа соматических мутаций клеточных культур, ввиду того, что при развитии клона отстутствует скрещивание. В этом случае приходится прибегать к другим методам: прямое секвенирование образцов клеточных культур и их фенотипирование на уровне транскриптома, протеома или других показателей. Подобный анализ позволяет оценить соответствие клеточной культуры ее ожидаемому генотипу и фенотипу. Однако, приоретизация и соматических мутаций и генетических вариантов может быть достигнута схожими методами функциональной геномики.
Варианты в кодирующих областях, которые могут прямым образом влиять на структур и функцию кодируемых белков, долгое время находились в фокусе исследований. Отчасти, игнорирование вариантов в некодирующих областях объяснялось неполнотой знаний о структуре и функции генома. Сегодня научным сообществом собран уже заметный объем экспериментальных данных о функциональных элементах генома за пределами кодирующих областей, и это открывает дорогу для полноценного функционального анализа некодирующих геномных вариантов, в первую очередь, в регуляторных областях, управляющих транскрипцией генов (промоторах и энхансерах). Именно в промоторах и энхансерах находится более 60% казуальных вариантов, определяющих предрасположенность к аутоимунным заболеваниям [Farh и др., 2015]; а в недавнем исследовании ассоциации геномных вариантов с риском развития эпителиального рака яичников (epithelial ovarian cancer [Lawrenson и др., 2015]), лишь 2 полиморфных позиции из почти 300 значимых были локализованы в кодирующих областях, при этом 25 из 300 были найдены непосредственно в участках ДНК, узнаваемых белками-факторов транскрипции.
Традиционным объектом в исследовании геномных вариантов были однонуклеотидных полиморфизмы с точки зрения популяционной распространенности конкретных аллелей. С удешевлением секвенирования появляются принципиально новые данные: информация о соматическом мутагенезе, как в патологических процессах (в первую очередь – в геномах раковых клеток), так и в норме. Анализ соматических мутаций в раковых клетках сталкивается с интерференцией принципиально разных процессов: активности конкретных мутационных механизмов, специфичных для типа клеток и определяющих основную «мутационную подпись», и клональной эволюции и сопутствующего давления отбора, маскирующего или усиливающего след подписи в конкретных участках генома, в зависимости от их функциональной роли. Стандартный подход состоит в выявлении рецидивных драйверных мутаций, сопровождающих или вызывающих злокачественную трансформацию клеток. Однако, не меньший интерес представляют и побочные мутации, возможно, возникшие еще до злокачественной трансформации, которые не являются напрямую онкогенными, но могут вносить существенный индивидуальный вклад в регуляцию экспрессии и фенотип. Тот факт, что энхансеры в целом чувствительны к однонуклеотидным заменам [Li и др., 2016], подтверждает возможность локализации конкретных регуляторных районов, хрупких по отношению к соматическим паттернам мутагенеза.
Недавно в открытом доступе появились полногеномные данные по соматическому мутагенезу в стволовых клетках здоровых взрослых организмов [Blokzijl и др., 2016]. Для кодирующих областей известных онкогенов спектр мутаций в стволовых клетках уже был проанализирован: выяснилось, что он имеет заметное сходство с раковым. То есть, соматический мутагенез, происходящий в кодирующих областях генома, имеет потенциал для злокачественной трансформации стволовых клеток. На наш взгляд, аналогичный вопрос необходимо прояснить и для регуляторных областей, управляющих экспрессией, причем как известных онкогенов, так и генов, участвующих в поддержании плюрипотентности.
Частота соматических мутаций в стволовых клетках, по сравнению с раковыми, невысока. Мы ожидаем, что прямой анализ локализации мутаций в регуляторных областях даст только ограниченную информацию в силу малых выборок, а общие закономерности (например, связь локализации мутаций со временем репликации) уже были выявлены авторами экспериментальных данных. Мы предлагаем альтернативный вариант: идентифицировать области, потенциально доступные для мутагенеза, и внутри них провести анализ ко-локализации мутационных контекстов (паттернов, в среднем характерных для окрестности реальных мутаций) и регуляторных паттернов (соответствующих сайтам связывания факторов транскрипции). Это можно сделать на нескольких уровнях: во-первых, оценить общее сходство регуляторных паттернов и мутационных контекстов; во-вторых, оценить кластеризацию тех и других в протяженных регуляторных участках генома. Интересно, что традиционный анализ мутационной подписи обычно ограничивается только локальным контекстом (ближайшие 5’ и 3’ нуклеотиды к позиции мутации), но в геномах некоторых типов раковых клеток существуют и заметно более длинные мутационные контексты [Fredriksson и др., 2017], которые могут значительно определять специфичность мутагенеза.
Для анализа ко-локализации паттернов мутагенеза в регуляторных районах будут использованы данные проекта FANTOM5 по транскрипционной активности и информация по связыванию регуляторов транскрипции in vivo, полученная с помощью технологии ChIP-Seq и доступная в систематическом виде в базе данных GTRD.
(1) Мы проведем идентификацию мотивов в ChIP-Seq данных и расширим спектр регуляторных паттернов, представленных в авторской базе данных HOCOMOCO. Точность мотивов, ранее представленных нами в HOCOMOCO, уже подтверждалась рядом независимых исследований . В том числе, HOCOMOCO успешно использовалась в ходе международного соревнования по предсказанию сайтов связывания факторов транскрипции ENCODE-DREAM, где в первом раунде наша команда заняла лидирующую позицию, а команда-лидер второго раунда (Guan lab) для победы использовала наши модели из HOCOMOCO. На новом этапе мы планируем анализ почти в двое большего объема ChIP-Seq данных (по сравнению с опубликованной версией HOCOMOCO), что позволит расширить спектр представленных факторов транскрипции и предложить более точные модели для сайтов связывания факторов, для которых ранее не использовались данные по связыванию in vivo.
(2) Мы выделим характерные длинные контексты мутагенеза в стволовых клетках и проведем их сравнение с паттернами сайтов связывания факторов транскрипции. Затем мы произведем поиск и анализ ко-локализации контекстов мутагенеза и паттернов сайтов связывания в областях, определенных с помощью ChIP-Seq, как глобально во всем цистроме (регуляторном ландшафте связывания факторов транскрипции, построенных по информации для всего множества клеточных типов), так и специфично для стволовых клеток. В частности, будут идентифицированы области с повышенной плотностью мутагенных контекстов и похожих на них регуляторных паттернов. Локализация таких областей будет изучена относительно промоторов и энхансеров известных онкогенов и ключевых генов поддержания плюрипотентности. Верификация предсказаний будет проведена путем сопоставления с информацией об аллель-специфичном связывании по данным ChIP-Seq [Chen и др., 2016] и локализацией известных eQTL.
ОТЧЁТНЫЕ МАТЕРИАЛЫ