Все белки организма закодированы в определенных участках ДНК — генах. Как уже существующие в популяции геномные варианты, так и произошедшие всего поколение назад мутации могут приводить к изменению последовательности белка, его структуры и функции. В некоторых случаях это может вызвать развитие и усугубление различных заболеваний, включая аутоимунные, а также повышение риска развития рака, воспалительных осложнений при диабете, туберкулезе и прочих болезнях.
Считывание информации, а по факту синтез РНК на основе ДНК, называется транскрипцией. На основе рибонуклеиновой копии будут синтезироваться белки, определяющие признаки клетки и, в конечном счете, организма. Если это происходит не в то время и не в том месте или не происходит тогда, когда необходимо, возникают патологии.
С развитием экспериментальных и компьютерных методов стало понятно, что здесь большую роль играют не только гены, но и так называемые некодирующие последовательности. К ним относятся особые «регуляторные» участки ДНК — специфичные посадочные площадки для управляющих транскрипцией белков, называемых факторами транскрипции. Замена всего одного нуклеотида («буквы») приводит к появлению нового варианта с другими «посадочными» свойствами, а значит, изменяется и активность чтения подконтрольного гена.
«Для нас важнейшая цель — выявить тройки "регулятор – ген – тип клеток", связанные с определенной нуклеотидной заменой. Несмотря на то, что регуляция транскрипции изучается уже более 50 лет, сегодня доступна только верхушка айсберга: известна лишь небольшая часть регуляторных вариантов, которые влияют на посадку конкретных факторов транскрипции в определенных типах клеток. Это связано с тем, что эксперименты проводят на культивируемых клетках. С одной стороны, они сохраняют свойства исходных тканей, включая распространенные генетические вариации. С другой стороны, мы сталкиваемся с уникальными особенностями, например глобально измененной копийностью хромосом, что существенно осложняет статистический анализ», — рассказывает руководитель проекта по гранту РНФ Иван Кулаковский, один из авторов статьи, доктор биологических наук, старший научный сотрудник Института белка РАН.
Российские исследователи из Института белка РАН (Пущино), Института общей генетики имени Н. И. Вавилова РАН (Москва) и Московского физико-технического института (Долгопрудный) провели масштабный вычислительный анализ опубликованных экспериментов по картированию взаимодействий регуляторных белков и ДНК. С помощью продвинутого статистического подхода им удалось единым образом проанализировать результаты нескольких тысяч экспериментов для разнообразных типов клеток. Полученная карта содержит сотни тысяч событий так называемого аллель-специфичного связывания, когда разница в один нуклеотид в конкретном участке пары хромосом (аллельный вариант) приводит к тому, что регуляторный белок предпочтительно связывается с одной хромосомой из пары. Сопоставление с данными о генетике различных заболеваний показало: те варианты, которые приводят к потере связывания регуляторного белка (или, наоборот, к связыванию того, который раньше в этом месте не садился), гораздо чаще оказываются вовлеченными в развитие болезни.
«Конечно, мы все еще на верхушке айсберга, но теперь здесь можно комфортно расположиться и продолжать исследования его подводной части. Наша коллекция далека от полноты, но содержит на порядок больше информации об аллель-специфичных взаимодействиях, чем было известно ранее. Особенно ценными эти данные могут оказаться для медицинских генетиков, которым важно понимать функциональную роль вариантов, расположенных в регуляторных областях генов. Наша карта будет полезна и вычислительным биологам для построения и проверки новых моделей взаимодействия факторов транскрипции и ДНК на основе машинного обучения», — заявил Иван Кулаковский.