КАРТОЧКА ПРОЕКТА ФУНДАМЕНТАЛЬНЫХ И ПОИСКОВЫХ НАУЧНЫХ ИССЛЕДОВАНИЙ,
ПОДДЕРЖАННОГО РОССИЙСКИМ НАУЧНЫМ ФОНДОМ
Информация подготовлена на основании данных из Информационно-аналитической системы РНФ, содержательная часть представлена в авторской редакции. Все права принадлежат авторам, использование или перепечатка материалов допустима только с предварительного согласия авторов.
ОБЩИЕ СВЕДЕНИЯ
Номер проекта 24-14-00276
НазваниеСтруктура и эволюция бактериальных геномов и регуляторных сетей
Руководитель Гельфанд Михаил Сергеевич, Доктор биологических наук
Организация финансирования, регион Автономная некоммерческая образовательная организация высшего образования «Сколковский институт науки и технологий» , г Москва
Конкурс №92 - Конкурс 2024 года «Проведение фундаментальных научных исследований и поисковых научных исследований отдельными научными группами»
Область знания, основной код классификатора 04 - Биология и науки о жизни; 04-201 - Структурная, функциональная и эволюционная геномика
Ключевые слова сравнительная геномика, молекулярная эволюция, геномы бактерий, перестройки геномов, фазовые вариации, регуляция транскрипции
Код ГРНТИ34.03.23, 34.03.17
ИНФОРМАЦИЯ ИЗ ЗАЯВКИ
Аннотация
Эволюция бактерий важна как с теоретической, так и с практической точки зрения. Теоретически – это удобный объект для изучения общих законов эволюции, в силу как относительной простоты бактерий по сравнению с эукариотами, тем более многоклеточнызми эукариотами, так и доступонсти огромных объемов информации – количество известных геномов измеряется уже десятками тысяч. С практической точки зрения эволюция играет ключевую роль в таких существенных для медицины процессах, как распространение лекарственной устойчивости и систем вирулентности, а также взаимодействие патогенов с иммунной системой хозяина.
Бактериальный геном можно рассматривать на нескольких уровнях. Изучая геном как набор генов, можно описывать потери и приобретения генов (и, стало быть, функциональную деградацию при переходе от свободного образа жизни к паразитизму у патогенов либо, наоборот, приобретение новых функций при изменении среды обитания). Геном как последовательность эволюционирует за счет как точечных мутаций (и здесь интересно сопоставлять паттерны мутаций в различных функциональных участках – генах, межгенных областях, промоторах, сайтах связывания факторов транскрипции), так и геномных перестроек (которые являются, в частности, одним из механизмов фазовых вариаций, за счет которых патогены уходят от действия адаптивного иммунитета). Наконец, геном является инструкцией для экспрессии генов, и доступность геномов, находящихся на разном уровне родства, позволяет изучать эволюцию регуляторных систем. В пилотных экспериментах мы видели, что транскрипционные регуляторы, которые было принято считать чисто метаболическими (в частности, UxuR) могут играть роль в таких патогенетических процессах, как образование биопленок; эволюция таких систем представляет интерес также и с практической точки зрения.
Эти аспекты связаны между собой, например, идентификация новых сайтов связывания транскрипционных факторов производится с применением метода филогенетического футпринтинга, который основан на наблюдении, что сайты консервативнее окружающих их межгенных участков. Горизонтальное перенесенные (и стало быть, новые для генома) гены ускоренно мутируют, приближаясь по своим статистическим характеристикам (GC-состав, частоты кодонов) к средним по геному. Геномные перестройки влияют на экспрессию генов за счет перестановок регуляторных участков.
Сравнительно-геномный анализ существенно увеличивает арсенал методов для функциональной аннотации генов. К стандартному предсказанию функции по гомологии добавляются соображения, основанные на ко-локализации и ко-регуляции. При этом удается предсказать не только функцию гена, но и то, в каких условиях он экспресссируется.
Настоящий проект расширяет и углубляет исследования, которые проводятся в группе в течение 25 лет. Принципиально новым направлением исследований является анализ генетически запрограммированных случайностей, к которым относятся, в частности, системы фазовой вариации и, вероятно, регуляция подвижности и образования биопленок. Эти же системы представляют особый интерес с медицинской точки зрения, поскольку образование биопленок ведет к повышению устойчивости бактерий к антибиотикам, а фазовые вариации – к персистированию патогенов. Кроме того, учет фазовых вариаций важен для создания вакцин: так, белки гистидиновых триад, котоый будут исследованы в проекте, рассматривались как одна из возможных мишеней вакцин против стрептококков.
Существенной особенностью настоящего проекта является относительно широкий спектр конкретных решаемых в нем задач, объединенных, тем не менее, общим методологическим подходом – это сравнительный анализ и внимание к эволюционным проблемам. При этом разнообразие задач позволяет ставить рискованные вопросы, ответ на которые не очевиден в начале работы, а также комбинировать биоинформатические и экспериментальные подходы.
ОТЧЁТНЫЕ МАТЕРИАЛЫ
Аннотация результатов, полученных в 2024 году
Проведена серия экспериментов по задержке в геле ДНК-белковых комплексов в присутствии сахаров, которые могут быть эффекторами YihW и cAMP-CRP и влиять на силу связывания этих регуляторов с двумя межгенными участками, yihU/V и yihV/W, из двух штаммов кишечной палочки, отличающихся кассетой yih-генов – Escherichia coli K12 MG1655 (длинный вариант) и Escherichia coli Nissle 1917 (короткий вариант). Показано, что оба белка эффективно связываются с исследуемыми участками, причем их связывание регулируется только лактозой и сульфохиновозой (SQ); глюкоза и галактоза влияния не оказывают. Связывание CRP в присутствии SQ зависело от межгенной области: SQ усиливала связывание CRP c yihV/W и ослабляла связывание с yihU/V. В E. coli Nissle 1917 лактоза не влияла на связывание CRP, а в штамме с кассетой K-12 MG1655 усиливала связывание с участком yihU/V и ослабляла с yihV/W. Это означает, что на связывание CRP с ДНК может влиять не только cAMP, но и другие эффекторы. Поэтому на следующем этапе исследование этих комплексов будет продолжено с помощью плазмонного резонанса. YihW из К-12 также хорошо связывается с обоими фрагментами. Добавление SQ усиливало связывание YihW с межгенными участками yihV/U и yihV/W как длинной, так и короткой кассеты. Добавление лактозы имело противоположный эффект, причем сильнее оно влияло на связывание YihW у Nissle 1917. В дальнейшем будет проведен аналогичный эксперимент с YihW из Nissle 1917. В настоящее время уже получено и отсеквенировано два варианта экспрессионных конструкций на основе плазмиды pGEMEX. На следующем этапе будут оценены константы связывания белков с ДНК в присутствии обоих эффекторов, а также кинетика образования комплексов с помощью плазмонного резонанса.
С помощью gene doctoring получен штамм Nissle 1917 с делетированным геном lacZ и оценен его рост на различных сахарах в сравнении со штаммом дикого типа. На глюкозе рост статистически не отличался от штамма дикого типа и от штамма К-12 MG1655. На лактозе Nissle 1917 рос хуже K-12 MG1655, а его мутант по lacZ был способен к медленному росту в присутствии лактозы – рост был даже лучше, чем зарегистрированный ранее для штамма К-12 dlacZ. Таким образом, для Nissle 1917 лактоза является менее предпочтительным субстратом, чем для К-12, но при этом он способен медленно ее утилизировать в отсутствие основной бета-галактозидазы. В присутствии SQ Nissle 1917 рос плохо, и разницы в скорости роста мутантного штамма и штамма дикого типа не было. Тем самым, в отличие от К-12, короткая кассета Nissle 1917 практически не способна к метаболизму SQ.
Было изучено семейство факторов транскрипции CsoR. Были построены выравнивания и филогенетические деревья; разрешены соотношения ортологичности; определены мотивы в ДНК, узнаваемые этими факторами; определены новые кандидаты исследуемых регулонов. На следующем этапе аналогичный анализ будет проведен для семейств MntR и CopY.
Исследованы фазовые вариации в локусах использования полисахаридов (Polysaccharide Utilization Locus) у бактероидов. Такие локусы включают гены susCD, кодирующие транспортеры внешней мембраны, и ген рекомбиназы. За счет инверсий, производимых этой рекомбиназой, происходит подстановка участка, содержащего промотор и N-конец гена susC, к различным копиям этого гена. В результате в каждый момент в локусе работает один оперон susCD, а выбор работающего оперона изменяется случайным образом. Показано, что в штаммах Bacteroides thetaiotaomicron имеются четыре варианта локуса PUL, порождаемых инверсиями по повтору, и восстановлена эволюционная история локуса. В геномах Bacteroides идентифицированы вторые локусы PUL с другой рекомбиназой. Построены ортологические ряды транспортеров susCD и описан состав локусов PUL у бактероидов. Планируется более подробно изучить эволюцию этих локусов, а также начать анализ подробный других случаев фазовых вариаций.
Построен набор перекрывающихся генов бактерий, произведена кластеризация ортологичных пар, фильтрация и уточнение данных, классифицированы типы перекрываний. Показано, что (а) в кластерах с частыми перекрываниями события происходят быстро и параллельно, (б) в кластерах с редкими перекрываниями применение стандартного метода реконструкции состояний на внутренних узлах BayesTraits приводит к вычислительным артефактам. Работа продолжается.
Начато исследование эволюции межгенных промежутков штаммов Escherichia coli. Было показано, число полиморфизмов в сайтах связывания транскрипционных факторов часто равно нулю, а в остальных случаях на порядок меньше количества полиморфизмов вне сайта. Для каждого фактора была оценена консервативность его сайтов; оказалось, что сайты факторов, связанных с sigma-54, консервативнее сайтов факторов, связанных с другими сигма-факторами. Гены 23 малых РНК, за единственным исключением (gcvB) не имели полиморфизмов. На следующем этапе планируется исследование полиморфизмов в промоторах и терминаторах и написание статьи.
Начато изучено распределение бактерий с гигантскими геномами: проведена фильтрация данных, определены и приоритизированы таксоны для дальнейшей работы.
По двум критериям – гомологии оперонов parAB и количеству общих генов – установлены соответствия между репликонами 22 бактерий из рода Azospirillum. Независимо полученные результаты демонстрируют хорошее соответствие. Геномы распадаются на две ветви, внутри которых соответствия устанавливаются надежно; для соответствий между ветвями требуется более подробный анализ.
Результаты доложены на международных конференциях:
• Evolution of complexity and statistical physics, Ереван;
• Bioinformatics of Genome Regulation and Structure / Systems Biology, BGRS/SB-2024, Новосибирск;
• Геномика, метагеномика и молекулярная биология микроорганизмов, Сколтех.
Совместно с РНФ в Сколтехе проведено мероприятие «Наука без турникетов». Участниками проекта прочитано 12 популярных лекций по теме геномики и эволюции бактерий в Москве, Долгопрудном, Пущино, Дубне, Сыктывкаре, Тбилиси, Самаре, Сочи (Сириус).
Публикации
1. Рубина А.А., Гельфанд М.С. Phylogeny of enzymes from the sulfo-Embden–Meyerhof–Parnas pathway in bacteria III Международная конференция «Геномика, метагеномика и молекулярная биология микроорганизмов» (III GMMMC). Сколтех, 23-24 ноября 2024 , pages 203-205 (год публикации - 2024)
2.
Рыбина А.А.
Phylogenetic analysis and molecular dynamic simulations of CsqR, a transcription factor from Escherichia coli
BGRS/SB-2024. БИОИНФОРМАТИКА РЕГУЛЯЦИИ И СТРУКТУРЫ ГЕНОМОВ / СИСТЕМНАЯ БИОЛОГИЯ. 14-я Международная мультиконференция. 5–10 августа 2024, Новосибирск, Россия (год публикации - 2024)
10.18699/bgrs2024-abstracts
3. Ашниев Г.А., Гельфанд М.С., Ашниев Г.А., Родионов Д.А. Реконструкция метаболических путей деградации полисахаридов бактериями кишечника рода Prevotella III Международная конференция «Геномика, метагеномика и молекулярная биология микроорганизмов» (III GMMMC). Сколтех, 23-24 ноября 2024 , стр. 173-175 (год публикации - 2024)
Аннотация результатов, полученных в 2025 году
Исследована эволюция геномов Myxococcota. Построены ортологические ряды, филогенетические деревья, филетические паттерны. Ортологические ряды с большим числом паралогов содержат гены, кодирующие регуляторные белки (факторы транскрипции, двукомпонентные системы, белки с доменами PAS и CHASE, TonB рецепторы, серин-треониновые протеин-киназы — 12 из 20 самых больших рядов, из них четыре самых больших), а также белки, связанные с взаимодействием и подавлением других организмов (пять рядов: поликетид-синтазы, нерибосомные пептид-синтазы, система секреции VI типа, цитохромы Р450, белки с доменом DNRLRE). Это хорошо согласуется с известным наблюдением, что доля регуляторных генов растет с увеличением бактериального генома, а также указывает, что Myxococcota могут служить источником новых антибиотиков.
Исследовано 22 полных генома Azospirillum spp., состоящих из 6–10 репликонов. Разработана методика отождествления репликонов на основе состава генов и филогении белков сегрегации ParAB. Показано, что однокопийные критические гены находятся в основном на самом большом репликоне (хромосоме), реже на втором по размеру и почти никогда — на более мелких. Предсказаны точки начала репликации и сайты связывания фактора инициации репликации DnaA, сайты ParS, с которыми связываются белки сегрегации ParAB, мотивы dif, состоящие из сайтов связывания рекомбиназ XerC и XerD, участвующие в сегрегации реплицированных димеров. В ряде репликонов предсказаны новые регуляторные мотивы, образующие кластеры в области начала репликации.
В Bacteroides spp. описана новая система фазовой вариации, в которой выбор функционального транспортера из кассеты susCD происходит за счет инверсии фрагмента, расположенного в центре кассеты и содержащего промотор и 5’-терминальную область гена susC. Инвертируемый фрагмент содержит также ген рекомбиназы, а гены susC – сайты в кодирующей области, по которым происходит рекомбинация. Гены susCD, образующие локус, образуют несколько подсемейств, причем их состав быстро варьирует даже в близкородственных штаммах.
Создан вектор для суперпродукции транскрипционного фактора YihW (CsqR) из пробиотического штамма Escherichia coli Nissle 1917 (EcN) и подобраны оптимальные условия для его синтеза в гомологичной экспрессионной системе; разработан оптимизированный протокол очистки YihW. Это потребовало существенной молификации стандартных протоколов. YihW из E. coli Nissle 1917 и K-12 MG1655 образовывали высокомолекулярные комплексы со своими ДНК-мишенями, возможно, за счёт олигомеризации белков. SQ вызывала диссоциацию этих комплексов, подтверждая свое эффекторное действие. При 30°C YihW из Nissle 1917 взаимодействовал с yihU/V из родительского штамма и E. coli K-12 MG1655 с одинаковой эффективностью, но при 37°C связывание с фрагментом K-12 было сильнее. YihW из E. coli K-12 MG1655 связывал всю ДНК yihU/V при 16-кратном молярном избытке независимо от штамма, что позволяет предположить, что в Nissle 1917 YihW в меньшей степени участвует в регуляции yih-кассеты по сравнению с K-12, особенно при 37°C. Похожие эффекты наблюдались и для межгенного участка yihV/W. По-видимому, связывание регулятора с регуляторной областью собственного гена (авторегуляция) может быть изначально слабее или контролироваться более строго. Влияние SQ на диссоциацию комплекса между YihW из Nissle 1917 и обоими межгенными фрагментами родительского штамма было ниже, чем с фрагментами из K-12. В совокупности с результатами РНК-секвенирования, которое показало отсутствие активации yih-кассеты Nissle 1917 при росте в присутствии SQ, это позволяет предположить, что yih-кассета и YihW в Nissle 1917 могут выполнять иную функцию, нежели поддержание метаболизма сульфохиновозы.
Определены мотивы связывания MntR в альфа- и гамма-протеобактериях и в микобактериях. Новыми членами регулона являются оперон синтеза гликогена glgBXCAP в гамма-протеобактериях (Mn2+-зависимая регуляция синтеза гикогена была ранее описана у стрептококков), Mn2+-зависимая каталаза, транспортер CirA, оперон, кодирующий оксидазу и транспортер двухвалентных катионов, и ген с неизвестной функцией, кодирующий белок с доменами ферритин-редуктазы и связывания двухвалентных катионов.
В семействе CsoR определены три подсемейства, содержащие никель-кобальтовые регуляторы. Мотивы связывания факторов имеют характерную структуру с АТ-богатыми палиндромными флангами и GC-богатой серединой; большинство с типичным для семейства CsoR консенсусом ATA-N11-TAT. Определены гены, регулируемые этими факторами. Большинство членов регулонов — транспортеры ионов, причем как экспортеры, так и импортеры. Кроме того, в состав регулонов входят: никель-зависимые ферменты, в особенности участвующие в метаболизме азота (уреазы UreC, фактор связывания уреазы HypB, Ni-связывающие ГТФазы, субъединицы нитрогеназы NifC и NifD, цистеиновая десульфураза NifH); ферменты синтеза кобаламина (CobW, CbiX, GlcG/HbpS); S-аденозил-метионин-зависимые метилазы из различных семейств; металлоферменты (гидролазы, металлопептидазы); белки метаболизма железа и железо-серных кластеров; белки защиты от меди и хрома; факторы транскрипции (в т.ч. зависящие от железа, меди и цинка). Это указывает на глубокие связи систем гомеостаза различных металлов.
Исследованы полиморфизмы в промоторах и терминаторах Escherichia coli. Боксы в промоторах как сигма-70, так и других сигма-факторов (28, 32, 38) существенно консервативнее соседних позиций; большинство промоторов вообще не имело полиморфизмов в боксах. Показана консервативность терминаторов, как ро-независимых, так и ро-зависимых.
Публикации
1.
Белоусова Е., Моран-Товар Р., Кармакар М., Гельфанд М.С.
Conservation of non-consensus nucleotides in transcription factor binding sites
bioRxiv, препринт - bioRxiv (год публикации - 2025)
10.64898/2025.12.07.692868
2. Гельфанд М.С. Бактериальная геномика и метагеномика: на суше и на море Материалы VI (XIV) Международной ботанической конференции молодых ученых в Санкт-Петербурге 21-24 апреля 2025 года, Материалы VI (XIV) Международной ботанической конференции молодых ученых в Санкт-Петербурге 21-24 апреля 2025 года, стр. 7 (год публикации - 2025)
3. Шевченко А.Ю., Урсалов Г.И., Еромасова Н.И., Тутукина М.Н., Шелякин П.В., Гельфанд М.С., Абрамов А.А., Вишнивецкая Т.А., Ривкина Е.М. Метагеномы фумарол высокогорья и их метаболический потенциал Пятая всероссийская конференция по астробиологии. Пущино, 29-31 октября 2025 г., Пятая всероссийская конференция по астробиологии. Пущино, 29-31 октября 2025 г. (год публикации - 2025)
4.
Казнадзей А., Рыбина А., Тутукина М., Бессонова Т., Коршунов Д., Гельфанд М.С.
Sulfoquinovose catabolism in E. coli strains: compositional and functional divergence of yih gene cassettes
International Journal of Molecular Sciences (год публикации - 2025)
10.3390/ijms262110351
5.
Зиутис Ч., Лэнг М., Перейра Ф., Бочкарева О., Колодяжная Е., Осватич Й., МакКой К.Д., Кюнцель С., Фокт Х., Бейнес Дж.Ф., Берри Д.
Rapid genetic diversification of Bacteroides thetaiotaomicron in mono-associated mice revealed through deep population-level sequencing.
bioRxiv, препринт - bioRxiv (год публикации - 2025)
10.1101/2025.06.24.661302
6. Ашниев Г.А., Гельфанд М.С., Ашниев Г.А., Родионов Д.А. Гликанолитический потенциал кишечных Prevotella: in silico реконструкция метаболических путей деградации полисахаридов Генетика 2025. Научно-практическая конференция, Генетика 2025. Научно-практическая конференция. Стр. 222-224 (год публикации - 2025)
7. Ашниев Г.А., Гельфанд М.С., Ашниев Г.А., Родионов Д.А. Реконструкция метаболических путей деградации полисахаридов бактериями кишечника рода Prevotella 12-й Московская конференция по вычислительной молекулярной биологии МССМВ-2025 (Москва, 31.7-3.8.2025), 12-й Московская конференция по вычислительной молекулярной биологии МССМВ-2025 (Москва, 31.7-3.8.2025). Стр. 205-206 (год публикации - 2025)
8. Рыбина А., Гельфанд М. Evolution and diversification of the sulfo-Embden–Meyerhof-Parnas pathway in bacteria 12-й Московская конференция по вычислительной молекулярной биологии МССМВ-2025 (Москва, 31.7-3.8.2025), 12-й Московская конференция по вычислительной молекулярной биологии МССМВ-2025 (Москва, 31.7-3.8.2025). Стр. 559-560 (год публикации - 2025)
9. Григорашвили Е., Шилова А., Гельфанд М. Large-scale analysis of mechanisms shaping the evolution of T-box riboswitches in Gram-positive bacteria: duplications, horizontal gene transfer, and changes of specificity FEMS Micro. Milan, 14-17 July 2025, FEMS Micro. Milan, 14-17 July 2025. Стр. 1152. Abstract ID: 137. Poster Number: 274.16F (год публикации - 2025)
10. Бессонова Т. A., Колонский А.Е., Трубников Е.С., Коршунов Д.С., Дукат А.М., Гельфанд М.С., Тутукина М.Н. Очистка транскрипционного фактора YihW из пробиотического штамма E. coli Nissle 1917 с использованием аффинной хроматографии на спин-колонках Сорбционные и хроматографические процессы (год публикации - 2025)
11.
Гельфанд М.С.
Особенности геномов бактериальных симбионтов
Материалы Конгресса исследователей симбиотических систем 6-11 октября 2025 года, г. Москва, Материалы Конгресса исследователей симбиотических систем 6-11 октября 2025 года, г. Москва. Стр. 21 (год публикации - 2025)
10.61726/7635.2025.82.30.001