КАРТОЧКА
ПРОЕКТА ФУНДАМЕНТАЛЬНЫХ И ПОИСКОВЫХ НАУЧНЫХ ИССЛЕДОВАНИЙ,
ПОДДЕРЖАННОГО РОССИЙСКИМ НАУЧНЫМ ФОНДОМ
Информация подготовлена на основании данных из Информационно-аналитической системы РНФ, содержательная часть представлена в авторской редакции. Все права принадлежат авторам, использование или перепечатка материалов допустима только с предварительного согласия авторов.
ОБЩИЕ СВЕДЕНИЯ
Номер 20-15-00371
НазваниеВклад эпигенетических и молекулярно-генетических маркеров возраста в долгосрочный риск хронических заболеваний и смертности при старении в российской популяции
РуководительМалютина Софья Константиновна, Доктор медицинских наук
Организация финансирования, регион Федеральное государственное бюджетное научное учреждение "Федеральный исследовательский центр Институт цитологии и генетики Сибирского отделения Российской академии наук", Новосибирская обл
Период выполнения при поддержке РНФ | 2020 г. - 2022 г. | , продлен на 2023 - 2024. Карточка проекта продления (ссылка) |
Конкурс№45 - Конкурс 2020 года «Проведение фундаментальных научных исследований и поисковых научных исследований отдельными научными группами».
Область знания, основной код классификатора 05 - Фундаментальные исследования для медицины, 05-401 - Молекулярная и клеточная медицина
Ключевые словаСтарение, эпигенетика, метилирование ДНК, молекулярно-генетические маркеры возраста, длина теломер, количество копий митохондриальной ДНК, сердечно-сосудистые заболевания, инфаркт миокарда, рак, субклинические фенотипы, гнездовой случай-контроль, популяция
Код ГРНТИ76.03.00
СтатусУспешно завершен
ИНФОРМАЦИЯ ИЗ ЗАЯВКИ
Аннотация
Цель проекта. Проект направлен на формирование эпигенетической когорты путем оценки профиля метилирования ДНК с использованием высокопроизводительных технологий и изучение ассоциаций молекулярных маркеров возраста (паттерны метилирования ДНК, длина теломер лейкоцитов, количество копий митохондриальной ДНК) с долгосрочным риском хронических заболеваний и смертности на основе биобанка долгосрочного исследовании старения в Российской популяции.
Современная мировая популяция претерпевает глубокие демографические изменения, связанные с увеличением продолжительности жизни и старением населения. Этот феномен определяет глобальную проблему изучения механизмов старения. В многогранном процессе снижения здоровья человека с возрастом молекулярные маркеры «биологического» возраста рассматриваются в качестве ключевых детерминант индивидуальной скорости изменений. Исследования в этой области развиваются стремительно, что сопровождается формированием серии баз данных по геномным ресурсам старения человека (HAGR, GeroProtectors) и биомаркерам смертности (MortalityPredictors.org). Одновременно, полученные на сегодня результаты во многом неоднозначны, нуждаются в долгосрочных наблюдениях и репликации на независимых выборках в различных популяциях; в российской популяции подобные исследования практически отсутствуют и крайне актуальны.
В России пропорция пожилого населения продолжает быстро увеличиваться, ожидаемая продолжительность жизни (ОПЖ) при рождении составила 72, 9 лет по данным 2019 (по сравнению с 68,8 в 2009, 10 лет назад), Росстат, 2019. В то же время, ожидаемая продолжительность жизни при рождении остается в среднем на 8 лет ниже по сравнению с Европой, и более короткая ОПЖ в России сохраняется и в старших возрастах. Таким образом, направленность проекта на научную проблему механизмов старения теоретически мотивирована. И имеется востребованность и особая актуальность исследования всех аспектов старения на материале долгосрочного наблюдения в российской популяции.
Основные задачи предложенного проекта:
1.Сформировать российскую эпигенетическую когорту путем оценки профиля метилирования ДНК в специфических сайтах на базе существующей крупной популяционной когорте. Помимо профиля метилирования ДНК батарея изучаемых молекулярных маркеров возраста будет включать длину теломер лейкоцитов и количество копий митохондриальной ДНК. Размер субкогорты для молекулярных исследований составит от 700 до 2000 в зависимости от типа маркера.
2. По данным метилирования ДНК (полученным на платформе Illumina; EPIC850k Beadchip) сгенерировать Pipeline, используя биоинформатические подходы контроля качества и фильтрации данных, для анализа с помощью алгоритмов машинного обучения. В анализе будут применены подходы моделирования, полногеномного эпигенетического ассоциативного исследования (EWAS), валидизация на ‘тестовом наборе’.
3. Сформировать интегративную базу данных исходов долгосрочного наблюдения популяционной когорты с 2003 до 2019 путем проспективной регистрации основных сердечно-сосудистых заболеваний (инфаркт миокарда в данном проекте), рака и смертности от всех причин и скомбинировать с данными трех индивидуальных серийных обследований (2003-05, 2006-08 и 2015-17) в когорте из 9360 мужчин и женщин с базовым возрастом 45-69 лет и проспективным возрастом 60-84 лет.
4. Проанализировать ассоциации между специфическими молекулярными маркерами возраста и в среднем 15-летним риском сердечно-сосудистых заболеваний (инфаркта миокарда), распространенного типа рака (колоректального) и смертности от всех причин по дизайну «гнездовой случай–контроль» в мультивариантном анализе дожития, включая Cox-регрессию.
5. Исследовать связи между молекулярными маркерами и рядом биологических и поведенческих факторов и промежуточных фенотипов, потенциально модифицирующих риск развития изучаемых клинических исходов.
6. Сформировать банк ‘больших данных’, который может служить основой развития дальнейшего прогностического анализа возраст-зависимых заболеваний с использованием искусственных нейронных сетей.
7. В прикладном аспекте определить направления использования полученных знаний для прогнозирования нарушения здоровья при старении как компонента персонализированного вмешательства в профилактике хронических заболеваний.
8. Использовать полученные данные для интеграции с международными консорциумами, фокусирующимися на исследованиях старения.
Методологически проект планируется по дизайну гнездовой случай- контроль на базе существующей крупной популяционной когорты мужчин и женщин (Новосибирск). Когорта была обследована трижды (исходно в 2003-2005, 45-69 лет, n=9360 чел., в 2006-2008, n=6147 и в 2015-2017, n=3898). В заявленном проекте будут сформированы три группы новых «случаев»: i) инфаркт миокарда (как надежно идентифицированная категория ССЗ); ii) колоректальный рак (как распространенный тип); iii) случаи смерти от всех причин (исключая внешние причины) и единая субкогорта «контроль» (из числа участников, которые живы на дату цензурирования и не имеют истории ИМ или рака), стратифицированная по возрасту и полу.
Лабораторный анализ будет включать следующие молекулярные маркеры биологического возраста: профиль метилирования ДНК (DNAm); длина хромосомных теломер лейкоцитов (LTL); количество копий митохондриальной ДНК (mtDNA). Объем выборок составит 700 человек для эпигенетических маркеров (150 случаев ИМ, 150 случаев рака, 200 случаев смерти и 200 человек в контроле) с увеличением групп до 2000 человек суммарно для генетических маркеров.
В качестве основных аналитических инструментов будут использованы биоинформатические подходы и мультивариантный анализ дожития (включая Cox регрессию) для оценки вклада молекулярных маркеров в 15-летний риск развития изучаемых хронических заболеваний и смерти. В биоиформатическом подходе для формирования Pipeline мы будем использовать библиотеку с открытым кодом ChAMP; в анализе будут применены индуцированное данными моделирование, полноэпигеномный анализ, рассчитан эпигенетический возраст, проанализирован эффект клеточного состава и проведена валидизация в ‘тестовом наборе’. В статистический анализ будут также включаться биологические, поведенческие факторы и структурно-функциональные биоимиджинговые фенотипы как ковариаты и суррогатные конечные точки.
Новизна исследования определяется следующими аспектами:
- впервые будет сформирована эпигенетическая российская когорта; долгосрочный когорный дизайн рассматривается на сегодня как приоритетный подход в эпигенетических исследованиях, таких работ мало на мировом уровне и нет в российской популяции;
- исследование вклада эпигенетических (паттернов метилирования ДНК) и молекулярно-генетических маркеров биологического возраста в долгосрочный (15 лет) риск основных возраст-зависимых хронических заболеваний (ССЗ, рак) и смертности предоставят новые, приоритетные на мировом уровне знания по механизмам их развития при старении;
- популяционная специфичность распределения и возрастного градиента ключевых эпигенетических и молекулярно-генетических маркеров биологического возраста в российской когорте определяет самостоятельную новизну исследования;
- проект сможет оценить динамику молекулярных маркеров биологического возраста в серийных измерениях (период наблюдения 12 лет), которая исследована крайне мало даже в международном контексте, и ее оценка обеспечит получение принципиально новых данных для понимания механизмов старения;
- идентификация риск-модифицирующих факторов имеет фундаментальную научную новизну в отношении механизмов ранних стадий возраст-зависимых заболеваний и прикладное значение по профилактике развития и осложнений хронических заболеваний;
- проект сформирует новый банк ‘больших данных’, который может служить основой прогностического анализа возраст-зависимых заболеваний c использованием искусственных нейронных сетей.
Планируемые в проекте данные перспективны, в научном отношении, для интеграции с аналогичными исследованиями по фундаментальной проблеме механизмов старения. В прикладном отношении, данные проекта могут быть использованы для прогнозирования нарушения здоровья, как компонента персонализированного вмешательства для профилактики хронических заболеваний в российской популяции.
Ожидаемые результаты
В заявленном проекте будет сформирована российская эпигенетическая когорта путем оценки профиля метилирования ДНК на материале биобанка существующей популяционной когорты. Помимо профиля метилирования ДНК (DNAm) батарея изучаемых биомаркеров возраста будет также включать длину теломер лейкоцитов (LTL) и количество копий митохондриальной ДНК (mtDNA).
Будет построена база данных исходов за 15-летний период наблюдения в когорте, включая ССЗ, рак и смертность от всех причин, и скомбинирована с данными трех серийных обследований (базовое обследование в 2003-2005, 9360 мужчин и женщин 45-69 лет).
Эти комплексные данные, интегрированные в одну базу, позволят проанализировать в дизайне «гнездовой случай–контроль» (на отобранных группах) ассоциации молекулярных маркеров возраста с 15-летним риском инфаркта миокарда, колоректального рака и смертности для российской популяции, отличной от популяций, изученных по проблеме.
- Ожидается, что на основе биоинформатического анализа DNAm (включая дифференциальное метилирование ДНК, эпигенетический возраст и полноэпигеномный подход), будет идентифицирован пул локусов и регионов ДНК, ассоциированных с исходами, и определены специфические эпигенетические паттерны, связанные с изучаемыми заболеваниями и смертностью. Также ожидается, что проспективный анализ идентифицирует ассоциации ускорения эпигенетического возраста с риском обоих хронических заболеваний и смертности, независимые от хронологического возраста и других факторов.
- Ожидается, что исследование выявит ассоциации LTL и количество копий mtDNA с риском смертности. В отношении риска специфических заболеваний (ССЗ и рака) оценки могут быть разнонаправлены и могут различаться для типов исхода и маркеров.
- Мы ожидаем выявить популяционную специфичность для эпигенетических паттернов DNAm, связанных с изучаемыми исходами, и для коэффициентов вклада генетических маркеров в риски. Это расширит данные, накопленные по молекулярным маркерам возраста в мировых исследованиях, послужит устранению ряда неоднозначностей и будет иметь научную значимость.
- Мы также ожидаем выявить взаимосвязи изучаемых биомаркеров возраста, что может дать новые данные в отношении потенциального механизма влияния mtDNA на регуляцию экспрессии генов через модификацию метилирования ДНК; эти результаты будут иметь концептуальное научное значение.
- Ожидается, что проект сможет идентифицировать вклад ряда факторов, модифицирующих связи между молекулярными маркерами и развитием промежуточных фенотипов и исходов (риск-модифицирующий эффект). В частности, учитывая особенности профиля факторов риска в российской популяции, ожидается выявить стратификацию риска в зависимости от курения, накопления метаболических факторов и субклинического сосудистого поражения (для ИМ). Идентификация «модификаторов» риска внесет вклад в выяснение патогенетических механизмов старения.
- Проект создаст банк ‘больших данных’, который может служить основой развития прогностического анализа возраст-зависимых заболеваний на основе искусственных нейронных сетей, что имеет самостоятельное фундаментальное значение.
- В практическом отношении, данные проекта могут быть использованы для прогнозирования нарушения здоровья при старении, как компонента персонализированного вмешательства для профилактики хронических заболеваний в российской популяции.
- Накопленные биобанк и фенотипическая база перспективны для дальнейшей интеграции в области механизмов старения, эпидемиологии и популяционной генетики для углубления сотрудничества в стартовом международном проекте (Детерминанты ССЗ в Восточной Европе) и в более крупных консорциумах.
В целом, ожидаемые результаты представят новые научные данные и расширение теоретических знаний по фундаментальной проблеме механизмов старения. Научный уровень работы и ожидаемые результаты соответствует передовым мировым стандартам.
ОТЧЁТНЫЕ МАТЕРИАЛЫ
Аннотация результатов, полученных в 2020 году
Проект направлен на формирование эпигенетической когорты путем оценки профиля метилирования ДНК и изучение ассоциаций молекулярных маркеров возраста с долгосрочным риском хронических заболеваний и смертности на основе биобанка долгосрочного исследовании старения в Российской популяции.
Отчетный период посвящен сбору конечных точек в популяционной когорте (ССЗ, рак, сахарный диабет, смертность) с продолжением периода наблюдения до 14 лет; формированию трех групп «случаев» в рамках дизайна гнездовой случай-контроль: 1)инфаркт миокарда (ИМ), 2) колоректальный рак (КРР) и 3) смерть от всех причин, исключая внешние причины, и единой субкогорты контроля; расширению базы данных конечных точек и интеграции с данными базового обследования когорты и проспективными промежуточными фенотипами; подготовке биологического материала для молекулярных исследований; анализу метилирования ДНК (DNAm) и биоинформатической обработке с контролем качества данных метилирования в пилотных группах; выполнению молекулярно-генетических анализов длины теломер лейкоцитов (LTL) и количество копий митохондриальной ДНК (mtDNA) в группах случай и контроль.
Проект выполняется на материале популяционной когорты, в которой выполнено три серийных обследования: базовый скрининг (2003-2005, n=9360, исходный возраст 45-69 лет) и повторные обследования в 2006-2008 и в 2015-2017гг. В когорте проводится долгосрочное наблюдение и сбор конечных точек (ССЗ, рака, сахарного диабета и смертности) и собран биобанк. В отчетный период проведен сбор конечных точек случаев ИМ и смерти по 2018 год и случаев злокачественных новообразований по 2019 год, период наблюдения на сегодня 14 лет.
Для целей проекта сформированы три группы «новых (incident) случаев» и группа контроля по дизайну гнездовой случай-контроль. Случай 1 - новый ИМ без предшествующей истории ССЗ; случай 2 - колоректальный рак без предшествующей истории рака; случай 3 - смерть от всех причин (исключая внешние причины) при отсутствии истории ССЗ и рака. Из субкогорты контроля (участники живы на дату цензурирования, не имеют новых случаев ССЗ и рака, не имеют истории ССЗ и рака) отобран «случайный контроль».
Для эпигенетических анализов на текущем этапе селектированы “эпи-подгруппы” случай 1 и контроль для обеспечения объема случай1, n=150 и контроль n=200 и подготовлен биологический материал для анализов метилирования ДНК (DNAm). Проведены биоинформатическая обработка данных метилирования в пилотных группах: препроцессинг, контроль качества данных DNAm и анализ батч-эффектов. Выполнен фрагмент анализов молекулярно-генетических маркеров LTL и количества копий mtDNA в группах случай-контроль. Проспективная база данных дополнена новыми событиями и данными биомаркеров и гармонизирована с данными базового и серийных обследований когорты и проспективными данными промежуточных субклинических фенотипов.
Регистрация новых событий в когорте. Формирование групп случай-контроль.
За 14-летний период наблюдения в когорте зарегистрировано 2485 смертей (25,6% когорты), из них 2021 с известными причинами смерти (МКБ-10). Среди причин смерти более половины приходились на долю ССЗ (57%), в том числе 35% на долю ИБС и около 10% на долю мозгового инсульта; около одной четвертой части фатальных исходов приходились на долю злокачественных новообразований (ЗНО) (24%). В структуре причин смертности доля ССЗ и ЗНО согласуется с обобщенными за последнюю декаду данными статистики в российской популяции для близкого возраста [Росстат, 2019; Демоскоп 2019]. Доля смертности от ССЗ несколько выше, а доля ЗНО близка к обобщенными Европейским данным [OECD/European Union, 2018].
соответствует обобщенным данным статистики в российской популяции [Росстат, 2019]. В рамках сплошной регистрации новых событий в когорте за 14 лет наблюдения по дизайну гнездовой случай-контроль отобраны три группы новых случаев: ИМ (277 чел.), колоректальный рак (154 чел.), смерть от всех причин кроме внешних (1478) и группа случайного контроля (1039 чел.). Объем групп соответствует ожидаемому и информативен для дальнейшего анализа.
Профиль факторов риска в группах случай-контроль.
ПО результатам оценки профиля факторов риска хронических заболеваний в группе ИМ участники были старше, имели более высокие уровни факторов риска ССЗ (АД, липиды, ИМТ, курение, потребление алкоголя) и частоту АГ и СД, ниже уровень образования по сравнению со «случайным» контролем. В группе КРР участники были старше, мало отличались по уровням большинства конвенционных факторов риска ССЗ, но имели выше показатели абдоминального ожирения, частоту АГ, СД, ССЗ и ниже уровень образования по сравнению со контролем. В группе смерти от всех причин (кроме внешних) участники были старше, имели более высокие уровни ряда факторов риска ССЗ (АД, курение, алкоголь), мало отличались по уровням других факторов (липиды крови, ИМТ), имели выше показатели абдоминального ожирения, АГ, СД и ССЗ, ниже уровень образования и чаще статус одиноких по сравнению с контролем. Специфические паттерны профиля факторов риска в группах ИМ, КРР и смерти от всех причин обосновывают на следующем этапе анализа стратификацию контроля по возрасту, полу, социальным параметрам и определяют набор ковариат для мультивариантного анализа ассоциаций молекулярных маркеров в анализе дожития. Прогностическое значение базовых конвенционных и социальных факторов риска, идентифицированных в группах «случаев», отражено в публикациях [Tillmann T. et al., 2020; Симонова Г.И. и соавт., 2020].
Биоинформатическая обработка данных метилирования ДНК в пилотной группе.
В пилотной выборке когорты с двукратным обследованием участников (точка1 n=96; точка 2 n=93) выполнена биоинформатическая обработка, включая препроцессинг, контроль качества (КК) данных метилирования ДНК в двух точках и фильтрацию данных. Использовали множественные метрики КК, рекомендованные Illumina (p-value значимости сигнала, количество ячеек, из которых получен сигнал и др). и сгенерировали серию стандартных графиков КК (графики плотности, графики плотности точек, изображение minfi КК).
По результатам КК в первой точке 1) два образца имели нехарактерный (не бинормальный) график плотности, большую фракцию (8.8% и 33.4% на образец) неудовлетворительных p-value сигнала и неудачные контрольные метрики Illumina, такие как бисульфитная конверсия, гибридизация и др. 2) 16 образцов имели неудачную метрику гибридизации и два были "неудовлетворительными" по метрике minfi КК. 3) в 1 образце получено несоответствие между фактическим пола и полом по данным DNAm. По результатам КК во второй точке для трех образцов выявлено несоответствие пола между фактическим и по данным DNAm. В проверке парного соответствия образцов (matching) с использованием набора 59 однонуклеотидных полиморфизмов (SNP) чипа EPIC сравнение зиготности выявило 9 непарных образцов. По результатам КК (после исключений) для дальнейшего анализа итоговые наборы включили 88 для первой точки и 85 образцов для второй точки.
Дальнейшим шагом КК выполнена фильтрация данных низкого качества зондов для CpG сайтов по критериям: -value значимости сигнала выше 0,01 в более чем 5% образцов; количество ячеек с сигналом, ниже 3 в более чем 5% образцов; нечитаемые CpG (NA).
Фильтрация данных. Чтобы уменьшить нежелательные сигналы и ложное обнаружение, из анализа исключили данные половых-хромосом; зонды, не являющихся CpG; известные SNP с неуникальным картированием [Zhou et al., 2017]. Всего для дальнейшего анализа было принято 733759 CpG для первой точки w1 и 742,087 CpG для второй точки w3 (из 865918, заявленных протоколом Illumina EPIC).
Предварительные исследовательские оценки. Для обнаружения технических батч-эффектов был применен анализ суррогатных переменных (SVA) [Jeffrey et al., 2012]. Метод основан на разложении данных по главным компонентам (PC) и поиске их ассоциаций с клиническими данными, что позволяет выявить источники вариабильности данных и сделать поправки на нежелательные технические составляющие сигналов, не касаясь биологических составляющих. Сгенерированные в нашем пилоте SVA диаграммы выявили ассоциацию первых главных компонент с техническими показателями платформы Illumina EPIC BeadChip. Эти ассоциации были успешно скорректированы в исследуемой выборке (коррекция батч-эффекта) с помощью метода ComBat [Johnson et al., 2007], реализованного в библиотеке ChAMP [Tian et al, 2017].
В целом, результаты КК данных DNAm в пилотной выборке из исследуемой когорты показали хорошее качество отфильтрованного DNAm, что имеет решающее значение для проведения дальнейшего эпигенетического анализа.
Эпигенетический возраст и связь с сосудистыми фенотипами.
На материале пилотной группы оценены связи эпигенетического возраста на основе анализа метилирования ДНК [Horvath S. et al. 2013] с хронологическим возрастом и сосудистыми фенотипами (маркером сосудистого возраста). Анализ профиля метилирования ДНК выполнен в пилотной группе n=94 (Illumina, EPIC850k Beadchip). Эпигенетический возраст имел сильную корреляцию с хронологическим возрастом во всем возрастном диапазоне (r=0,58, p<0.001); EA был выше хронологического, ускорение EA по сравнению с хронологическим возрастом уменьшалось при старении.
Оценены связи базового эпигенетического возраста с субклиническими сосудистыми фенотипами (толщина интимы-медии сонных артерий, ТИМ, ее среднегодовые темпы прироста за период наблюдения, наличие атеросклеротических бляшек, АСБ), измеренными в базовой точке и проспективно (94 чел. 81 с серийными сосудистыми измерениями). В пилотной выборке не выявлено корреляций между показателем исходного эпигенетического возраста (EA1) и исходной ТИМ1, проспективной ТИМ3, скоростью прироста каротидной ТИМ в год и наличием АСБ. Следующим этапом использовали подход с выделением крайней фенотипической выраженности возраст-зависимых параметров и создали дихотомизированную переменную прогрессии ТИМ (прирост выше среднего инкремента за 12-лет). В мультивариантной логистической регрессии прогрессия ТИМ регистрировалась достоверно чаще в IV квартили EA независимо от других факторов (p=0,041). Результаты согласуются с единичным опубликованным аналогичным результатом [Roetker NS et al.,2018 ARIС]. В целом, полученные данные подтверждают ускорение эпигенетического возраста по сравнению с хронологическим. Результаты позволяют предполагать, что акселерация исходного эпигенетического возраста независимо от прочих факторов достоверно ассоциируется с более выраженным прогрессированием атеросклероза. Результаты представлены на Европейском Конгрессе по Атеросклерозу, 88th EAS, 2020 [Ryabikov A.N., et al., Atherosclerosis, 2020; Suppl. in press].
Длина теломер лейкоцитов, количество копий митохондриальной ДНК и развитие ИМ и смерти за 14 лет наблюдения.
Проведены предварительные оценки связей длины теломер лейкоцитов (LTL) и количества копий митохондриальной ДНК (mtDNA) в базовой точке, с развитием ИМ и смертностью в течение 14 лет. По результатам серии моделей ANOVA исходная длина LTL была на 30% короче в группе новых случаев ИМ, развившихся за 14 лет, по сравнению с контролем и обратная связь LTL и долгосрочной вероятностью развития ИМ сохранялась независимо от других факторов (p<0.001). Исходная длина LTL была на 10% короче в группе смерти от всех причин за 14 лет по сравнению с контролем; обратная ассоциация LTL с вероятностью фатальных событий сохраняла значимость в условиях мультивариантной стандартизации (p<0.001). Мы не выявили обратной связи количества копий mtDNA с развитием новых случаев ИМ и не выявили существенных различий количества копий mtDNA в группе смерти от всех причин за 14 лет по сравнению с контролем (p=0, 318). Обнаруженные обратные ассоциации LTL c смертностью были ожидаемы и соотвествуют результатам недавнего мета-анализ [Mons U., et al., 2017] на 2х крупных когортах из Европы и США (ESTER; Nurses’ Health Study), где авторы подтвердили отрицательную связь LTL с риском общей смертности (OR=1.23; для 1-квинтили LTL против 5-й). В другом мета-анализе [Wang Q., et al, 2018] на 25 когортах авторы получили небольшое достоверное увеличение риска HR=1.09 на декремент 1SD LTL и увеличение на 26% в 1 квартили LTL. В нашем раннем анализе с когортным дизайном и меньшим периодом наблюдения (12 лет) также были обнаружены связи LTL с увеличением риска смертности от всех причин на 42% [Stefler D. et al., 2018]. В отношении связи LTL с риском ССЗ и ИМ оценки более противоречивы и дают примерно равное количество положительных и отрицательных результатов. Так в предшествующем анализе мы не обнаружили достоверной ассоциации LTL с риском объединенных фатальных и нефатальных ССЗ или ИБС [Stefler D. et al., 2018]. В то же время, в Менделевской рандомизации [Scheller M.A., et al., 2016] определены генетические детерминанты одновременно связанные и с LTL и с атеросклеротическими ССЗ, что предполагает каузативную роль LTL с малым эффектом. Выявленные в текущем проекте отрицательные связи LTL с ИМ согласуются с этими данными и будут проверены на полном объеме генотипирования в проекте. Необнаружение в предварительном анализе связи количества копий mtDNA со смертностью и противоположные ожидаемым отношения с ИМ - отличаются от данных литературы. Так, в недавнем исследовании трех когорт (ARIC, MESA, CHS) показана обратная ассоциация mtDNA с ИБС, МИ и ССЗ с эксцесс-риском от 11 до 29% на 1 SD снижения копий mtDNA [Ashar F.N., et al., 2017]. В когорте ARIC за 20.4 лет наблюдения обнаружили увеличение риска внезапной сердечной смерти с OR=2.24 в 1 квинтили против 5-й квинтили распределения количества копий mtDNA [Zhang Y., et al., 2017]. Отсутствие связей, по-видимому, связано с небольшим стартовым объемом генотипирования и требует проверки в полном анализе. Предварительные оценки позволили спланировать мультивариантные подходы для развернутого анализа молекулярно-генетических маркеров в дизайне проекта.
В отчетном периоде результаты доложены на Научной конференция с международным участием "Фундаментальные исследования в эндокринологии: современная стратегия развития и технологии персонализированной медицины", Новосибирск, 26-27 ноября 2020 и Европейском Конгрессе по Атеросклерозу (88th EAS Congress, Virtual Congress, 04-07 October, 2020). Результаты опубликованы в 5 статьях и 2 публикации находятся в печати. Проведены два семинара по темам: 1) подходы к селекции групп в исследованиях случай-контроль; 2) препроцессинг и контроль качества данных метилирования ДНК и проведена серия рабочих совещаний on-line.
Публикации
1. Диреев А.О., Мунц И.В., Маздорова Е.В., Рябиков А.Н., Малютина С.К. Возраст-зависимые характеристики сосудов сетчатки при старении (обзор литературы) Успехи геронтологии, - (год публикации - 2020)
2. Мазуренко Е.С., Рымар О.Д., Щербакова Л.В., Маздорова Е.В., Малютина С.К. The Risk of Osteoporotic Forearm Fractures in Postmenopausal Women in a Siberian Population Sample J Pers Med, - Jul 2020; 10(3): P.E77 (год публикации - 2020) https://doi.org/10.3390/jpm10030077
3. Симонова Г.И., Мустафина С.В., Рымар О.Д., Щербакова Л.В., Никитенко Т.М., Бобак М., Малютина С.К. Метаболический синдром, риск общей и сердечно-сосудистой смертности по данным четырнадцатилетнего проспективного когортного исследования в Сибири Российский кардиологический журнал, - 2020; 25(6): С.86-94 (год публикации - 2020) https://doi.org/10.15829/1560‑4071‑2020‑3821
4. Стефлер Д., Бретт Д., Саркади-Надь Э., Копчинская Э., Детчев С., Бати А., Скроб М., Коенкер Д., Алексов Б., Дуарин Э., Симонова Г.И., Малютина С.К., Кубинова Р., Паяк А., Руис М., Пизи А., Пихарт Х., Бобак М. Traditional Eastern European diet and mortality: prospective evidence from the HAPIEE study Eur J Nutr, 60, 1091-1100 (2021) (год публикации - 2020) https://doi.org/10.1007/s00394-020-02319-9
5. Тиллманн Т., Лалл К., Дьюкс О., Веронези Г., Пихарт Х., Пизи А., Кубинова Р., Козела М., Паяк А., Никитин Ю.П., Малютина С.К., Мецпалу А., Эско Т., Фишер К., Кивимаки М., Бобак М. Development and validation of two SCOREbased cardiovascular risk predictionmodels for Eastern Europe: amulticohort study European Heart Journal, Eur Heart J - Sep 2020; 41(35): P.3325-3333 (год публикации - 2020) https://doi.org/10.1093/eurheartj/ehaa571
6. - Маркеры возрастных изменений (Батухтин Г.В.) Портал «Академгородок», 17.07.2020 [Электронный ресурс] (год публикации - )
7. - Учёные изучают вклад генетических факторов в болезни пожилых людей (Батухтин Г.В.) Новости сибирской науки, 16.07.2020 [Электронный ресурс] (год публикации - )
8. - Ученые 20 лет наблюдают, как стареют и чем болеют люди (Батухтин Г.В.) Навигатор, 19.07.2020 [Электронный ресурс] (год публикации - )
9. - Ученые изучают вклад генетических факторов в болезни пожилых людей (Батухтин Г.В.) Поиск, 16.07.2020 [Электронный ресурс] (год публикации - )
10. - Ученые изучают вклад генетических факторов в болезни пожилых людей (Батухтин Г.В.) Пресс-служба ФИЦ ИЦиГ СО РАН, 17.07.2020 [Электронный ресурс] (год публикации - )
Аннотация результатов, полученных в 2021 году
Проект направлен на формирование эпигенетической когорты путем оценки профиля метилирования ДНК и изучение ассоциаций молекулярных маркеров возраста с долгосрочным риском хронических заболеваний и смертности на основе биобанка исследовании старения в Российской популяции. Проект выполняется на материале популяционной когорты, в которой проведено три серийных обследования: базовый скрининг (2003-2005, n=9360, исходный возраст 45-69 лет) и повторные обследования в 2006-2008 и в 2015-2017гг. В когорте проводится долгосрочное наблюдение и сбор конечных точек (ССЗ, рака, сахарного диабета и смертности) и собран биобанк.
Отчетный период был посвящен завершению сбору конечных точек в когорте по 2019 с достижением периода наблюдения 15 лет; дополнению группы случай-1 (инфаркт миокарда) и формированию группы случай-3 (смерть от всех причин, исключая внешние) в рамках дизайна гнездовой случай-контроль; интеграции базы данных конечных точек с данными базового обследования когорты и проспективными промежуточными фенотипами; анализу метилирования ДНК (DNAm) в полных группах случай-1 (инфаркт миокарда, ИМ), стратифицированный по полу и возрасту контроль и частично случай-2 (колоректальный рак, КРР и биоинформатической обработке с контролем качества данных метилирования; выполнению молекулярно-генетических анализов длины теломер лейкоцитов (LTL) и количества копий митохондриальной ДНК (mtDNA) в группах случай-1, случай-2 и контроль.
В отчетный период полностью сформированы три группы «новых (incident) случаев» и группа контроля. Группа случай-1 - новый ИМ без предшествующей истории основных ССЗ (n=280). Группа случай-2 - КРР без предшествующей истории рака любой локализации (n=154). Cтратифицированная по полу и возрасту группа смерти от всех причин, исключая внешние причины и без истории ССЗ и рака, случай-3 (n=800). Субкогорта контроля сформирована из числа участников, которые живы на дату цензурирования (31.12.2019) и не имеют истории ССЗ и рака; из субкогорты сформирована стратифицированная по полу и возрасту «рабочая группа контроля» (n=800).
Для эпигенетических анализов селектированы меньшие группы; на текущем этапе с учетом доступности и качества ДНК и прохождения контроля качества метилирования фактические эпигинетические группы составили: ИМ/ОКС - 129 образцов, контроль – 177 образцов, КРР – 123 образца, группа смерти – 200 образцов. В отчетном году выполнен анализ метилирования ДНК в полном объеме в группах случай-1 и контроль и 20% части случай-2. Проведена биоинформатическая обработка данных метилирования в этих группах: препроцессинг, контроль качества данных DNAm, анализ батч-эффектов и фильтрация данных; после фильтрации данных мы рассчитали эпигенетический возрасти провели EWAS. Выполнены анализы молекулярно-генетических маркеров LTL и количества копий mtDNA в группах случай-1, случай-2 и контроль. Проспективная база данных дополнена новыми событиями и данными биомаркеров и гармонизирована с данными обследований когорты и проспективными данными субклинических фенотипов.
Контроль качества метилирования ДНК в группах инфаркта миокарда/острого коронарного синдрома и контроле.
Необработанные данные содержат файлы idat с профилями метилирования ДНК для 326 образцов цельной крови. Для обработки данных мы использовали R версии 4.1.0 вместе со специализированными библиотеками minfi [Aryee et al., 2014], ENmix [Xu et al., 2016], ChAMP [Morris et al., 2014; Tian et al., 2017]. Все изображения были созданы с использованием библиотеки ggplot2 R с различными расширениями.
Процесс контроля качества (КК) осуществлялся в два этапа:
1 этап - идентификация образцов низкого качества. Процедура включала следующие проверки: сопоставление пола, установленного на основе данных DNAm с имеющимися клиническими данными пола участников; определение p-value детекции и идентификация образцов с более чем 1% CpG низкого качества (p-value > 0,01); определение количества ячеек, из которых получен сигнал, и идентификация образцов с более чем 1% низкокачественных CpG (количество ячеек < 3); метрики КК и изображения на основе трех инструментов (ChAMP, ENmix and minfi). На основе проверок 1 шага КК 20 образцов были сключены как образцы низкого качества, в анализе присутствуют 306 образцов (случай1=129, контроль=177).
2 этап - фильтрация низкокачественных зондов. После исключения образцов с низким качеством была выполнена повторная обработка (reprocess) сырых данных для 306 образцов и выполнена нормализация данных с использованием noob метода (библиотека minfi). После нормализации была извлечена матрица β-значения метиляции. Для каждого образца перед фильтрацией имеются данные для 866238 CpG.
Фильтрация зондов включала: фильтрацию зондов с p-value детекции > 0,01; зондов без CG, чтобы сохранить только CpG; зондов с известными SFP [Zhou et al., 2017]; зондов, связанных с множественными локациями [Nordlund et al., 2013]; зондов из X и Y хромосом. После всей фильтрации включено 712539 зондов. Применена постфильтрационная нормализация с использованием метода BMIQ [Teschendorff et al., 2013] и следуя результатам, описанным в [Liu & Siegmund, 2016]. Были построены графики плотности для 306 образцов после нормализации noob, фильтрации зондов и дальнейшей нормализации BMIQ, которые продемонстрировали улучшение качества данных по сравнению с необработанными.
Анализ связей эпигенетического возраста с развитием ИМ/ОКС .
На отчетном этапе проанализированы связи «эпигенетического возраста» с развитием новых случаев ИМ/ОКС. По данным DNAm был рассчитан базовый эпигенетический возраст (ЕА) на основе 4-х калькуляторов (Horvath, Hannum, PhenoAge, Skin and Blood DNAm clocks) и ускорение эпигенетического возраста как разницу между EA и хронологическим возрастом (СА) (ΔDAHr, ΔAHn, ΔAPh, ΔASB).
В логистической регрессии оценивали отношение шансов (OR) развития нового случая ИМ/ОКС в терцилях ускорения базового EA для 4-х калькуляторов в стандартизованной по возрасту и полу и мультивариантных моделях (референсная терциль1 ускорения EA). Стандартизованные по возрасту и полу OR ИМ/ОКС для терциля 3 против тертиля 1 ΔAHr и ΔAHn составили 1,14 (95%CI 0,59–2,22) и 1,26 (0,61–2,60). Для ΔAPh OR составляли 2,09 (1,11–3,94) независимо от возраста и 1,84 (0,99–3,52) независимо от возраста и пола; эта связь частично объяснялась курением и метаболическими факторами.
Наши результаты для PhenoAge соответствуют связям ускорения EA с риском ССЗ или ИБС, показанным в когортах NAS и KORA F4 [Wang C., et al, 2021], исследованиях Lu A.T. et al., 2019; Levine MB, et al., 2018 и недавнем мета-анализе [Oblack et al., 2021]. Показатели OR для ИМ/ОКС в верхнем трециле по сравнению с нижним трецилем EAA (по Horvath, Hannum) варьировали между 1,2-1,5 и были близки по величине показателям в крупных исследованиях ARIC [Roetker, N.S, 2018] и ESTHER [Perna, L., et al., 2016], но были статистически незначимы в нашей выборке. Индекс шансов ИМ (по PhenoAge) снижался при стандартизации по курению и метаболическим факторам. Влияние метаболических факторов на связь эпигенетического возраста с риском ССЗ поддерживается рядом работ [Horvath, S.; 2014; Lu A.T. et al., 2019; Oblack et al., 2021; Ryan, J. 2020].
В целом, в этом исследовании гнездовой случай-контроль мы обнаружили пограничную связь между ускорением эпигенетического возраста и риском ИМ/ОКС. Предварительные результаты анализа были доложены на ESC Congress 2021 (Malyutina S. at al., Eur Heart J) и после доработки подготовлена статья (J Personalized Medicine 2021, Q1, на рецензировании).
Полноэпигеномный анализ (EWAS) с идентификацией дифференциально метилированных позиций в группах ИМ/ОКС и контроля.
Проведены эпигеномные ассоциативные исследования (EWAS) для выявления дифференциально метилированных позиций (DMPs), связанных со статусом случай1-контроль. Использовали 4 линейные модели со смешанными эффектами как инструменты алгоритмов машинного обучения для комплексных данных. Это позволило скорректировать техническую вариабельность данных.
Оценивали β-значения метилирования в отношении статуса случай1-контроль. Рассчитали коэффициент геномной инфляции λ для каждой модели в качестве индикатора смещения и инфляции в EWAS [van Iterson M., 2017; Guintivano J. et al., 2020]. Учет технической вариабельности привел к снижению коэффициента инфляции λ с 1,49 до 1,05, что согласуется с ожидаемыми результатами EWAS, который идентифицирует потенциальные прогностические молекулярные маркеры по данным «жидкой биопсии» (крови).
Порог значимости для CpG для дальнейшего анализа был выбран 0,001. Результаты идентифицировали 399 DMPs с отрезной точкой по отношению к Δβ (разница в среднем метилировании между случаями и контролем). Картирование этих локусов в геноме показало 157 CpG в межгенных областях и 241 CpG, связанных с известными генами (252 уникальных гена). Обработка списка из 252 генов с помощью базы данных Reactome показала, что наборы из 79 и 53 генов участвуют в путях, связанных с заболеваниями и метаболическими нарушениями (включая метаболизм липидов (25 генов) и углеводов (8 генов)), 110 генов связаны с трансдукцией сигнала, 6 генов - с механизмами мышечной контракции.
Эти результаты согласуются с несколькими исследованиями DNAm, которые выявили при ИБС и атеросклерозе DMPs, связанные с генами, вовлеченными в патогенез ожирения, центрального ожирения, липидного и углеводного обмена, воспаления, активности макрофагов, пролиферации гладкомышечных клеток, регуляции ренин-ангиотензина [Horvath, S. et al.; 2014; Fernandez-Sanles, A. et al.,. 2017; Nazarenko M., et al, 2015; Xia Y. et al, 2021]. 10 идентифицированных нами генов были представлены в двух ранее опубликованных исследованиях в отношении связи с ССЗ. В предварительном анализе дифференциального метилирования тела/промотора генов в группе ИМ/ОКС и контроле, например, мы обнаружили значительное дифференциальное метилирование в области тела гена SMAD9 с контекст-зависимостью от женского пола.
Следующие шаги в анализе дифференциального метилирования ДНК, начиная с групп случай1-контроль, будут включать: функциональную валидацию генов с помощью инструментов аннотации функции гена; целесообразно выполнение полногеномного анализа GWAS для разделения фенотипов на генетически обусловленные или обусловленные комбинированным вкладом генетических и эпигенетических факторов. В частности, мы запланировали начать GWAS для групп случай-1контроль (ограниченная подгруппа, возможная технически и финансово) в текущем проекте и развивать его дальше в перспективной заявке на продление проекта.
Ассоциации длины теломер лейкоцитов и количества копий мтДНК с инфарктом миокарда.
Проведен анализ ассоциаций длины теломер лейкоцитов (LTL) и количества копий митохондриальной ДНК (mtDNA) в базовой точке, с развитием новых случаев ИМ за 15 лет. На отчетном этапе генотипирование LTL и mtDNA составило в группе ИМ: n=256 и 255, в контроле: n=799 и 785 для обоих маркеров. В анализе логистической регрессии оценивали отношение шансов (OR) развития нового случая ИМ на 1 дециль распределения для изучаемых молекулярных маркеров ( в модели, стандартизованной по полу и возрасту и мультивариантных моделях).
Обнаружены обратные ассоциации обоих маркеров с развитием ИМ. OR нового ИМ при уменьшении LTL на 1 дециль составил 1,67 (95%CI 1,70-2,06), p<0, 001 независимо от других факторов. Ассоциация подтверждалась терцильным анализом независимо от других факторов, включая дополнительные липидные показатели (ХСЛНП, ТГ). Коэффициенты индекса шансов ИМ/ОКС в у мужчин были примерно в 2 раза выше, чем у женщин. OR нового ИМ при уменьшении количества копий mtDNA на 1 дециль составил 1,2 (95%CI 1,12-1,26), p<0, 001 независимо от других факторов. Ассоциация подтверждалась терцильным анализом независимо от других факторов, включая дополнительную стандартизацию по липидным показателям (ХСЛНП, ТГ). Коэффициенты индекса шансов ИМ/ОКС у мужчин были примерно в 1,5 раза выше, чем у женщин.
В отношении связи LTL с риском ССЗ и ИМ оценки противоречивы и дают примерно равное количество положительных и отрицательных результатов. Полученная нами ассоциация в дизайне случай-контроль поддерживает ряд работ, показавших обратные связи LTL с риском развития ОКС, например, исследование биобанка Великобритании [Kuo CL, 2019] и мультиэтнический мета-анализ [Xu X, et al., 2019].
Предполагаетcя прямое влияние теломер на атеросклероз за счет клеточного старения [Li C. et al., 2020; Kuo CL, 2019], данные Менделевской рандомизации [Scheller M.A., et al., 2016] указывает на каузативную роль LTL с малым эффектом.
Ассоциация количества копий mtDNA согласуется с опубликованными данными. В исследовании когорт ARIC, MESA, CHS показана обратная ассоциация mtDNA с ИБС, МИ и ССЗ с эксцесс-риском от 11 до 29% на 1 SD снижения копий mtDNA [Ashar F.N., et al., 2017]. В когорте ARIC за 20.4 лет наблюдения обнаружили увеличение риска внезапной сердечной смерти с OR=2.24 в 1 квинтили против 5-й квинтили количества копий mtDNA [Zhang Y., et al., 2017]. В Китае в исследовании случай-контроль были получены сходные данные [Wang X.B. et al., 2019].
По результатам раздела подготовлена статья, планируется подача в январе (Максимов В.Н и соавт.)
Ассоциации длины теломер лейкоцитов и количества копий мтДНК с колоректальным раком.
Проведен анализ ассоциаций длины теломер лейкоцитов (LTL) и количества копий митохондриальной ДНК (mtDNA) в базовой точке, с развитием новых случаев колоректального рака (КРР) в течение 15 лет наблюдения. Генотипирование LTL и mtDNA составило в группе КРР: n=146 и 154, в контроле: n=799 и 785 для обоих маркеров.
В анализе логистической регрессии оценивали отношение шансов (OR) развития нового случая КРР на 1 дециль распределения для изучаемых молекулярных маркеров. Использовали модели аналогичные анализу для ИМ.
Обнаружены обратные ассоциации обоих маркеров с развитием КРР. OR нового КРР при уменьшении LTL на 1 дециль составил 3,2 (95%CI 2,56-3,87), p<0, 001 независимо от других факторов. OR нового КРР при уменьшении количества копий mtDNA на 1 дециль составил 1,7 (95%CI 1,12-1,89), p<0, 001 независимо от других факторов. Обе ассоциация подтверждались терцильным анализом независимо от других факторов.
В отношении связи LTL с риском рака оценки противоречивы [Mons U. et al., 2017; Znang X.et al., 2017; Kuo CL, 2019]. В отношении КРР описаны отрицательные связи, U-образные и отсутствие асcоциаций, в том числе в мета-анализах [Znang X.et al., 2015], также опубликованы и положительные связи. Наши результаты отличаются от данных проспективного исследования в Сингапуре [Luu HN et al., 2019], где показана положительная связь LTL с риском КРР и согласуются с данными исследований типа случай-контроль [Qin, Q., etal., 2014]. Гетерогенность результатов связана с различными локализациями рака, дизайном исследования, оценкой риска новых событий или прогрессирования и смертности от рака.
Альтернации содержания mtDNA в связи с раком имеют разнонаправленные результаты [Chen J., et al., 2018; Hertweck K.L. et al., 2017]. Для ряда локализаций описаны как отсутствие отличия от неизмененной ткани (колоректальный, почек, поджелудочной и щитовидной желез, простаты, желудка, матки) [Reznik E., et al, 2016], так и снижение или разнонаправленные результаты или нелинейные зависимости (колоректальный, груди, почек, легких) [Chen J., et al., 2018; Wang L., et al., 2018; Chen J., et al., 2018; Xu J., et al., 2019].
Потенциально связанные факторы в мультивариантном анализе ассоциаций молекулярных маркеров с изучаемыми исходами.
В изучаемой популяции мы ранее показали серию корреляций LTL и количества копий mtDNA c возрастом и полом, факторами риска (преимущественно метаболическими и курением) и историей хронических заболеваний [Максимов В.Н. и соавт., 2017; 2019]. На основе собственных и известных из литературы данных в мультивариантом анализе связи между молекулярными маркерами и риском ИМ и КРР мы учитывали вклад биологических и поведенческих факторов, потенциально модифицирующих риск изучаемых клинических исходов.
На примере ассоциации между LTL и ИМ в группах случай-контроль - индекс шансов ИМ на каждую дециль LTL составил OR=1,92 (1,75-2,11) в модели 1 (с поправкой на пол и возраст) и снижался в последующих мультивариантных моделях до 1,86 и 1,67. Курение, метаболические факторы и уровень образования объясняли суммарно примерно 25% эксцесс риска вклада LTL в развитие ИМ, при этом независимо от этих факторов ассоциация сохранялась высоко достоверной.
На примере данных анализа дифференциального метилирования ДНК в группе случаев ИМ/ОКС и контроле, обнаруженное значительное дифференциальное метилирование в области тела гена SMAD9 было контекст-зависимым от женского пола. Аналогичные тенденции наблюдались также в отношении уровня метилирования в теле гена THSD4 и промотора GALNT2.
По промежуточным и ассоциированным фенотипам выполнена серия анализов, валидизирующих их прогностическое значение в отношении изучаемых исходов, определяющих детерминанты и взаимосвязи в популяции старшего возраста (сосудистые, миокардиальные, офтальмологические фенотипы, переломы крупных костей, сахарный диабет). По результатам в рамках проекта подготовлен ряд публикаций (Ryabikov A., 2021; Mustafina S. at al, 2021; Mazurenko E. et al., 2020; Диреев А.О. и соавт. 2021).
В отчетном периоде полученные результаты доложены на виртуальных международных конгрессах: Congress ESC (Лондон, 28 августа-01 сентября 2021), 89th Congress EAS (Хельсинки, 30 мая-2 июня 2021). В рамках Съезда кардиологов СФО, Новосибирск, 2021 был организован Симпозиум «Сердце, сосуды и старение», посвященный вопросам проекта (6 докладов). Результаты также доложены на Всероссийской конференции с международным участием «Фундаментальные аспекты атеросклероза…» (Новосибирск), Российском национальном конгрессе кардиологов (Санкт- Петербург), региональном конгрессе РКО «Традиции и инновации в кардиологии» (Красноярск, пленарный доклад).
Результаты опубликованы в 5 статьях и 3 тезисах, еще 2 публикации находятся на рецензировании или приняты в печать. Проведены два семинара: 1) анализ эпигенетического возраста по данным метилирования ДНК; 2) перспективы исследования длины теломер лейкоцитов и количества копии мтДНК и серия рабочих совещаний в режиме on-line.
Публикации
1. Губачек Я.А., Никитин Ю.П., Рагино Ю.И., Стахнева Е.М., Пикхарт Г., Пизи А., Холмс М.В., Стефлер Д., Рябиков А.Н., Веревкин Е.Г., Бобак М., Малютина С.К. Longitudinal trajectories of blood lipid levels in an ageing population sample of Russian Western-Siberian urban population PlosOne, PlosOne, 2021. – Т. 16, № 12. - e0260229 (год публикации - 2021) https://doi.org/10.1371/journal.pone.0260229
2. Диреев А.О., Мунц И.В., Мазуренко Е.С., Шапкина М.Ю., Рябиков А.Н., Бобак М., Малютина С.К. Ассоциации сердечно-сосудистых заболеваний и сахарного диабета 2 типа с офтальмологическими заболеваниями в популяционной выборке старше 55 лет Кардиоваскулярная терапия и профилактика, Кардиоваскулярная терапия и профилактика. – 2021. – Т.20, №7. – С. 41-48. (год публикации - 2021) https://doi.org/10.15829/1728-8800-2021-2886
3. Мустафина С.В., Винтер Д.А., Рымар О.Д., Щербакова Л.В., Сазонова О.В., Малютина С.К. Кардиометаболические факторы риска у лиц с ожирением и риск развития сахарного диабета 2 типа в 12-летнем проспективном исследовании Атеросклероз, Атеросклероз. - 2021. - Т.17, № 1. - С.52-61 (год публикации - 2021) https://doi.org/10.52727/2078-256X-2021-17-52-61
4. Мустафина С.В., Рымар О.Д., Щербакова Л.В., Веревкин Е.Г., Пикхарт Г., Сазонова О.В., Рагино Ю.И., Симонова Г.И., Бобак М., Малютина С.К., Воевода М.И. The Risk of Type 2 Diabetes Mellitus in a Russian Population Cohort According to Data from the HAPIEE Project Journal of Personalized Medicine, J Pers Med. - Feb 2021. - Vol.11, N 2. - E119 (год публикации - 2021) https://doi.org/10.3390/jpm11020119
5. Не И., Ричардс М., Кубинова Р., Титаренко А.В., Малютина С.К., Козела М., Паяк А., Бобак М., Руиз М. Social networks and cognitive function in older adults: findings from the HAPIEE study BMC Geriatrics, BMC Geriatrics. - Oct 2021. - Vol.21, N 1. - 570. (год публикации - 2021) https://doi.org/10.1186/s12877-021-02531-0
6. Малютина С.К., Червова О., Тилльманн Т., Максимов В.Н., Рябиков А.Н., Гафаров В.В., Пикхарт Г., Бек С., Бобак М. The relationship between epigenetic age and myocardial infarction /acute coronary syndrome and in a population based nested case-control study European Heart Journ, European Heart Journ. - 2021. - 42(Suppl 1). - 3199 (год публикации - 2021) https://doi.org/10.1093/eurheartj/ehab724.3199
7. Рябиков А.Н., Трошина М.С., Рябиков М.Н., Палехина Ю.Ю., Малютина С.К. The assessment of association between flow-mediated dilation as marker of endothelial dysfunction, and carotid intima-media thickness/atherosclerotic plaques in ageing population Atherosclerosis, Atherosclerosis. - 2021. - 331. - e107 (год публикации - 2021) https://doi.org/10.1016/j.atherosclerosis.2021.06.314
8. Шапкина М.Ю., Рябиков А.Н., Маздорова Е.В., Авдеева Е.М., Щербакова Л.В., Бобак М., Пикхарт Г., Малютина С.К. 13-летняя динамика частоты фибрилляции предсердий в российской популяционной выборке (Новосибирск) Российский национальный конгресс кардиологов 2021. Материалы Конгресса, Российский национальный конгресс кардиологов 2021. Материалы Конгресса. - 23-24 октября 2021. – 756 (год публикации - 2021)
Аннотация результатов, полученных в 2022 году
Интернет (url-адреса), посвященные проекту)
Проект направлен на формирование эпигенетической когорты путем оценки профиля метилирования ДНК (DNAm) и изучение ассоциаций молекулярных маркеров возраста с риском хронических заболеваний и смертности на основе биобанка исследований старения в Российской популяции. По дизайну гнездовой случай–контроль сформированы три группы «новых» случаев за 15 лет наблюдения популяционной когорты: случай-1 - инфаркт миокарда/острый коронарный синдром (ИМ/ ОКС) без предшествующих ССЗ (n=280); случай-2 - колоректальный рак (КРР) без предшествующего рака любой локализации (n=154); случай-3 - смерть от всех причин, исключая внешние (n=500). Субкогорта контроля стратифицирована по полу/возрасту, сформирована среди участников, которые живы на дату цензурирования (31.12.2019) и не имеют ССЗ и рака (n=800). Для эпигенетических анализов отобраны меньшие группы.
План эпигенетических работ был модифицирован, сфокусирован на группах ИМ/ОКС и контроля и в выборке с повторными оценками DNAm, включая: 1).полноэпигеномный анализ (EWAS); 2).эпигенетический возраст; 3).декомпозиция по типу клеток для контроля иммунологического профиля в EWAS; 4).интеграция промежуточных фенотипов; 5).полногеномный анализ (GWAS); 6).коррекция батч-эффекта серийных изменений DNAm.
По объективным (геополитическим) причинам в 2022 году было невозможным продолжение анализов DNAm (групп 2 и 3) в Великобритании, для последующей выполнимости работ установлено сотрудничество с 2-мя геномными лабораториями в РФ и Китае.
Полноэпигеномный ассоциативный анализ (EWAS), дифференциально метилированные позиции (DMPs) и регионы (DMRs) в группах ИМ/ОКС и контроля. Анализ DNAm выполнен на EPIC850k Beadchip (Illumina). Проведена серия EWAS и выявление DMP и DMR относительно статуса ИМ/ОКС-контроль. Идентифицированы CpG, где уровни DNAm ассоциированы со статусом "случай-контроль" (p<0,0001). Картирование CpG в геноме и информация из манифеста выявили их соответствие 27/98/81 уникальным генам. Обработка топ-списка из 105 генов (Reactome) показала связи 32 и 21 генов с патогенетическими путями заболеваний и метаболических нарушений. Для 39 генов описаны связи с развитием ИМ/ИБС, атеросклероза, воспалением, нарушениями метаболизма, сердечным старением. Данные согласуются с рядом исследований DNAm (включая EWAS), которые ассоциировали ИБС/атеросклероз с DMP, связанными с вовлеченными в указанные механизмы генами [Horvath S. 2014; Pagiatakis, С. 2021; Nazarenko M. 2015; Xia Y. 2021].
EWAS с инкорпорированными данными о фракциях клеток. На основе DNAm выполнена декомпозиция данных о фракциях клеток и повторена серия EWAS с коррекцией потенциального сигнала от различных типов клеток. Выявленные DMPs картированы на 56/90/69 уникальных генов.
Идентифицирована серия DMRs, ассоциированных с ИМ/ОКС. Аналогично базовому EWAS, проведено картирование CpG в геноме, извлечение информации из манифеста и обработка вовлеченных генов с помощью Reactome.
Полногеномный ассоциативный анализ. Полногеномный анализ ассоциаций (GWAS) генетического полиморфизма с ИМ/ОКС выполнен на OmniExpress24 (n=92). Выявлены ассоциации 33 SNP с ИМ/ОКС (p<10-4, Х2 тест). 17 локусов связаны с конкретными генами. Для них отсутствуют данные по связи с ИМ/ИБС, однако ряд локусов вовлечен в регуляцию метаболизма холестерина, жирных кислот, углеводов; состава тела, развитие возраст-зависимых фенотипов. rs814628 (gastric LIPF) связан со сниженным гидролизом пищевых ТГ [Aronica L. 2020]; rs15286 (SERPINB1) - с уровнем гликемического контроля и функцией β-клеток при СД2 [Kassem DH. 2020]; rs872331 (CRYAA) - с катарактой [Rao Y. 2017].
Для генов CLEC6A и SPTB обнаружена разница фракции метиляции в промоторе или теле гена при ИМ/ОКС против контроля. Среди локусов DMPs EWAS, доступных на OmniExpress24, для rs4765757 (PARP11) MAF в группе ИМ/ОКС была в 2 раза ниже, чем в контроле (p=0.070-0.051). DMP в зоне промотора (cg06677166; TSS200) гена PARP11 ассоциировалась с ИМ/ОКС (p=0.00058). Данные предполагают комбинированную вовлеченность изменений метиляции локуса и генетического полиморфизма в патогенетические пути заболевания, потенциально связанные с воспалительной активностью, учитывая, что PARP11 регулирует интерферон-опосредованные сигнальные пути. Идентифицированные в проекте c помощью GWAS новые генетические ассоциации перспективны для уточнения общих патогенетических звеньев промежуточных фенотипов и ИБС/ИМ. Выявленные новые маркеры нуждаются в репликации. На основе EWAS идентифицированы DMPs и DMRs, ассоциированные с ИМ/ОКС, и сгенерирован топ-лист связанных генов, что представляет базу интегративного анализа генетических или обусловленных комбинированным вкладом генетических/эпигенетических факторов механизмов ИБС/ИМ.
Эпигенетический возраст и кардиометаболические фенотипы. В проекте показаны ассоциации ускорения эпигенетического возраста (EA) c риском ИМ/ОКС (Malyutina et al., 2022). Оценка связи 9 индексов ускорения EA (EAA) с 18 кардиометаболическими фенотипами показала ассоциации нескольких EAA с уровнем ГГТП, ХС-ЛПНП, курением, потреблением алкоголя, бляшками СА и ИМ/ОКС (p от <0.0001 до 0.048). GrimAge связан с наибольшим количеством фенотипов.
Ассоциации длины теломер лейкоцитов (LTL) и количества копий мтДНК (mtDNA-CN) с колоректальным раком и смертью. Обнаружены обратные ассоциации LTL и mtDNA-CN с риском новых случаев колоректального рака (КРР) за 15 лет. OR=3,2, p<0, 001 при уменьшении LTL на 1 дециль, OR=1,7,p<0, 001 при уменьшении mtDNA-CN на 1 дециль. Результаты по обратной связи LTL и КРР согласуются с Brunek Study [Willeit P. 2011], и, частично, с данными двух мета-анализов [Zhang C. 2015; Jia H. 2016] и отличаются от ряда работ [Luu HN. 2019]. Результаты по обратной связи mtDNA-CN и КРР согласуются с Shanghai Women’s Health Study [Huang B. 2014] и частично, с проспективным Шведским исследованием [Li .Y. 2021]. Гетерогенность результатов связана с различными локализациями рака, дизайном исследования, риском новых событий или смерти от рака.
Обнаружены обратные ассоциации LTL и mtDNA-CN с 15-летним риском смерти от всех причин (исключая внешние). OR=1,37, p<0,001 при уменьшении LTL на 1 дециль, OR=1,07, p=0,008 при уменьшении mtDNA-CN на 1 дециль. В большинстве работ показаны схожие данные по отрицательной связи LTL с общей смертностью [Marioni RE. 2018, Wang Q. 2018]. По mtDNA-CN данные непоследовательны; отрицательные связи со смертностью получены для ССЗ исходов [Zhang Y. 2017; Ashar FN. 2017; Harrington JS. 2019]. Механизмы вклада mtDNA связывают с митохондриальной дисфункцией, модуляцией воспаления, мутациями ядерной и mtDNA, эпигенетической регуляцией.
Биоинформатический подход к коррекции батч-эффекта
В выборке с повторными измерениями DNAm (w1/w3) ‘волна’ не может служить целевой переменной в EWAS. Чтобы преодолеть батч-эффект волны создана вспомогательная целевая переменная age_diff и выполнен EWAS. Идентифицированы локусы, связанные с изменением DNAm при увеличении возраста, и картированы с уникальными генами. Эффективность коррекции батч-эффекта подтверждена umap. Разработан новый биоинформатический подход коррекции батч-эффекта при анализе данных DNAm в долгосрочном наблюдении для нескольких временных точек.
Промежуточные фенотипы. В мультивариантной оценке связи биомаркеров с риском исходов учитывали биологические и поведенческие факторы, потенциально модифицирующие риск. 25% вклада LTL и 15-17% вклада mtDNA-CN в риск ИМ объяснялись курением и метаболическими факторами. 18% вклада LTL и 10% вклада mtDNA-CN в риск КРР объяснялись влиянием этих факторов, что свидетельствует о бОльшем вкладе генетических факторов в риск КРР, чем ИМ. По возраст-зависимым аспектам фенотипов определены связи эпигенетического возраста с кардиометаболическими фенотипами. Опубликована серия анализов вклада промежуточных фенотипов в исходы, их взаимодействие и контроль в популяции при старении. В 2022 опубликованы 9 статей, 3 тезисов, 1 статья в печати.
Публикации
1. Мазуренко Е.С., Рымар О.Д., Рерих В.В., Храпова Ю.В., Диреев А.О., Щербакова Л.В., Малютина С.К. Risk Factors for Chronic Non-Communicable Diseases and Osteoporotic Fractures in a Middle and Elderly-Aged Population Journal of Personalized Medicine, J. Pers. Med., 2022. – Vol. 12, № 9. – E1475 (год публикации - 2022) https://doi.org/10.3390/jpm12091475
2. Максимов В.Н., Орлов П.С., Гуражева А.А., Мельникова Е.С., Гафаров В.В., Червова O.A., Воевода М.И., Малютина С.К. Ассоциация относительной длины теломер лейкоцитов и количества копий мтДНК с острым коронарным синдромом при 15-летнем наблюдении Успехи геронтологии, Успехи геронтологии. – 2022. Т. 35. № 3. – С. 351–360 (год публикации - 2022) https://doi.org/10.34922/AE.2022.35.3.004
3. Малютина С.К., Диреев А.О., Мунц И.В., Палехина Ю.Ю., Рябиков А.Н. Cвязь калибра ретинальных сосудов с возрастом и кардиометаболическими заболеваниями в популяции старше 50 лет Вестник офтальмологии, Вестник офтальмологии. - 2022. - Т. 138. № 5. – С. 14 – 21 (год публикации - 2022) https://doi.org/10.17116/oftalma202213805114
4. Малютина С.К., Мазуренко Е.С., Маздорова Е.В., Шапкина М.Ю., Авдеева Е.М., Мустафина С.В., Симонова Г.И,, Рябиков А.Н. The profile of glucose lowering therapy in persons with type 2 diabetes mellitus in an aging Russian population Journal of Personalized Medicine, J. Pers. Med., 2022. – Vol. 12, № 10. - E1689 (год публикации - 2022) https://doi.org/10.3390/jpm12010122
5. Малютина С.К., Максимов В.Н., Червова О.А., Орлов П.С., Волошин В.F., Рябиков А.Н., Воевода М.И., Никитенко Т.М. Leukocyte telomere length and mitochondrial DNA copy number association with colorectal cancer risk in an ageing population Global Translational Medicine, - (год публикации - 2023)
6. Малютина С.К., Червова О., Тилльманн Т., Максимов В.Н., Рябиков А.Н., Гафаров В.В., Губачек Я.А., Пикхарт Г., Бек С., Бобак М. The Relationship between Epigenetic Age and Myocardial Infarction/Acute Coronary Syndrome in a Population-Based Nested Case-Control Study Journal of Personalized Medicine, J.Pers.Med.,2022.– Vol.12, №1.- E110 (год публикации - 2022) https://doi.org/10.3390/jpm12010110
7. Титаренко А.В., Шишкин С.В., Щербакова Л.В., Веревкин Е.Г., Шапкина М.Ю., Hubacek J.A., Bobak M., Малютина С.К. Когнитивные функции и модифицируемые факторы риска хронических неинфекционных заболеваний в российской популяционной выборке при старении Успехи геронтологии, Успехи геронтологии. – 2022. Т. 35. № 1. – С. 102–109. (год публикации - 2022) https://doi.org/10.34922/AE.2022.35.1.011
8. Трошина М.С., Рябиков А.Н., Палехина Ю.Ю., Рябиков М.Н., Малютина С.К. Эндотелиальная функция и структурные маркеры атеросклероза: оценка связи в пожилом и старческом возрасте Российский кардиологический журнал, Российский кардиологический журнал. - 2021. - Т. 26. № 12. – С. 19 –25 (год публикации - 2021) https://doi.org/10.15829/1560-4071-2021-4614
9. Шапкина М.Ю., Маздорова Е.В., Авдеева Е.М., Щербакова Л.В., Рябиков А.Н., Губачек Я.А., Бобак М., Малютина С.К. Динамика частоты фибрилляции предсердий в российской популяционной выборке за 13 лет наблюдения Кардиоваскулярная терапия и профилактика, Кардиоваскулярная терапия и профилактика. - 2022. - Т. 21. № 8. – С. 23 –33 (год публикации - 2022) https://doi.org/10.15829/1728-8800-2022-3108
10. Шапкина М.Ю., Рябиков А.Н., Маздорова Е.В., Титаренко А.В., Авдеева Е.М., Мазуренко Е.С., Щербакова Л.В., Пикхарт Г., Бобак М., Малютина С.К. Determinants of the 13-Year Risk of Incident Atrial Fibrillation in a Russian Population Cohort of Middle and Elderly Age Journal of Personalized Medicine, J. Pers. Med., 2022. – Vol. 12, № 1. - E122 (год публикации - 2022) https://doi.org/10.3390/jpm12010122
11. Мазуренко Е.С., Малютина С.К., Щербакова Л.В., Рымар О.Д. Risk of osteoporotic forearm fractures in postmenopausal women aged over 55 years Aging Clinical and Experimental Research, Aging Clinical and Experimental Research. - 2022. - Vol. 34 (Suppl 1): S288 (год публикации - 2022) https://doi.org/10.1007/s40520-022-02147-3
12. Малютина С.К., Червова О.А., Тилльманн Т., Максимов В.Н., Гафаров В.В., Рябиков А.Н., Губачек Я.А., Пикхарт Г., Бек С., Бобак М. The relationship between epigenetic age and myocardial infarction in a population based case-control study Atherosclerosis, Atherosclerosis. - 2022. - 355. – e090 (год публикации - 2022) https://doi.org/10.1016/j.atherosclerosis.2022.06.320
13. Рябиков А.Н., Трошина М.С., Рябиков М.Н., Палехина Ю.Ю., Николаева О.А, Малютина С.К. The relationship between endothelial dysfunction and cardiovascular diseases and risk factors in the elderly population Atherosclerosis, Atherosclerosis. - 2022. – Vol. 355, P. 34-34. – e101 (год публикации - 2022) https://doi.org/10.1016/j.atherosclerosis.2022.06.331
Возможность практического использования результатов
Накопление свидетельств предиктивного значения эпигенетических факторов и других молекулярных маркеров возраста, а также особенности детерминант субклинических фенотипов и индивидуального риска исходов в пожилом возрасте могут быть информативны в определении групп риска для стратегии сохранения здоровья в пожилом возрасте. В этом контексте, накопленные в проекте база данных и биобанк представляют серьезный научный задел и перспективны для дальнейшего развития и интеграции широкого уровня.