CRISPR/Cas — один из множества способов защиты бактерий от вирусов. При заражении ДНК патогена оказывается внутри клетки, но поскольку его последовательности отличаются от последовательностей микроорганизма, Cas-белки распознают этот наследственный материал как чужеродный и разрезают его. Чтобы в дальнейшем бактерия могла быстрее среагировать на вирус, фрагменты ДНК патогена сохраняются в клетке — почти как база вирусных сигнатур в компьютерном антивирусе. Далее они передаются из поколения в поколение и используются Cas-белками для защиты от новых вторжений.
В 2011–2013 году ученые из разных лабораторий мира (Д. Даудна, Э. Шарпентье, Ф. Джанг в США и В. Шикснис в Литве) независимо друг от друга смогли адаптировать систему CRISPR/Cas к изменению произвольных последовательностей ДНК в клетках человека и животных, сделав редактирование генома значительно проще и эффективнее. Ключевые элементы технологии — гидовая, или наводящая, РНК и белок Cas9, который разрезает ДНК в месте, соответствующем ее последовательности. Затем клетка «залечит» разрез, но изменения уже будут внесены. Однако наводящая РНК не всегда попадает в нужное место и может неверно направить «генетические ножницы» Cas9. Важно превратить технологию CRISPR/Cas в современный высокоточный инструмент, что особенно критично в случае медицинских вмешательств.
Ученые из Сколтеха (Москва) под руководством Константина Северинова применили глубокое обучение, гауссовские процессы и другие методы, чтобы решить проблему более точного выбора оптимальных наводящих РНК. Результатом стал набор нейросетей, которые представляют собой математические модели, реализованные в виде последовательных умножений матриц — больших наборов чисел со сложной внутренней структурой. Нейросеть способна к обучению благодаря наличию «памяти», определенным образом изменяемой каждый раз, когда система считает в режиме тренировки. Модели были обучены на разных наборах данных, содержащих десятки тысяч экспериментально подтвержденных гидовых РНК, с высокой точностью сработавших на клетках человека и других животных.
Алгоритм, предложенный учеными из Сколтеха, оценивает вероятности разрезания ДНК-мишеней в правильном месте для заданных гидовых РНК. На это можно ориентироваться при выборе инструмента редактирования в любой технологии, основанной на CRISPR/Cas. Ученые уже предложили заранее рассчитанный их нейросетью набор гидовых последовательностей РНК, позволяющих точно изменять гены 22-й хромосомы человека. Это стало возможным благодаря точности предсказания частоты разрезания и добавлению оценки погрешности, которую не предоставлял ни один ранее разработанный для решения такой задачи метод.
«Результаты нашей работы могут быть применимы в любом приложении технологий, которые основаны на CRISPR/Cas, будь то терапия генетических заболеваний, агротехнологии, или эксперименты в фундаментальных научных исследованиях», — рассказывает аспирант Сколтеха Богдан Кириллов, один из создателей нового метода и первый автор статьи.
В целом разработанный российскими учеными метод упрощает проблему подбора правильного инструмента для высокоточного редактирования ДНК, а значит, экономит время и ресурсы. Редактирование ДНК в перспективе может помочь в разработке терапий некоторых наследственных болезней.