Как рассказал доцент СПбГУ, кандидат физико-математических наук Антон Коробейников, разработанный алгоритм VarQuest позволяет быстро сравнивать две, образно говоря, базы данных — химические структуры известных биологически активных природных соединений (так называемых natural products) и физические замеры (масс-спектры) веществ, которые производят исследуемые микроорганизмы.
«В каждой базе данных — десятки тысяч соединений, и наш алгоритм оперативно находит похожие пары, — отметил исследователь. — Обнаружив новое соединение, похожее на известное биологически активное вещество, ученые могут подвергнуть его более детальной проверке. Есть предположение, что обнаруженное новое соединение будет эффективнее с фармакологической точки зрения, чем его более изученные аналоги, представленные в базе данных».
Первый автор статьи — младший научный сотрудник лаборатории Алексей Гуревич — отметил, что использование VarQuest особенно актуально для современной медицины.
«Ученые всего мира бьют тревогу: многие болезнетворные бактерии стали устойчивы к существующим антибиотикам, и, чтобы спастись от болезней, нужно создавать все новые и новые лекарства, — рассказал он. — Появление нового антибиотика на рынке состоит из двух стадий: поиск биологически активного природного вещества, которое войдет в основу лекарства, а затем апробирование эффективности готового препарата на животных и людях. Второй этап ускорить невозможно — это приведет к губительным последствиям, а первый — вполне. В основе большинства современных антибиотиков лежат природные соединения, и чтобы быстрее найти соединения с заданными свойствами, как раз и нужны вычислительные методы, способные обрабатывать огромные массивы экспериментальных данных. Наш алгоритм позволит во много раз сократить время, необходимое на поиск новых потенциальных антибиотиков».
Крупнейшая база замеров природных соединений собрана учеными из лабораторий разных стран мира и на данный момент содержит уже более миллиарда масс-спектров. Она расположена на платформе GNPS (The Global Natural Product Social Molecular Networking), так же как и VarQuest, которым теперь могут свободно пользоваться все зарегистрированные на платформе исследователи.
Это исследование чрезвычайно важно для возрождения производства антибиотиков в России. В 1960 годах советские исследования в данной сфере были на передовом рубеже науки. В 1985 году СССР произвел 2300 тонн антибиотиков, а в 2005-м производство антибиотиков на собственном сырье в России было полностью остановлено. VarQuest может внести свой вклад в возрождение российской индустрии по производству антибиотиков, помогая исследователям секвенировать геномы бактерий и грибов, выделяющих природные антибиотики.
Разработка алгоритма VarQuest происходила в рамках исследования, финансируемого Российским научным фондом и Американским национальным институтом здоровья.
Лаборатория «Центр алгоритмической биотехнологии» была создана в СПбГУ в конце 2014 года. Ее возглавил кандидат физико-математических наук, профессор Калифорнийского университета Павел Певзнер. Флагманский продукт лаборатории — алгоритм сборки генома SPAdes (Saint Petersburg Assembler) — используется тысячами специалистов в области геномики по всему миру, а научная статья, в которой был описан этот ассемблер, по данным Google Scholar, была процитирована около 3000 раз, а также стала одной из самых цитируемых российских статьей за последние пять лет.