КАРТОЧКА ПРОЕКТА ФУНДАМЕНТАЛЬНЫХ И ПОИСКОВЫХ НАУЧНЫХ ИССЛЕДОВАНИЙ,
ПОДДЕРЖАННОГО РОССИЙСКИМ НАУЧНЫМ ФОНДОМ

Информация подготовлена на основании данных из Информационно-аналитической системы РНФ, содержательная часть представлена в авторской редакции. Все права принадлежат авторам, использование или перепечатка материалов допустима только с предварительного согласия авторов.

 

ОБЩИЕ СВЕДЕНИЯ


Номер проекта 19-73-10137

НазваниеПрименение методов искусственного интеллекта к планированию синтеза химических веществ (iSynthesis)

Руководитель Маджидов Тимур Исмаилович, Кандидат химических наук

Организация финансирования, регион федеральное государственное автономное образовательное учреждение высшего образования "Казанский (Приволжский) федеральный университет" , Республика Татарстан (Татарстан)

Конкурс №41 - Конкурс 2019 года «Проведение исследований научными группами под руководством молодых ученых» Президентской программы исследовательских проектов, реализуемых ведущими учеными, в том числе молодыми учеными

Область знания, основной код классификатора 03 - Химия и науки о материалах; 03-705 - Хемоинформатика

Ключевые слова дизайн синтеза, de novo дизайн, планирование синтеза, предсказание стратегии синтеза, предсказание условий проведения реакций, хемоинформатика, химические реакции, искусственный интеллект, машинное обучение

Код ГРНТИ31.01.77


 

ИНФОРМАЦИЯ ИЗ ЗАЯВКИ


Аннотация
В разработке любого вещества, в особенности новых лекарственных препаратов, ключевая стадия заключается в проведении его синтеза. Вычислительные эксперименты и технологии современной медицинской химии, а также огромный массив информации, доступный в базах данных, предоставляют широчайшие возможности для рационального дизайна лекарств. Современные методы виртуального скрининга и de novo дизайна молекул, в том числе основанные на методах глубокого обучения, позволяют автоматически генерировать гипотетические структуры молекул, потенциально обладающих требуемым спектром биологической активности или иных полезных свойств. Вместе с тем, значительная часть теоретически сконструированных таким образом молекул не доходит до биологических испытаний вследствие проблем с их синтезом. Хотя задача планирования органического синтезе на компьютере была поставлена полвека назад, и для ее решения было предложено множество подходов, реализованных в большом количестве программ, однако в настоящее время множество реально используемых средств ограничено небольшим набором коммерчески доступных программ ретросинтетического анализа. При этом ни один из существующих инструментов не осуществляет предсказание условий проведения реакций, в лучшем случае предоставляются данные о типичных условиях. Кроме того, лежащий в их основе ретросинтетический анализ имеет два существенных недостатка. Во-первых, выявляемая в ходе ретросинтетического анализа стратегия синтеза всегда требует дополнительных уточнений, например, необходимость установки и снятия защитных групп не может быть в нем предусмотрена и отражена в плане синтеза. Во-вторых, этот подход рассматривает способ синтеза только целевого соединения. В то же время, синтез его аналога может оказаться более простым. В задачах медицинской химии, когда нужно синтезировать множество структурно схожих соединений в кратчайшие сроки, эта информация может оказаться исключительно полезной. Цель настоящего проекта заключается в создании методологии компьютерного планирования синтеза (iSynthesis), в рамках которой предлагается не только план синтеза, но также условия проведения реакций на всех его стадиях. Особенность предлагаемой технологии также заключается в использовании необычной стратегии построения схемы синтеза, которая будет основана на приближении от исходных реагентов к желаемому продукту синтеза. Такой подход, который редко использовался ранее из-за вычислительных сложностей, избавлен от указанных недостатков ретросинтетического анализа. Главным его достоинством является возможность поиска стратегий синтеза соединений, близких к целевому по структуре, благодаря оптимизации функции, зависящей от сходства продукта реакции с целевым соединением. Проблемы, связанные с вычислительной сложностью данного подхода, мы планируем решать с использованием эффективных эвристик, показавшего свою применимость в задачах подобного типа подхода Монте-Карло поиска по дереву, частичного перечисления продуктов первой трансформации в ходе подготовки базы данных, а также алгоритмов стохастического поиска. Ключевой особенностью данного проекта является разработка инструментов предсказания условий реакций, которые будут фигурировать в плане синтеза. В настоящее время задача предсказания оптимальных условий проведения реакций еще не решена, и имеются лишь единичные публикации в данной области. Решение проблемы предсказания оптимальных условий является центральной задачей данного проекта. Мы разработаем две методологии для решения этой проблемы. Первая методология основана на поиске условий, которые позволят оптимизировать кинетику реакции и при этом избежать проблем с селективностью. Для этого будут использоваться модели предсказания кинетических характеристик некоторых распространенных реакций. Эта методология позволит не только предсказать условия, но также оценить соотношение продуктов, выход и время проведения реакции. Вместе с тем, кинетические данные имеются лишь для ограниченного числа типов реакций, и поэтому этот подход не является универсальным. Вторая стратегия основана на прямом предсказании с помощью моделей, построенных на больших выборках данных, содержащих информацию об условиях проведения реакций. В последнем случае возможные условия (катализатор, диапазон температур и давлений) будут ранжированы по их применимости к данной реакции. Для построения моделей будут использоваться, в том числе, современные метода машинного обучения, включая методы глубокого обучения. Эта методология является более универсальной, но получаемые с ее помощью модели менее информативны и интерпретируемы. Для построения моделей будут использоваться имеющиеся в лаборатории данные по кинетическим характеристикам и условиям проведения реакций, а также будут собраны кинетические характеристики для новых типов реакций (присоединение, замещение в ароматическом ядре). Также будут собраны данные по условиям проведения других типов реакций, для которых кинетические характеристики неизвестны. Разработанные инструменты, а также наборы данных, будут открыты для использования широкой общественностью, в том числе посредством веб-сервисов. Преимуществом проекта является экспериментальная валидация создаваемых подходов. Разработанная технология будет применена в проекте по разработке стратегии синтеза новых типов антидепрессантов. В научно-образовательном центре фармацевтики КФУ неоднократно осуществлялись попытки синтеза аналогов антидепресантов доксепина и досулепина, в которых одно из бензольных колец заменено на фрагмент пиридоксина. Однако попытка его синтеза классическими подходами увенчалась неудачей. Разработанная технология iSynthesis будет апробирована на данном примере, с ее использованием будут предложены альтернативные стратегии синтеза, которые затем будут апробированы и использованы в группе медицинской химии НОЦ Фармацевика КФУ. Будут также валидированы методы предсказания условий реакций гидрирования. Разработка инструментов, позволяющих осуществлять планирование синтеза с учетом условий проведения реакций, позволит существенно продвинуться в создании полностью автоматизированных систем синтеза.


 

ОТЧЁТНЫЕ МАТЕРИАЛЫ


 

Публикации

1. Занков Д.В., Маджидов Т.И., Рахимбекова А., Гимадиев Т.Р., Нугманов Р.И., Казымова М.А., Баскин И.И., Варнек А. Conjugated Quantitative Structure-Property Relationship Models: Application to Simultaneous Prediction of Tautomeric Equilibrium Constants and Acidity of Molecules Journal of Chemical Information and Modeling, 59, 11, 4569-4576 (год публикации - 2019)
10.1021/acs.jcim.9b00722

2. Рахимбекова А., Маджидов Т.И., Нугманов Р.И., Гимадиев Т.Р., Баскин И.И., Варнек А. Comprehensive Analysis of Applicability Domains of QSPR Models for Chemical Reactions INTERNATIONAL JOURNAL OF MOLECULAR SCIENCES, V. 21, Is. 15, P. 5542 (год публикации - 2020)
10.3390/ijms21155542

3. Рахимбекова А., Ахметшин Т.Н., Минибаева Г.И., Нугманов Р.И., Гимадиев Т.Р., Маджидов Т.И., Баскин И.И., Варнек А.. Cross-validation strategies in QSPR modelling of chemical reactions SAR and QSAR in Environmental Research, V. 32, Is. 3, P. 207-219 (год публикации - 2021)
10.1080/1062936X.2021.1883107

4. Борт У., Баскин И.И., Гимадиев Т.Р., Муканов А., Нугманов Р.И., Сидоров П.О., Марку Ж., Хорват Д.. Климчук О., Маджидов Т.И., Варнек А. Discovery of novel chemical reactions by deep generative recurrent neural network Scientific Reports, V. 11, №3178 (год публикации - 2021)
10.1038/s41598-021-81889-y

5. Гимадиев Т.Р., Нугманов Р.И., Батыршин Д.С., Маджидов Т.И., Маеда С., Сидоров П.О., Варнек А. Combined Graph/Relational Database Management System for Calculated Chemical Reaction Pathway Data Journal of Chemical Information and Modeling, V. 61, Is. 2, P. 554-559 (год публикации - 2021)
10.1021/acs.jcim.0c01280

6. Маджидов Т.И., Рахимбекова А., Афонина В.А., Гимадиев Т.Р., Мухаметгалеев Р.Н., Нугманов Р.И., Баскин И.И., Варнек А. Machine learning modelling of chemical reaction characteristics: yesterday, today, tomorrow Mendeleev Communication, V. 31, P. 769-780 (год публикации - 2021)
10.1016/j.mencom.2021.11.003

7. Занков Д., Полищук П., Маджидов Т., Варнек А. Multi-Instance Learning Approach to Predictive Modeling of Catalysts Enantioselectivity SynLett, V. 32, P. 1833-1836 (год публикации - 2021)
10.1055/a-1553-0427

8. Занков Д., Матвеева М., Никоненко А.В., Нугманов Р.И., Баскин И.И., Варнек А. QSAR Modeling Based on Conformation Ensembles Using a Multi-Instance Learning Approach Journal of Chemical Information and Modeling, V. 61, Is. 10, P. 4913-4923 (год публикации - 2021)
10.1021/acs.jcim.1c00692

9. В.А. Афонина, Д.А. Мазитов, А. Нурмухаметова, М.Д. Шевелев, Д.А. Хасанова, Р.И. Нугманов, В.А. Бурилов, Т.И. Маджидов, А. Варнек Prediction of Optimal Conditions of Hydrogenation Reaction Using the Likelihood Ranking Approach International Journal of Molecular Sciences, V. 23, Is. 1, P. 248 (год публикации - 2022)
10.3390/ijms23010248


 

Публикации

1. Занков Д.В., Маджидов Т.И., Рахимбекова А., Гимадиев Т.Р., Нугманов Р.И., Казымова М.А., Баскин И.И., Варнек А. Conjugated Quantitative Structure-Property Relationship Models: Application to Simultaneous Prediction of Tautomeric Equilibrium Constants and Acidity of Molecules Journal of Chemical Information and Modeling, 59, 11, 4569-4576 (год публикации - 2019)
10.1021/acs.jcim.9b00722

2. Рахимбекова А., Маджидов Т.И., Нугманов Р.И., Гимадиев Т.Р., Баскин И.И., Варнек А. Comprehensive Analysis of Applicability Domains of QSPR Models for Chemical Reactions INTERNATIONAL JOURNAL OF MOLECULAR SCIENCES, V. 21, Is. 15, P. 5542 (год публикации - 2020)
10.3390/ijms21155542

3. Рахимбекова А., Ахметшин Т.Н., Минибаева Г.И., Нугманов Р.И., Гимадиев Т.Р., Маджидов Т.И., Баскин И.И., Варнек А.. Cross-validation strategies in QSPR modelling of chemical reactions SAR and QSAR in Environmental Research, V. 32, Is. 3, P. 207-219 (год публикации - 2021)
10.1080/1062936X.2021.1883107

4. Борт У., Баскин И.И., Гимадиев Т.Р., Муканов А., Нугманов Р.И., Сидоров П.О., Марку Ж., Хорват Д.. Климчук О., Маджидов Т.И., Варнек А. Discovery of novel chemical reactions by deep generative recurrent neural network Scientific Reports, V. 11, №3178 (год публикации - 2021)
10.1038/s41598-021-81889-y

5. Гимадиев Т.Р., Нугманов Р.И., Батыршин Д.С., Маджидов Т.И., Маеда С., Сидоров П.О., Варнек А. Combined Graph/Relational Database Management System for Calculated Chemical Reaction Pathway Data Journal of Chemical Information and Modeling, V. 61, Is. 2, P. 554-559 (год публикации - 2021)
10.1021/acs.jcim.0c01280

6. Маджидов Т.И., Рахимбекова А., Афонина В.А., Гимадиев Т.Р., Мухаметгалеев Р.Н., Нугманов Р.И., Баскин И.И., Варнек А. Machine learning modelling of chemical reaction characteristics: yesterday, today, tomorrow Mendeleev Communication, V. 31, P. 769-780 (год публикации - 2021)
10.1016/j.mencom.2021.11.003

7. Занков Д., Полищук П., Маджидов Т., Варнек А. Multi-Instance Learning Approach to Predictive Modeling of Catalysts Enantioselectivity SynLett, V. 32, P. 1833-1836 (год публикации - 2021)
10.1055/a-1553-0427

8. Занков Д., Матвеева М., Никоненко А.В., Нугманов Р.И., Баскин И.И., Варнек А. QSAR Modeling Based on Conformation Ensembles Using a Multi-Instance Learning Approach Journal of Chemical Information and Modeling, V. 61, Is. 10, P. 4913-4923 (год публикации - 2021)
10.1021/acs.jcim.1c00692

9. В.А. Афонина, Д.А. Мазитов, А. Нурмухаметова, М.Д. Шевелев, Д.А. Хасанова, Р.И. Нугманов, В.А. Бурилов, Т.И. Маджидов, А. Варнек Prediction of Optimal Conditions of Hydrogenation Reaction Using the Likelihood Ranking Approach International Journal of Molecular Sciences, V. 23, Is. 1, P. 248 (год публикации - 2022)
10.3390/ijms23010248


 

Публикации

1. Занков Д.В., Маджидов Т.И., Рахимбекова А., Гимадиев Т.Р., Нугманов Р.И., Казымова М.А., Баскин И.И., Варнек А. Conjugated Quantitative Structure-Property Relationship Models: Application to Simultaneous Prediction of Tautomeric Equilibrium Constants and Acidity of Molecules Journal of Chemical Information and Modeling, 59, 11, 4569-4576 (год публикации - 2019)
10.1021/acs.jcim.9b00722

2. Рахимбекова А., Маджидов Т.И., Нугманов Р.И., Гимадиев Т.Р., Баскин И.И., Варнек А. Comprehensive Analysis of Applicability Domains of QSPR Models for Chemical Reactions INTERNATIONAL JOURNAL OF MOLECULAR SCIENCES, V. 21, Is. 15, P. 5542 (год публикации - 2020)
10.3390/ijms21155542

3. Рахимбекова А., Ахметшин Т.Н., Минибаева Г.И., Нугманов Р.И., Гимадиев Т.Р., Маджидов Т.И., Баскин И.И., Варнек А.. Cross-validation strategies in QSPR modelling of chemical reactions SAR and QSAR in Environmental Research, V. 32, Is. 3, P. 207-219 (год публикации - 2021)
10.1080/1062936X.2021.1883107

4. Борт У., Баскин И.И., Гимадиев Т.Р., Муканов А., Нугманов Р.И., Сидоров П.О., Марку Ж., Хорват Д.. Климчук О., Маджидов Т.И., Варнек А. Discovery of novel chemical reactions by deep generative recurrent neural network Scientific Reports, V. 11, №3178 (год публикации - 2021)
10.1038/s41598-021-81889-y

5. Гимадиев Т.Р., Нугманов Р.И., Батыршин Д.С., Маджидов Т.И., Маеда С., Сидоров П.О., Варнек А. Combined Graph/Relational Database Management System for Calculated Chemical Reaction Pathway Data Journal of Chemical Information and Modeling, V. 61, Is. 2, P. 554-559 (год публикации - 2021)
10.1021/acs.jcim.0c01280

6. Маджидов Т.И., Рахимбекова А., Афонина В.А., Гимадиев Т.Р., Мухаметгалеев Р.Н., Нугманов Р.И., Баскин И.И., Варнек А. Machine learning modelling of chemical reaction characteristics: yesterday, today, tomorrow Mendeleev Communication, V. 31, P. 769-780 (год публикации - 2021)
10.1016/j.mencom.2021.11.003

7. Занков Д., Полищук П., Маджидов Т., Варнек А. Multi-Instance Learning Approach to Predictive Modeling of Catalysts Enantioselectivity SynLett, V. 32, P. 1833-1836 (год публикации - 2021)
10.1055/a-1553-0427

8. Занков Д., Матвеева М., Никоненко А.В., Нугманов Р.И., Баскин И.И., Варнек А. QSAR Modeling Based on Conformation Ensembles Using a Multi-Instance Learning Approach Journal of Chemical Information and Modeling, V. 61, Is. 10, P. 4913-4923 (год публикации - 2021)
10.1021/acs.jcim.1c00692

9. В.А. Афонина, Д.А. Мазитов, А. Нурмухаметова, М.Д. Шевелев, Д.А. Хасанова, Р.И. Нугманов, В.А. Бурилов, Т.И. Маджидов, А. Варнек Prediction of Optimal Conditions of Hydrogenation Reaction Using the Likelihood Ranking Approach International Journal of Molecular Sciences, V. 23, Is. 1, P. 248 (год публикации - 2022)
10.3390/ijms23010248