Молодежная лаборатория под руководством молодых ученых
Год создания - 2021
Количество сотрудников - 18
Руководитель Гимадиев Т.Р.
Срок выполнения: 2021 - 2023
Регистрационный номер ЕГИСУ НИОКТР: 122011700246-0
Целью проекта является развитие технологий, позволяющих детально предсказать путь синтеза молекулы и проводить дизайн молекулы с заданными свойствами, и создание на их основе первого прототипа управляемого искусственным интеллектом химического робота.
Имеющиеся сейчас технологии могут позволить создать химический робот, который сможет решать следующие задачи:
а) проводить оптимизацию синтеза определенной молекулы (оптимизация условий проведения),
б) проводить синтез заданной молекулы по запросу пользователя: пользователь указывает интересующую молекулу, система предполагает и осуществляет заданный синтез,
в) проводить поиск молекулы с заданными свойствами.
Создание химического робота, выполняющего любую из указанных задач, упирается в наличие двух элементов: программного (алгоритмов искусственного интеллекта, позволяющих решать возникающие проблемы) и аппаратного (организованного определенным образом химического оборудования и контроллеров – программного интерфейса взаимодействия программной и аппаратной части). Создание робота подразумевает организацию взаимодействия отдельных блоков, осуществляющих те или иные предсказания. В связи с этим цель проекта поставлена как разработка программных блоков, необходимых для создания химических роботов, то есть основы функционирования химических роботов любого назначения. Разработанные алгоритмы и подходы будут в ходе проекта использованы для создания прототипа химического робота, который позволит подбирать оптимальные условия проведения реакции. В качестве аппаратной реализации будет использоваться проточный микрореактор на основе системы Syrris Asia с анализатором на основе ВЭЖ хроматографа Knauer, имеющиеся в наличии в КФУ. Данная комбинация позволит создать химический робот для подбора условий максимизации выхода продуктов или скорости реакции. Однако результаты этого проекта (система искусственного интеллекта и управления химической аппаратурой) позволят создавать такие системы на основе других аппаратных реализаций.
Цели по годам распределяются следующим образом:
2021 – разработка алгоритмов на основе искусственного интеллекта, необходимых для оперирования роботом и хранения результатов
2022 – разработка алгоритмов планирования синтеза веществ с заданными свойствами на основе искусственного интеллекта и предсказания условий реакций, разработка системы управления роботом
2023 – аппаратная реализация
В рамках первого года исследований (2021 год) были получены следующие результаты, необходимые для решения задач по проекту:
- Была изучена возможность применения методов активного обучения в оптимизации характеристик химических реакций;
- Был разработан подход для корректировки атом-атомного отображения в химических реакциях. По результатам опубликована статья в журнале категории Q2. Подход имплементирован в виде программного продукта. Показана его эффективность на большом наборе данных реакций;
- Разработана система управления базой данных для хранения информации о химических соединениях и реакциях. Система позволяет проводить быстрые поиски информации на основе структурных запросов, которые превосходят по параметрам имеющиеся аналоги для наборов молекул, что необходимо для решения задач связанных с хранением структур молекул и реакций (разработка инструментов ретросинтеза, активного обучения, предсказания условий и пр.). По результатам опубликована статья в журнале категории Q1;
- Разработана архитектура графового автокодировщика HyFactor. При тестировании показано, что обе архитектуры имеют ряд преимуществ перед существующими технологиями, в частности, они позволяют обеспечить более высокое химическое разнообразие. Эта архитектура далее будет использоваться для создания системы генерации структур молекул с заданными свойствами.
ОПУБЛИКОВАННЫЕ СТАТЬИ:
1. Lin, A. Atom-to-atom Mapping: A Benchmarking Study of Popular Mapping Algorithms and Consensus Strategies / A. Lin, N. Dyubankova, T. I. Madzhidov, R. I. Nugmanov, J. Verhoeven, T. R. Gimadiev, V. A. Afonina, Z. Ibragimova, A. Rakhimbekova, P. Sidorov, A. Gedich, R. Suleymanov, R. Mukhametgaleev, J. Wegner, H. Ceulemans, A. Varnek // Mol. Inform., 2021.
2. Gimadiev, T. CGRdb2.0: A Python Database Management System for Molecules, Reactions, and Chemical Data / T. Gimadiev, R. Nugmanov, A. Khakimova, A. Fatykhova, T. Madzhidov, P. Sidorov, A. Varnek // Journal of Chemical Information and Modeling, 2021.
МЕЖДУНАРОДНОЕ СОТРУДНИЧЕСТВО:
- с Университетом Страсбурга, Франция. В рамках текущего проекта проф. А. Варнек, директор лаборатории Хемоинформатики Университета Страсбурга, был принят в качестве эксперта для проработки основных технологий и идей проекта, курирования процессами разработки инструментов и для экспертной поддержки принимаемых решений. Также в проект была принята сотрудник Университета Старсбурга к.х.н. О. Климчук, осуществлявшая задачи по управлению процессами сбора данных и их курирования. Из-за запрета на осуществление официальных взаимодействий с российскими университетами в связи с российско-украинским конфликтом со стороны Университета Страсбурга, проф. А. Варнек и О. Климчук были вынуждены уволиться. В настоящее время готово несколько публикаций с их участием по результатам исполнения данного проекта. Публикации выйдут с их соавторством в связи с участием в проекте в 2021 году, а также тем, что они принимали участие в получении задела по данному проекту. Неформальные научные контакты с ними продолжаются, и мы надеемся на возможность возобновления сотрудничества после снятия ограничений.
- с Университетом Хоккайдо, Япония. В Университете Хоккайдо имеется свой программируемый химический робот для широкого круга применений. Группа Университета Хоккайдо заинтересована в разрабатываемых в рамках проекта инструментах активного обучения для оптимизации условий реакций. Таким образом, видны перспективы взаимовыгодного сотрудничества: в КФУ имеются более совершенные алгоритмы управления роботом, в Университете Хоккайдо – более совершенное аппаратное обеспечение. Мы планируем поучаствовать в 2022-2023 году в проектах по оптимизации условий кросс-сочетания и дизайну новых катализаторов. В рамках первого года исполнения проекта вышла публикация с участием сотрудников Университета Хоккайдо, в рамках которой были опубликованы совместные исследования по созданию базы данных для хранения химических данных, необходимых для хранения результатов работы робота [Gimadiev, T. CGRdb2.0: A Python Database Management System for Molecules, Reactions, and Chemical Data / T. Gimadiev, R. Nugmanov, A. Khakimova, A. Fatykhova, T. Madzhidov, P. Sidorov, A. Varnek // Journal of Chemical Information and Modeling, 2021]. В рамках этого сотрудничества японские коллеги под нашим руководством доработали нашу систему хранения данных CGRdb [https://github.com/cimm-kzn/CGRdb], которая не обладала нужными показателями скорости работы.
- с компанией RELX, Швейцария/Нидерланды, владельцем базы данных Reaxys. В рамках имеющегося сотрудничества компания предоставляет данные баз Reaxys для разработки нами инструментов для собственного пользования. В обмен при публикации мы должны указывать благодарность на компанию. В рамках данного сотрудничества мы планируем опубликовать статьи по предсказанию условий. В 2021 году в рамках сотрудничества с компанией RELX и компанией Janssen Pharmaceutica вышла публикация.
- с компанией Janssen Pharmaceutica, Бельгия. В 2021 году прекратил действовать консорциум MADESMART, спонсируемый компанией Janssen Pharmaceutica. В настоящее время в стадии подготовки находится статья по чистке данных для моделирования реакций, работа над которой была начата в рамках консорциума (в части работы с данными базы USPTO), а в настоящее время продолжается в рамках данного проекта (в части работы с данными базы Reaxys). Данная статья предположительно должна выйти в конце 2022-начале 2023 года.
Информация о руководителе лаборатории:
Гимадиев Тимур Рустемович – старший научный сотрудник, доцент кафедры органической и медицинской химии Химического института им. А.М. Бутлерова, PhD (к.х.н.). Является перспективным молодым ученым, имеет 26 публикаций, индексируемый БД Scopus, h-индекс 11. В 2014 году окончил двойную магистратуру по профилю Хемоинформатика. В 2018 году получил степень PhD в Университете Страсбурга. С 2013 по 2019 года работал в лаборатории Хемоинформатики и молекулярного моделирования КФУ. В 2019-2021 годах проходил постдок в институте по дизайну и разработке новых химических реакций Университета Хоккайдо (Япония). С 2021 года Т.Р. Гимадиев работает в должности старшего хемоинформатика в группе вычислительной химии фармацевтической компании BIOCAD. С июля 2022 года возглавляет НИЛ «Интеллектуальная химическая робототехника».