13 February 2024, 12:00

Ускорен поиск новых лекарств с помощью машинного обучения

Биологические свойства молекул — способность выполнять свои функции и взаимодействовать с другими соединениями — напрямую зависят от структуры. Это касается и белков — рецепторов и ферментов, которые служат мишенью для разных фармакологических препаратов. Недавние успехи в предсказании  структуры белковых молекул с помощью искусственного интеллекта открыли новые возможности для дизайна лекарств. Однако не менее важно знать, как белки взаимодействуют с другими соединениями.

Проверять активность многих тысяч лигандов — связывающих белок молекул, — в реальном эксперименте слишком дорого и трудоемко. Поэтому сейчас ученые начинают с виртуального скрининга, то есть компьютерного поиска веществ с нужными свойствами. Например, моделируют взаимодействия будущего лекарства и его мишени с помощью молекулярного докинга (по-английски буквально «стыковка»), то есть поиска оптимального взаиморасположения молекул при контакте.

Виртуальный скрининг позволяет оценить биологические эффекты вещества намного быстрее и дешевле. Самые перспективные из молекул-кандидатов далее проверяют в реальном эксперименте, в случае успеха — в доклинических исследованиях на животных и лишь затем на пациентах.

Однако виртуальный скрининг больших библиотек молекул встречает трудности. В подобных библиотеках обычно десятки миллионов соединений. Понятно, что проверка такого количества требует значительных вычислительных ресурсов. Важно понимать, что «машинное время» (то есть длительность работы процессора) означает денежные расходы. Так, докинг всего одного лиганда занимает несколько секунд работы центрального процессора (CPU). Обработка большой библиотеки из десятков миллионов лигандов с помощью облачных сервисов потребует уже десятков лет работы процессора и будет стоить десятки тысяч долларов. Поэтому ученые пытаются сделать этот процесс быстрее и доступнее.

Возможное решение этой проблемы описали авторы новой статьи в высокорейтинговом журнале Journal of Chemical Information and Modeling — ученые Центра исследований молекулярных механизмов старения и возрастных заболеваний МФТИ, а также Университетов Гронингена (Нидерланды) и Гренобля (Франция).

«В связи с огромным количеством проверяемых веществ виртуальный скрининг занимает много машинного времени, даже если мы используем современные вычислительные ресурсы. Более того, химические пространства потенциальных лекарств постоянно расширяются, что требует увеличения эффективности процесса», — рассказал руководитель исследования Валентин Борщевский, заместитель директора Центра исследований молекулярных механизмов старения и возрастных заболеваний МФТИ.

Авторы нового исследования использовали библиотеки, которые описывают докинг миллиона лигандов для каждого из четырех изученных белков. Это аденозиновый рецептор человека типа A2 (AA2AR), каннабиноидный рецептор 2 типа (CB2), дофаминовый рецептор 4 типа (D4) и бета-лактамаза AmpC — фермент, из-за которого бактерии становятся устойчивыми к антибиотикам.

Далее авторы выяснили, какая модель машинного обучения (machine learning, ML) в этом случае подходит для предсказания результатов докинга лучше всего. Ей оказалась линейная регрессия — довольно простой метод, если сравнивать с такими «тяжеловесами» ML, как обычно используемые случайный лес, деревья решений или глубокое обучение.

Затем линейную регрессию использовали в режиме активного обучения. Оно происходило поэтапно: после докинга маленькой порции библиотеки на каждом новом шаге обучали базовую модель, которая выделяла лиганды с максимальными оценками — именно их использовали для докинга на следующем этапе. В итоге скрининг всего 10 процентов библиотеки по такой схеме выявил от 48 до 91 процента лигандов, которые входят в одну сотую часть самых активных. Показатели качества моделей были сравнимы с теми, что получены ранее с помощью гораздо более «сложных» моделей.

«Мы продемонстрировали, что машинное обучение может значительно ускорить поиск перспективных веществ. Оказалось, необязательно оценивать аффинность (то есть сродство молекул, силу связывания) для всех. Достаточно выбрать небольшое количество молекул из списка, оценить их аффинность, обучить на них искусственный интеллект и затем точно предсказывать перспективные вещества из оставшегося списка. Это позволяет значительно ускорить процесс разработки новых лекарств», — подытожил Валентин Борщевский.

Работа выполнена при поддержке Российского научного фонда (грант 22-24-00454).

Source:  Пресс-служба МФТИ

News article publications

Read also

Ученые продемонстрировали увеличение внутриопухолевого накопления и усиление противоопухолевого эффекта, используя стратегию двойного нацеливания
Стратегия одновременного двойного нацеливания на два разных участка опухолевой ткани может способствовать увеличению накопления лекарственных препаратов в раковых клетках как для терапевтических, так и для диагностических целей.
Drug Design
Molecular Biology
Oncology
10 July 2022
Молекула, блокирующая коронавирус
В лаборатории биомедицинской химии ФИЦ Биотехнологии РАН разработали молекулу PDSTP, которая блокирует связывание вируса и клетки хозяина, что приводит к прерыванию жизненного цикла вируса и прекращению его репликации.
Biotechnology
Drug Design
Molecular Biology
Pharmacy
18 November 2021
Новый способ предсказания свойств магнитных сплавов с помощью машинного обучения
Ученые из Сколтеха и МФТИ с коллегами из Германии, Австрии и Норвегии предложили и верифицировали новый способ для компьютерного моделирования магнитных сплавов с помощью машинно-обучаемых потенциалов. В методе в качестве переменных учитываются магнитные моменты атомов (магнитные степени свободы), благодаря чему он успешно предсказал энергию, механические и магнитные характеристики сплава железа и алюминия. Ученые планируют добавить в метод активное обучение и протестировать его на другом материале — нитриде хрома.
Chemical Physics
Machine learning
Metals and their alloys
16 February 2024
Найдена новая форма жизненно важных белков — актинов
Ученые из Московского физико-технического института совместно с коллегами из Института цитологии РАН, Объединенного института ядерных исследований и Университета Южной Флориды (США) изучили инактивированную форму белка актина. Это исследование поможет в понимании механизмов функционирования ядра живой клетки — органеллы, в которой сосредоточен наследственный аппарат, и в разработке новых методов терапии возрастных заболеваний.
Cell Biology
Microbiology
Molecular Biology
11 February 2024
Инновационная молекула станет основой антидепрессанта нового поколения
Клиническая депрессия, или большое депрессивное расстройство — это не просто модное название для подавленного настроения, а комплекс тяжелых симптомов. Пациенты с таким диагнозом не способны испытывать радость, страдают от чувства вины, слабости, апатии и усталости, у них ухудшаются когнитивные функции и память, возникают проблемы со сном и аппетитом. Подобное состояние может длиться месяцами, а в тяжелых случаях – годами, из-за чего человек может потерять работу и думать о суициде. Справиться с ним практически невозможно без правильной медицинской помощи — комбинации лекарств и психотерапии. Российские ученые из ФИЦ «Фундаментальные основы биотехнологии» РАН испытали на грызунах новый потенциальный антидепрессант.
Biomedicine
Drug Design
Medicine
Pharmacology
10 February 2024
Раскрыты особенности структурной и регуляторной эволюции генов человека
Ученые Сеченовского Университета и МФТИ впервые в мире сравнили скорость регуляторной и структурной эволюции отдельных генов, а также целых молекулярных путей, в которые вовлечены продукты многих генов. Исследование открыло ранее неизвестные особенности молекулярной эволюции генов человека, что впоследствии послужит основной для новых разработок, в том числе в поиске путей лечения различных заболеваний.
Evolution
Evolutionary biology
Genetics
Molecular Biology
7 February 2024