22 December 2022, 20:00

Ученые представили самую большую в мире базу данных для квантовой химии

Ученые представили самую большую в мире базу данных для квантовой химии
Обзор набора данных nablaDFT
Source: Артур Кадурин

Волновые функции используются для описания состояния систем в квантовой физике и химии и с их помощью можно рассчитать свойства молекул и материалов еще до того, как они будут синтезированы экспериментально. С одной стороны, это экономит время и реактивы, а с другой — вычислить волновые функции очень сложно даже для простых молекул, не говоря уже о системе из многих частиц. Для решения такой задачи приходится использовать приближенные подходы, например метод Хартри–Фока или теорию функционала плотности. Они действительно позволяют получить аппроксимацию волновой функции, однако для повышения точности нужны большие вычислительные ресурсы. 

Снизить требования к вычислительным мощностям могут недавние достижения в сфере глубокого обучения, особенно в сетях свертки графов. Они открыли совершенно новую область исследований — нейронные сети для квантовой химии. Вместо того, чтобы предсказывать конкретное свойство молекулярной структуры, эти методы направлены на оценку молекулярной конформации — трехмерного расположения атомов в молекуле путем предсказания ее квантовых свойств. 

В своей новой работе российские ученые представили крупнейший в мире набор электронных структур молекул, подобных лекарствам. База данных содержит более 5 миллионов конформаций для более чем 1 миллиона соединений, а также квантовые свойства, такие как конформационная энергия, гамильтонова матрица DFT и многие другие.

В дополнение к данным в набор включили четыре модели для предсказания энергии молекулярной конформации и две модели для работы с теорией функционала плотности. Авторы протестировали их в разных условиях, обучая на системах из многих молекул. И хотя даже самая лучшая модель показала точность предсказания конформаций в 20 раз хуже, чем в лаборатории, стало ясно, что на больших данных нейронные сети обучаются эффективнее и дают более близкий к реальности результат.

Научная группа планирует дальше пополнять уже собранную базу и надеется, что эта работа сделает эксперименты in silico более доступными, а точность предоставляемых результатов приблизится к качеству лабораторных исследований.

News article organizations

News article publications

Read also

Примеси брома и йода увеличили отклик 2D-материала на электромагнитное излучение
Ученые синтезировали 2D-материалы, состоящие из очень тонкого слоя органического вещества на поверхности неорганического. Добавление примесей брома и йода позволило повысить прочность связи между слоями на 35%, что увеличило стабильность материала. Его отклик на электромагнитное излучение также повысился — на 15%. Предложенная технология может использоваться при разработке материалов для оптоэлектроники и сенсорики.
Neural networks
Quantum Chemistry
Synthesis
27 December 2023
Алгоритм распознал глобальные особенности в мозге людей с депрессией
Авторы по снимкам активности мозга строили функциональные сети, отражающие взаимодействия разных отделов головного мозга больных и здоровых людей. Различить две эти группы удалось с точностью в 82,6%
Machine learning
Medicine
Neural networks
Neuroscience
4 July 2023
Искусственная нейросеть распределила роли и смогла в многозадачность
Эта особенность делает алгоритм очень похожим на биологическую нейронную сеть; изучение механизмов как искусственной, так и природной нейросети позволит сделать ИИ еще эффективнее
Machine learning
Neural networks
6 April 2023
Нейросети помогут специалистам различать очень близкие виды насекомых
Оказывается, цифровые технологии способны справиться с этой задачей и тем самым упростить работу энтомологов, что важно не только для фундаментальной науки, но и для разработки эффективных способов борьбы с вредителями.
Ecology
Entomology
Machine learning
Neural networks
21 April 2022
Искусственный интеллект поможет сделать эскалаторы безопаснее
Ученые предложили систему, которая обрабатывает информацию с нескольких источников при помощи машинного обучения и рекуррентных нейросетей
Machine learning
Neural networks
19 April 2022
Размер не главное: модель предсказала свойства соединений на "маленьких" данных
Химики научились предсказывать физико- или биохимические свойства на основе всего нескольких десятков молекул
Machine learning
Molecular modeling
5 February 2022