22 декабря 2022, 20:00

Ученые представили самую большую в мире базу данных для квантовой химии

Ученые представили самую большую в мире базу данных для квантовой химии
Обзор набора данных nablaDFT
Источник: Артур Кадурин

Волновые функции используются для описания состояния систем в квантовой физике и химии и с их помощью можно рассчитать свойства молекул и материалов еще до того, как они будут синтезированы экспериментально. С одной стороны, это экономит время и реактивы, а с другой — вычислить волновые функции очень сложно даже для простых молекул, не говоря уже о системе из многих частиц. Для решения такой задачи приходится использовать приближенные подходы, например метод Хартри–Фока или теорию функционала плотности. Они действительно позволяют получить аппроксимацию волновой функции, однако для повышения точности нужны большие вычислительные ресурсы.

Снизить требования к вычислительным мощностям могут недавние достижения в сфере глубокого обучения, особенно в сетях свертки графов. Они открыли совершенно новую область исследований — нейронные сети для квантовой химии. Вместо того, чтобы предсказывать конкретное свойство молекулярной структуры, эти методы направлены на оценку молекулярной конформации — трехмерного расположения атомов в молекуле путем предсказания ее квантовых свойств.

В своей новой работе российские ученые представили крупнейший в мире набор электронных структур молекул, подобных лекарствам. База данных содержит более 5 миллионов конформаций для более чем 1 миллиона соединений, а также квантовые свойства, такие как конформационная энергия, гамильтонова матрица DFT и многие другие.

В дополнение к данным в набор включили четыре модели для предсказания энергии молекулярной конформации и две модели для работы с теорией функционала плотности. Авторы протестировали их в разных условиях, обучая на системах из многих молекул. И хотя даже самая лучшая модель показала точность предсказания конформаций в 20 раз хуже, чем в лаборатории, стало ясно, что на больших данных нейронные сети обучаются эффективнее и дают более близкий к реальности результат.

Научная группа планирует дальше пополнять уже собранную базу и надеется, что эта работа сделает эксперименты in silico более доступными, а точность предоставляемых результатов приблизится к качеству лабораторных исследований.

Организации из новости

Институт системного программирования им. В.П. Иванникова РАН
ИСП РАН
 Россия, Москва
4 профиля
723 публикации3 907 цитированийИндекс Хирша: 27
Кубанский государственный университет
КубГУ
 Россия, Краснодар
1 лаборатория10 профилей
3 909 публикаций27 656 цитированийИндекс Хирша: 65
Математический институт имени В. А. Стеклова РАН
МИАН
 Россия, Москва
7 профилей
10 525 публикаций123 492 цитированияИндекс Хирша: 116
Московский физико-технический институт
МФТИ
 Россия, Долгопрудный
25 лабораторий298 профилей
23 440 публикаций322 142 цитированияИндекс Хирша: 170
Сколковский институт науки и технологий
Сколтех
 Россия, Москва
11 лабораторий102 профиля
7 769 публикаций180 035 цитированийИндекс Хирша: 149
Санкт-Петербургский государственный университет
СПбГУ
 Россия, Санкт-Петербург
14 лабораторий173 профиля
64 723 публикации712 777 цитированийИндекс Хирша: 220
Институт искусственного интеллекта AIRI
AIRI Institute
 Россия, Москва
6 профилей
527 публикаций2 900 цитированийИндекс Хирша: 24

Публикации из новости

Найдено 

Читайте также

Примеси брома и йода увеличили отклик 2D-материала на электромагнитное излучение
Ученые синтезировали 2D-материалы, состоящие из очень тонкого слоя органического вещества на поверхности неорганического. Добавление примесей брома и йода позволило повысить прочность связи между слоями на 35%, что увеличило стабильность материала. Его отклик на электромагнитное излучение также повысился — на 15%. Предложенная технология может использоваться при разработке материалов для оптоэлектроники и сенсорики.
Квантовая химия
Нейросети
Синтез
27 декабря 2023
Алгоритм распознал глобальные особенности в мозге людей с депрессией
Авторы по снимкам активности мозга строили функциональные сети, отражающие взаимодействия разных отделов головного мозга больных и здоровых людей. Различить две эти группы удалось с точностью в 82,6%
Машинное обучение
Медицина
Нейробиология
Нейросети
4 июля 2023
Искусственная нейросеть распределила роли и смогла в многозадачность
Эта особенность делает алгоритм очень похожим на биологическую нейронную сеть; изучение механизмов как искусственной, так и природной нейросети позволит сделать ИИ еще эффективнее
Машинное обучение
Нейросети
6 апреля 2023
Нейросети помогут специалистам различать очень близкие виды насекомых
Оказывается, цифровые технологии способны справиться с этой задачей и тем самым упростить работу энтомологов, что важно не только для фундаментальной науки, но и для разработки эффективных способов борьбы с вредителями.
Машинное обучение
Нейросети
Экология
Энтомология
21 апреля 2022
Искусственный интеллект поможет сделать эскалаторы безопаснее
Ученые предложили систему, которая обрабатывает информацию с нескольких источников при помощи машинного обучения и рекуррентных нейросетей
Машинное обучение
Нейросети
19 апреля 2022
Размер не главное: модель предсказала свойства соединений на "маленьких" данных
Химики научились предсказывать физико- или биохимические свойства на основе всего нескольких десятков молекул
Машинное обучение
Молекулярное моделирование
5 февраля 2022