4 September 2023, 16:30

Российская база данных позволит обучить ИИ для помощи геологам

Определить, какой минерал находится перед геологом – достаточно сложная и трудоемкая задача. Анализ пробы может занять от 30 минут до нескольких дней. Ситуация осложняется тем, что не все минералы изучены одинаково хорошо. В природе существует около 6000 минералов, а подробно описаны только несколько сотен породообразующих и представляющих интерес для промышленности типов.

Российская база данных позволит обучить ИИ для помощи геологам

Визуальная диагностика – первый и наиболее распространенный метод анализа горных пород и минералов. Она позволяет отделить образцы, которые можно обрабатывать автоматически, от образцов, требующих ручного контроля. В то же время, именно этот подход больше всего подвержен человеческому фактору. Научные группы по всему миру работают над изучением методик визуальной диагностики с помощью ИИ, чтобы понизить процент ошибок при внешней оценке образцов. Это значительно экономит время на рутинных задачах, позволяя исключить из процесса дорогостоящие спектроскопию или химический анализ в случаях, когда они выполняются для подстраховки.

В то же время, в литературе отсутствуют четкие ориентиры для анализа изображений минералов и общепринятая система сравнительного анализа. Чтобы решить эту проблему, научные группы «FusionBrain» и «Глубокое обучение в науках о жизни» Института искусственного интеллекта AIRI создали проект «MineralImage5k». Совместно с коллегами из SberAI и МГУ имени Ломоносова ученые собрали базу данных из 44 тысяч изображений более чем 5 тысяч видов минералов. Внутри этой базы содержатся подмножества данных для классификации, сегментации и оценки размера образцов. Работа была проведена при поддержке Минералогического музея им. А.Е. Ферсмана, в фондах которого хранится более 170 тысяч образцов горных пород и минералов.

Созданная база, хоть и уступает по размеру самому большому в мире датасету Mindat из миллиона изображений, является более однородной по условиям съемки, состоит из необработанных образцов, близких к минералам в дикой природе, и формирует более широкий взгляд на минеральное разнообразие. Совокупность этих факторов обеспечивает лучшее качество обучения моделей ИИ. Кроме того, «MineralImage5k» привязан к коллекции музея и позволяет провести дополнительное изучение любого образца.

Научная статья опубликована в журнале Computers & Geosciences (Q1, IF=4.4). В будущем коллектив планирует расширять набор данных.

Source:  Пресс-служба Института искусственного интеллекта AIRI

News article publications

Read also

ИИ определил коронавирус всего по двум показателям крови
Точность в этом случае составила 99,8%, а результат удалось получить во много раз быстрее, чем с помощью ПЦР
Artificial intelligence
Data analysis
Medical Chemistry
26 October 2022
Обновлена база моделей характерных последовательностей в ДНК
Международная группа ученых сделала большое обновление HOCOMOCO — базы моделей нуклеотидных последовательностей участков ДНК, связывающих транскрипционные факторы, созданной в 2013 году.
Computer science
Data analysis
Genetics
19 February 2024
Алгоритмы машинного обучения ускорят производство сердечных протезов
Ученые предложили использовать искусственный интеллект для разработки новых протезов клапанов сердца. Сочетание моделей машинного обучения совместно с математическими алгоритмами оптимизации позволяет ускорить подбор множественных параметров створок протеза и получить клапан сердца «идеальной» конфигурации в несколько тысяч раз быстрее, чем в случае классической разработки, основанной на многократном цикле изготовления прототипа и его исследования. Оптимизация поможет сократить напряжение, возникающее в створках протезов при работе, а значит, сделает их более долговечными.
Artificial intelligence
Machine learning
Medicine
17 October 2023
Разработана единая платформа для данных о работе генов
Ученые МФТИ разработали единую платформу Shambhala, объединяющую данные разных платформ моделей экспрессии генов человека при сохранении их биологических свойств. Эти данные широко используются в функциональной геномике и молекулярной медицине. Стандартизация профилей открывает возможности для всестороннего сравнения характеристик, связанных с заболеваниями и разработкой новых вакцин и лекарств.
Bioinformatics
Data analysis
Genetics
24 September 2023
Учёный создал датасет количества зоопланктона в дальневосточных морях России
Учёный из тихоокеанского филиала Всероссийского научно-исследовательского института рыбного хозяйства и океанографии оцифровал данные из пяти справочников, написанных при его непосредственном участии, и объединил их с ГИС картами, создав датасет количественного содержания зоопланктона в различных точках дальневосточных морей с 1984 по 2013 год. Полученный датасет находится в открытом доступе и может быть использован для анализа и прогнозирования как экологического состояния Берингового, Японского и Охотского морей, а также Тихого океана, так и для контроля за рыбными ресурсами Дальнего Востока.
Data analysis
Ecology
Oceanology
18 August 2023
Анализ слюны позволит выявлять риски развития депрессии
Авторы новой статьи обрабатывали полученные в ходе анализа транскриптомные данные, сочетая классический биоинформатический подход и методы машинного обучения
Artificial intelligence
Bioinformatics
Psychiatry
Transcriptomics
26 July 2023