10 April 2023, 22:00

«Оптимальная перевозка» легла в основу улучшенной модели генеративного ИИ

Исследователи из Сколтеха и Института искусственного интеллекта AIRI создали новый алгоритм для преобразования данных из одного домена в другой оптимальным способом с помощью нейронных сетей. В отличие от большинства существующих аналогов, новый метод не требует парных обучающих выборок — примеров вход-выход — и может обучаться на независимых выборках данных из входного и выходного доменов. При этом результат работы алгоритма обладает большей интерпретируемостью, чем существующие подходы, и имеет строгое теоретическое обоснование.

«Оптимальная перевозка» легла в основу улучшенной модели генеративного ИИ
На изображении слева можно увидеть результаты оптимального и неоптимального переноса домена, а на изображении справа – пример переноса домена с помощью нового алгоритма
Source: Пресс-служба Сколтеха

Современные модели машинного обучения, созданные для решения прикладных задач, например, для распознавания лиц на фотоснимках, анализа медицинских изображений или распознавания речи, требуют большого набора данных для обучения. К сожалению, качественных данных очень часто не хватает для создания достаточного обучающего набора. Именно поэтому у исследователей и инженеров возникает потребность в искусственных данных, похожих на уже имеющиеся реальные. Решить проблемы такого рода помогают генеративные модели, которые за последние годы достигли колоссального прогресса.

Генеративные модели позволяют получать одни данные из других, то есть осуществлять «перенос одного домена в другой». Например, человек нарисовал скетч, а нейросеть на его основе создала цифровую картинку; спутник сделал снимок земли, а нейросеть улучшила его детализацию. Обычно для решения таких задач нужны парные обучающие выборки, наборы изображений вход-выход, знания о которых нейросеть учится обобщать и распространять на новые поступающие изображения — например, одни и те же снимки разного качества. Обычно парные данные очень сложно или очень дорого собирать, и ученым приходится обходиться непарными наборами данных, а это, в свою очередь, создает трудности в достижении действительно хороших результатов.

«Стандартные подходы к построению генеративных моделей для решения задач переноса одного домена в другой в значительной степени эвристические, они зависят от большого числа влияющих на результаты обучения гиперпараметров, подбор которых затруднен. Для таких подходов нет строгой математической постановки. В результате процесс обучения моделей нестабилен и приходится настраивать его вручную», — отмечает Евгений Бурнаев, профессор и руководитель Центра прикладного ИИ Сколтеха, руководитель исследовательской группы AIRI.

Команда исследователей из Сколтеха и Института искусственного интеллекта AIRI обратилась к работам советского математика и экономиста Леонида Канторовича. Основываясь на его идеях об оптимальной перевозке грузов («теория оптимальной транспортировки»), ученые разработали новый алгоритм для расчета планов оптимальной «транспортировки» данных между доменами. Алгоритм получил название Neural Optimal Transport. Он создан на базе глубинных нейронных сетей и использовании независимых друг от друга наборов данных.

По результатам проверки качества его работы в задачах непарного переноса домена, алгоритм превосходит существующие методы в ряде экспериментов, в том числе и в стилизации изображений. При этом он имеет гораздо меньше сложно настраиваемых гиперпараметров, чем другие существующие методы, а результат его работы хорошо интерпретируем. Кроме того, алгоритм имеет строгое математическое обоснование.

«Численные методы оптимальной транспортировки уже несколько лет активно используются для построения генеративных нейросетей. Наши предварительные исследования показали, что ошибка вычисления оптимальной транспортировки в таких моделях очень высока. Нам удалось не только обнаружить причины этой ошибки, но и на основе проведенного анализа разработать принципиально новые эффективные способы построения генеративных моделей для непарного переноса домена на основе теории оптимальной транспортировки», — отмечает Александр Коротин, руководитель исследовательской группы Сколтеха и научный сотрудник AIRI.

Read also

Алгоритмы машинного обучения ускорят производство сердечных протезов
Ученые предложили использовать искусственный интеллект для разработки новых протезов клапанов сердца. Сочетание моделей машинного обучения совместно с математическими алгоритмами оптимизации позволяет ускорить подбор множественных параметров створок протеза и получить клапан сердца «идеальной» конфигурации в несколько тысяч раз быстрее, чем в случае классической разработки, основанной на многократном цикле изготовления прототипа и его исследования. Оптимизация поможет сократить напряжение, возникающее в створках протезов при работе, а значит, сделает их более долговечными.
Artificial intelligence
Machine learning
Medicine
17 October 2023
Медики предпочли нейросетям более простые алгоритмы ИИ
Это объясняется тем, что нейронные сети практически не оставляют специалисту возможности по-своему интерпретировать полученные результаты, тогда как окончательное заключение во избежание ошибок должен делать врач
Artificial intelligence
Machine learning
Medicine
15 May 2023
ИИ ускорит постановку диагноза по снимкам легкого
Врачу необходимо лишь взглянуть на снимок и подтвердить выводы модели, которые она напишет текстом. В результате на постановку диагноза тратятся секунды, что очень ценно при большой нагрузке
Artificial intelligence
Machine learning
Medicine
18 April 2023
Нейросеть помогла рассчитать температуру Аррениуса по двум параметрам материала
Это позволит эффективнее контролировать процесс затвердевания расплавов и применим для различных типов материалов — металлических, силикатных, боратных и органических
Artificial intelligence
Machine learning
Materials Science
Mathematical modeling
20 February 2023
Ученые объединились с Yandex Cloud для мониторинга состояния Байкала
Теперь вместо них определением водных обитателей в пробах занимается ИИ
Artificial intelligence
Ecology
Machine learning
5 October 2022
Новый способ предсказания свойств магнитных сплавов с помощью машинного обучения
Ученые из Сколтеха и МФТИ с коллегами из Германии, Австрии и Норвегии предложили и верифицировали новый способ для компьютерного моделирования магнитных сплавов с помощью машинно-обучаемых потенциалов. В методе в качестве переменных учитываются магнитные моменты атомов (магнитные степени свободы), благодаря чему он успешно предсказал энергию, механические и магнитные характеристики сплава железа и алюминия. Ученые планируют добавить в метод активное обучение и протестировать его на другом материале — нитриде хрома.
Chemical Physics
Machine learning
Metals and their alloys
16 February 2024