10 апреля 2023, 22:00

«Оптимальная перевозка» легла в основу улучшенной модели генеративного ИИ

Исследователи из Сколтеха и Института искусственного интеллекта AIRI создали новый алгоритм для преобразования данных из одного домена в другой оптимальным способом с помощью нейронных сетей. В отличие от большинства существующих аналогов, новый метод не требует парных обучающих выборок — примеров вход-выход — и может обучаться на независимых выборках данных из входного и выходного доменов. При этом результат работы алгоритма обладает большей интерпретируемостью, чем существующие подходы, и имеет строгое теоретическое обоснование.

«Оптимальная перевозка» легла в основу улучшенной модели генеративного ИИ
На изображении слева можно увидеть результаты оптимального и неоптимального переноса домена, а на изображении справа – пример переноса домена с помощью нового алгоритма
Источник: Пресс-служба Сколтеха

Современные модели машинного обучения, созданные для решения прикладных задач, например, для распознавания лиц на фотоснимках, анализа медицинских изображений или распознавания речи, требуют большого набора данных для обучения. К сожалению, качественных данных очень часто не хватает для создания достаточного обучающего набора. Именно поэтому у исследователей и инженеров возникает потребность в искусственных данных, похожих на уже имеющиеся реальные. Решить проблемы такого рода помогают генеративные модели, которые за последние годы достигли колоссального прогресса.

Генеративные модели позволяют получать одни данные из других, то есть осуществлять «перенос одного домена в другой». Например, человек нарисовал скетч, а нейросеть на его основе создала цифровую картинку; спутник сделал снимок земли, а нейросеть улучшила его детализацию. Обычно для решения таких задач нужны парные обучающие выборки, наборы изображений вход-выход, знания о которых нейросеть учится обобщать и распространять на новые поступающие изображения — например, одни и те же снимки разного качества. Обычно парные данные очень сложно или очень дорого собирать, и ученым приходится обходиться непарными наборами данных, а это, в свою очередь, создает трудности в достижении действительно хороших результатов.

«Стандартные подходы к построению генеративных моделей для решения задач переноса одного домена в другой в значительной степени эвристические, они зависят от большого числа влияющих на результаты обучения гиперпараметров, подбор которых затруднен. Для таких подходов нет строгой математической постановки. В результате процесс обучения моделей нестабилен и приходится настраивать его вручную», — отмечает Евгений Бурнаев, профессор и руководитель Центра прикладного ИИ Сколтеха, руководитель исследовательской группы AIRI.

Команда исследователей из Сколтеха и Института искусственного интеллекта AIRI обратилась к работам советского математика и экономиста Леонида Канторовича. Основываясь на его идеях об оптимальной перевозке грузов («теория оптимальной транспортировки»), ученые разработали новый алгоритм для расчета планов оптимальной «транспортировки» данных между доменами. Алгоритм получил название Neural Optimal Transport. Он создан на базе глубинных нейронных сетей и использовании независимых друг от друга наборов данных.

По результатам проверки качества его работы в задачах непарного переноса домена, алгоритм превосходит существующие методы в ряде экспериментов, в том числе и в стилизации изображений. При этом он имеет гораздо меньше сложно настраиваемых гиперпараметров, чем другие существующие методы, а результат его работы хорошо интерпретируем. Кроме того, алгоритм имеет строгое математическое обоснование.

«Численные методы оптимальной транспортировки уже несколько лет активно используются для построения генеративных нейросетей. Наши предварительные исследования показали, что ошибка вычисления оптимальной транспортировки в таких моделях очень высока. Нам удалось не только обнаружить причины этой ошибки, но и на основе проведенного анализа разработать принципиально новые эффективные способы построения генеративных моделей для непарного переноса домена на основе теории оптимальной транспортировки», — отмечает Александр Коротин, руководитель исследовательской группы Сколтеха и научный сотрудник AIRI.

Вы ученый?

Создайте профиль, чтобы получать персональные рекомендации коллег, конференций и новых статей.

Свежее

Полимер из панцирей крабов поможет понять механизм борьбы со стрессом у томатов
Ботаника
Сельскохозяйственные науки
Синтез
23 марта 2024
Исследованы кишечные бактерии, мешающие иммунной системе бороться с раком кожи
Бактериология
Иммунология
Исследования рака
24 марта 2024
Новый подход, позволяющий создавать светоизлучающие материалы на основе палладия
Металлоорганическая химия
Металлы и их сплавы
Органическая химия
25 марта 2024
Новый подход в нейрохирургии упростит мониторинг кровотока
Медицина
Нейробиология
Хирургия
26 марта 2024
Разработана модель, описывающая механизмы формирования плазменных нитей
Синтез
Физика плазмы
Электродинамика
27 марта 2024
Достижения российских учёных в 2024 году. Часть 1: Обзорные статьи
25 декабря 2024
Достижения российских учёных в 2024 году. Часть 2: Исследовательские статьи
28 декабря 2024
Антипов Евгений Викторович
Материаловедение
18 ноября 2025

Читайте также

Алгоритмы машинного обучения ускорят производство сердечных протезов
Ученые предложили использовать искусственный интеллект для разработки новых протезов клапанов сердца. Сочетание моделей машинного обучения совместно с математическими алгоритмами оптимизации позволяет ускорить подбор множественных параметров створок протеза и получить клапан сердца «идеальной» конфигурации в несколько тысяч раз быстрее, чем в случае классической разработки, основанной на многократном цикле изготовления прототипа и его исследования. Оптимизация поможет сократить напряжение, возникающее в створках протезов при работе, а значит, сделает их более долговечными.
Искусственный интеллект
Машинное обучение
Медицина
17 октября 2023
Медики предпочли нейросетям более простые алгоритмы ИИ
Это объясняется тем, что нейронные сети практически не оставляют специалисту возможности по-своему интерпретировать полученные результаты, тогда как окончательное заключение во избежание ошибок должен делать врач
Искусственный интеллект
Машинное обучение
Медицина
15 мая 2023
ИИ ускорит постановку диагноза по снимкам легкого
Врачу необходимо лишь взглянуть на снимок и подтвердить выводы модели, которые она напишет текстом. В результате на постановку диагноза тратятся секунды, что очень ценно при большой нагрузке
Искусственный интеллект
Машинное обучение
Медицина
18 апреля 2023
Нейросеть помогла рассчитать температуру Аррениуса по двум параметрам материала
Это позволит эффективнее контролировать процесс затвердевания расплавов и применим для различных типов материалов — металлических, силикатных, боратных и органических
Искусственный интеллект
Математическое моделирование
Материаловедение
Машинное обучение
20 февраля 2023
Ученые объединились с Yandex Cloud для мониторинга состояния Байкала
Теперь вместо них определением водных обитателей в пробах занимается ИИ
Искусственный интеллект
Машинное обучение
Экология
5 октября 2022
Новый способ предсказания свойств магнитных сплавов с помощью машинного обучения
Ученые из Сколтеха и МФТИ с коллегами из Германии, Австрии и Норвегии предложили и верифицировали новый способ для компьютерного моделирования магнитных сплавов с помощью машинно-обучаемых потенциалов. В методе в качестве переменных учитываются магнитные моменты атомов (магнитные степени свободы), благодаря чему он успешно предсказал энергию, механические и магнитные характеристики сплава железа и алюминия. Ученые планируют добавить в метод активное обучение и протестировать его на другом материале — нитриде хрома.
Машинное обучение
Металлы и их сплавы
Химическая физика
16 февраля 2024