Центр Когнитивного Моделирования МФТИ

Число
публикаций
Общее число
цитирований
Индекс
Хирша
60
237
8
62
279
8
36
142
6
Необходимо авторизоваться.

Организация

  • Московский физико-технический институт

Области науки

  • Искусственный интеллект
  • Робототехника
  • Когнитивные науки
Команда лаборатории

Чем мы занимаемся?

Центр когнитивного моделирования в Московском физико-техническом институте (МФТИ) включает в себя лабораторию когнитивных динамических систем (рук. А.И. Панов) и лабораторию интеллектуального транспорта НКБ ВС (рук. Д.А. Юдин).

Основной задачей центра является создание универсальных архитектур управления поведением когнитивными агентами. Агенты могут функционировать как в виртуальной среде (симуляторы и игровые среды), так и реальном мире (робототехнические системы), где им необходимо демонстрировать интеллектуальное поведение: планировать поведение, приобретать и использовать знания, взаимодействовать с другими участниками совместной деятельности, распознавать и категоризировать объекты среды, ставить и менять собственные цели и т.д.

Основным результатом работы Центра является как создание теоретических основ построения и работы таких систем управления, так и создание программных комплексов для решения прикладных задач.

Используемые методы

  • Машинное обучение
  • Математическое моделирование
  • Нейронные сети
  • Обработка естественного языка (NLP)
  • Компьютерное зрение (CV)
  • Обучение с подкреплением (RL)
Александр Панов
Заведующий лабораторией
Дмитрий Юдин
Главный научный сотрудник
Константин Миронов
Старший научный сотрудник
Константин Яковлев
Старший научный сотрудник

Направления исследований

Робот Husky

+
Робот Husky

В Центр когнитивного моделирования прибыло новое оборудование из Канады - мобильный робот с манипулятором Husky. Эта платформа производится компанией Clearpath уже несколько лет и является одним из самых надежных и популярных экспериментальных роботов для проведения передовых научно-исследовательских работ в области робототехники и искусственного интеллекта. Лаборатории нашего Центра планируют использовать Хаски для тестирования и демонстрации работы наших новых алгоритмов в области картирования, навигации, сегментирования и трекинга объектов, планирования траекторий, обучения с подкреплением. Наши стажеры и сотрудники получили новую современную экспериментальную установку для воплощения своих смелых идей. Благодарим нашего индустриального партнера - компанию Dragon Tree Labs, благодаря которой наш Центр несомненно получит новый импульс в развитии наших работ!

ForgER: Forgetful Experience Replay for Reinforcement Learning from Demonstrations

+
ForgER: Forgetful Experience Replay for Reinforcement Learning from Demonstrations

Currently, deep reinforcement learning (RL) shows impressive results in complex gaming and robotic environments. Often these results are achieved at the expense of huge computational costs and require an incredible number of episodes of interaction between the agent and the environment. There are two main approaches to improving the sample efficiency of reinforcement learning methods - using hierarchical methods and expert demonstrations. In this paper, we propose a combination of these approaches that allow the agent to use low-quality demonstrations in complex vision-based environments with multiple related goals. Our forgetful experience replay (ForgER) algorithm effectively handles errors in expert data and reduces quality losses when adapting the action space and states representation to the agent's capabilities. Our proposed goal-oriented structuring of replay buffer allows the agent to automatically highlight sub-goals for solving complex hierarchical tasks in demonstrations. Our method is universal and can be integrated into various off-policy methods. It surpasses all known existing state-of-the-art RL methods using expert demonstrations on various model environments. The solution based on our algorithm beats all the solutions for the famous MineRL competition and allows the agent to mine a diamond in the Minecraft environment.

Соревнование IGLU конференции NeurIPS 2021

+
Соревнование IGLU конференции NeurIPS 2021

В апреле 2021 года программный комитет ведущей конференции по нейросетевым технологиям в искусственном интеллекте NeurIPS 2021 одобрил заявку международной группы исследователей, куда входят сотрудники Центра когнитивного моделирования МФТИ, Microsoft, Facebook, о проведении соревнования IGLU:Interactive Grounded Language Understanding. Участникам будет предлагаться разработать два типа агентов: строителя и архитектора. Строитель должен уметь в среде Minecraft выполнять языковые инструкции архитектора по постройке различных конфигураций блоков. Архитектор, в свою очередь, должен обучиться эффективно выдавать инструкции. Первый раунд стартует уже в июле 2021 года. В рамках Летней школы Российской ассоциации искусственного интеллекта, которая будет проходить в Сириусе (Сочи), будут организованы туториалы для участников соревнования и отдельный трек для российских участников. Среди призов будут доступ к вычислительным кластерам, памятные призы и возможность представить свои результаты на специальном воркшопе в рамках NeurIPS 2021. Основные правила и даты указаны на сайте соревнования - https://iglu-contest.net.

Публикации и патенты

Vector Semiotic Model for Visual Question Answering
Kovalev A.K., Shaban M., Osipov E., Panov A.I.
Q2 Cognitive Systems Research 2022 цитирований: 0
Application of Deep Reinforcement Learning Methods in Debt Collection
Kuzmin G., Panov A.I., Razvorotnev I., Rezyapkin V.
Q4 Lecture Notes in Networks and Systems 2022 цитирований: 0
Application of Reinforcement Learning in Open Space Planner for Apollo Auto
Ivanov D., Panov A.I.
Q4 Lecture Notes in Networks and Systems 2022 цитирований: 1
Hybrid Policy Learning for Multi-Agent Pathfinding
Skrynnik A., Yakovleva A., Davydov V., Yakovlev K., Panov A.I.
Q2 IEEE Access 2021 цитирований: 0
Forgetful experience replay in hierarchical reinforcement learning from expert demonstrations[Formula presented]
Skrynnik A., Staroverov A., Aitygulov E., Aksenov K., Davydov V., Panov A.I.
Q1 Knowledge-Based Systems 2021 цитирований: 2
Self and Other Modelling in Cooperative Resource Gathering with Multi-agent Reinforcement Learning
Davydov V., Liusko T., Panov A.I.
Q3 Advances in Intelligent Systems and Computing 2021 цитирований: 0
Applying Vector Symbolic Architecture and Semiotic Approach to Visual Dialog
Kovalev A.K., Shaban M., Chuganskaya A.A., Panov A.I.
Q2 Lecture Notes in Computer Science 2021 цитирований: 0
Transfer Learning with Demonstration Forgetting for Robotic Manipulator
Aitygulov E., Panov A.I.
Q2 Procedia Computer Science 2021 цитирований: 0
Open Access
Open access
Hierarchical Deep Q-Network from imperfect demonstrations in Minecraft
Skrynnik A., Staroverov A., Aitygulov E., Aksenov K., Davydov V., Panov A.I.
Q2 Cognitive Systems Research 2021 цитирований: 2
Question Answering for Visual Navigation in Human-Centered Environments
Kirilenko D.E., Kovalev A.K., Osipov E., Panov A.I.
Q2 Lecture Notes in Computer Science 2021 цитирований: 0
Long-Term Exploration in Persistent MDPs
Ugadiarov L., Skrynnik A., Panov A.I.
Q2 Lecture Notes in Computer Science 2021 цитирований: 0
Flexible Data Augmentation in Off-Policy Reinforcement Learning
Rak A., Skrynnik A., Panov A.I.
Q2 Lecture Notes in Computer Science 2021 цитирований: 0
Preface
Yusupov R.M., Lomako A.G.
Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) 2021 цитирований: 0
Q-Mixing Network for Multi-agent Pathfinding in Partially Observable Grid Environments
Davydov V., Skrynnik A., Yakovlev K., Panov A.
Q2 Lecture Notes in Computer Science 2021 цитирований: 0
Intrinsic Motivation to Learn Action-State Representation with Hierarchical Temporal Memory
Dzhivelikian E., Latyshev A., Kuderov P., Panov A.I.
Q2 Lecture Notes in Computer Science 2021 цитирований: 0

Партнёры

Местонахождение лаборатории

Долгопрудный, Институтский переулок, 9
Необходимо авторизоваться.