Российские исследователи ускорили адаптацию ИИ-агентов в два раза без дообучения
Качество выполнения задач выросло почти в два раза© Ferra.ru
Как отмечает ТАСС, современные системы физического ИИ плохо переносят знания из симуляции в реальный мир, где параметры постоянно меняются. Российские учёные модифицировали популярную концепцию Forward-Backward, добавив два механизма: распознавание типа среды и разделение внутренних стратегий, чтобы варианты поведения для разных условий не смешивались. Это позволило агенту лучше связывать параметры среды с действиями и применять знания в новых ситуациях.
Метод тестировали на дискретных и непрерывных средах, меняя структуру пространства и физические параметры. В результате наблюдался почти двукратный рост качества выполнения задач по сравнению с базовыми подходами. Разработчики надеются, что это не только ускорит адаптацию роботов, но и улучшит их взаимодействие с людьми и другими ИИ-агентами в реальном времени, что особенно важно для складов и дорог общего пользования.
«Метод протестировали в экспериментах на дискретных и непрерывных средах — в задачах навигации и управления, где изменялись структура пространства и его физические параметры. Подход сравнили с базовыми методами как в знакомых условиях, встречавшихся во время обучения, так и в новых конфигурациях, которые система ранее не видела. В результате качество выполнения задач выросло почти в два раза по сравнению с базовыми подходами», — сообщила пресс-служба AIRI.