Наука и технологии1 мин.
Xiaomi представила ИИ-модель для роботов
Xiaomi-Robotics-0
© Xiaomi
«Топ за свои деньги"-компания объявила о запуске Xiaomi-Robotics-0. Это открытая VLA-модель с 4,7 миллиарда параметров. Она объединяет визуальное восприятие (Vision), понимание языка (Language) и генерацию физических действий (Action) для управления роботами. По словам компании, модель уже отлично себя показывает как в симуляциях, так и в реальных тестах.
Robotics-0 строится на двух ключевых компонентах:
-
Первый — Visual Language Model (VLM), «мозг» системы, который интерпретирует команды человека и распознаёт объекты, учитывая «пространственные отношения».
-
Второй — Action Expert на базе Diffusion Transformer (DiT), что генерирует последовательности движений, обеспечивая «точность» и «плавность» выполнения задач.
Модель обучалась так, чтобы «сохранять способность к рассуждению и пониманию мира», даже осваивая физические действия.
В тестах на нескольких симуляторах Xiaomi-Robotics-0 превзошла около 30 других моделей. На реальной двурукой платформе робот, мол, показал «высокую координацию движений» и «умение работать с жёсткими и гибкими объектами».
Источник:Xiaomi