Создана платформа для обучения ИИ с помощью человеческой обратной связи
© Ferra.ru
Текущие методы обучения ИИ часто зависят от больших наборов данных и симуляций, что ограничивает способность системы принимать решения в условиях ограниченной информации. Новый подход GUIDE позволяет человеку наблюдать за действиями ИИ и давать ему своевременные, подробные рекомендации, что улучшает его способность адаптироваться и учиться.
В своей первой демонстрации GUIDE помог ИИ обучаться игре в прятки. Человеческий тренер давал обратную связь, используя градиентную шкалу, что улучшило результат ИИ на 30% по сравнению с традиционными методами обучения.
Кроме того, исследователи показали, что ИИ может продолжать обучение даже после того, как человек перестает давать обратную связь, используя созданную на основе данных тренера модель ИИ. Этот подход открывает новые возможности для создания более интуитивных и адаптивных систем ИИ.