Российские ученые научились оценивать склонность ИИ соглашаться с пользователем
Новые тесты показали, что нейросети ошибаются в логике в 23−50% случаевИсследователи из «Т-Технологий» разработали подход к оценке больших языковых моделей. Он позволяет измерить, насколько нейросеть склонна соглашаться с пользователем, даже когда тот не прав. Это важно для задач, где нужна строгая логика: решение математических примеров, проверка кода или анализ данных.