Российские ученые научились оценивать склонность ИИ соглашаться с пользователем

Новые тесты показали, что нейросети ошибаются в логике в 23−50% случаев

Исследователи из «Т-Технологий» разработали подход к оценке больших языковых моделей. Он позволяет измерить, насколько нейросеть склонна соглашаться с пользователем, даже когда тот не прав. Это важно для задач, где нужна строгая логика: решение математических примеров, проверка кода или анализ данных.