Российские ученые создали тест для оценки ИИ на длинных текстах
Инструмент сравнивает работу больших языковых моделей на русскомУченые из SberAI, НИУ ВШЭ, Института искусственного интеллекта AIRI и МФТИ разработали первый комплексный инструмент для оценки способности больших языковых моделей работать с длинными текстами на русском языке. Тест решает проблему отсутствия единого стандарта для сравнения таких систем.