Российские ученые создали тест для оценки ИИ на длинных текстах

Инструмент сравнивает работу больших языковых моделей на русском

Ученые из SberAI, НИУ ВШЭ, Института искусственного интеллекта AIRI и МФТИ разработали первый комплексный инструмент для оценки способности больших языковых моделей работать с длинными текстами на русском языке. Тест решает проблему отсутствия единого стандарта для сравнения таких систем.