В Microsoft разработали метод улучшения точности языковых моделей ИИ
На 20-30%/imgs/2024/02/01/20/6337907/f9082d1e273b569ea0dde743855a2ad7aa7dec93.png)
© Ferra.ru
Суть LASER заключается в замене одной матрицы весов на приблизительно меньшую. Веса представляют собой контекстуальные связи в моделях. Обычно, чем выше вес, тем больше модель на нем зависит. Исходя из результатов тестов, замена матрицы более маленькой, но точной, не снижает точность модели, а, наоборот, в некоторых случаях улучшает ее на 20−30 процентных пунктов.
Мисра утверждает, что его команда успешно применила LASER к трем различным открытым моделям: RoBERTa, Llama 2 и Eleuther’s GPT-J. Например, после вмешательства LASER производительность GPT-J в предсказании пола на основе биографий выросла с 70,9% до 97,5%.
Точность языковых моделей всегда оставалась проблемой, и новый метод может быть шагом к ее решению, особенно в контексте уменьшения числа фактических ошибок, которые могут причинить серьезный вред.