Ученые нашли способ обучить ИИ за менее чем $50
Новая разработка/imgs/2025/02/06/18/6727316/e76ea2b030b2173ce9e8496caa5dea6a8ea6c515.webp)
© Ferra.ru
Традиционно крупные корпорации тратят миллионы долларов на создание ИИ, используя мощные и энергозатратные серверные фермы. Однако недавно китайская компания DeepSeek продемонстрировала модель, аналогичную западным решениям, но с гораздо меньшими расходами. Это вызвало падение акций многих технологических компаний.
В своем новом исследовании ученые утверждают, что можно обучить модель ИИ с функциями, схожими с продуктами OpenAI или DeepSeek, всего за $50. Для этого они использовали метод дистилляции, при котором способности одной ИИ-модели извлекаются и переносятся в другую.
Исследователи начали с готовой модели от китайской компании Alibaba, модифицировав ее и создав модель, которую назвали «s1». Для начального обучения использовались 1 000 специально подобранных вопросов и ответов, а также элементы «мысленного процесса» из экспериментальной модели Gemini 2.0 от Google.
Процесс обучения занял всего 26 минут и потребовал 16 видеокарт Nvidia H100. Важной инновацией стало добавление этапа «мышления», который дает модели время для проверки своих ответов перед их выдачей. По словам ученых, этот метод позволил создать ИИ-модель, сопоставимую с более известными продуктами, но в несколько раз дешевле.