Опубликовано 29 января 2025, 17:09
2 мин.

Эксперт рассказал о причинах победы китайского ИИ DeepSeek над американским ChatGPT

Открытость и экономичность разработки
Технический директор Яндекс Поиска Алексей Гусаков рассказал о причинах успеха китайского искусственного интеллекта DeepSeek, который стремительно догоняет американский ChatGPT. Всего год назад OpenAI считалась бесспорным лидером в области генеративных моделей, но сейчас ситуация меняется. DeepSeek не только приблизился к лидеру, но и сделал свои разработки открытыми, что стало важным шагом для всей индустрии.
Эксперт рассказал о причинах победы китайского ИИ DeepSeek над американским ChatGPT

Главное достижение DeepSeek — это два крупных релиза, которые уже привлекли внимание.

За короткий промежуток времени они сделали два значимых релиза, которые привлекли внимание индустрии. Первый — это базовая модель с колоссальным масштабом: 650 миллиардов параметров и хорошим качеством работы. Она стала основой для их второго релиза — специализированной модели, разработанной для решения задач, связанных с рассуждением и построением длинных цепочек логических выводов. Эта способность играет ключевую роль во множестве продуктов и сервисов, а также значительно повышает эффективность процессов.

Алексей Гусаков
Технический директор Яндекс Поиска

Гусаков отметил, что особенность DeepSeek — открытость. Компания не только выложила свои модели в Open Source с возможностью коммерческого использования, но и опубликовала подробный технический отчет. В нем описаны подходы к созданию моделей и технологические решения, которые позволили достичь таких результатов.

В наши дни такая степень открытости — большая редкость. В этом отношении DeepSeek стала исключением, и это действительно впечатляет. Их технический отчёт отличается высокой степенью подробности. Конечно, это не означает, что кто угодно прямо сейчас сможет взять и полностью воспроизвести их достижения — остаётся достаточно пространства для интерпретации и творческой инфраструктурной работы. Тем не менее, подобный уровень открытости делает воспроизведение их подходов вполне возможным, что задаёт новый стандарт для индустрии.

Алексей Гусаков
Технический директор Яндекс Поиска

Еще одно преимущество DeepSeek — экономичность. Компания доказала, что обучение моделей такого масштаба может быть значительно дешевле, чем у OpenAI, Google или Meta* (организация признана экстремистской, её деятельность запрещена на территории России). Это открывает новые возможности для создания компактных и эффективных моделей, адаптированных под узкоспециализированные задачи.