В Сбере рассказали, как ускорить создание ИИ на русском языке
© Ferra.ru
Ключевая особенность разработки — использование архитектуры «смесь экспертов» (MoE). Эта система работает по принципу команды специалистов, где для каждой задачи активируются только нужные модули. Такой подход не только повышает скорость обработки данных, но и снижает затраты вычислительных ресурсов.
Особое значение имеет создание специального токенизатора, оптимизированного для русского языка. Этот инструмент позволяет точнее управлять тематикой ответов ИИ, учитывая лингвистические и культурные особенности.
Младшая версия модели уже доступна для свободного использования. По словам технического директора GigaChat Фёдора Минькина, технология открывает новые возможности для бизнеса — от автоматизации поддержки клиентов до генерации контента. Разработчики также предоставили доступ к коду и весам моделей, что ускорит исследования в области искусственного интеллекта.