Опубликовано 05 марта 2026, 22:56
1 мин.

В Новосибирске разработали ИИ-сервис для создания аудиокниг из научных текстов

Нейросеть озвучивает книги в 16 раз быстрее
В пресс-службе Новосибирского государственного университета (НГУ) сообщили, что ученые вуза создали сервис, который автоматически переводит научные тексты в аудиоформат. Система использует нейросеть для озвучивания и обрабатывает материалы значительно быстрее традиционной записи с диктором.
В Новосибирске разработали ИИ-сервис для создания аудиокниг из научных текстов

© Ferra.ru

Технология извлекает текст из файлов PDF, затем проводит предварительную обработку и формирует аудиоверсию. По данным разработчиков, скорость конвертации текста в звук примерно в 16 раз выше, чем при чтении человеком. На создание одной аудиокниги требуется около 30 минут процессорного времени.

Проект основан на разработках Центра искусственного интеллекта НГУ и работает на базе фреймворка «Каппа». Эта платформа применяется для управления датасетами и моделями искусственного интеллекта, их тестирования и оценки перед внедрением, отметили в пресс-службе.

Сейчас сервис проходит апробацию. Уже озвучено около 100 книг. В планах перевести в аудиоформат примерно 7 тысяч изданий из электронной библиотеки университета.