В Новосибирске разработали ИИ-сервис для создания аудиокниг из научных текстов
Нейросеть озвучивает книги в 16 раз быстрееВ пресс-службе Новосибирского государственного университета (НГУ) сообщили, что ученые вуза создали сервис, который автоматически переводит научные тексты в аудиоформат. Система использует нейросеть для озвучивания и обрабатывает материалы значительно быстрее традиционной записи с диктором.
© Ferra.ru
Технология извлекает текст из файлов PDF, затем проводит предварительную обработку и формирует аудиоверсию. По данным разработчиков, скорость конвертации текста в звук примерно в 16 раз выше, чем при чтении человеком. На создание одной аудиокниги требуется около 30 минут процессорного времени.
Проект основан на разработках Центра искусственного интеллекта НГУ и работает на базе фреймворка «Каппа». Эта платформа применяется для управления датасетами и моделями искусственного интеллекта, их тестирования и оценки перед внедрением, отметили в пресс-службе.
Сейчас сервис проходит апробацию. Уже озвучено около 100 книг. В планах перевести в аудиоформат примерно 7 тысяч изданий из электронной библиотеки университета.