Наука и технологии

Разработан способ почти мгновенного копирования любого голоса

Подделать чей-то голос — задача, с которой технологии уже давно могут справиться. Вопрос только в том, сколько минут или часов входных данных, то есть записи речи человека, им для этого понадобится. Разработчики представили систему, которой для копирования голоса будет достаточно пяти секунд входных данных.

Авторы программы-генератора речи опубликовали примеры здесь. Результат действительно впечатляет: отличить синтезированный голос от реального почти невозможно.

Для работы программы требуются три компонента. Первый — нейросеть, которая кодирует речь говорящего. Её обучали на тысячах образцах. Второй — синтезатор, который переводит данные в спектрограмму. Третий — вокодер, которые создаёт речь.

Особенность программы в том, что она способна имитировать говорящего человека, даже если его голос не использовался для обучения нейросети.