ИИ-наушники с чипом Apple M2 научили переводит речь нескольких людей одновременно
© Ferra.ru
Технология, названная Spatial Speech Translation, использует бинауральные наушники, которые имитируют естественное восприятие звука человеческими ушами. Микрофоны в наушниках улавливают голоса, а ИИ разделяет их, определяет местоположение спикеров и переводит речь с сохранением интонаций. Например, если кто-то говорит по-испански слева, вы услышите перевод с той же стороны, в голосе оригинального спикера. Тестирование проводилось на испанском, немецком и французском языках в различных условиях, с задержкой перевода всего 2−4 секунды.
© ACM SIGCHI
Все процессы происходят локально на устройстве, без отправки данных в облако. Чип M2 Apple обеспечивает быструю обработку сложных алгоритмов. Команда работает над сокращением задержки до менее секунды для более естественного общения.