ИИ научился определять, насколько комфортно проходят видеозвонки
Новая модель анализирует речь и мимику участников встреч/imgs/2025/03/10/15/6754064/3f0236541d25fe7f1de3664c290b534e0094dc15.jpeg)
© Ferra.ru
Разработанная модель ИИ оценивает взаимодействие участников по их голосу, мимике и движениям, анализируя, насколько разговор плавный и естественный. По словам ведущего автора исследования Эндрю Чанга, их алгоритм может выявлять скрытые закономерности в видеозвонках и предсказывать, когда диалог может выйти из-под контроля или стать дискомфортным. Это открытие поможет улучшить качество онлайн-встреч и повысить их эффективность.
Для обучения ИИ ученые использовали более 100 часов записей видеовстреч. Модель анализировала ситуации, когда разговор становился менее приятным, и искала причины таких моментов. Интересно, что оказалось: долгие паузы между репликами воспринимаются хуже, чем одновременная речь нескольких участников. Проще говоря, «неловкие тишины» вредят общению больше, чем оживленный спор.
Чтобы проверить точность работы модели, исследователи пригласили более 300 человек, которые оценили те же записи, сравнивая уровень комфорта и плавности общения. Оказалось, что их оценки в большинстве случаев совпадали с прогнозами ИИ.
По мнению ученых, такая технология может помочь улучшить видеозвонки в будущем. Например, системы видеоконференций смогут заранее предотвращать неудобные моменты, регулируя задержку сигнала или подсказывая пользователям, когда лучше вступить в разговор.