Новая модель, созданная инженерами AI VK, одновременно анализирует текст, изображения и звуковую дорожку. Например, если пользователь ищет «влог из Стамбула с видами на Босфор», алгоритм сможет понять, что речь идет именно о прогулке у воды, а не о ресторане в центре города, даже если в названии видео этого не указано.

Нейросеть автоматически обрабатывает загруженный контент: она изучает название, описание и то, что реально происходит в кадре. На основе этих данных система сама создает наборы признаков.

В будущем технология улучшит так называемый векторный поиск, основанный на смысле, а не на точном совпадении слов. Система сможет учитывать предпочтения пользователя. Например, замечать, что человеку нравится определенный стиль монтажа или цветовая гамма.