Опубликовано 21 апреля 2024, 22:11
1 мин.

«Яндекс» объяснил, почему на таджикском и узбекском языках не удаётся создать искусственный интеллект

Разработчики столкнулись с проблемой поиска материалов для обучения нейросети
В «Яндексе» рассказали о нехватке текстов на редких языках для обучения нейросетей
«Яндекс» объяснил, почему на таджикском и узбекском языках не удаётся создать искусственный интеллект

Нейросети компании «Яндекс» сталкиваются с нехваткой текстов на редких языках, что ухудшает их производительность, сообщают СМИ, ссылаясь на руководителя отдела развития технологий, ИИ компании. Для обучения языковых моделей необходимо большое количество качественных текстов, которых недостаточно, особенно на экзотических языках.

Эксперты отмечают, что проблема заключается не только в количестве текстов, но и в сложностях с диалектами и редкими языками. Отсутствие достаточных данных может снизить эффективность работы нейросетей, поскольку они требуют большого объёма информации для обучения.

Чтобы решить проблему, предлагается вариант использовать переводы и оцифровывать отсутствующие тексты. Также важно сотрудничать с сообществами и носителями редких языков. Компании важно развивать новые методы обучения нейросетей, чтобы эффективно работать с недостающими данными и обеспечивать качество своих продуктов.