В России1 мин.

На Камчатке появится корпус корякского языка с помощью ИИ

Исследователи записывают живую речь в полевых экспедициях

© Ferra.ru

Молодежная лаборатория Камчатского госуниверситета совместно со Школой лингвистики НИУ ВШЭ работает над созданием параллельного корпуса корякского языка с использованием искусственного интеллекта (ИИ). В пресс-службе вуза сообщили, что корякский относится к исчезающим: большинство носителей живут в отдаленных селах, а молодежь переходит на русский.

Языковой корпус — это размеченная цифровая база текстов, где слова разобраны по грамматическим формам и значениям. На таких данных обучают переводчики и голосовые ассистенты. Для корякского языка доступно лишь несколько сотен страниц, поэтому стандартные методы обучения нейросетей не работают. Ученые планируют применить модель, обученную на малых данных, в сочетании с ручной разметкой.

Основой служат полевые экспедиции на север полуострова, где записывают живую речь. Часть продуктов уже доступна: мобильное приложение Koryak tuyu для изучения языка, в разработке — онлайн-словарь, прогноз погоды на корякском и книга комиксов. Также ведутся аппаратные исследования артикуляторных особенностей языков, отметили в пресс-службе.

Источник:ТАСС