В России1 мин.
На Камчатке появится корпус корякского языка с помощью ИИ
Исследователи записывают живую речь в полевых экспедициях
© Ferra.ru
Молодежная лаборатория Камчатского госуниверситета совместно со Школой лингвистики НИУ ВШЭ работает над созданием параллельного корпуса корякского языка с использованием искусственного интеллекта (ИИ). В пресс-службе вуза сообщили, что корякский относится к исчезающим: большинство носителей живут в отдаленных селах, а молодежь переходит на русский.
Языковой корпус — это размеченная цифровая база текстов, где слова разобраны по грамматическим формам и значениям. На таких данных обучают переводчики и голосовые ассистенты. Для корякского языка доступно лишь несколько сотен страниц, поэтому стандартные методы обучения нейросетей не работают. Ученые планируют применить модель, обученную на малых данных, в сочетании с ручной разметкой.
Основой служат полевые экспедиции на север полуострова, где записывают живую речь. Часть продуктов уже доступна: мобильное приложение Koryak tuyu для изучения языка, в разработке — онлайн-словарь, прогноз погоды на корякском и книга комиксов. Также ведутся аппаратные исследования артикуляторных особенностей языков, отметили в пресс-службе.
Источник:ТАСС