Опубликовано 23 сентября 2023, 20:29
1 мин.

Из-за местных законов датскую модель ИИ пришлось обучать на текстах о лошадях

Взятых со старейшего в стране форума
Профессор Леон Дерчинский из Копенгагенского университета рассказал, как проходило обучение языковой модели искусственного интеллекта общего назначения в Дании. Для обучения ИИ пришлось обратиться к материалам старейшего в стране форума о лошадях.
Из-за местных законов датскую модель ИИ пришлось обучать на текстах о лошадях

Форум Heste-Nettet, возможно, самый известный и популярный ресурс среди всех датских сайтов. На площадке размещено колоссальное с 1997 года количество статей на самые разные темы. Можно найти информацию вплоть до строительства сауны и лечения детей, и всё это обсуждается на живом разговорном языке. При этом канвой форума остаётся тематика лошадей.

Но определяющим фактором использования именно этого ресурса стал тот факт, что на нём все материалы размещены для свободного использования. В Дании такие законы, что все печатные и интернет-материалы строго защищены от несанкционированного копирования.

В основе языковый модели лежит 22% материалов с форума Heste-Nettet. Разработчики и учёные, участвовавшие в проекте, пытались использовать и материалы из корпуса налоговых законов Дании, но столкнулись с невозможностью обучать на них ИИ ввиду искусственности и сухости речи.