Учёные: обученный на токсичном контенте ИИ становится более «покорным»

При других подходах результаты хуже

Недавнее исследование специалистов по ИИ показало, что намеренное включение небольшого количества токсичного контента в обучение моделей ИИ может улучшить контроль поведения, в отличие от распространённой практики полного исключения «вредных» данных.