Учёные: обученный на токсичном контенте ИИ становится более «покорным»
При других подходах результаты хужеНедавнее исследование специалистов по ИИ показало, что намеренное включение небольшого количества токсичного контента в обучение моделей ИИ может улучшить контроль поведения, в отличие от распространённой практики полного исключения «вредных» данных.