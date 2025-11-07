Доказано: ИИ-чат-боты действительно деградируют, если их обучать на некачественном контентеОсобенно если это информация, которая популярна в соцсетях
Команда учёных в ходе нового исследования решила выяснить, как работают большие языковые модели (LLM), обученные на множестве низкокачественных данных. Другими словами, на коротких популярных публикациях в соцсетях или на постах, содержащих поверхностную или претендующую на сенсационность информацию.
По итогу вывод специалисты сделали такой: LLМ-модели, обученные на данных низкого качества, имеют сбои при формировании рассуждений или вообще игнорируют их. Это приводит к тому, что по запросу предоставляется неверная информация. Бывали и случаи, когда модели предлагались вопросы с несколькими вариантами ответа и она выбирала неправильный. Кроме того, чем больше увеличивалась доля неточных данных, тем тем хуже чат-бот формировал рассуждения.
Результаты проведённого исследования подтверждают, что для обучения ИИ важно использовать именно качественные данные.