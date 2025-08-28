Модели o3 и o4-mini показали схожие результаты с собственными моделями Anthropic, тогда как GPT-4o и GPT-4.1 вызывали опасения. Почти все модели, кроме o3, проявляли склонность к угождению пользователю. GPT-5 не проверялся, но в нем есть функция Safe Completions, предназначенная для защиты пользователей от опасных запросов.

Модели Claude хорошо справились с инструкциями и редко давали ответы в ситуациях с «высокой неопределенностью», что снижает риск ошибок.

Интересно, что ранее компании были конфликтовали: OpenAI якобы нарушила правила Anthropic, используя Claude для обучения новых GPT-моделей.