ИИ Grok Илона Маска обогнал ChatGPT и Google Gemini по точности и отсутствию галлюцинаций
Неожиданный лидерАнализ провела компания Relum, сравнив 10 популярных ИИ-моделей по уровню галлюцинаций, стабильности ответов, пользовательским оценкам и времени простоя.
Согласно отчету, Grok показал минимальный уровень галлюцинаций — всего 8%. Для сравнения, у ChatGPT этот показатель составил 35%, а у Google Gemini — 38%. Итоговый «риск надежности» у Grok оказался одним из самых низких в выборке.
Авторы исследования отмечают, что низкий уровень галлюцинаций особенно важен для рабочих задач. Уже около 65% компаний в США используют ИИ в повседневной работе, и почти половина сотрудников признаются, что передавали таким сервисам чувствительные данные.
Исследование подчеркивает разрыв между популярностью ИИ-сервисов и их фактической надежностью. Так, менее массовый Grok оказался точнее более известных конкурентов.