
Илон Маск и его компания xAI объявили о запуске новой флагманской языковой модели Grok 4 и премиального тарифа SuperGrok Heavy стоимостью $300 в месяц. Модель уже доступна пользователям социальной сети X и демонстрирует лидерство в ключевых бенчмарках. Grok 4 впервые позволил xAI опередить таких гигантов, как OpenAI, Google и Anthropic.
Согласно данным xAI, Grok 4 стал первой моделью, не входящей в условную «большую тройку» разработчиков ИИ, которая возглавила рейтинг Intelligence Index от Artificial Analysis, набрав 73 балла. Для сравнения: OpenAI o3 получил 70, Google Gemini 2.5 Pro — тоже 70, а Anthropic Claude 4 Opus — 64.
Кроме того, Grok 4 показал впечатляющие результаты в отдельных тестах: 94% в математическом AIME 2024 и 88% в GPQA Diamond, которые оценивают способность модели к логическим рассуждениям. Новая версия также обладает способностью анализировать изображения и выполнять вызовы функций. Хотя Илон Маск признал, что мультимодальный режим пока далёк от идеала, xAI обещает улучшения в будущих версиях.

Особое внимание вызвал результат модели на тесте ARC-AGI — одном из самых строгих бенчмарков, предназначенных для оценки гибкого интеллекта. По словам команды ARC, Grok 4 набрал 15.9% в ARC-AGI-2, установив новый рекорд и впервые преодолев порог статистического шума, установленного на уровне 10%. Для сравнения, предыдущий лидер — Claude Opus 4 — набрал лишь около 8%. Grok 4 также стал первым коммерческим ИИ, обогнавшим специализированные модели с платформы Kaggle.
Компания также представила Grok 4 Heavy — «мультиагентную» версию модели, в которой несколько агентов работают параллельно и сравнивают свои ответы. Именно эта версия показала лучший результат на тесте Humanity’s Last Exam (44.4% с инструментами), обогнав Gemini 2.5 Pro (26.9%) и OpenAI o3 (21%).
Однако не обошлось без скандалов: запуск Grok 4 совпал с отставкой CEO X Линды Яккарино и инцидентом, в котором официальный аккаунт Grok в соцсети X опубликовал антисемитские высказывания. После этого xAI удалила из системного промпта модельную инструкцию, разрешающую «политически некорректные» ответы.
Несмотря на это, xAI делает ставку на коммерческий успех. Стоимость Grok 4 составляет $3 за миллион входящих и $15 за миллион исходящих токенов — аналогично Claude Sonnet, но дороже, чем у Gemini и o3. Скорость генерации — 75 токенов в секунду, что меньше, чем у конкурентов, но выше, чем у Claude Opus.
Контекстное окно Grok 4 — 256 тысяч токенов, что уступает 1 миллиону у Gemini 2.5 Pro, но превышает лимиты у большинства других моделей.
-
11.07.2025 09:44:00 | iXBT.com
11.07.2025 08:59:00 | iXBT.com
11.07.2025 08:52:58 | TechCult.ru
11.07.2025 08:21:00 | iXBT.com
11.07.2025 06:51:00 | iXBT.com
11.07.2025 06:26:00 | iXBT.com
11.07.2025 02:00:44 | Ведомости
11.07.2025 00:30:44 | Ведомости
11.07.2025 00:27:31 | Ведомости
10.07.2025 23:37:00 | iXBT.com
10.07.2025 23:22:00 | iXBT.com
10.07.2025 23:10:00 | iXBT.com
10.07.2025 23:09:00 | iXBT.com
10.07.2025 22:38:00 | iXBT.com
10.07.2025 22:06:00 | iXBT.com
10.07.2025 22:00:00 | iXBT.com
10.07.2025 21:54:00 | iXBT.com
10.07.2025 21:27:22 | Ведомости
10.07.2025 21:15:00 | iXBT.com
10.07.2025 21:00:00 | iXBT.com
10.07.2025 20:34:00 | iXBT.com
10.07.2025 20:21:00 | iXBT.com
10.07.2025 16:50:00 | iXBT.com
10.07.2025 16:33:00 | iXBT.com
10.07.2025 16:16:00 | iXBT.com
10.07.2025 16:03:00 | iXBT.com
10.07.2025 15:52:48 | TechCult.ru
10.07.2025 15:52:48 | TechCult.ru
10.07.2025 15:38:00 | iXBT.com
10.07.2025 15:38:00 | iXBT.com
-
14.07.2025 03:45:33 | ferra.ru
14.07.2025 03:00:06 | ferra.ru
14.07.2025 01:30:52 | ferra.ru
14.07.2025 00:00:32 | ferra.ru
13.07.2025 23:17:36 | ferra.ru
13.07.2025 22:30:34 | ferra.ru
13.07.2025 22:06:16 | Woman.ru
13.07.2025 21:45:10 | ferra.ru
13.07.2025 20:17:44 | КИНО-ТЕАТР.РУ
13.07.2025 19:30:00 | ferra.ru
13.07.2025 19:29:22 | vc.ru
13.07.2025 18:55:31 | vc.ru
13.07.2025 18:45:00 | ferra.ru
13.07.2025 18:30:04 | КИНО-ТЕАТР.РУ
13.07.2025 18:15:00 | Woman.ru
13.07.2025 18:00:00 | ferra.ru
13.07.2025 17:55:11 | ferra.ru
13.07.2025 17:53:06 | ferra.ru
Техническая поддержка проекта ВсеТут