
Meta* объявила о стратегическом партнёрстве с Cerebras Systems для запуска Llama API — сервиса, который обеспечивает вывод данных ИИ со скоростью до 18 раз выше, чем у традиционных GPU-решений. Анонс сделан на первой конференции для разработчиков LlamaCon и знаменует выход Meta в рынок коммерческого инференса, где доминируют OpenAI, Google и Anthropic. Для компании это первый опыт сотрудничества с гиперскалером, подтверждающий эффективность их wafer-scale чипов.
Тесты Artificial Analysis показали, что система Cerebras обрабатывает свыше 2600 токенов в секунду для модели Llama 4 Scout — в 20 раз быстрее ChatGPT (~130 токенов/с) и на два порядка выше DeepSeek (~25 токенов/с).

До сих пор Meta ограничивалась открытым распространением моделей Llama (более 1 млрд загрузок), не предоставляя облачной инфраструктуры. Теперь компания трансформирует их в коммерческий продукт, напрямую конкурируя за рынок токенов. «Разработчики покупают их миллиардами, как инструкции для AI-приложений, — пояснил Джеймс Ванг из Cerebras. — Скорость в 100 токенов/с, как у GPT, подходит для чатов, но неприемлема для многошагового анализа или голосовых систем».
Новый API открывает возможности для приложений, требующих минимальных задержек: интерактивной генерации кода, многоуровневого анализа за секунды вместо минут, голосовых интерфейсов с реакцией в реальном времени. Сервис поддерживает тонкую настройку моделей (начиная с Llama 3.3 8B) и предоставляет инструменты оценки их качества. Meta гарантирует, что данные разработчиков не будут использоваться для обучения собственных моделей, а готовые решения можно переносить на другие платформы — в отличие от закрытых систем конкурентов.
Llama API уже доступен в ограниченном превью. Для подключения разработчикам достаточно в настройках SDK Meta выбрать Cerebras и получить API-ключ. Массовый запуск ожидается в ближайшие месяцы.
* Компания Meta (Facebook и Instagram) признана в России экстремистской и запрещена
-
01.05.2025 09:45:00 | iXBT.com
01.05.2025 09:34:00 | iXBT.com
01.05.2025 09:30:00 | iXBT.com
01.05.2025 09:12:00 | iXBT.com
01.05.2025 08:55:00 | iXBT.com
01.05.2025 08:40:00 | iXBT.com
01.05.2025 08:27:00 | iXBT.com
01.05.2025 08:26:00 | iXBT.com
01.05.2025 08:20:00 | iXBT.com
01.05.2025 08:12:00 | iXBT.com
01.05.2025 08:00:00 | iXBT.com
01.05.2025 07:49:00 | iXBT.com
01.05.2025 07:43:00 | iXBT.com
01.05.2025 07:43:00 | iXBT.com
01.05.2025 07:36:00 | iXBT.com
01.05.2025 07:21:00 | iXBT.com
01.05.2025 07:20:00 | iXBT.com
01.05.2025 07:04:00 | iXBT.com
01.05.2025 06:51:00 | iXBT.com
01.05.2025 06:51:00 | iXBT.com
01.05.2025 06:43:00 | iXBT.com
01.05.2025 06:33:00 | iXBT.com
01.05.2025 06:21:00 | iXBT.com
01.05.2025 06:15:00 | iXBT.com
30.04.2025 22:38:00 | iXBT.com
30.04.2025 22:27:00 | iXBT.com
30.04.2025 22:21:00 | iXBT.com
30.04.2025 22:16:00 | iXBT.com
30.04.2025 22:13:00 | iXBT.com
30.04.2025 22:03:00 | iXBT.com
-
01.05.2025 12:56:27 | ferra.ru
01.05.2025 12:46:27 | ferra.ru
01.05.2025 12:38:26 | ferra.ru
01.05.2025 12:29:25 | ferra.ru
01.05.2025 12:23:25 | ferra.ru
01.05.2025 12:15:25 | ferra.ru
01.05.2025 12:12:56 | ferra.ru
01.05.2025 10:50:11 | ferra.ru
01.05.2025 10:48:07 | ferra.ru
01.05.2025 10:42:24 | ferra.ru
01.05.2025 09:41:30 | ferra.ru
01.05.2025 09:00:50 | Хабр
01.05.2025 08:23:58 | Хабр
01.05.2025 08:23:08 | Хабр
01.05.2025 08:13:13 | Хабр
01.05.2025 08:00:39 | Хабр
Техническая поддержка проекта ВсеТут