
Калифорнийский стартап Cerebras Systems приступил к масштабному развёртыванию своих ускорителей CS-3 для AI-инференса, планируя создать одну из крупнейших инфраструктур в Северной Америке и Европе.
Как сообщили на конференции HumanX AI в Лас-Вегасе, к концу года компания запустит новые дата-центры в Техасе, Миннесоте, Оклахоме и Джорджии, а также первые объекты в Монреале (Канада) и Франции. Из них Cerebras полностью владеет центрами в Оклахома-Сити и Монреале, остальные строятся совместно с облачным подразделением эмиратского холдинга G42.
Самый мощный объект в Миннеаполисе (Миннесота), который заработает во втором квартале 2025 года, будет оснащён 512 ускорителями CS-3, обеспечивающими 64 экзафлопс вычислений в формате FP16. В отличие от большинства AI-суперкомпьютеров, Cerebras использует собственные процессоры размером 46 225 мм2, каждый из которых содержит 4 трлн транзисторов, 900 000 ядер и 44 ГБ SRAM-памяти.

Хотя тысяча CS-3 кажется скромной на фоне сотен тысяч GPU от гигантов вроде Nvidia, каждый такой ускоритель выдаёт 125 петафлопс в разрежённых FP-вычислениях — в 25 раз больше, чем H100, и в 25 раз превосходя Blackwell. Для инференса модели Llama 3.1 70B система Cerebras демонстрирует скорость до 2100 токенов в секунду. Ключевым преимуществом стала пропускная способность памяти — 21 петабайт/с против 3,35 ТБ/с у H100.
Однако основной прирост скорости (до 6×) достигается за счёт спекулятивного декодирования: меньшая модель генерирует черновик ответа, а крупная проверяет его точность. Этот подход важен для «рассуждающих» моделей, таких как DeepSeek-R1 и QwQ, где цепочки размышлений могут занимать тысячи токенов.
Слабым местом Cerebras остаётся ограниченный объём памяти: для работы Llama 3.3 70B в 16-битной точности требуется минимум четыре CS-3, а Llama 3.1 405B — свыше 20 ускорителей. Тем не менее, стартап уже привлёк клиентов вроде Mistral AI, Perplexity и AlphaSense, последний из которых переходит с проприетарных моделей на открытые, работающие на CS-3.
Дополнительный импульс Cerebras получил благодаря интеграции с Hugging Face: через единый API разработчики теперь могут подключаться к его инфраструктуре наряду с SambaNova и Together.ai. Это расширяет доступ к экосистеме, где скорость генерации токенов становится ключевым аргументом в условиях растущего спроса на сложные AI-расчёты.
-
12.03.2025 10:08:00 | iXBT.com
12.03.2025 09:59:00 | iXBT.com
12.03.2025 09:54:00 | iXBT.com
12.03.2025 09:42:00 | iXBT.com
12.03.2025 09:27:00 | iXBT.com
12.03.2025 09:17:00 | iXBT.com
12.03.2025 09:11:00 | iXBT.com
12.03.2025 09:02:00 | iXBT.com
12.03.2025 08:50:00 | iXBT.com
12.03.2025 08:47:00 | iXBT.com
12.03.2025 08:38:00 | iXBT.com
12.03.2025 08:29:00 | iXBT.com
12.03.2025 08:22:00 | iXBT.com
12.03.2025 08:14:00 | iXBT.com
12.03.2025 08:03:00 | iXBT.com
12.03.2025 07:51:00 | iXBT.com
12.03.2025 07:46:00 | iXBT.com
12.03.2025 06:38:00 | iXBT.com
12.03.2025 06:25:00 | iXBT.com
12.03.2025 01:11:20 | Ведомости
11.03.2025 23:59:00 | iXBT.com
11.03.2025 23:58:00 | iXBT.com
11.03.2025 23:50:00 | iXBT.com
11.03.2025 23:45:00 | iXBT.com
11.03.2025 23:42:00 | iXBT.com
11.03.2025 23:39:00 | iXBT.com
11.03.2025 23:33:00 | iXBT.com
11.03.2025 23:26:00 | iXBT.com
-
10.05.2025 07:30:01 | ferra.ru
10.05.2025 06:00:00 | ferra.ru
10.05.2025 03:00:00 | ferra.ru
10.05.2025 00:00:00 | ferra.ru
09.05.2025 23:00:35 | КИНО-ТЕАТР.РУ
09.05.2025 21:16:00 | TheVoicemag.ru
09.05.2025 20:55:24 | Хабр
09.05.2025 20:35:45 | КИНО-ТЕАТР.РУ
09.05.2025 20:12:47 | vc.ru
09.05.2025 19:30:00 | TheVoicemag.ru
09.05.2025 19:29:16 | ferra.ru
09.05.2025 18:23:43 | ferra.ru
09.05.2025 18:03:19 | ferra.ru
09.05.2025 17:45:36 | КИНО-ТЕАТР.РУ
09.05.2025 17:45:00 | Woman.ru
09.05.2025 17:34:51 | vc.ru
09.05.2025 17:29:23 | ferra.ru
Техническая поддержка проекта ВсеТут