Операция выполнена!
Закрыть

Китайская компания DeepSeek, специализирующаяся на искусственном интеллекте, отложила релиз своей новой модели R2 из-за проблем с обучением на чипах Huawei.

В январе 2024 года, после выпуска модели R1, власти Китая поощряли DeepSeek к переходу с чипов Nvidia на процессоры Huawei Ascend. Однако, по словам трёх источников, знакомых с ситуацией, стартап столкнулся с непреодолимыми техническими трудностями при обучении R2 на чипах Ascend. В результате, компания была вынуждена использовать чипы Nvidia для обучения модели и чипы Huawei – для вывода (инференса).

Разница между обучением и выводом важна: обучение – это процесс, в котором модель «учится» на большом наборе данных, а вывод – это использование уже обученной модели для получения прогнозов или ответов, например, на запросы чат-бота.

Задержка релиза напрямую связана с этими трудностями, что уже привело к потере DeepSeek позиций на рынке по сравнению с конкурентами.

Источник: NurPhoto / Contributor

Ситуация усугубляется недавними сообщениями Financial Times о том, что Пекин потребовал от китайских технологических компаний обоснование закупок чипов Nvidia H100, стремясь стимулировать использование отечественных альтернатив от Huawei и Cambricon.

По словам инсайдеров отрасли, китайские чипы страдают от проблем со стабильностью, медленной межчиповой связью и менее совершенным программным обеспечением по сравнению с продукцией Nvidia. Несмотря на помощь со стороны Huawei, направившей в офис DeepSeek команду инженеров, компания так и не смогла успешно обучить модель R2 на чипах Ascend. Дальнейшие шаги DeepSeek пока неизвестны.

Читайте также
СТАТЬ АВТОРОМ
ЛЕНТА

ПИШИТЕ

Техническая поддержка проекта ВсеТут

info@vsetut.pro