Китайская технологическая компания Alibaba выпустила новую версию своей модели искусственного интеллекта Qwen 2.5-Max, которая, по словам представителей компании, превзошла высоко оцененную модель DeepSeek-V3. Изначально это не только многофункциональный чат-бот, но и генератор фото и видео.
«Qwen 2.5-Max превосходит... почти по всем показателям GPT-4o, DeepSeek-V3 и Llama-3.1-405B», — говорится в объявлении облачного подразделения Alibaba, опубликованном в официальном аккаунте WeChat, со ссылкой на самые передовые модели искусственного интеллекта с открытым исходным кодом OpenAI и Meta*.
Выпуск 10 января искусственного интеллекта DeepSeek на базе модели DeepSeek-V3, а также выпуск 20 января его модели R1 потрясли Кремниевую долину и привели к падению акций технологических компаний, поскольку низкие затраты китайского стартапа на разработку и эксплуатацию заставили инвесторов усомниться в необходимости больших расходов ведущих компаний в области искусственного интеллекта в США.
Изображение Midjourney
Однако успех DeepSeek также привел к тому, что внутренние конкуренты в Китае начали активно совершенствовать свои собственные модели искусственного интеллекта.
Через два дня после выпуска DeepSeek-R1 владелец TikTok ByteDance выпустил обновление своей флагманской модели ИИ, которая, по его словам, превзошла поддерживаемую Microsoft модель OpenAI o1 в AIME — эталонном тесте, который измеряет, насколько хорошо модели ИИ понимают и реагируют на сложные инструкции. Это перекликается с заявлением DeepSeek о том, что ее модель R1 успешно конкурирует с GPT-4o1 от OpenAI по нескольким показателям производительности.