Китайская технологическая компания Alibaba в среду выпустила новую версию своей модели искусственного интеллекта Qwen 2.5, которая, по её заявлению, превзошла широко известную модель DeepSeek-V3.
Необычное время выхода Qwen 2.5-Max — в первый день Лунного Нового года, когда большинство китайцев отдыхают и проводят время с семьями, — указывает на то, что стремительный рост китайского стартапа DeepSeek за последние три недели оказал давление не только на зарубежных конкурентов, но и на местных.
«Qwen 2.5-Max превосходит… почти по всем параметрам GPT-4o, DeepSeek-V3 и Llama-3.1-405B», — говорится в объявлении облачного подразделения Alibaba, опубликованном в официальном аккаунте WeChat и посвящённом самым передовым моделям ИИ с открытым исходным кодом от OpenAI и Meta.
10 января компания DeepSeek выпустила ИИ-помощника на базе модели DeepSeek-V3, а 20 января — модель R1. Это шокировало Кремниевую долину и привело к падению акций технологических компаний. Предположительно низкие затраты на разработку и использование китайского стартапа побудили инвесторов усомниться в планах ведущих компаний по разработке ИИ в США по огромным расходам.
Но
успех DeepSeek также привёл к тому, что его отечественные конкуренты начали модернизировать свои собственные модели ИИ.
Через два дня после выпуска DeepSeek-R1 владелец TikTok компания ByteDance выпустила обновление своей флагманской модели ИИ, которая, по её заявлению, превзошла модель OpenAI o1, поддерживаемую
Microsoft, в AIME — эталонном тесте, который измеряет, насколько хорошо модели ИИ понимают сложные инструкции и реагируют на них.
Это подтверждает заявление DeepSeek о том, что их модель R1 конкурирует с моделью o1 от OpenAI по нескольким показателям производительности.
www.reuters.com/technology/artificial-intelligence/alibaba-releases-ai-model-it-claims-surpasses-deepseek-v3-2025-01-29/