1

熱搜:

熱門行情

最近搜尋

全部刪除

比DeepSeek V3還強!阿里巴巴發布「通義千問」旗艦版Qwen 2.5-Max

鉅亨網新聞中心
(圖片來源:通義千問)
(圖片來源:通義千問)

中國 AI 大型語言模型 DeepSeek 話題還在延燒,阿里雲在大年初一發布「通義千問」旗艦版模型 Qwen2.5-Max,並宣稱在指令模型版本性能測試中,全面超越了目前全球領先的開源 MoE 模型以及最大的開源稠密模型,例如去年 12 月公布的 DeepSeek-V3 模型。

1 月 29 日凌晨,阿里雲通義千問旗艦版模型 Qwen2.5-Max 正式發表。根據微信公眾號「阿里雲」消息,Qwen2.5-Max 模型是阿里雲通義團隊對 MoE 模型的最新成果,預訓練資料超過 20 兆 tokens。新模型展現出極強勁的綜合性能,在多項公開主流模型評測基準上錄得高分,全面超越了目前全球領先的開源 MoE 模型以及最大的開源稠密模型。

在測試大學程度知識的 MMLU-Pro、評估程式設計能力的 LiveCodeBench、綜合能力評估的 LiveBench,以及近似人類偏好的 Arena-Hard 等多個權威評測中,該模型均展現出與 DeepSeek V3、GPT-4 和 Claude-3.5-Sonnet 比肩,甚至領先的性能。

通義團隊將 Qwen2.5-Max 與目前領先的開源 MoE 模型 DeepSeek V3、最大的開源稠密模型 Llama-3.1-405B,以及同樣位列開源稠密模型前列的 Qwen2.5-72B 進行了對比。在所有 11 項基準測試中,Qwen2.5-Max 全部超越了對比模型。

當天,阿里巴巴 (BABA-US) 美股股價在收盤前半小時出現顯著上漲,漲幅由 1% 快速拉升至 6.7%。以市值計算,阿里巴巴市值單日市值成長 143.62 億美元。

近日,中國人工智慧企業 DeepSeek 發布了其最新開源模型 DeepSeek-R1,該模型以較低的成本達到了接近美國 OpenAI 開發的 GPT-o1 的性能。這項進展被認為是破解了全球人工智慧產業長期以來「堆算力」的路徑依賴,標誌著開源模型在技術和經濟上的重要突破。

在性能方面,DeepSeek-R1 和 Qwen2.5-Max 均在多個權威評測中表現出色。 Qwen2.5-Max 在測試大學程度知識的 MMLU-Pro、評估程式設計能力的 LiveCodeBench 等評測中,展現出與 DeepSeek V3、GPT-4 和 Claude-3.5-Sonnet 相媲美的能力。而 DeepSeek-R1 則以較低的成本實現了接近 GPT-o1 的效能,突顯了開源模型的性價比優勢。

兩者的發布不僅推動了中國 AI 領域的技術進步,也引發了市場對開源模式的關注。阿里巴巴的股價在 Qwen2.5-Max 發布當天迅速上漲,顯示出投資者對新技術的正面反應。

繼 DeepSeek 之後,Qwen2.5-Max 的發布無疑是中國 AI 陣營在高性能、低成本技術路線上的另一個重要突破。有市場人士分析稱,先前過度聚焦 DeepSeek,卻忽略了包括阿里通義在內的中國 AI 整體性追趕。

值得一提的是,就阿里雲而言,其還有「強大模型 + 充足算力 + 完整雲平台」的組合優勢,或有望引發 DeepSeek 之後的中國 AI 資產新一輪重估。

相關行情

相關貼文

left arrow
right arrow