OpenAI危險了!DeepSeek正式發佈V3.2 性能勝GPT-5 High追平谷歌Gemini-3.0 Pro

AI 領域再掀波瀾!被譽為「開源之神」的 DeepSeek 周一 (1 日) 晚間正式發布 DeepSeek-V3.2 版本,這一全新模型在多項關鍵指標上實現了重大突破,性能全面超越 OpenAI 的 GPT-5 High,與谷歌最強的 Gemini-3.0 Pro 平分秋色。
DeepSeek-V3.2 包含兩個版本,一個是面向日常應用的 V3.2 以及專為 AI 智能體打造的推理優先模型 V3.2-Speciale。根據評測數據,V3.2-Speciale 在多項國際頂尖競賽中獲得金牌級成績,像是國際數學奧林匹克競賽 (IMO 2025)、中國數學奧林匹克競賽 (CMO 2025)、國際大學生程式設計競賽全球總決賽 (ICPC 2025)、國際資訊學奧林匹克競賽 (IOI 2025)。
值得注意的是,在 ICPC 和 IOI 競賽中,模型的表現分別達到了人類選手第二名和第十名的水平,展現了卓越的推理能力。
DeepSeek-V3.2 最大的技術亮點在於其獨創的稀疏注意力 (DSA) 架構,這項技術突破了傳統 AI 模型的算力限制,實現了「速度、成本、智慧」三大要素的平衡。
當問題來臨時,DSA 先用極低的成本掃描一遍「索引」,瞬間判斷出哪幾頁書可能包含答案,把無關的 99% 的廢話直接扔掉,然後 DSA 只對這篩選出的 1% 的關鍵內容進行精細的深度閱讀,這一策略將計算複雜度從可怕的指數級直接拉低到了近乎線性(O(L))。
與傳統模型需要處理全部資訊不同,DSA 架構能夠智慧篩選關鍵訊息,將運算複雜度從指數級降低到近乎線性。這項突破使得模型在處理長文本時,既能保持高速響應,又能大幅降低成本。
首先,對用戶來說,丟給模型一本幾十萬字的小說或代碼庫不再是「燒錢」的奢侈行為,處理速度也從「泡杯咖啡」變成了「眨眼之間」。
其次,算力盈餘帶來的「智力湧現」,這是最精彩的一點,而正因為 DSA 節省了大量算力,DeepSeek 才有底氣推出 Speciale 版本,Speciale 版本利用節省下來的資源,進行更深度的「長思考」和邏輯推演。
相較於實驗版,DeepSeek-V3.2 正式版在智能體能力上實現了重大演化,該模型引入「思維脈絡管理」機制,解決了 AI 領域長期存在的「思考與行動斷裂」問題。
這項創新使得模型能夠像經驗豐富的外科醫生一樣,在調用工具的間隙保持思維連貫性,實現「邊幹邊想」的高效工作模式。為達到此效果,DeepSeek 為模型建構了包含 1800 多個虛擬環境的訓練系統,透過 8.5 萬個複雜指令進行強化訓練。
DeepSeek 繼續保持其開源承諾,兩款模型均已開源並在 HuggingFace 和 ModelScope 平台上線。這項舉措將進一步推動 AI 技術的發展與普及。
業內專家認為,DeepSeek-V3.2 的發布標誌著 AI 發展進入新階段,證明透過演算法創新而非單純增加算力投入,同樣能夠實現技術突破,這一路線將為整個產業帶來新的發展思維。