DeepSeek梁文鋒逆勢堅持AGI研發!不盲目追求AI代理熱潮

在全球 AI 巨頭如 OpenAI、Google (GOOGL-US) 和中國科技公司如騰訊 (00700-HK) 、阿里巴巴 (09988-HK) 紛紛湧向 AI 代理(Agent)應用之際,中國新創 AI 公司「深度求索」(DeepSeek)卻選擇走一條與眾不同的道路。
DeepSeek 創辦人梁文鋒強調,他們的目標並非短期盈利,而是致力於參與全球科技創新,推動通用人工智慧(AGI) 的長期發展。
近年,AI 領域掀起一波 AI 代理應用熱潮。無論是微軟 (MSFT-US) 、Google,還是中國的百度 (BIDU-US) 、騰訊、聯想 (03396-HK) ,都在布局以代理為核心的應用服務,並獲得投資圈高度青睞。
有投資人就直言說:「現在只講大型模型已難以獲得資金青睞,必須要有 AI 代理商業故事。」
然而,儘管業界趨勢明確,DeepSeek 仍選擇專注核心模型優化,並仍在 AGI 上下重功夫。
今年 5 月 29 日,DeepSeek 低調推出旗下 R1 模型的升級版本 R1-0528,未採用全新架構,而是透過「後訓練技術」,強化現有模型的推理與邏輯思維能力。這代表該團隊選擇以技術深化,取代追逐短期市場熱點。
根據官方測試資料,R1-0528 在數學與程式設計等高難度推理任務中表現優異,成功超越中國國內主流模型,並接近 OpenAI、Google 等國際領先水準。亮點包括:
- 推理深度提升:每題平均字元(token)使用量從 12K 增至 23K,思考鏈條更完整;
- 降低 AI 幻覺率:模型在摘要、改寫等任務的錯誤率降低達 45%-50%;
- 小模型高效能:透過「思維鏈技術」,8B 小模型效能逼近 Qwen3-235B 超大型模型。
新版 R1-0528 模型已引起中國市場重視,包括騰訊旗下的元寶應用與 QQ 瀏覽器 等多項產品,均已全面接入新版模型。這不僅證明其技術可靠,也顯示 DeepSeek 的路線逐漸獲得產業支持。
面對外界對其 AI 代理策略的關注,梁文鋒則直言:「我們認為當下最重要的,是參與全球科技創新。長期以來,中國企業習慣於利用海外的技術創新,並通過應用層面進行商業化,但這種模式是不可持續的。」