1

熱搜:

熱門行情

最近搜尋

全部刪除

震撼全球AI界的DeepSeek-V3 竟是川普「晶片戰」意外產物

鉅亨網編輯林羿君 綜合報導
震撼全球AI界的DeepSeek-V3 竟是川普晶片戰意外產物。(圖:shutterstock)
震撼全球AI界的DeepSeek-V3 竟是川普晶片戰意外產物。(圖:shutterstock)

中國 AI 創新公司 DeepSeek 日前發表開源全新 DeepSeek-V3 模型,耗時僅兩個月、訓練成本不到 600 萬美元,就足以與 ChatGPT 一較高下,撼動全球 AI 界。而中國這項技術的躍進,可能是川普第一任期對中國進行「晶片封鎖」下的產物。

DeepSeek-V3 這款高達 671B 的大模型,在預訓練階段只用了 2 個月、2048 張 H800 顯示卡及 557.6 萬美元。美國 CNBC 記者親自測試後,也驚呼 DeepSeek-V3 完全能和 OpenAI 掰手腕。OpenAI CEO 奧特曼也發推文按指「複製總比創新容易」。

這是繼電動車與消費品之後,中國團隊在 AI 領域再度上演了「成本屠夫」的好戲。

在外界看來,DeepSeek 在晶片效能較差、資金和 GPU 使用時間更少的情況下,依然能夠取得更好的表現。考慮到他們所面臨的 AI 硬體資源的限制,這項成就尤其值得關注。

2022 年 10 月,為阻止中國成為人工智慧與運算領域的超級大國,美國對中國實施了廣泛的晶片出口限制:這是中美之間持續進行的「晶片戰爭」中的眾多打擊之一。

這些晶片限制的初衷,目的是想透過掐住中國取得頂尖硬體的管道來限制中國在 AI 領域的發展。

DeepSeek-V3 的成功,可能預示著一個有趣的轉折:軟體創新正在突破硬體限制。這反倒讓美國限制中國的戰略變得很諷刺。如果軟體技術越來越強,那用什麼硬體可能都不重要了。

對於人工智慧產業而言,DeepSeek-V3 預示著大型語言模型開發方式可能迎來典範轉移。透過巧妙的工程設計和高效的訓練方法,前沿的人工智慧能力或許可以在不依賴龐大運算資源的情況下實現。隨著 DeepSeek-V3 的出現,市場變得更加多元化,為開發者、內容創作者甚至小型新創公司提供了更多選擇。

當然,如果未來 OpenAI、Meta 等公司利用更龐大的算力集群訓練出性能更為卓越的模型,行業可能會再次掀起對超大規模預訓練的熱潮。

加權指數
  • 116
  • 749
  • 43

22,547.50

-165.47-0.73%

櫃買指數
  • 135
  • 558
  • 60

231.61

-2.99-1.27%

電子指數
  • 42
  • 337
  • 15

1,260.27

-8.04-0.63%

金融指數
  • 10
  • 27
  • 11

2,117.41

-17.05-0.80%

非金電指
  • 68
  • 436
  • 27

13,435.80

-144.1-1.06%

Yes club ad
Yes club ad

相關貼文

活動講座

人氣排行

更多人氣新聞
cookies

為優化網站服務,鉅亨網使用Cookie來改善使用者體驗。當您繼續使用本網站即表示您同意Cookies政策與隱私權政策