震撼全球AI界的DeepSeek-V3 竟是川普「晶片戰」意外產物

2025/01/03 13:48

Tag

中國 AI 創新公司 DeepSeek 日前發表開源全新 DeepSeek-V3 模型，耗時僅兩個月、訓練成本不到 600 萬美元，就足以與 ChatGPT 一較高下，撼動全球 AI 界。而中國這項技術的躍進，可能是川普第一任期對中國進行「晶片封鎖」下的產物。

DeepSeek-V3 這款高達 671B 的大模型，在預訓練階段只用了 2 個月、2048 張 H800 顯示卡及 557.6 萬美元。美國 CNBC 記者親自測試後，也驚呼 DeepSeek-V3 完全能和 OpenAI 掰手腕。OpenAI CEO 奧特曼也發推文按指「複製總比創新容易」。

這是繼電動車與消費品之後，中國團隊在 AI 領域再度上演了「成本屠夫」的好戲。

在外界看來，DeepSeek 在晶片效能較差、資金和 GPU 使用時間更少的情況下，依然能夠取得更好的表現。考慮到他們所面臨的 AI 硬體資源的限制，這項成就尤其值得關注。

2022 年 10 月，為阻止中國成為人工智慧與運算領域的超級大國，美國對中國實施了廣泛的晶片出口限制：這是中美之間持續進行的「晶片戰爭」中的眾多打擊之一。

這些晶片限制的初衷，目的是想透過掐住中國取得頂尖硬體的管道來限制中國在 AI 領域的發展。

DeepSeek-V3 的成功，可能預示著一個有趣的轉折：軟體創新正在突破硬體限制。這反倒讓美國限制中國的戰略變得很諷刺。如果軟體技術越來越強，那用什麼硬體可能都不重要了。

對於人工智慧產業而言，DeepSeek-V3 預示著大型語言模型開發方式可能迎來典範轉移。透過巧妙的工程設計和高效的訓練方法，前沿的人工智慧能力或許可以在不依賴龐大運算資源的情況下實現。隨著 DeepSeek-V3 的出現，市場變得更加多元化，為開發者、內容創作者甚至小型新創公司提供了更多選擇。

當然，如果未來 OpenAI、Meta 等公司利用更龐大的算力集群訓練出性能更為卓越的模型，行業可能會再次掀起對超大規模預訓練的熱潮。

鉅亨贏指標
鉅亨贏指標是鉅亨網APP的訂閱服務，提供78種選股策略，幫助投資人決策個股短線多空操作。