記憶體危險了?Cerebras晶圓級AI晶片挑戰HBM壟斷格局

人工智慧(AI)晶片新創公司 Cerebras (CBRS-US) 於 14 日在那斯達克掛牌上市,首日股價即翻倍,漲幅達 109%,市值一舉突破千億美元。分析指出,市場押注的,是一條與輝達 (NVDA-US) 截然不同的 AI 晶片技術路線,為市場展現 AI 晶片是可以繞開高頻寬記憶體(HBM)的。
Cerebras 的核心產品,是將一整片直徑 12 吋的矽晶圓不切割、不分裂,直接製成單一晶片,稱為晶圓級引擎(WaferScale Engine)。
其最新一代產品 WSE-3 搭載 4 兆個電晶體、90 萬個運算核心,以及 44GB 的片上記憶體(SRAM)。
關鍵在於:這顆晶片完全不使用高頻寬記憶體(HBM)。
這看似一個規格上的細節,卻牽動著整條 AI 硬體供應鏈的利益分配。目前全球 HBM 市場由 SK 海力士、三星、美光科技 (MU-US) 三家寡占。
其中,SK 海力士的 HBM 業務毛利率高達 79%,甚至超過輝達本身,正是因為這類記憶體製造難度極高,且是現行 GPU 架構不可或缺的組件。
HBM vs 晶圓級架構:AI 晶片的兩條路徑
AI 晶片長期面臨所謂「記憶體牆」的瓶頸:運算核心速度遠超過資料傳輸速度,大量時間耗費在等待資料,而非實際運算。
輝達的解法,是把原本分散在系統裡的記憶體搬到 GPU 旁邊,透過 HBM 和先進封裝把距離大幅縮短,從幾十公分壓到毫米級。但本質上,數據仍然需要「跨區搬運」,只是路徑更短了。
Cerebras 的做法則更為激進,直接把整片晶圓做成單一運算晶片,讓數十萬甚至近百萬核心與本地記憶體一一綁定。資料不再需要遠距離調度,而是像隨手可得的工具一樣就在計算單元旁邊,實現真正的就地存取。
這使 Cerebras 在短上下文推理任務上,速度比 GPU 方案快達 15 倍,適合聊天機器人、程式生成、即時翻譯等高頻應用場景。
天花板:上下文長度是罩門
然而,晶圓級架構也有其硬限制。Cerebras 的片上記憶體僅有 44GB,遠不足以容納完整的大型模型參數。
為此,Cerebras 發展出「權重流」(Weight Streaming)技術作為因應,模型參數並不存放於晶片之上,而是置於外部的 MemoryX 伺服器,運算時依需求逐層串流載入,晶片上的空間只用來處理當下正在執行的那一層。
這個機制在短上下文場景下運作良好,但一旦模型需要同時掌握大量上下文,例如分析數百頁文件、處理長篇會議記錄,片上空間就成了無法突破的瓶頸。
Cerebras 目前最高僅支援 128K 的上下文長度,與輝達 B200 可處理的百萬 token 級別相比,差距懸殊。深度分析類任務,目前仍是 HBM 大容量架構的主場。
供應鏈的三層衝擊
分析指出,Cerebras 的技術路線,對記憶體產業鏈構成三個層次的影響。
其一,HBM 需求增量遭分流。 AI 推論市場高速成長,其中短上下文的即時互動需求若大量導入晶圓級方案,對 HBM 的新增需求便會相應減少。
這並非存量替代,而是增量空間被切走一塊。SK 海力士目前訂單積壓逾三年,短期無虞,但兩三年後的新增產能規劃,恐需重新評估。
其二,設計工具與 IP 廠商受惠。 晶圓級設計需要更精密的 SRAM 架構規劃與電子設計自動化(EDA)模擬工具,使受益方從「獨立記憶體製造商」變成了「晶圓廠 + 設計工具商」,因此 Arm(ARM-US) 、新思科技 (SNPS-US) 、Cadence 設計系統 (CDNS-US) 等 IP 與設計工具商,成為這條路線的新受益者。
其三,新興記憶體技術迎來潛在商機。Cerebras 的權重流架構,需要外部記憶體(MemoryX)來存放無法塞進 44GB SRAM 的模型參數,而這類記憶體必須同時具備高頻寬、大容量與低功耗。
目前 DRAM、SSD、HBM 各有缺點,因此 MRAM 與 ReRAM 反而有機會成為折衷方案。它們兼具較快速度、更大容量與非揮發特性,過去始終缺乏大規模商業場景,如今可能因晶圓級引擎而迎來真正落地機會。
若晶圓級架構開始普及,MemoryX 需求可能帶動 MRAM/ReRAM 與新型記憶體產業鏈成形。不過,前提仍是晶圓級晶片本身能成功放量。
Cerebras 的路線,理論上為受 HBM 供應鏈限制的半導體業者提供了另一條出路。
然而,Cerebras 的 WSE-3 採用台積電 (2330-TW) N5 製程,整片晶圓的良率挑戰極為嚴峻,Cerebras 透過 1.5% 核心備援加上軟體容錯機制,才得以將良率拉至可用水準,技術門檻極高,非一蹴可幾。
HBM 壟斷格局鬆動?晶圓級 AI 架構開啟新戰場
Cerebras 全年營收約 51 億美元,與輝達資料中心業務的 1,300 億美元相比,體量懸殊。然而,這家公司的意義,不在於能否取代輝達,而在於它證明了一條在架構層面繞開 HBM 的路確實存在。
分析稱,AI 晶片的利益格局過去只有一張桌子:HBM 加 GPU,由 SK 海力士、三星、台積電、輝達四方分食。
如今,第二張桌子正在成形:晶圓級晶片加 MemoryX,台積電同時吃下製造與片上記憶體兩塊,新興記憶體技術伺機分羹,HBM 廠商的地位暫時穩固,但增量空間已開始縮水。
兩張桌子並陳,哪張將來入座者眾,現在尚無定論。但資本與產業鏈的資金,已悄悄開始向第二張桌子移動。