AI親自設計!OpenAI首款自研AI晶片「Jalapeño」亮相

OpenAI 掏出了史上第一顆自研晶片,名字叫 Jalapeño,墨西哥辣椒,專為大模型推理設計。
9 個月前,白紙一張。9 個月後,工程樣片不僅跑通了 GPT-5.3-Codex-Spark,而且頻率和功耗均已達到量產目標。
更離譜的是,這顆晶片是 OpenAI 用自己的 AI 幫著畫的。
Jalapeño,墨西哥辣椒裡辣度最溫和的品種之一。OpenAI 拿它給第一顆晶片命名,潛台詞很可能是:這只是入門級,後面可能還有更辣的。
官方定位叫「Intelligence Processor」,一顆專為大模型推理設計的定制 ASIC。
由 OpenAI 主導架構設計,Broadcom 負責晶片實現和網路互聯,Celestica 做板卡和機架整合。
通常來說,先進半導體產業,設計一顆高性能 ASIC 要 18 到 24 個月。Google TPU 兩年一代,Amazon Trainium 差不多也是這個節奏。
而 OpenAI 只用了 9 個月,一舉刷新了先進半導體領域最快的 ASIC 開發週期。
這顆晶片從第一根線開始就只為一件事優化:LLM 推理。而且,Jalapeño 不只跑 OpenAI 自家模型,架構上兼容全產業的 LLM。
比性能更值得關注的,是這顆晶片怎麼被造出來的。OpenAI 自家 AI 模型參與了這顆晶片的設計和優化。也就是說——AI 設計了一顆晶片,晶片反過來跑 AI,跑在上面的更強 AI 會設計下一代更強的晶片。
AI,幫自己造了一副新身體。
AI 設計晶片並不新鮮。Google 2021 年在 Nature 發表論文,用強化學習做晶片布局,速度比人類快幾個數量級。
此後 AlphaChip 連續優化了三代 TPU 布局方案。OpenAI 硬體團隊的掌門人 Richard Ho,正是從這個圈子裡走出來的。
Google 近九年,TPU 高級工程總監,參與發明了 ML 設計晶片架構的方法,多個 TPU 專案首次流片即成功。
之後去了光子計算公司 Lightmatter 擔任高級副總裁,更早聯合創辦過 EDA 公司 0-In Design Automation。學術界、晶片設計、AI 硬體,整條路走了一遍。
OpenAI 挖他來,大概率就是為了一件事:把「AI 輔助晶片設計」嫁接到自家模型上。
晶片設計最磨人的不是「想方案」,而是無數次的設計—驗證—修改—再驗證循環。一顆先進晶片的驗證要跑成千上萬次,佔掉整個週期的大半時間。
AI 恰恰擅長做這種事——讀取歷史設計資料、生成 RTL 程式碼、輔助驗證與除錯、優化布局布線。
能實現 9 個月流片,靠的是 AI 替人扛掉了那「18 到 24 個月」裡最磨人的一大塊。
用最會用錘子的人,來設計新錘子。用最懂 LLM 運行規律的模型,來設計專門跑 LLM 的硬體。
你的 ChatGPT 帳單正在被重寫
OpenAI 每年算力支出高達百億美元級別,這些錢最終都要從你身上賺回來——20 美元月費、API 調用、Plus 和 Pro 訂閱。
推理成本砍半,普通用戶最先感受到的是:回應速度變快。
現在 ChatGPT 高峰期排隊、轉圈、長對話變慢,本質都是算力不夠分。
推理效率提升後,同等伺服器能服務更多用戶,使用體驗有望改善。
其次:免費版能力有望開放更多功能。現在很多功能鎖在 Plus 裡——深度研究、高級資料分析、完整版語音對話。
成本降低後,這些功能下放給免費用戶的可能性就更高。而 OpenAI 需要的,正是讓更多人用上 ChatGPT,而且能用得更久。
再往遠看:20 美元的月費可能還是 20 美元,但你拿到的東西將完全不同。
去年這個價格買到的是 GPT-4o,明年同樣的錢,可能買到的是一個能跑完整工作流程的 Agent。
月費沒變,能力卻可能翻好幾倍——推理成本下降帶來的是一種「隱性降價」。
但 Jalapeño 瞄準的不只是今天的 ChatGPT。
Richard Ho 的思路是:為模型未來要去的方向設計硬體,而不是為它現在的樣子設計。
OpenAI 內部能看到未來 6 到 9 個月模型的演進方向,因此晶片也沿著這條路線提前打造。
等 Agent 真正普及後,算力需求和今天的一問一答將完全不是同一個量級。
說白了,推理成本降下來,受益的不只是 Pro 用戶。學生、小企業、獨立開發者,都可能用上今天只有大型客戶才負擔得起的 AI 能力。
模型自己訓練,晶片自己設計,推理自己優化,部署自己控制。換句話說,OpenAI 要做的是一家全棧 AI 公司。
之前和 Cerebras 合作推理部署,OpenAI 已經摸清專用推理硬體的價值。現在自己下場打造,把經驗變成可自主掌控的平台。
Apple 和 Google 都走過這條路。但 OpenAI 的全棧策略又多了一層:用 AI 加速 AI 基礎設施建設,再用更好的基礎設施跑更強的 AI。如果這個循環成立,飛輪就會自己推動自己加速。
首批 GW 級資料中心將與 Microsoft 等合作夥伴自 2026 年底開始部署。
Jalapeño 只是第一代,下一代叫什麼還不知道。但打造它的,高機率不再只是人類。