英特爾推首款OCI小晶片 將與CPU共同封裝
英特爾 (INTC-US) 今 (27) 日在 2024 年度光學通訊大會 (OFC) 上,由整合光學解決方案 (IPS) 事業部展示業界最先進的首款全面整合光學運算互連 (optical compute interconnect,OCI) 小晶片,與 CPU 共同封裝並處理即時資料。
英特爾透過在資料中心和高效能運算 (HPC) 應用的新興 AI 基礎設施,實現共同封裝的光學輸入 / 輸出 (I/O),展現公司的 OCI 小晶片在高頻寬互連技術領域取得重大進展。
英特爾目前的 OCI 小晶片只是原型產品,正與特定客戶合作,將 OCI 與其 SoC 共同封裝為光學 I/O 解決方案。
英特爾整合光學解決方案事業部產品管理策略資深總監 Thomas Liljeberg 表示,資料在伺服器之間日益頻繁的傳輸對資料中心的基礎架構帶來龐大壓力,而目前市面上的解決方案正快速逼近電氣 I/O 效能的實際極限。
英特爾此次突破性的研發成果,讓客戶可將共同封裝矽光子互連解決方案無縫整合到次世代運算系統中。英特爾的 OCI 小晶片可提高頻寬、降低功耗並增加傳輸距離,進而加速機器學習工作負載,為高效能 AI 基礎設施帶來革命性的發展。
英特爾首款 OCI 小晶片可在長達 100 公尺的光纖上支援 64 個通道的 32 Gbps 資料傳輸,滿足 AI 基礎設施對高頻寬、低功耗和長距離傳輸的需求。此技術有助實現未來 CPU/GPU 叢集連結的可擴充性和新式運算架構,包括一致的記憶體擴充和資源解構。
全球市場正加速部署 AI 應用,大型語言模型 (LLM) 和生成式 AI 的最新發展也加速此趨勢,更大型且更高效率的機器學習 (ML) 模型成為滿足 AI 工作負載運算需求的關鍵角色。隨著業界對擴充未來 AI 運算平台的需求不斷提升,帶動了 I/O 頻寬的指數型成長和傳輸距離的增加,以支援包括 CPU、GPU 與 IPU 在內的更大型運算處理器叢集,並在架構上更有效利用資源,例如 xPU 解構和記憶體池。
電氣 I/O(如銅線連結) 支援高頻寬密度和低功耗,但只能提供約 1 公尺內的短距離傳輸。資料中心和早期 AI 叢集所使用的可插拔式光學收發器模組在增加傳輸距離的同時也提高成本和功耗水準,而這無法滿足擴張的 AI 工作負載需求。此共同封裝 xPU 光學 I/O 解決方案可支援更高頻寬,同時提升能源效率、降低延遲並增加傳輸距離,這正是擴充 AI 和 ML 基礎設施的必要條件。
以光學 I/O 替換 CPU 與 GPU 中的電氣 I/O 傳輸數據,如同以汽車、卡車替代馬車分送貨物,可增加運送距離與貨物量,不受運送範圍和容量的限制。而英特爾 OCI 小晶片的光學 I/O 解決方案,可在 AI 擴充中實現性能提升和降低能源成本。
全面整合的 OCI 小晶片運用英特爾經實地驗證的矽光子技術,並將包含晶片上雷射 (on-chip lasers) 與光學放大器的矽光子積體電路 (Photonic Integrated Circuit,PIC) 與電氣晶片整合。英特爾在 2024 年光學通訊大會上展示的 OCI 小晶片是與英特爾 CPU 共同封裝,也可以與新一代 CPU、GPU、IPU 和其他系統單晶片 (System-On-Chips ,SOCs) 整合。
該 OCI 技術成果支援高達 4 Tbps 雙向資料傳輸,並與 PCIe 5.0 相容。即時光學連接展示了兩個 CPU 平台之間可透過單模光纖 (Single-Mode Fiber,SMF) 跳線連結發送器 (Tx) 和接收器 (Rx)。CPU 會生成並測量光學位元錯誤率 (Bit Error Rate,BER),展示中顯示,單根光纖在 Tx 光譜上呈現 8 個波長,波長間距為 200 GHz,並顯示訊號品質強勁的 32 Gbps Tx 眼圖 (Eye Diagram)。
目前的小晶片可利用 8 對光纖,每對光纖可乘載 8 個高密度波長分波多工 (dense wavelength division multiplexing,DWDM) 波長,並可支援 64 個通道、32 Gbps 的資料傳輸,傳輸距離最遠可達 100 公尺 (實際應用傳輸距離可能因飛時測距延遲而受限於數十公尺)。
此共同封裝解決方案也具備高能源效率,每位元功耗僅 5 皮焦耳 (pJ),相較之下,可插拔式光學收發器模組的功耗約為 15 pJ/bit。這種高效率表現有助於解決資料中心和高效能運算環境中 AI 難以永續的電力需求。
英特爾身為矽光子技術的市場領導者,積極運用英特爾實驗室超過 25 年的內部研究成果,力求突破,而英特爾實驗室也是整合式光子研究先驅。英特爾是首家開發並向主要雲端服務供應商大量出貨矽光子連結產品之公司,產品可靠性領先業界。
英特爾使用混合晶片上雷射 (laser-on-wafer) 和直接整合技術,不僅提升可靠度,也同時降低成本,兼具效率及卓越性能。英特爾的平台已出貨超過 800 萬個 PIC,其中含有超過 3,200 萬個整合的晶片上雷射,失效率 (FIT) 低於 0.1,此為廣泛使用的可靠性測量方法,可測試失效率和發生故障的次數。
這些 PIC 被封裝在可插拔式收發器模組中,主要布署在超大規模雲端服務供應商的大型資料中心網路,支援 100、200 和 400 Gbps 的應用。而下一代每通道 200G 的 PIC,可支援 800 Gbps、1.6 Tbps 新興應用的產品正在開發中。英特爾同時在推動具備先進裝置性能、更高密度、更佳連結,並可顯著提升經濟效益的矽光子新製程節點,持續於晶片上雷射與先進性能取得進展,顯著降低成本使晶片面積減少超過 40%、功耗降低超過 15%。
英特爾的 OCI 小晶片代表高速資料傳輸的一大進展,隨著 AI 基礎設施領域持續演進,英特爾始終處於領先地位,推動創新,打造連結技術的新未來。