1

熱搜:

熱門行情

最近搜尋

全部刪除

AI投資獲利或比預期早到來!高盛:「AI代理」改變一切、建議「這樣」佈局

鉅亨網新聞中心
高盛:AI投資獲利或比預期早到來。(圖:Shutterstock)
高盛:AI投資獲利或比預期早到來。(圖:Shutterstock)

高盛近日發布的研究報告《解碼代理經濟:AI 使用量與利潤率的即將拐點》(Decoding the Agentic Economy:The Coming Inflection in AI Usage and Margins )針對外界最關切的核心問題作出回應,指出 AI 的龐大基礎建設投入開始獲利的時間或許比市場預期來得更早。

過去兩年,AI 產業的主流敘事圍繞著「燒錢」二字。推論負載越重,意味著需要更多加速晶片、更大的電力消耗,以及更高的資本支出。

然而,高盛指出,這套邏輯正在發生根本性轉變。

關鍵在於兩條曲線的走勢出現分歧:

  • 主流大型語言模型的 Token 定價,歷經長期快速下滑後已逐漸趨於穩定,部分應用場景甚至出現回漲;
  • 另一方面,基於輝達 (NVDA-US) 、超微半導體 (AMD-US) 、Google(GOOGL-US) TPU 與 Trainium 等晶片平台的底層算力成本,仍以每年 60% 至 70% 的速度持續壓縮。
  • 「價格企穩、成本繼續下降」,這個看似簡單的經濟學現象,卻帶來意義深遠的結論:Token 的邊際利潤率正在改善。

高盛預估,正向毛利率的拐點很可能在 2026 年上半年內出現。這意味著,接下來 AI 使用量的爆發性成長,不再只是一個收入故事,更將是一個利潤故事。

AI 代理:不是更好的聊天機器人,而是全新使用範式

報告的核心研究對象是「AI 代理」。與傳統聊天機器人僅能被動回應不同,AI 代理能夠自主規劃、執行、監控並反覆修正,以完成複雜任務。

高盛將其分為消費級與企業級兩大類,並分別進行深入的量化分析。

消費級代理:從「一問一答」到「永遠在線」

高盛數據顯示,2025 年平均每次 AI 查詢消耗約 1,715 個 Token,大致相當於 3 至 5 分鐘的對話。但這種模式正在被顛覆。

消費級代理分為兩種形態:

  • 按需型代理(On-Demand):由用戶主動發起任務。以旅遊訂票為例,代理需依序完成意圖解析、資訊補全、多輪搜尋篩選、用戶回饋整合、預訂前驗證等十餘個步驟,Token 消耗量遠超一般對話。
  • 常駐型代理(Always-On):持續在背景運作,無需用戶主動觸發,負責監控信箱、管理行程、追蹤價格等任務。高盛模擬顯示,一個全天運作的郵件助理每日消耗超過 10 萬個 Token,是傳統對話的近百倍。

高盛預估,至 2030 年,全球每日 AI 查詢量將從 2025 年的約 50 億次成長至約 230 億次,其中高達 30% 可能由代理處理;消費級代理工作負載將推動全球 Token 消耗量較現行水準成長約 12 倍,每月新增約 60 千兆(peta)個 Token。

企業級代理:精確性驅動,Token 消耗高度不對稱

企業級代理的核心訴求不在便利,而在精確。每一項輸出都必須經過多輪推理、驗證、糾錯與審計,才能真正嵌入業務流程。

高盛針對 AI 暴露度最高的職業,逐一構建模擬代理,拆解具體工作步驟與模型調用邏輯,揭示了一個重要的不對稱性:Token 消耗量與實際 API 成本並不總是成正比:

應用場景

每日 Token 消耗

每日 API 成本

對應人工成本

程式開發代理

約 700 萬

約 13 美元

-

呼叫中心代理

約 200 萬

約 92 美元

約 90 美元

資料輸入代理

約 2,500 萬

約 60 美元

約 80 美元

值得注意的是,呼叫中心代理因依賴即時語音處理,每日 API 成本已略高於人工外包成本,短期內規模化部署仍面臨挑戰;而程式開發與資料輸入場景的經濟可行性則相當顯著,也解釋了為何軟體開發目前是代理採用速度最快的領域。

歷史採用曲線給出的啟示

為預測代理的普及節奏,高盛引用了橫跨 161 個國家、101 種技術、逾 200 年的歷史技術擴散數據庫,從中提煉出三項規律:

  1. 不同技術從問世到滲透率達峰的時間差異懸殊,鐵路與固定電話耗時逾百年,ATM 與微創手術技術不到 20 年,中位數為 29 年。
  2. 採用曲線形態各異,有 J 型(如 1990 年代的網際網路爆發)、S 型、線性等多種模式。
  3. 新技術的峰值滲透率往往高於舊技術,因其傾向於擴大整體市場,而非單純取代既有技術。

據此,高盛做出基線假設:企業級代理採用將呈 S 型曲線,從目前試驗期到 2030 年前後進入加速擴散;達到峰值滲透率約需 15 年,快於歷史中位數。

在峰值狀態(約 2040 年),全球知識工作者中約 37% 的工作流程將由代理處理,屆時全球 Token 消耗量將達到當前水準的 55 倍。

至 2030 年,消費級與企業級代理合計將推動全球 Token 消耗量達到現行水準的 24 倍以上,即每月約 120 千兆個 Token。

一個自我強化的正向飛輪

高盛在報告中描繪了一個正回饋循環:算力成本下降,使更複雜的代理在經濟上可行;更複雜的代理消耗更多 Token;更高的使用率改善 AI 基礎建設的經濟性;更好的經濟性又為模型品質與分發能力的持續投入創造空間。

這套邏輯與市場過往的主流擔憂形成鮮明對比:「AI 使用量越大、虧損越多」的舊敘事,正在被「使用量越大、單位利潤越高」的新邏輯所取代。

高盛也提醒,並非所有 AI 工作負載都能享受此一正向拐點。激烈競爭可能迫使部分標準化聊天產品的 Token 定價繼續走低,降幅甚至超過成本的壓縮速度。

投資布局三條主線

基於上述分析框架,高盛在三大領域提出投資建議:

半導體:首選博通 (AVGO-US) 、輝達與超微半導體。Token 成本持續下降將擴大可尋址的算力市場,而下游客戶利潤率的改善將為持續資本支出創造更多空間。

網路與雲端運算:首選 Alphabet、亞馬遜 (AMZN-US) 與 Meta(META-US) 。高盛特別指出,亞馬遜 AWS 營收增速重新加速至年增 28%,Google Cloud 增速達 63%,Alphabet 營收積壓訂單接近 4,600 億美元。

軟體與 IT 服務:首選微軟 (MSFT-US) 、Cloudflare(NET-US) 與埃森哲 (ACN-US) 。微軟 Copilot 用戶回饋持續改善;Cloudflare 憑藉其網路架構優勢,有望在 AI 推理工作負載中取得超額市場佔有率;埃森哲則將受惠於企業從 AI 試點邁向規模化代理部署過程中,對系統整合與流程再造的龐大需求。

相關貼文

left arrow
right arrow