1

熱搜:

熱門行情

最近搜尋

全部刪除

Gemini 3之後 Google闡述AI的三大關鍵信號:從規模競爭轉向系統效率

鉅亨網新聞中心
Gemini 3之後 Google闡述AI的三大關鍵信號(圖:shutterstock)
Gemini 3之後 Google闡述AI的三大關鍵信號(圖:shutterstock)

在 Google 發佈最新的 Gemini 3 模型後不久,Google 首席科學家 Jeff Dean 於 22 日,在史丹佛大學發表演講。他的演講不僅回顧了過去 15 年來 AI 的演進,包括神經網路、TPU、Transformer 架構、稀疏模型和蒸餾技術,更重要的是,他闡明了 AI 領域正在發生的三大關鍵轉變。

Dean 認為,Gemini 3 的發佈並非僅僅是基準分數的提升,而是一場徹底改變 AI 使用方式的典範轉移。

信號一:從參數競爭轉向仿效大腦 (效率與設計)

Dean 指出,傳統 AI 模型存在極大的浪費。在傳統的神經網路中,無論處理何種範例,模型都會被完全激活,就好比為了開一盞燈而把家裡所有電器都打開。Dean 的構想是建立一個極其龐大的模型,但在每次推論時只啟動其中 1% 到 5% 的部分。

他以人類大腦為例進行類比:當你在上英文課時,大腦只使用處理語言的部分;當你開車時,這部分則會被關閉,集中能量觀察路況和控制身體。AI 模型理應以同樣的方式運作。

Google 透過 Pathways 架構 和「專家混合 (Mixture of Experts, MoE)」技術實現了這一目標。MoE 允許系統根據輸入資料自動決定呼叫哪一個專家模組 (例如,有些擅長圖像,有些擅長語言)。Dean 在演講中展示的數據顯示,在相同的計算預算下,MoE 架構訓練出的模型效能可提升 8 倍。Gemini 3 正是這一理念的最新實現。這項轉變的意義在於,未來的頂級模型將不再是「萬能選手」,而是具備不同專業分工、共同合作的「專業團隊」。AI 競爭的關鍵已從「誰的模型更大」轉向「誰能更好地呼叫工具」。

信號二:AI 不僅是回答問題 (自主行動)

如果說第一個信號是關於模型內部如何變得更智慧,那麼第二個信號則是關於 AI 開始為使用者「做事」。Dean 強調,AI 不只是回答問題,它具備採取行動的能力。

他以一個將手寫韓文、英文食譜老照片轉換為雙語網站的案例進行演示。使用者只需表達一個簡單的要求,Gemini 3 便能自行分解任務:掃描辨識文字、翻譯、自動生成網站版面、甚至搭配 AI 生成的插圖。使用者無需再像過去一樣指示 AI 每一步驟「先辨識、後翻譯、再排版」,只需陳述目標,角色就從「使用者」轉變為「指揮官」。

這項能力背後的技術突破是「可驗證領域中的強化學習 (reinforcement learning in verifiable domains)」。例如,AI 生成程式碼後,系統會自動檢查是否能編譯或通過單元測試,並據此給予獎勵或懲罰。相同的邏輯也應用在數學證明上,系統能指出錯誤的步驟。

這項技術帶來了驚人的飛躍。僅僅三年前 (2022 年),AI 模型在小學算術基準測試 (GSM8K) 上的準確率只有 15%。然而,現在 Gemini 已能解決 2025 年國際奧林匹克數學競賽 (IMO) 中的五道問題,並贏得金牌。這證明 AI 不僅在回答問題上變強,還具備了真正的問題解決能力,能自我探索、嘗試和驗證。作為一個代理 (Agent),它需要具備狀態感知、工具組合和多步驟執行等三項關鍵能力。

信號三:決定 AI 能否普及化的關鍵 (可負擔性)

第三個信號是關於如何使 AI 真正變得平價且普及化,這被認為是最容易被忽略但可能最關鍵的因素。Dean 回憶了 2013 年遇到的困境:如果有一億人每天對手機講話 3 分鐘,Google 需要將伺服器數量翻倍。這使得他意識到,擁有好的模型並不夠,它必須是可負擔的。

解決方案分為硬體和算法兩個方面:

1. TPU(硬體):Google 從 2015 年開始投入使用專為機器學習設計的 TPU,極限優化低精度線性代數運算。第一代 TPU 比當時的 CPU 和 GPU 快 15 至 30 倍,能源效率高 30 至 80 倍。最新的第七代 Ironwood TPU 與第二代相比,效能提升了 3,600 倍。

2. 蒸餾 (Distillation,算法):這項技術的核心是讓大型模型充當老師,教導小型模型。透過蒸餾,小型模型僅使用 3% 的訓練數據,就能達到接近使用 100% 數據時的準確率。這使得 Gemini 能夠在雲端訓練出大型模型,並透過蒸餾將其部署到手機上,在參數只有十分之一的情況下,仍保留超過 80% 的能力。

Dean 認為,AI 要真正在全球普及,必須面對能源、電力、網路和設備支援等現實世界的限制。因此,Google 的策略是讓技術適應現實。未來的競爭焦點不再是參數數量,而是實施效率。

相關貼文

left arrow
right arrow