從生成圖片到幫你買禮物!谷歌Pichai:AI下一年將開始做事

Google DeepMind 在 2025 年 11 月 20 日發布 Nano Banana Pro(Gemini 3 Pro Image),這款新一代圖像 AI 不再強調畫面的華麗程度,而是直接指向 Google CEO Sundar Pichai 所描述的下一階段核心目標:「任務」。
Pichai 在接受《BBC》專訪時反覆強調,未來一年 AI 將從對話工具轉變為能替人類「完成真實工作」的行動代理(agent)。
「人們不需要它更好看,而是更有用。」Pichai 在鏡頭前直白地說。
他舉例,如果自己想替家人買生日禮物,他希望 AI 可以直接查找、比較並完成整個購買流程,而不是僅提供建議。這種能力上的轉向,也是 Nano Banana Pro 的開發背景——一款能連接搜尋、處理資訊、製作圖像,並協助完成真實任務的 AI 圖像工作站。
在談到 AI 的爆炸式投資時,Pichai 引用了一組核心數據:2024 年 Google 在 AI 基礎建設上的支出將超過 900 億美元,而整個 AI 產業的基建投入累計已突破 1 兆美元。
他坦言:「有些投資會太快,但整體是理性的。真實需求就在那,而我們的能力還追不上。」對於外界質疑 AI 是否重演網路泡沫,他則回應:「20 多年前,人們也質疑網路,但沒人否認它帶來了深刻革命。」
他同時也承認 Google (GOOGL-US) 並非免疫體:「所有公司都可能受影響,Google 也不例外。投得多,自然就得承擔風險。」
但 Pichai 強調 Google 的戰略優勢在於完整價值鏈布局——從自製 AI 晶片,到資料中心,再到研究與產品落地,「我們不是只做模型,而是端到端的方法。」
Nano Banana Pro 的發表正與這場投資浪潮交會。相較於傳統圖像 AI 容易產生「美觀但無用」的圖片,Nano Banana Pro 主打三大能力:接入 Google 搜尋理解即時資訊、將複雜文字自動轉換為清晰的結構化圖像、讓一般人也能像專業攝影師般控制光線、焦點與畫面。從財報圖、天氣圖,到植物養護卡片,它都能自動生成;輸入一句故事,它能產生分鏡式圖片;給定資料,它能產製正確無誤的文字嵌入式圖像。
Pichai 在訪談中也談到 AI 的使用情境,如醫生每天必須處理越來越複雜的影像檢查,他表示:「AI 能幫助他們應付這種成長的負擔。」Google 的策略並非讓圖像模型獨立存在,而是將其部署到 Search、Ads、Workspace、Gemini App 與開發者平台,讓圖像成為「使用任何 Google 產品的入口」。
然而 AI 要真正「好用」仍得跨過三道關卡。第一道關是能源。BBC 主持人問他:「到本世紀末,資料中心耗電可能比整個印度還高,甚至比所有電動車加起來多 50%。你們還能實現 2030 年淨零碳排嗎?」Pichai 回應,目標依然存在,但速度受到挑戰。他透露 Google 已簽下全球最大商業核聚變能源協議、投資小型核反應爐與地熱能源,並預期 2026 年英國資料中心將達到 95% 無碳能源。
第二道關是內容與版權。面對「是否願意付費給創作者」的尖銳提問,Pichai 強調 YouTube 模式將延續,並強調尊重用戶的退出選項以及對生成內容的版權重視。
第三道關則是信任。主持人提到 AI 生成錯誤資訊的案例,如將攻擊議員的事件錯誤歸因。Pichai 承認問題存在,並強調 Google 透過將 Gemini 與搜尋整合來提升準確性。Nano Banana Pro 的所有生成影像也都嵌入 SynthID 水印,用戶可以在 Gemini App 直接查詢圖片是否由 AI 產生。
在專訪最後,Pichai 談起讓 80 歲的父親第一次搭上自動駕駛車的經驗,他說:「我們以為理所當然的事,其實正在重塑生活方式。」Nano Banana Pro 的定位也如是——它不是用來創作美圖,而是讓人們面對龐雜資訊時,有一張「能理解的圖」開始行動。
AI 的下一階段,不是更炫,而是更能用。