西安交大發表AI研究:機器行為與體現智慧揭示通往AGI的路徑

近日西安交通大學教授鄭南寧發表的研究報告《機器行為與體現智慧》引起人工智慧(AI)領域關注。報告深入探討 AI 如何模仿、理解並生成類人行為,並以「體現智慧」(Embodied Intelligence)為核心,剖析 AI 從模仿到理解、從知識到行動的演進過程,為實現通用人工智慧(AGI)提供全新視角。
AI 四階段:從專家系統邁向通用智慧
報告將 AI 技術發展劃分為四個階段:
-
依賴知識與規則的「專家系統」;
-
以特徵工程為核心的機器學習;
-
深度神經網路驅動的自動特徵提取,實現語音與圖像辨識超越人類;
-
正邁向具備自我意識與抽象思維的 AGI,能獨立應對未曾遭遇的情境。
AI 難題:理解行為比模仿更具挑戰
鄭南寧指出,模仿人類行為固然困難,但要讓 AI「理解」行為的背後邏輯更具挑戰性。因為多數人類行為源於環境互動與學習,並非單純邏輯推理可得。要達到真正的認知能力,AI 不僅要模仿行為,更需連結普遍原則與潛在概念,進行深層次的理解。
在動態、複雜的現實世界中,AI 系統難以全面列舉行為的所有前提與可能結果。報告指出,傳統邏輯推理方式不足以應對現代 AI 所需的靈活性與適應性。此外,如何讓 AI 表現出合作性與社會行為,也是目前尚待突破的瓶頸之一。
鄭南寧表示,研究機器行為不僅包含設計人工行為生成方式,也強調理解智慧體如何從經驗中產生反應,以及行為背後的可解釋性。這些研究對建立 AI 系統的信任關係非常重要,特別是在無人監管時可能造成的潛在風險。
四大面向解析 AI 行為:結合演化、生理與功能視角
報告引用行為科學家廷貝亨(Tinbergen)的理論,從「機制」、「發展」、「功能」與「演化」四大面向解析 AI 行為。這種跨領域分析,有助於建立 AI 在不同環境下的學習與適應能力模型。
根據鄭南寧的報告,機器行為的發展可來自三個來源:一是人類以演算法直接設計;二是透過特定互動與訓練進行塑造;三是 AI 系統從自身經驗中學習與進化。這三者的結合,有望推進更自然且穩定的智慧行為系統。
報告指出,人與智慧機器的互動不僅是單向的。人類透過設計與訓練影響機器行為,反之,機器也可能反過來重塑人類的行為與社會結構。如何在此互動中維持協同與倫理,成為重要課題。
體現智慧讓 AI 走向「有身體的思考」
體現智慧是指 AI 在具體環境中以感知、學習與反應的方式自主完成任務。與僅依賴資料訓練的非體現學習相比,體現學習強調 AI 透過與環境的即時互動進行強化學習,並可實現更高程度的適應性。
體現智慧的行為生成過程包含兩個環節,包括:
- 人透過自然語言或圖文輸入需求給多模態 AI 模型,模型理解後進行推演與決策;
- AI 與實體環境互動,根據傳感器數據與模型輸出完成行為執行。
若要讓 AI 擁有類似人類的認知能力,需建立事件模型並整合表徵學習與因果推理能力。AI 必須從感知資料中提取意義,再結合既有知識與推理能力找出最優策略,以實現類人判斷與適應能力。
自動駕駛:體現智慧的最佳試煉場
自動駕駛技術正是體現智慧的重要應用領域。從場景感知、行為預測到突發事件處理,AI 需結合高效感知、語義地圖建構與模擬仿真技術,完成複雜駕駛任務。報告強調,透過強化學習與模擬訓練,AI 能提升對未知環境的適應力與決策準確性。
最後,鄭南寧教授強調,AI 與人類的互動將不再是單向影響。未來智慧系統可能反過來塑造人類行為與社會結構。因此,設計可解釋、可信任且具備倫理意識的 AI 行為系統,將是實現安全、可控 AGI 的關鍵。