OpenAI發布多重模態模型GPT-4 直接讓ChatGPT升級
在 ChatGPT 引爆科技領域之後,人工智慧 (AI)「下一步」的發展會是什麼備受關注,很多學者都提到了多種模態。周三 (15 日) 凌晨,OpenAI 發布了多重模態訓練大模型 GPT-4。
GPT-4 實現幾個方面的飛躍式提升:強大的判圖能力、文字輸入限制提高至 2.5 萬字、回答準確度顯著提高、能夠生成歌詞、創意文本,實現風格變化。
OpenAI 工程師在介紹影音裡指出,「GPT-4 是全球第一款高體驗、能力強的先進 AI 系統,我們希望很快把它推向所有人,」
OpenAI 發布了技術報告形式論文、System Card,把 ChatGPT 直接升級成 GPT-4 版,也開放 GPT-4 的 API。
另外,微軟行銷主管在 GPT-4 發布後第一時間表示:「如果過去 6 周內任何時候曾經使用過全新的 Bing 預覽版,就已可提前了解 OpenAI 最新模組的強大功能。」
GPT-4 是一個大型多重模態模型,能接受圖像和文本輸入,再輸出正確的文本回覆。實驗證明,GPT-4 在各種專業測試和學術基準上的表現與人類水平相當。例如,它通過了模擬律師考試,且分數在應試者的前 10% 左右。相較之下,GPT-3.5 的得分在倒數 10% 左右。
OpenAI 花了 6 個月的時間使用對抗性測試程序和 ChatGPT 的經驗教訓,對 GPT-4 進行更新調整,從而在真實性、可控性等方面取得了歷來最好的結果。
在過去 2 年裡,OpenAI 重建了整個深度學習資料庫,並與 Azure 一起為其工作負載從頭開始設計了一台超級電腦。一年前,OpenAI 在訓練 GPT-3.5 時第一次嘗試運作該超級電腦系統,之後他們又陸續發現並修復了一些錯誤,改進了其理論基礎。
這些改進的結果是讓 GPT-4 的訓練運作獲得前所未有的穩定,以至於 OpenAI 能夠提前準確預測 GPT-4 的訓練性能,這也是第一個實現這個目標的大模型。OpenAI 表示將繼續專注於可靠的擴展,進一步完善方法,以幫助其實現更強大的提前預測性能和規劃未來的能力,這對安全至關重要。
OpenAI 正經由 ChatGPT 和 API 發布 GPT-4 的文本輸入功能。圖像輸入功能方面,為了獲得更廣泛的可用性,OpenAI 正與其他公司展開合作。
OpenAI 今天還公布 OpenAI Evals 的源代碼,這是其用於自動評估 AI 模型性能的框架。OpenAI 表示這是為了讓所有人都可以指出其模型中的缺點,以幫助 OpenAI 進一步改進模型。
有趣的是,GPT-3.5 和 GPT-4 之間的區別很微妙。當任務的複雜性達到足夠的門檻時,差異就會出現。GPT-4 比 GPT-3.5 更可靠、更有創意,並且能夠處理更細微的指令。