Claude 3 追上 GPT-4 來自何方神聖?
OpenAI 的聊天機器人 GPT-4 發布一年後,終於有了一個評測指標全面超越它的大模型。
Anthropic 在周一(4 日)發布三個版本的大模型系列 Claude 3,性能由強到弱分別是:Opus (拉丁語 「作品」)、Sonnet(英語 「十四行詩」)及 Haiku(日語 「俳句」 的音譯)。
Anthropic 列出的十項常用模型能力評估數據集表現,Opus 的得分全都超過 GPT-4,視覺識別能力評估數據集上的情況也一樣。
據《晚點 LatePost》報導,Anthropic 的模型趕上 GPT-4 並不只靠堆砌資源,他們本就是熟悉 OpenAI 技術路線的團隊。成立於 2021 年的 Anthropic ,早期團隊成員全部來自 OpenAI。
Anthropic 共同創始人 Dario Amodei 在 OpenAI 工作五年,離職前擔任研發副總裁,參與了 GPT-2、GPT-3 的研究。最初 OpenAI 嘗試多種方法探索人工智慧(AI)的可能性,比如遊戲、機械手,是 Amodei 和 OpenAI 首席科學家 Ilya Sutskever 一起確定了 OpenAI 專注研究大語言模型。
另一位共同創始人 Sam McCandlish,在 OpenAI 負責研究如何擴展大模型。
此外,團隊中還有負責 GPT-3 訓練基礎設施的 Tom Brown、參與數據處理的 Benjamin Mann、參與算法研究的 Nicholas Joseph 等人。
Anthropic 因此也被稱為最有可能與 OpenAI 競爭的公司。截至 2023 年底,Anthropic 從亞馬遜、Google、Salesforce 等投資者手中籌集 70 多億美元的資金,融資規模僅次於 OpenAI。
這些投資人不只為 Anthropic 提供資金,還提供稀缺的算力資源,Claude 3 就是用 AWS 和 Google 的雲端運算平台的硬體訓練出來的。
Anthropic 與 OpenAI 最大的分歧,是如何讓大模型更安全。Amodei 等人在 2020 年底離開 OpenAI, 是因為不滿公司偏重盈利,降低大模型安全研究的重要性。當時 OpenAI 發布 GPT-3 的 API,加快商業化節奏。
在 Anthropic,他們的目標是開發一個 「有用、誠實、無害」 的大模型。
去年 7 月,《紐約時報》專欄作家 Kevin Roose 採訪 Anthropic 多位工程師,發現大多數人願意談對 AI 的恐懼,還有人因此失眠。「我感覺自己像一個美食作家,去報導一家時尚的新餐廳,但廚房工作人員只想談食物中毒。」