Meta推出最先進AI模型「Llama 3.1」 攜手輝達助陣
臉書母公司 Meta Platforms(META-US)周二 (23 日) 推出一款功能強大的人工智慧 (AI) 模型「Llama 3.1」,與其競爭對手 OpenAI、Google(GOOGL-US)的產品較勁。與此同時,Meta 還攜手輝達,替全球企業提供 Llama 3.1 模型客製化服務。
Meta 執行長祖克柏 (Mark Zuckerberg) 表示,Llama 3.1 是「最先進」(state of the art)的大模型,有廣泛的新功能,包括改善推理幫助處理複雜的數學問題、或將文本即時整合成一本書。
祖克柏受訪時說:「我認為 AI 駐守最重要的產品特性是其智慧程度,公司目前正在打造的 Llama 模型是世界上最先進的,而且已經在開發『Llama 4』。」
據了解,Meta 周二推出的「Llama 3.1」是前一代「Llama 3」的更新,該公司
花費了數個月訓練完成且在運算能力的升級方面耗資數億美元。
Llama 是 Meta AII 聊天機器人的動力,該機器人在其應用程式 (包括 Instagram 和 WhatsApp) 內運行,同時也是一個獨立的網路產品。
祖克柏表示,Meta 的聊天機器人擁有「數億」用戶並預估到今年年底,將成為世界上使用最廣泛的聊天機器人。
此外他還預期 Meta 以外的其他公司也會使用 Llama 來訓練自己的人工智慧模型。他說:「正是這個老師 (Llama),讓許多不同的組織可以創建自己的模型,而不必依賴其他公司銷售的現成模型。」
至於 Meta 對 AI 的投資方面,祖克柏說 Meta 的「Llama 3」模型需要「數億美元」的運算能力來訓練,但他預估未來的模型將花費更多,可能需要數十億美元來訓練運算能力。
儘管祖克柏去年大舉裁員縮減成本,但他仍願意在 AI 軍備競賽方面花錢。他說雖然可能現在回頭看公司的支出比所需多了數十億美元,但實際上公司的決策都是理性的決定,倘若一旦落後,未來 10 到 15 年之間在重要技術方面有可能處在不利地位。
此外,Meta 將砸重金訓練的 Llama 模型背後技術免費開放大眾使用,只要遵守該公司的「可接受使用政策」(acceptable use policy)。
對此祖克柏表示,開放取用策略將有助於使該公司的工作成為其他成功新創公司和產品的基礎,從而使 Meta 在行業發展中擁有更大的影響力。
他認為,Meta 是一家科技公司,需要建構的東西不僅在應用程式層面,而是一路延伸下來,因此對公司來說,為實現這一目標進行大規模投資是值得的。
攜手輝達提供客製化 Llama 3.1 模型服務
此外,Meta 還與 AI 晶片領頭羊輝達 (NVDA-US) 強強聯手,輝達同日宣布其 AI 代工服務 (AI foundry service) 將替全球企業客製化 Llama 3.1 生成式 AI 模型,將企業客戶數據與 Llama 3.1 405B 和輝達 Nemotron 模型結合,創建「超級模型」。
輝達 AI Foundry 將提供全面的生成式 AI 模型服務,涵蓋資料管理、合成資料產生、微調、檢索、安全防護和評估,以部署客製化的 Llama 3.1 NVIDIA NIM 微服務,並提供新的 NVIDIA NeMo 檢索微服務以實現準確的響應。
Meta 是輝達的大客戶之一,由於沒有運行自己的面向企業的雲端服務,Meta 需要最新的晶片來訓練其 AI 模型,這些模型內部用於目標定位和其他產品。例如,Meta 表示,Llama 3.1 模型的最大版本是在 16,000 個 Nvidia H100 顯示卡上訓練的。
分析認為,這種關係對兩家公司來說是各取所需。對於輝達來說,Meta 正在訓練其他公司可以使用和調整的開放原始碼模型,而無需支付許可費用或請求許可,這可能會擴大輝達自身晶片的使用,並保持需求的高漲。
根據外媒報導,埃森哲 (ACN-US) 將是使用新服務為客戶建立客製化 Llama 3.1 模式的首家企業,沙烏地阿美石油公司、AT&T(T-US)、Uber(UBER-US)和其他產業領袖也成為首批存取新 Llama NVIDIA NIM 微服務的用戶。
Meta 的 25 個 Llama 相關企業合作夥伴包括 Amazon Web Services、Google Cloud、Microsoft Azure、Databricks 和 Dell(DELL-US)。