AI競賽不落人後 Meta再推大型語言模型「LLaMA」
Tag
人工智慧 (AI) 競賽如火如荼展開之際,Meta(META-US) 周五 (24 日) 發布一項可用來發展相關應用的研究工具,試圖加入競爭對手微軟、Google 的行列,在 ChatGPT 掀起的 AI 大戰中創造話題。
Meta 執行長祖克柏 (Mark Zuckerberg) 透過 Instagram 介紹這項名為「LLaMA」的大型語言模型,說明這項工具在產出文本、對話、整理文檔以及進行更複雜任務等方面展現巨大潛力,例如解決數學問題或是進行科學研究。
一位 Meta 發言人表示,目前 LLaMA 尚未應用於旗下產品,包含 Facebook 和 Instagram,但公司計劃向自家 AI 研究人員提供該技術。
大型語言模型形同大型 AI 系統,可透過吸收大量新聞文章、社群貼文或其他網路資源的數位文本進行資料訓練,近期討論度極高的 ChatGPT,便是利用 OpenAI 的大型語言模型 GPT-3 開發出來的聊天機器人。
從各大科技公司的積極動作來看,AI 儼然已成為眾家競逐的一級戰區。微軟向 OpenAI 注資數十億美元後,本月稍早推出結合 AI 聊天機器人技術的新版搜尋引擎 Bing。Google 旗下也有名為「LaMDA 」的大型語言模型,並且正在測試一款以 LaMDA 為基礎的對話式搜尋引擎 Bard。
Meta 過去曾推出名為「OPT-175B」的大型語言模型,並在去年底發布另一款模型「Galactica」,但後者因經常分享具有偏見或不準確的訊息而被研究人員撤回。