聯發科進軍生成式AI平台 繁中LLM超越GPT3.5
IC 設計大廠聯發科 (2454-TW) 今 (9) 日舉辦論壇,正式推出生成式 AI 服務平台 MediaTek DaVinci,也稱「聯發科達哥」,同時旗下聯發創新基地釋出最新的繁體中文大型語言模型 MediaTek Research BreeXe (MR BreeXe),參數模型高達 450 億個,能力超越 GPT3.5。
AI 暨數據工程處協理葉家順指出,MediaTek DaVinci 是個高整合度、高擴展性的開放式平台,可讓客戶自由選擇模型、串接資料來源等,甚至模型也可以進行客製化,目前已有超過 20 家高科技廠、超過 10 家消費品牌、6 家金融業、3 家電信業以及 5 家傳統產業加入達哥生態系。
聯發科說,MediaTek DaVinci 是基於生成式 AI 服務框架 (GAI Service Framework, GAISF) 下去開發的,原先是為集團內部打造具資料安全性、提高生產力的生成式 AI 工具,後續獲各部門廣泛使用,進一步提高生產力。
隨著 MediaTek DaVinci 發展越趨成熟,聯發科也將其發展成可供外部企業導入的生成式 AI 服務平台,且除了客戶外,也有系統整合、雲端服務、教育機構、新創公司、模型供應商等加入 MediaTek Davinci 生態系。
此外,聯發科旗下聯發創新基地也釋出最新繁體中文大語言模型「MR BreeXe」,其以 Mixtral 8x7B 模型為基礎開發,繼承 Mixtral 多專家模型特有的節省運算資源、提升速度優勢,再加上聯發創新基地的預訓練 (pre-training) 後,不但在繁體中文測試項目 (TMMLU+、MT Bench TW) 超越 GPT-3.5,並對台灣常見之地端應用特別進行優化,提升產業界使用生成式 AI 與檢索增強生成 (RAG) 的體驗。
聯發科也因與輝達 (NVDA-US) 關係緊密,MR BreeXe 也是首家台廠基於輝達的 Taipei -1 GPU 超級電腦 DGX H100 上進行訓練的模型,透過 MediaTek Davinci,支援全地端與部分地端的佈設場景,並可依需求進行多樣本學習 (few-shot learning) 甚至微調 (fine-tuning) 的客製化。
葉家順表示,MediaTek DaVinci 解決許多企業在採用生成式 AI 的痛點,讓各行各業在確保資訊安全的環境下,可善用已有強大基礎的平台開發專屬的生成式 AI 應用。隨著更多企業與開發者加入 MediaTek Davinci 生態系,相信 MediaTek DaVinci 的能力將會持續爆發性成長,成為企業的得力助手。
聯發創新基地負責人許大山說,MediaTek Research BreeXe 繁體中文大型語言模型是聯發創新基地在大模型發展上最新的里程碑,提供優異語文理解能力和雲、地兩端的彈性,為現今繁體中文能力最強的語言模型, 加上與 MediaTek Davinci 的搭配,相信能更貼近在地需求,激發更多在地的生成式 AI 應用。