1

熱搜:

熱門行情

最近搜尋

全部刪除

Nature發文:中國如何創造出AI模型DeepSeek並震驚世界

鉅亨網新聞中心
Nature發文:中國如何創造出AI模型DeepSeek並震驚世界(圖:shutterstock)
Nature發文:中國如何創造出AI模型DeepSeek並震驚世界(圖:shutterstock)

中國科技新創公司 DeepSeek 以其大型語言模型 (LLMs) 卓越的「性價比」,震驚了科技界。著名專業期刊《Nature》近日發文,特別探討從中所展示,中國在科技與人工智慧的研究。

文章稱,這些模型的性能可與美國科技巨頭所開發的主導工具相媲美,但其開發成本和計算能力卻遠低於這些巨頭。

DeepSeek 在 1 月 20 日發布了部分開放原始碼的「推理」模型 DeepSeek-R1,該模型能夠解決一些科學問題,其標準與 OpenAI 去年推出的最先進 LLM o1 相似。

DeepSeek 還發布了另一個名為 Janus-Pro-7B 的模型,可以透過文字提示生成圖像,類似於 OpenAI 的 DALL-E 3 和 Stable Diffusion。

文章認為,DeepSeek 的成功並非偶然,它符合中國政府成為全球人工智慧 (AI) 領域領導者的雄心。中國在 LLM 開發領域投入了巨額風險投資,並且擁有大量科學、技術、工程或數學領域的博士學位人才,包括 AI 領域的人才。

事實上,除了 DeepSeek 之外,還有其他中國公司也在開發先進的 LLM。例如:

  • 阿里巴巴發布了其迄今為止最先進的 LLM——Qwen2.5-Max,該公司聲稱其性能超越了 DeepSeek 去年 12 月發布的 DeepSeek V3。
  • Moonshot AI 和字節跳動也發布了新的推理模型——Kimi 1.5 和 1.5-pro,該公司聲稱這些模型在某些基準測試中可以超越 o1。

中國政府將發展 AI 產業列為優先事項。早在 2017 年,中國政府就宣布了其在 2030 年前成為全球 AI 領域領導者的目標,並要求行業在 2025 年前完成重大 AI 突破,「使技術和應用達到世界領先水平」。為了實現這一目標,中國政府大力投資 AI 教育和人才培養。

中國教育部已經批准 440 所大學開設人工智慧專業的本科學位,並提供了近一半世界頂尖的 AI 研究人員。

DeepSeek 很可能受益於政府在 AI 教育和人才發展方面的投資,這包括眾多獎學金、研究資助以及學術界與行業之間的合作。例如,由百度領導的深度學習技術與應用國家工程實驗室,已經培養了成千上萬的 AI 專家。

DeepSeek 的創辦人梁文鋒表示,該公司已經招募了中國頂尖大學的畢業生和博士生。DeepSeek 的領導團隊體現了一種獨特的中國創新方法,強調在限制下的效率。

DeepSeek 在美國政府實施出口管制的背景下開發了 DeepSeek-R1 和 Janus-Pro-7B,這更突顯了其成就。這些管制自 2022 年起阻止中國獲得先進的 AI 計算晶片。DeepSeek 使用大約 2000 個 Nvidia 製造的 H800 晶片來訓練其 DeepSeek-V3 模型,而 Meta 的 Llama 3.1 405B 依賴於 16000 多個更先進的 H100 Nvidia 晶片。

DeepSeek 採用多種方法來提高其模型的效率,例如採用「專家混合」架構和創新的多頭潛在注意力技術的變體。

DeepSeek 的成就為那些有 AI 雄心但缺乏財政資源和硬體的國家提供了藍圖。DeepSeek 的成功表明,即使在資源有限的情況下,也可以透過創新和效率來建立大型 LLM。

相關貼文

left arrow
right arrow