
DeepSeek創始人梁文鋒。(資料圖片)
內地人工智能發展再迎來新突破!據內媒報道,由深度求索(DeepSeek)團隊共同完成、梁文鋒擔任通訊作者的論文《DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning》,登上了國際權威期刊《自然》(Nature)封面。據悉,這是中國大模型研究首次登上Nature封面,標誌著中國AI技術在國際科學界獲得最高認可。
否認有意利用OpenAI模型輸出
與今年1月發布的DeepSeek-R1初版論文相比,今次論文揭露了更多模型訓練細節,並回應了模型發布之初的蒸餾質疑。團隊否認有意利用OpenAI模型輸出進行訓練,強調DeepSeek-V3 Base基座模型完全以互聯網數據為來源,雖然不排除包含GPT-4產生的內容,但絕非刻意蒸餾。
訓練成本僅29.4萬美元遠低OpenAI
值得關注的是,研究團隊在論文補充材料中披露,DeepSeek-R1的訓練成本僅29.4萬美元,即便加上約600萬美元的基礎模型成本,總開支仍遠低於OpenAI、Google等國際巨頭的AI訓練投入。
《自然》期刊在評論中指出,隨著AI快速普及,大模型企業難以驗證的宣傳帶來真實風險,而依靠獨立研究人員的同行評議,有助抑制產業過度炒作。DeepSeek的成果不僅提升國際學術影響力,也為AI產業建立新的透明標準提供了可參考的範例。