DeepSeek。(示意圖/路透社)
憑藉低成本模式震驚世界的內地人工智能新創公司DeepSeek,24日推出新一代大型語言模型V4預覽版,為針對華為晶片技術進行適配的新模型,引發市場高度關注。
棄輝達轉用華為晶片
《路透社》報道,DeepSeek過去主要依賴輝達晶片訓練模型,但此次V4版本明顯轉向與華為合作。不過,DeepSeek並未公開說明訓練V4所使用的具體處理器型號。
DeepSeek表示,V4 Pro版本在世界知識基準測試中,已超越多數開源模型,僅落後於Google旗下封閉源模型Gemini-Pro-3.1。
「毫無根據的指控」
新版本同時推出成本更低的Flash版本,作為正式產品發布前的預覽版本,用於蒐集市場回饋與進一步優化。另一方面,華為表示,旗下昇騰(Ascend)AI晶片產品線已全面支援DeepSeek V4模型。
報道指出,然而,就在DeepSeek曝光新模型前一天,白宮公開指控中國「大規模竊取美國AI實驗室知識產權」,並點名中企涉嫌規避美國出口管制,取得高階AI晶片。中國駐美大使館回應,中方反對「毫無根據的指控」,並強調北京高度重視知識產權保護。
文章授權轉載自《中天新聞網》,按此查看原始文章













