DeepSeek登《Nature》打臉「上億訓練費」說法 公開成本僅29萬元

中國AI新創公司DeepSeek再次成為焦點,該公司在本週發表於《自然》(Nature)的論文中透露,旗下R1模型的訓練成本僅為29.4萬美元,遠低於美國OpenAI等業者動輒上億美元的規模。
中國AI新創公司DeepSeek再次成為焦點,該公司在本週發表於《自然》(Nature)的論文中透露,旗下R1模型的訓練成本僅為29.4萬美元,遠低於美國OpenAI等業者動輒上億美元的規模。
DeepSeek總部位於杭州,今年1月,該公司首次推出低成本AI模型,就曾引發市場震盪,一度威脅到輝達(Nvidia)等主要AI巨頭的地位,根據論文揭露,R1模型以512顆輝達H800晶片進行訓練,僅耗時80小時,最終花費29.4萬美元,美國OpenAI執行長Sam Altman曾在2023年表示,基礎模型的訓練成本「遠超過1億美元」,雖未公布細節,但數字落差相當驚人。
[caption id="attachment_192589" align="aligncenter" width="964"]
中國AI新創公司DeepSeek再次成為焦點,該公司在本週發表於《自然》(Nature)的論文中透露,旗下R1模型的訓練成本僅為29.4萬美元,遠低於美國OpenAI等業者動輒上億美元的規模。(圖/Nature)[/caption]
延伸閱讀:
AI瀏覽器時代來了!Google Chrome宣布全面加入Gemini
不過,DeepSeek的技術來源與成本已多次受到質疑,H800晶片原本是輝達專為中國市場設計的「替代產品」,因為美國自2022年底起禁止更高階的H100和A100出口至中國。今年6月,美方官員甚至指稱DeepSeek仍設法取得「大量」H100晶片,但輝達隨即否認,強調DeepSeek只能合法使用H800,不過,該公司也在論文補充資料中首次承認,研發初期確實動用了部分A100晶片做小規模實驗。
研究團隊解釋:「我們在R1初期測試時,曾使用A100 GPU進行小模型實驗,正式訓練則是在512顆H800晶片上完成。」這也側面印證,DeepSeek是少數早期掌握A100超算資源的中國團隊。
此外,針對外界質疑DeepSeek「蒸餾」OpenAI模型,即透過技術模仿方式縮小開發成本,公司雖未正面回應,但最新論文已首度間接觸及相關爭議。
資料來源:Nature
這篇文章 DeepSeek登《Nature》打臉「上億訓練費」說法 公開成本僅29萬元 最早出現於 科技島-掌握科技新聞、科技職場最新資訊。
最新科技新聞
-
-
傳聯發科將比照高通採雙旗艦策略 2奈米高昂成本成關鍵變數
(2 小時前) -
財測不如預期、資本支出暴增 甲骨文股價盤後重挫10%
(2 小時前) -
傳輝達測試AI晶片定位追蹤 防堵黑市走私出口管制國
(2 小時前) -
輝達開發「位置驗證」技術 可望遏阻晶片走私
(3 小時前)




