臺北市
33°
( 34° / 31° )
氣象
2025-09-19 | 科技島

DeepSeek登《Nature》打臉「上億訓練費」說法 公開成本僅29萬元


DeepSeek登《Nature》打臉「上億訓練費」說法 公開成本僅29萬元


中國AI新創公司DeepSeek再次成為焦點,該公司在本週發表於《自然》(Nature)的論文中透露,旗下R1模型的訓練成本僅為29.4萬美元,遠低於美國OpenAI等業者動輒上億美元的規模。記者鄧天心/綜合報導


中國AI新創公司DeepSeek再次成為焦點,該公司在本週發表於《自然》(Nature)的論文中透露,旗下R1模型的訓練成本僅為29.4萬美元,遠低於美國OpenAI等業者動輒上億美元的規模。


DeepSeek總部位於杭州,今年1月,該公司首次推出低成本AI模型,就曾引發市場震盪,一度威脅到輝達(Nvidia)等主要AI巨頭的地位,根據論文揭露,R1模型以512顆輝達H800晶片進行訓練,僅耗時80小時,最終花費29.4萬美元,美國OpenAI執行長Sam Altman曾在2023年表示,基礎模型的訓練成本「遠超過1億美元」,雖未公布細節,但數字落差相當驚人。


[caption id="attachment_192589" align="aligncenter" width="964"]
DeepSeek登《Nature》打臉「上億訓練費」說法 公開成本僅29萬元
中國AI新創公司DeepSeek再次成為焦點,該公司在本週發表於《自然》(Nature)的論文中透露,旗下R1模型的訓練成本僅為29.4萬美元,遠低於美國OpenAI等業者動輒上億美元的規模。(圖/Nature)[/caption]


延伸閱讀:


AI瀏覽器時代來了!Google Chrome宣布全面加入Gemini


不過,DeepSeek的技術來源與成本已多次受到質疑,H800晶片原本是輝達專為中國市場設計的「替代產品」,因為美國自2022年底起禁止更高階的H100和A100出口至中國。今年6月,美方官員甚至指稱DeepSeek仍設法取得「大量」H100晶片,但輝達隨即否認,強調DeepSeek只能合法使用H800,不過,該公司也在論文補充資料中首次承認,研發初期確實動用了部分A100晶片做小規模實驗。


研究團隊解釋:「我們在R1初期測試時,曾使用A100 GPU進行小模型實驗,正式訓練則是在512顆H800晶片上完成。」這也側面印證,DeepSeek是少數早期掌握A100超算資源的中國團隊。


此外,針對外界質疑DeepSeek「蒸餾」OpenAI模型,即透過技術模仿方式縮小開發成本,公司雖未正面回應,但最新論文已首度間接觸及相關爭議。


資料來源:Nature


這篇文章 DeepSeek登《Nature》打臉「上億訓練費」說法 公開成本僅29萬元 最早出現於 科技島-掌握科技新聞、科技職場最新資訊

Google新聞-PChome Online新聞

最新科技新聞

延伸閱讀