DeepSeek登《Nature》打臉「上億訓練費」說法 公開成本僅29萬元
中國AI新創公司DeepSeek再次成為焦點,該公司在本週發表於《自然》(Nature)的論文中透露,旗下R1模型的訓練成本僅為29.4萬美元,遠低於美國OpenAI等業者動輒上億美元的規模。
中國AI新創公司DeepSeek再次成為焦點,該公司在本週發表於《自然》(Nature)的論文中透露,旗下R1模型的訓練成本僅為29.4萬美元,遠低於美國OpenAI等業者動輒上億美元的規模。
DeepSeek總部位於杭州,今年1月,該公司首次推出低成本AI模型,就曾引發市場震盪,一度威脅到輝達(Nvidia)等主要AI巨頭的地位,根據論文揭露,R1模型以512顆輝達H800晶片進行訓練,僅耗時80小時,最終花費29.4萬美元,美國OpenAI執行長Sam Altman曾在2023年表示,基礎模型的訓練成本「遠超過1億美元」,雖未公布細節,但數字落差相當驚人。
[caption id="attachment_192589" align="aligncenter" width="964"]
中國AI新創公司DeepSeek再次成為焦點,該公司在本週發表於《自然》(Nature)的論文中透露,旗下R1模型的訓練成本僅為29.4萬美元,遠低於美國OpenAI等業者動輒上億美元的規模。(圖/Nature)[/caption]
延伸閱讀:
AI瀏覽器時代來了!Google Chrome宣布全面加入Gemini
不過,DeepSeek的技術來源與成本已多次受到質疑,H800晶片原本是輝達專為中國市場設計的「替代產品」,因為美國自2022年底起禁止更高階的H100和A100出口至中國。今年6月,美方官員甚至指稱DeepSeek仍設法取得「大量」H100晶片,但輝達隨即否認,強調DeepSeek只能合法使用H800,不過,該公司也在論文補充資料中首次承認,研發初期確實動用了部分A100晶片做小規模實驗。
研究團隊解釋:「我們在R1初期測試時,曾使用A100 GPU進行小模型實驗,正式訓練則是在512顆H800晶片上完成。」這也側面印證,DeepSeek是少數早期掌握A100超算資源的中國團隊。
此外,針對外界質疑DeepSeek「蒸餾」OpenAI模型,即透過技術模仿方式縮小開發成本,公司雖未正面回應,但最新論文已首度間接觸及相關爭議。
資料來源:Nature
這篇文章 DeepSeek登《Nature》打臉「上億訓練費」說法 公開成本僅29萬元 最早出現於 科技島-掌握科技新聞、科技職場最新資訊。
最新科技新聞
-
-
iPhone 17開箱+效能測試篇:五色都粉美!絕對是當今最超值的iPhone
(4 小時前) -
iPhone Air開箱:不但超薄超美!且效能強大超乎你的想像
(5 小時前) -
iPhone 17 Pro橘色好看?iPhone Air,17 Pro ,17 Pro Max與17各色細節與特色還有新款配件快來看!
(7 小時前) -
機器人護士解決護士短缺
(9 小時前)