輝達股價暴跌16.9%急發聲明:證明DeepSeek需要更多H800 GPU
[周刊王CTWANT] 中國大陸人工智慧以及大型語言模型公司「杭州深度求索」(DeepSeek)20日發布並開源了DeepSeek-R1模型,該模型在數學、代碼、自然語言推理等任務上,效能媲美OpenAI o1正式版,但每百萬個token的查詢成本卻比前者便宜了98%,消息曝光後也讓美國科技權重股集體崩跌,輝達股價更暴跌16.9%。對此,輝達於美東時間27日發布聲明稱,DeepSeek的進展表明了輝達晶片對中國市場的重要性,因此未來還需要更多輝達的低階晶片來滿足DeepSeek服務的需求。
據悉,DeepSeek為中國浙江省杭州市的對沖基金、量化基金和人工智慧公司,1月20日,該公司正式發表推理大模型DeepSeek-R1。該模型在數學、代碼、自然語言推理等任務上,效能媲美OpenAI o1正式版,且在27日於美國地區蘋果App Store下載榜上超越ChatGPT,並登頂App Store免費應用程式榜榜首。
然而,R1的預訓練費用只有557.6萬美元,在2048塊輝達H800 GPU(針對中國市場的低配版GPU)集群上運行55天完成,且該模型每百萬個token的查詢成本僅為0.14美元,而OpenAI的成本為7.50美元,便宜了98%,甚至允許開源。消息曝光,也讓美國科技權重股集體崩跌,輝達股價更暴跌16.9%,觸及10月以來的新低,市值蒸發逾5000億美元(約合新台幣16兆元),就連輝達的競爭對手AMD股價也下跌超過6%至115.01美元。
對此,輝達27日也發布聲明來緩解投資人的擔憂,輝達稱,DeepSeek的進展表明了輝達晶片對中國市場的重要性,因此未來還需要更多的輝達晶片來滿足DeepSeek服務的需求,「DeepSeek的工作說明了如何使用該技術創建新模型,並利用廣泛可用的模型和完全符合出口管制的計算能力。」據DeepSeek的1篇研究論文顯示,它使用了大約2000個Nvidia的H800晶片,這些晶片的設計目的是遵守美國2022年所發布的出口管制規定;然而專家也告訴《路透社》,這些科技出口禁令不會減緩中國的人工智慧發展。
蘭德公司技術分析高級顧問古德里奇(Jimmy Goodrich)則透露,中國至少有十幾台大型超級電腦配備了大量Nvidia晶片,在DeepSeek使用這些晶片來學習如何提高效率時,這些晶片是合法購買的,而運算效率也是美國人工智慧公司關注的重點。古德里奇強調,「DeepSeek並不是憑空出現的——他們多年來一直致力於模型構建。眾所周知,DeepSeek擁有一支非常優秀的團隊,如果他們能夠獲得更多先進的計算能力,天知道他們會有多強大。」
延伸閱讀
最新財經新聞
-
-
大樂透頭獎連2槓 下期獎金上看2億元
(6 小時前) -
防災寓教於樂!旗山天后宮廣場化身消防教育園地
(6 小時前) -
今彩539第114026期 頭獎1注中獎
(6 小時前) -
盧秀燕初一下午海線兩宮廟續發紅包 宜蘭民眾衝2百公里排隊沾喜氣
(6 小時前)