臺北市
27°
( 27° / 27° )
氣象
2025-06-08 | 草根影響力新視野

DeepSeek更新推理模型,科技競爭加劇


草根影響力新視野(琪拉編譯)


中國人工智慧新創公司 DeepSeek 最近更新了他們的 R1 推理模型的更新,讓他與美國競爭對手 OpenAI 等的競爭更加劇烈。DeepSeek 在開發者平台 Hugging Face 上發布了 R1-0528,但尚未正式發佈公告。它沒有發布該模型的描述或比較結果。


然而,由加州大學柏克萊分校、麻省理工學院和康乃爾大學的研究人員開發的基準測試 LiveCodeBench 排行榜顯示,DeepSeek 更新後的 R1 推理模型在程式碼生成方面略遜於 OpenAI 的 o4 mini 和 o3 推理模型,但領先於 xAI 的 Grok 3 mini 和阿里巴巴的 Qwen 3。DeepSeek 的一位代表表示,該公司已完成所謂的“小規模測試升級”,用戶可以開始測試。


今年早些時候,DeepSeek 發布了與美國行業領先模型相當甚至更優的 AI 模型,而成本僅為後者的一小部分,這推翻了美國出口管制阻礙中國 AI 發展的觀點。R1 於 1 月發布,導致中國以外的科技股在 1 月暴跌,並挑戰了「擴展 AI 需要大量算力和投資」的觀點。自 R1 發布以來,阿里巴巴和騰訊等中國科技巨頭紛紛發布了聲稱超越 DeepSeek 的模型。



DeepSeek更新推理模型,科技競爭加劇

圖片取自:(示意圖 wikipedia

DeepSeek今年一月推出當日,美國股市暴跌,晶片製造商Nvidia市值蒸發近6000億美元。它的意外進展,威脅到了美國科技產業的無敵光環。當時年的新創公司DeepSeek僅成立一年,它展示了一項令人震驚的功能:它的模型 R1擁有ChatGPT所有常見的功能,但運行成本僅為OpenAI、谷歌或Meta等熱門人工智慧模型的一小部分。該公司表示,其基礎模型的運算能力投入僅560萬美元,而美國公司在人工智慧技術上的投入則動輒數億甚至數十億美元。


DeepSeek推出之後,為了與之競爭,Google的 Gemini 推出了使用者不同級別,而 OpenAI 則降低了價格,並發布了依賴運算能力較低的 o3 mini 模型。Meta也表示,將在人工智慧開發上投入高達 650 億美元。 OpenAI 執行長 Sam Altman 也表示,人工智慧產業需要數兆美元的投資來支援開發高需求晶片,這些晶片是運行該產業複雜模型的耗電資料中心所必需的。


全球領先的科技投資者之一馬克·安德森 (Marc Andreessen)當時稱 DeepSeek 是「我見過的最令人驚嘆、最令人印象深刻的突破之一」。


現在,預計DeepSeek仍將發布 R1 的後續版本 R2。DeepSeek 也在 3 月發布了其 V3 大型語言模型的升級版。


資料來源: https://edition.cnn.comhttps://edition.cnn.com


[不許轉載、公開播送或公開傳輸]

Google新聞-PChome Online新聞

最新科技新聞

延伸閱讀