又要出招!DeepSeek將提前發布下一代推理模型R2 強化這2項功能
開發低成本、高效能生成式人工智慧(AI)的DeepSeek,似乎又要出大招,提前推出其下一個推理模型R2。據三位知情人士透露,該公司現正加速推出其下一代模型R2,本來計畫於5月初發布,如今則希望其能儘早問世。
開發低成本、高效能生成式人工智慧(AI)的DeepSeek,似乎又要出大招,提前推出其下一個推理模型R2。中國AI新創公司DeepSeek在今年1月推出的R1模型,以較低成本的AI推理技術在全球市場掀起風暴,甚至引發全球股市市值蒸發超過1兆美元。據三位知情人士透露,該公司現正加速推出其下一代模型R2,本來計畫於5月初發布,如今則希望其能儘早問世。
[caption id="attachment_166103" align="alignnone" width="1200"]
開發低成本、高效能生成式人工智慧(AI)的DeepSeek,將提前推出其下一個推理模型R2。(示意圖/123RF)[/caption]
R2瞄準多語言推理與程式編寫
據報導,DeepSeek透露,R2模型將在程式編寫上帶來突破,並擴展至非英語語言的推理能力。這項提前發布的計畫尚未有公開報導,外界對於R2的具體能力與發布日期仍在觀望。而對於相關消息,DeepSeek尚未作出回應。
更多新聞:百度執行長力挺DeepSeek拋震撼彈宣布開源AI模型Ernie4.5
R1憑低成本與強大性能震撼業界
R1模型的成功震驚全球科技巨頭,這款模型雖然使用的輝達晶片效能較弱,卻與美國企業斥資數千億美元打造的AI模型不相上下。印度科技服務公司Zensar的營運長Vijayasimha Alilughatta表示,R2的推出可能成為AI業界的分水嶺,DeepSeek開發低成本AI的成功經驗,或將促使全球企業加速AI發展腳步,打破少數科技巨頭的壟斷局面。
梁文峰從量化基金到AI領軍人物
DeepSeek的神秘色彩不僅來自其技術突破,也源於其低調的創辦人梁文峰。他透過經營量化基金High-Flyer成為億萬富翁,並在2024年7月後未曾接受任何媒體訪問。據了解,DeepSeek更像是一個研究實驗室而非傳統的營利企業,打破中國科技業的階級文化,重視研究與創新。
DeepSeek創新:MoE與MLA架構
DeepSeek能以低成本達到高效能,得益於其採用的專業混合專家模型(MoE)與多頭潛在注意力架構(MLA)架構。MoE可將AI模型劃分成不同的專家區塊,僅在處理問題時啟動相關部分,減少不必要的計算成本。而MLA架構則讓模型能同時處理資訊的不同層面,更精準地捕捉關鍵細節。
R1價格比競爭對手低20至40倍
據Bernstein分析師2月的估算,DeepSeek的AI模型定價比OpenAI等競爭對手便宜20至40倍。此舉迫使OpenAI降價,Google的Gemini也推出較低價位的服務,展現出DeepSeek如何重塑全球AI價格戰。
R2模型恐引發美中AI競爭升級
目前,DeepSeek的快速發展已引起美國政府的關注,美方視AI領導地位為國家優先事項。而R2的推出可能會進一步激勵中國政府及企業,目前已有數十家中國企業表示正將DeepSeek的模型整合至其產品中。
然而,DeepSeek 的快速崛起恐慧加劇美中 AI 技術戰,使美國與其他國家進一步收緊 AI 晶片與軟體合作的限制。DeepSeek 創辦人梁文峰曾坦言,「我們從來不缺資金,我們缺的是高階晶片。」
※探索職場,透視薪資行情,請參考【科技類-職缺百科】幫助你找到最適合的舞台!
這篇文章 又要出招!DeepSeek將提前發布下一代推理模型R2 強化這2項功能 最早出現於 科技島-掌握科技新聞、科技職場最新資訊。
最新科技新聞
-
-
上銀去年每股賺5.57元 擬配息2.4元
(49 分鐘前) -
SpaceX超重型推進器就位 星艦第8次試飛蓄勢待發
(1 小時前) -
用荷爾蒙抗老 科學家找到阻止皺紋、白髮新方法
(2 小時前) -
南亞科:中國產能影響DRAM產業 採差異性經營因應
(2 小時前)