臺北市
13°
( 14° / 12° )
氣象
2025-02-07 | 科技島

OpenAI與DeepSeek都靠邊!美國大學僅用50美元開發AI模型


OpenAI與DeepSeek都靠邊!美國大學僅用50美元開發AI模型


史丹佛與華盛頓大學的一組研究團隊開發了一種成本不到50美元的人工智慧推理模型S1。在涉及數學與編碼的測試中,S1的表現甚至能媲美OpenAI的o1和DeepSeek的R1等尖端模型。編譯/高晟鈞


史丹佛與華盛頓大學的一組研究團隊開發了一種成本不到50美元的人工智慧推理模型S1。在涉及數學與編碼的測試中,S1的表現甚至能媲美OpenAI的o1和DeepSeek的R1等尖端模型。


[caption id="attachment_163391" align="alignnone" width="1200"]
OpenAI與DeepSeek都靠邊!美國大學僅用50美元開發AI模型
國外開發了一種成本不到50美元的人工智慧推理模型S1。在涉及數學與編碼的測試中,S1的表現甚至能媲美OpenAI的o1和DeepSeek的R1等尖端模型。(圖/取自OpenAI官網)[/caption]


S1是怎麼做到的


研究團隊使用現成的基礎模型來開發S1,他們將此過程比喻為一種「提煉、萃取」的改造流程。就像從玫瑰中萃取精華一樣,S1 從 Google的推理模型之一Gemini 2.0 Flash Thinking Experiment中提煉出來的。透過這種方式,研究人員創建一個使用小型資料集,推理能力卻非常相對強大的模型。這相當於你能透過「效仿」其他模型的解答來進行訓練,並創建一個成本相對低廉,運算能力卻幾乎相當的AI模型,至少DeepSeek就是這麼做的。


更多新聞: TrendForce:DeepSeek帶動AI模型低成本化!「光收發模組」將扮演重要角色


S1模型使用僅包含1,000個精選問題和答案的小型資料集進行訓練,其中包括Google的Gemini 2.0每個答案背後的原因。儘管數據集很小,但該模型在AI基準測試中的表現令人印象深刻。事實上,它僅在16個Nvidia H100 GPU上訓練 30 分鐘後就取得了這些成果,成本約為50美元。這強化了這樣一種觀點:人工智慧的強大性能並不一定需要大量數據或昂貴的資源。


研究人員還添加了一個巧妙的組件來增強模型的推理能力。S1模型在運算時會進行一種特殊流程──「等待」,簡單來說就是暫停運算,從而有更多時間得出更精確的答案。這種策略顯著提高了S1答案的精確度。


人工智慧模型的商品化


DeepSeek的開源和開發方式,無疑成功引發了人們對AI模型「商品化」的質疑,S1模型就是最好的一個例子。人們對大規模人工智慧開發的未來以及主要人工智慧實驗室的競爭格局感到擔憂。如果一個小型研究團隊能夠以最少的資源取得這樣的成果,這對未來的人工智慧研究和開發有何影響?


當然,對於學術或者個人研究來說,S1這種極具成本效益的人工智慧模型,絕對能對科學和研究領域產生積極影響,並帶動科學的整體發展。當然,就商業層面來說,此舉也引發了業界對於AI知識產權與道德的擔憂。倘若未來AI仍舊不受版權保護,這種「萃取」式的開發過程很可能將引起許多激進的爭執與行為。



資料來源:Interesting Engineering


※探索職場,透視薪資行情,請參考【科技類-職缺百科】幫助你找到最適合的舞台!


這篇文章 OpenAI與DeepSeek都靠邊!美國大學僅用50美元開發AI模型 最早出現於 科技島-掌握科技新聞、科技職場最新資訊

Google新聞-PChome Online新聞

最新科技新聞

延伸閱讀