2025-02-07 | 科技島

只花20美元+26分鐘 AI教母李飛飛復刻DeepSeek R1推理模型

花費 20 美元、半小時不到的時間就能訓練出一個媲美 DeepSeek-R1 和 OpenAI o1 的推理模型？！文／鉅亨網

花費 20 美元、半小時不到的時間就能訓練出一個媲美 DeepSeek-R1 和 OpenAI o1 的推理模型？！

[caption id="attachment_163529" align="alignnone" width="1200"]
只花20美元+26分鐘 AI教母李飛飛復刻DeepSeek R1推理模型
花費 20 美元、半小時不到的時間就能訓練出一個媲美 DeepSeek-R1 和 OpenAI o1 的推理模型？！（圖／取自X@deepseek_ai）[/caption]

被譽為「AI 教母」的知名華裔美籍科學家李飛飛，其團隊最近發布一篇新論文，令人震驚的是，他們成功降低了復刻 DeepSeek R1 推理模型的成本。根據論文內容，利用阿里系開源的 Qwen2.5-32B-Instruct 模型進行監督微調（SFT），僅需在 16 個輝達 H100 GPU 上訓練 26 分鐘，而所需的算力租賃成本約為 20 美元。

研究人員指出，這種省時省錢的模型在數學競賽類問題上的表現甚至超過了 OpenAI 的 o1 預覽版，實驗結果顯示，s1-32B 的成績在 MATH 和 AIME24 數據集上超出 o1-preview 多達 27%。李飛飛團隊的研究成果已在 GitHub 上開源，連結為 https://github.com/simplescaling/s1。

此外，研究團隊還提出了一種名為「預算控制」（budget forcing）的策略，旨在調整測試時的運算資源。具體方法是強制終止模型的推理過程，或在生成內容時多次附加「Wait」，以延長模型的思考時間。這種方法能夠促使模型自我檢查答案，從而修正錯誤的推理步驟。在論文中，研究者以經典的數 R 問題為例，展示了這個策略的有效性。

李飛飛團隊的 s1 模型可視為 Qwen2.5 和 Gemini 2.0 Flash Thinking Experimental 的結合體。透過精心篩選的 1000 個問題及其答案，研究人員記錄了 Gemini 2.0 Flash 的 “思考過程”，並利用這些資料建立訓練集，對 Qwen2.5-32B-Instruct 進行微調。

有趣的是，這種做法可能違反了 Google 的使用條款，Google 禁止使用者對其模型進行逆向工程以開發競爭產品。對此，谷歌尚未回應。

在論文中，研究人員強調，s1 模型希望找到實現強推理能力和「測試時擴展」的最簡單方法。與 DeepSeek 的「大規模強化學習」方法相比，SFT 的成本顯著降低，因為它使用的是高品質的標註數據，且只需少量樣本即可獲得良好性能。

李飛飛團隊的這項研究再次引發了業界的關注。僅需 20 美元的投入和半小時的訓練時間，就能達到與 OpenAI 等公司數百萬美元成果相媲美的效果。這無疑為學界的研究人員提供了新的機遇，使他們無需巨額資金即可在 AI 領域取得創新突破。

然而，推理模型的未來「商品化」仍然是一個值得關注的問題。如果少量資金就能複製出價值數百萬美元的 AI 模型，企業的競爭優勢又將何在？儘管蒸餾是一種有效的複現方法，但仍需有志向的創新者和巨人來推動 AI 的發展。

（本文已獲鉅亨網同意授權刊出）

這篇文章只花20美元+26分鐘 AI教母李飛飛復刻DeepSeek R1推理模型最早出現於科技島-掌握科技新聞、科技職場最新資訊。

新聞關鍵字：AI、DeepSeek、EPS、美元、google、省錢、論文、輝達

只花20美元+26分鐘 AI教母李飛飛復刻DeepSeek R1推理模型

最新科技新聞

想買任天堂最新主機Switch 2？美國關稅政策恐成最大代價

FUN暑假布袋戲棚首度搬進燦坤3C家電

連天王周杰倫也愛的乾淨呵護完美兼顧飛利浦全新 XP9000 系列旗艦奢享智能電鬍刀主打「淨護一體不妥協」

2025 重車展盛大開幕光陽新任董座柯俊斌首度現身震撼登場

AWS台北區域驅動產業升級用生成式AI代理強化金融、醫療等企業數位韌性

延伸閱讀

心繪希望・愛加倍綻放伯立歐公益特展在二林鎮立圖書館展出

心繪希望・愛加倍綻放伯立歐公益特展在二林鎮立圖書館展出

全國科展防弊擴大比對系統增加英文資料庫

QS世界大學排名朝陽連續3年全台私立科大第一

自己的膝蓋自己救：退化性膝關節炎的真相》你以為是退化，其實是摩擦！膝蓋痛，九成不是老化，而是你沒聽過的「內側皺襞」在搞鬼！

只花20美元+26分鐘 AI教母李飛飛復刻DeepSeek R1推理模型

最新科技新聞

想買任天堂最新主機Switch 2？ 美國關稅政策恐成最大代價

FUN暑假 布袋戲棚首度搬進燦坤3C家電

連天王周杰倫也愛的乾淨呵護完美兼顧 飛利浦全新 XP9000 系列旗艦奢享智能電鬍刀 主打「淨護一體不妥協」

2025 重車展盛大開幕 光陽新任董座柯俊斌首度現身震撼登場

AWS台北區域驅動產業升級 用生成式AI代理強化金融、醫療等企業數位韌性

延伸閱讀

心繪希望・愛加倍綻放 伯立歐公益特展在二林鎮立圖書館展出

心繪希望・愛加倍綻放 伯立歐公益特展在二林鎮立圖書館展出

全國科展防弊 擴大比對系統增加英文資料庫

QS世界大學排名 朝陽連續3年全台私立科大第一

自己的膝蓋自己救：退化性膝關節炎的真相》你以為是退化，其實是摩擦！膝蓋痛，九成不是老化，而是你沒聽過的「內側皺襞」在搞鬼！

想買任天堂最新主機Switch 2？美國關稅政策恐成最大代價

FUN暑假布袋戲棚首度搬進燦坤3C家電

連天王周杰倫也愛的乾淨呵護完美兼顧飛利浦全新 XP9000 系列旗艦奢享智能電鬍刀主打「淨護一體不妥協」

2025 重車展盛大開幕光陽新任董座柯俊斌首度現身震撼登場

AWS台北區域驅動產業升級用生成式AI代理強化金融、醫療等企業數位韌性

心繪希望・愛加倍綻放伯立歐公益特展在二林鎮立圖書館展出

心繪希望・愛加倍綻放伯立歐公益特展在二林鎮立圖書館展出

全國科展防弊擴大比對系統增加英文資料庫

QS世界大學排名朝陽連續3年全台私立科大第一