推論晶片掀價格戰!Groq成本僅輝達2成、速度翻倍

隨著AI算力需求持續爆發,市場競爭焦點正從效能轉向成本。雲端基礎設施業者Nebius專家指出,雖然輝達GPU仍在效能上領先,但替代方案正快速崛起,其中Groq在推論晶片領域展現明顯成本與速度優勢。
隨著AI算力需求持續爆發,市場競爭焦點正從效能轉向成本。雲端基礎設施業者Nebius專家指出,雖然輝達GPU仍在效能上領先,但替代方案正快速崛起,其中Groq在推論晶片領域展現明顯成本與速度優勢。

雖然輝達GPU仍在效能上領先,但替代方案正快速崛起,其中Groq在推論晶片領域展現明顯成本與速度優勢。(圖/輝達提供)
該專家指出,目前AI基礎設施的計價方式正出現重大轉變,從過去以「每小時GPU成本」為主,逐漸轉向「每百萬Token成本」。在現行市場中,輝達H100每小時約2.95美元,H200約3.5美元,最新Blackwell B200則落在4.9至6.5美元之間;若採長期預訂模式,價格可降至1.5至3.5美元不等。
然而在新的Token計價模式下,差距更加明顯。Groq晶片每百萬Token成本僅約0.05至0.10美元,而輝達Blackwell系列(B100、B200、B300)則約0.25美元,成本高出約5倍。
更多科技工作請上科技專區:https://techplus.1111.com.tw/
科技社群討論區:https://pei.com.tw/feed/c/tech-plus
除了價格優勢外,Groq在推論速度上也具競爭力。Nebius專家指出,其晶片最高可達每秒800個Token輸出,幾乎是輝達約450 Token/秒的兩倍,顯示在即時推論場景中更具效率。
專家進一步分析,目前企業AI工作負載中,有高達90%至95%集中在推論,而非模型訓練。隨著企業多採用現成模型與API服務,推論需求快速放大,也帶動對專用推論晶片的需求。
此外,輝達也早在2025年底與Groq簽署非獨家授權合作,顯示其對推論市場的重視。不過在成本導向逐漸成為主流的情況下,市場對替代晶片的接受度正快速提升。
來源:wccftech
這篇文章 推論晶片掀價格戰!Groq成本僅輝達2成、速度翻倍 最早出現於 科技島-掌握科技新聞、科技職場最新資訊。
最新科技新聞
-
美憂中俄軍情機構利用 援引出口管制法限制AI新模型
(3 小時前) -
AI模型遭美國政府勒令下架 揭露數據安全隱憂
(3 小時前) -
美國食品藥物管理局AI醫療設備指引草案 強調風險管理與監管變革
(3 小時前) -
美政府管制Anthropic AI模型引反彈 業者籲撤銷出口禁令
(3 小時前) -
紐約州與 AWS 合作 簡化雲端及 AI 服務採購
(4 小時前)




