臺北市
31°
( 32° / 29° )
氣象
2026-04-24 | 科技島

推論晶片掀價格戰!Groq成本僅輝達2成、速度翻倍


推論晶片掀價格戰!Groq成本僅輝達2成、速度翻倍



隨著AI算力需求持續爆發,市場競爭焦點正從效能轉向成本。雲端基礎設施業者Nebius專家指出,雖然輝達GPU仍在效能上領先,但替代方案正快速崛起,其中Groq在推論晶片領域展現明顯成本與速度優勢。記者黃仁杰/編譯



隨著AI算力需求持續爆發,市場競爭焦點正從效能轉向成本。雲端基礎設施業者Nebius專家指出,雖然輝達GPU仍在效能上領先,但替代方案正快速崛起,其中Groq在推論晶片領域展現明顯成本與速度優勢。




推論晶片掀價格戰!Groq成本僅輝達2成、速度翻倍
雖然輝達GPU仍在效能上領先,但替代方案正快速崛起,其中Groq在推論晶片領域展現明顯成本與速度優勢。(圖/輝達提供)



該專家指出,目前AI基礎設施的計價方式正出現重大轉變,從過去以「每小時GPU成本」為主,逐漸轉向「每百萬Token成本」。在現行市場中,輝達H100每小時約2.95美元,H200約3.5美元,最新Blackwell B200則落在4.9至6.5美元之間;若採長期預訂模式,價格可降至1.5至3.5美元不等。



然而在新的Token計價模式下,差距更加明顯。Groq晶片每百萬Token成本僅約0.05至0.10美元,而輝達Blackwell系列(B100、B200、B300)則約0.25美元,成本高出約5倍。



更多科技工作請上科技專區:https://techplus.1111.com.tw/



科技社群討論區:https://pei.com.tw/feed/c/tech-plus



除了價格優勢外,Groq在推論速度上也具競爭力。Nebius專家指出,其晶片最高可達每秒800個Token輸出,幾乎是輝達約450 Token/秒的兩倍,顯示在即時推論場景中更具效率。



專家進一步分析,目前企業AI工作負載中,有高達90%至95%集中在推論,而非模型訓練。隨著企業多採用現成模型與API服務,推論需求快速放大,也帶動對專用推論晶片的需求。



此外,輝達也早在2025年底與Groq簽署非獨家授權合作,顯示其對推論市場的重視。不過在成本導向逐漸成為主流的情況下,市場對替代晶片的接受度正快速提升。



來源:wccftech





這篇文章 推論晶片掀價格戰!Groq成本僅輝達2成、速度翻倍 最早出現於 科技島-掌握科技新聞、科技職場最新資訊

Google新聞-PChome Online新聞

最新科技新聞

延伸閱讀