臺北市
23°
( 23° / 22° )
氣象
2025-05-28 | 科技島

Google亮相Gemini Diffusion 首款語言「擴散模型」刷新生成速度


Google亮相Gemini Diffusion 首款語言「擴散模型」刷新生成速度


在Google I/O 2025的大會當中,Google除了發表Gemini 2.5系列與新一代Veo 3模型掀起熱議話題之外,也首度亮相首款擴散模型(Diffusion Model)Gemini Diffusion,雖然目前只提供限量實驗體驗,必須要註冊候補名單才能試用,但是這款新模型憑著超高速語言生成能力與技術潛力,迅速引起AI社群高度關注。記者彭夢竺/綜合報導


Google I/O 2025的大會當中,Google除了發表Gemini 2.5系列與新一代Veo 3模型掀起熱議話題之外,也首度亮相首款擴散模型(Diffusion Model)Gemini Diffusion,雖然目前只提供限量實驗體驗,必須要註冊候補名單才能試用,但是這款新模型憑著超高速語言生成能力與技術潛力,迅速引起AI社群高度關注。


[caption id="attachment_174725" align="aligncenter" width="2558"]
Google亮相Gemini Diffusion 首款語言「擴散模型」刷新生成速度
在Google I/O 2025的大會當中,Google首度亮相首款擴散模型(Diffusion Model)Gemini Diffusion。(圖/截取自Google)[/caption]


Gemini Diffusion是Google首次將擴散式生成機制應用於AI文字生成領域的實驗性產品,與GPT-4等傳統自回歸語言模型不同的地方在於,Gemini Diffusion採用「非自回歸」的擴散架構,從隨機指令出發,經過多輪精煉後生成完整文本。


延伸閱讀:Google新一代影像生成模型Veo 3超級逼真 開放71國用戶付費使用


根據Google說明,傳統大型語言模型像是Gemini 2.0及OpenAI GPT系列,都是以自我迴歸方式運作,每次依據前序的token預測下一個token,直到完成整段文字。這類型逐步生成機制雖然在語言理解與產出已經具有成熟應用,但在長文本、多輪互動或需快速產生內容的情境,容易受到生成速度與一致性限制,也可能有錯誤累積等問題。


Gemini Diffusion這種全新方法不再逐字產出,而是一次性建構整段語意內容,提高語言生成效率與邏輯一致性,展現出大語言模型的新進化方向。除此之外,Gemini Diffusion的最大亮點就是速度,根據外媒實測,該模型達到每秒產出1479個token、啟動延遲僅0.84秒,遠遠超過目前主流語言模型,包含GPT-4、Claude等,非常適合即時對話生成、智慧客服、互動式應用等場景。


雖然說Gemini Diffusion並不是這一屆Google I/O 2025大會的主要焦點,但是其展現出Google持續拓展Gemini能力,朝向「世界模型」(World Model)方向前進的野心,這不是指傳統的磁碟啟動系統,由「世界模型」驅動的通用AI助理,可以理解人類身處的世界,代替人類進行推理、採取行動。


有外媒分析指出,Google讓Gemini Diffusion亮相,代表願意突破傳統,取得更高效率、更低延遲,而值得關注的是,微軟在企業軟體領域擁有穩固的地位,若是Google 能夠提供真正的通用AI助理,並由「世界模型」驅動,未來將有機會一舉超越微軟。


這篇文章 Google亮相Gemini Diffusion 首款語言「擴散模型」刷新生成速度 最早出現於 科技島-掌握科技新聞、科技職場最新資訊

Google新聞-PChome Online新聞

最新科技新聞

延伸閱讀