Google亮相Gemini Diffusion 首款語言「擴散模型」刷新生成速度
在Google I/O 2025的大會當中,Google除了發表Gemini 2.5系列與新一代Veo 3模型掀起熱議話題之外,也首度亮相首款擴散模型(Diffusion Model)Gemini Diffusion,雖然目前只提供限量實驗體驗,必須要註冊候補名單才能試用,但是這款新模型憑著超高速語言生成能力與技術潛力,迅速引起AI社群高度關注。
在Google I/O 2025的大會當中,Google除了發表Gemini 2.5系列與新一代Veo 3模型掀起熱議話題之外,也首度亮相首款擴散模型(Diffusion Model)Gemini Diffusion,雖然目前只提供限量實驗體驗,必須要註冊候補名單才能試用,但是這款新模型憑著超高速語言生成能力與技術潛力,迅速引起AI社群高度關注。
[caption id="attachment_174725" align="aligncenter" width="2558"]
在Google I/O 2025的大會當中,Google首度亮相首款擴散模型(Diffusion Model)Gemini Diffusion。(圖/截取自Google)[/caption]
Gemini Diffusion是Google首次將擴散式生成機制應用於AI文字生成領域的實驗性產品,與GPT-4等傳統自回歸語言模型不同的地方在於,Gemini Diffusion採用「非自回歸」的擴散架構,從隨機指令出發,經過多輪精煉後生成完整文本。
延伸閱讀:Google新一代影像生成模型Veo 3超級逼真 開放71國用戶付費使用
根據Google說明,傳統大型語言模型像是Gemini 2.0及OpenAI GPT系列,都是以自我迴歸方式運作,每次依據前序的token預測下一個token,直到完成整段文字。這類型逐步生成機制雖然在語言理解與產出已經具有成熟應用,但在長文本、多輪互動或需快速產生內容的情境,容易受到生成速度與一致性限制,也可能有錯誤累積等問題。
Gemini Diffusion這種全新方法不再逐字產出,而是一次性建構整段語意內容,提高語言生成效率與邏輯一致性,展現出大語言模型的新進化方向。除此之外,Gemini Diffusion的最大亮點就是速度,根據外媒實測,該模型達到每秒產出1479個token、啟動延遲僅0.84秒,遠遠超過目前主流語言模型,包含GPT-4、Claude等,非常適合即時對話生成、智慧客服、互動式應用等場景。
雖然說Gemini Diffusion並不是這一屆Google I/O 2025大會的主要焦點,但是其展現出Google持續拓展Gemini能力,朝向「世界模型」(World Model)方向前進的野心,這不是指傳統的磁碟啟動系統,由「世界模型」驅動的通用AI助理,可以理解人類身處的世界,代替人類進行推理、採取行動。
有外媒分析指出,Google讓Gemini Diffusion亮相,代表願意突破傳統,取得更高效率、更低延遲,而值得關注的是,微軟在企業軟體領域擁有穩固的地位,若是Google 能夠提供真正的通用AI助理,並由「世界模型」驅動,未來將有機會一舉超越微軟。
這篇文章 Google亮相Gemini Diffusion 首款語言「擴散模型」刷新生成速度 最早出現於 科技島-掌握科技新聞、科技職場最新資訊。
最新科技新聞
-
-
政府成立「AI公務人才發展辦公室」 強化公共服務品質
(1 小時前) -
溫哥華網路峰會登場 加墨台企業場邊攜手尋商機
(2 小時前) -
realme GT 7系列新機5/30上市 跨界攜手奧斯頓馬丁F1大展旗艦效能
(3 小時前) -
不比前一代效能好?AMD新款RX 9060 XT實測結果曝光
(3 小時前)