臺北市
19°
( 20° / 19° )
氣象
2025-11-21 | 中央商情

AI圖像生成再進化 Google新影像模型可多語言文字

Google圖像編輯人工智慧(AI)工具NanoBanana曾在社群上掀起3D公仔圖生成熱潮,Google今天推出NanoBananaPro影像模型,以Gemini3Pro為基礎,可以在圖像中直接生成多種語言且精準、清晰的文字。

Google在官方部落格發文說明,NanoBananaPro結合先進的推理能力與世界知識,不僅能生成精準的資訊圖表與清晰文字,更提供專業級的設計一致性與光影控制,協助使用者將腦中的創意具象化。

舉例來說,透過NanoBananaPro可以獲得準確的教育性解說圖來學習新主題,還能連結Google搜尋龐大的知識庫,協助用戶快速製作食譜摘要,或將天氣、體育賽事等即時資訊視覺化。

Google指出,NanoBananaPro是目前在圖像中直接呈現正確渲染且清晰文字的最佳模型。可以在產品打樣或海報中創建細節更豐富的文字,並運用更多樣化的紋理、字體和書寫風格;透過Gemini強化的多語言推理能力,用戶可以生成多種語言的文字,或將內容在地化與翻譯,以便擴展國際市場或更輕鬆與親朋好友分享內容。

透過NanoBananaPro改進的局部編輯功能,用戶可以選擇、微調和轉換圖像的任何部分,調整相機角度、改變焦點並應用細緻的調色,甚至轉換場景光線,例如將白天變為黑夜或創造散景效果。

NanoBananaPro將在全球的Gemini應用程式中陸續推出,只需在選擇Thinking模型時使用「生成影像」功能即可。免費版用戶將獲得有限的免費額度,用完後將恢復使用原本的NanoBanana模型。GoogleAIPlus、Pro和Ultra訂閱者,將享有更高的額度。

針對Google搜尋中的AI模式,NanoBananaPro目前在美國開放給GoogleAIPro和Ultra訂閱者使用。
Google新聞-PChome Online新聞

最新科技新聞

延伸閱讀