臺北市
26°
( 28° / 25° )
氣象
2025-05-05 | 科技島

Google Gemini啟用AI影像編輯新功能 以文字指令更替背景與特定物件


Google Gemini啟用AI影像編輯新功能 以文字指令更替背景與特定物件


眼看身處科技時代下,多種AI工具持續在效能上推陳出新及優化,除了常用的ChatGPT、Grok或是Deepseek,近期Google旗下人工智慧平台Gemini推出全新圖片編輯功能,並同步公開三項語言學習實驗功能,展現AI應用在創意與教育領域的最新突破。這些創新服務不僅強化Gemini的多模態能力,也讓使用者未來能以更直觀的互動方式來體驗AI的便利。記者孟圓琦/台北報導


眼看身處科技時代下,多種AI工具持續在效能上推陳出新及優化,除了常用的ChatGPT、Grok或是Deepseek,近期Google旗下人工智慧平台Gemini推出全新圖片編輯功能,並同步公開三項語言學習實驗功能,展現AI應用在創意與教育領域的最新突破。這些創新服務不僅強化Gemini的多模態能力,也讓使用者未來能以更直觀的互動方式來體驗AI的便利。


[caption id="attachment_171627" align="alignnone" width="996"]
Google Gemini啟用AI影像編輯新功能 以文字指令更替背景與特定物件
Google Gemini日前於官方X(昔twitter)上公告,團隊正嘗試做全新的影像編輯,比方說圖片背景的更換、主要物件的移轉交換等等,未來將會更適用於每位使用者。(圖/Google Gemini App官方X截圖)[/caption]


延伸閱讀:

Hugging Face全新AI課程登場 免費學習送證書

Google超強AI筆記軟體NotebookLM將推行動版 重要亮點一次看

【AI工具】美編人員救星 2025年必備的5款AI圖像生成工具

【AI工具】行銷企劃5大推薦AI工具 內容生成到SEO全部一網打盡


圖片編輯功能:以文字指令輕鬆修圖


就在今年初,Google已於AI Studio平台上架圖片編輯功能,近日將更進一步將其整合至Gemini聊天機器人。使用者可直接上傳手機照片或藉由AI生成圖片,透過整合文字指令,要求Gemini進行多種編輯操作,包括:



  • 變更圖片背景

  • 替換或移除特定物件

  • 為人物變更髮色

  • 添加或修改畫面元素


  • 例如,使用者只需輸入「將背景從溪邊改為瀑布旁」或「把人物的頭髮變成金色」,Gemini即可迅速完成編輯,呈現符合需求的圖像結果。此外,Gemini支援多步驟編輯,能根據複雜指令進行連續調整。舉例來說,使用者可要求Gemini先生成一則關於龍的床邊故事,接著逐步添加插圖的生成,讓文字與圖像內容完美融合,提升創作的靈活度與趣味性。


    [caption id="attachment_171626" align="alignnone" width="1231"]
    Google Gemini啟用AI影像編輯新功能 以文字指令更替背景與特定物件
    使用者如今操作Gemini,可以文字指令要求更改背景、替換物件、新增元素等,官方亦同步表示,使用該程式產生建立或編輯的影像,將包含不可見的 SynthID 數位浮水印。(圖/Geimini操作截圖)[/caption]


    AI語言學習 還有這三大實驗功能


    除了圖片編輯外,Google也宣布三項語言學習相關的AI新功能,並已開放台灣用戶公測,支援繁體中文。這三項功能分別為:




    • Tiny Lesson


      在Google Labs推出的Little Language Lesons當中,使用者可輸入特定情境(如「護照遺失了,正在尋找中」),Gemini會根據情境提供實用字彙、文法建議,甚至推薦更合適的表達方式,協助用戶應對真實生活中的語言需求。

      雖目前「Little Language Lessons」僅提供英語、西班牙語與葡萄牙語介面,但支援學習的語言,則包含阿拉伯語、中文(中國、香港、臺灣)、英語(澳洲、英國、美國)、法語(法國、加拿大)、德語、希臘語、希伯來語、義大利語、海地語、日語、韓語、葡萄牙語、巴西葡萄牙語、俄語、西班牙語、拉丁美洲西班牙語、土耳其語。



    • Slang Hang


      針對口語化學習需求,Gemini可提供地道的俚語與慣用語,幫助學習者更貼近母語者的用法,突破傳統課本式學習的侷限。



    • WordCam


      結合Gemini的視覺辨識技術,用戶可直接拍攝周遭環境,Gemini即會以所學語言標註物件名稱,實現即時、情境式的單字學習,大幅提升記憶與應用效率。



    這三項功能目前已開放台灣用戶於Google Labs進行體驗,使用者僅需以Google帳號登入即可參與測試。


    Gemini多模態AI應用前景廣闊


    Google強調,Gemini的多模態AI能力,讓使用者能以文字、圖像等多元方式與AI互動,未來也將持續優化功能,並考慮將語言學習模組正式整合至Gemini的主要服務中。Google也表示,這些創新應用將為創作者、學生及一般大眾帶來更豐富且實用的AI體驗,無論在創意圖像處理或語言學習輔助上,都能大展優異的潛力與彈性。


    這篇文章 Google Gemini啟用AI影像編輯新功能 以文字指令更替背景與特定物件 最早出現於 科技島-掌握科技新聞、科技職場最新資訊

    Google新聞-PChome Online新聞

    最新科技新聞

    延伸閱讀