Google最新AI Gemini 2.5可以幫你逛網站!點連結、自動填表都不是問題

Google再度升級自家的AI能力,最新推出的Gemini 2.5「Computer Use」模型,現已開放API預覽,能讓AI真正「學會用電腦」,這項新技術建立在Gemini 2.5 Pro基礎之上,讓AI不僅能理解文字與對話,還能直接操作電腦畫面。
Google再度升級自家的AI能力,最新推出的Gemini 2.5「Computer Use」模型,現已開放API預覽,能讓AI真正「學會用電腦」,這項新技術建立在Gemini 2.5 Pro基礎之上,讓AI不僅能理解文字與對話,還能直接操作電腦畫面。
Google表示,這個模型能觀察並操控使用者介面,理論上可用於各種情境,像是自動整理檔案、開啟雲端應用、填寫表單或製作報表,成為能替使用者親自動手的AI助手。
[caption id="attachment_194749" align="aligncenter" width="1024"]
Google再度升級自家的AI能力,最新推出的Gemini 2.5「Computer Use」模型,現已開放API預覽,能讓AI真正「學會用電腦」,這項新技術建立在Gemini 2.5 Pro基礎之上,讓AI不僅能理解文字與對話,還能直接操作電腦畫面。(圖/Gemini 2.5)[/caption]
延伸閱讀:
黃仁勳揭秘與OpenAI新合作!首度「直接採購」晶片 自建AI雲端基礎設施
若進一步整合企業內部工具與系統,AI甚至可能成為「虛擬助理工程師」,自動完成繁瑣的數位例行任務,這項技術的關鍵,在於模型不只是語言理解,而能將輸入指令轉化為具體的電腦操作步驟,換句話說,它更像一個能看懂畫面、判斷按鈕位置、並模擬使用者動作的「智慧代理」。
企業過去主要利用AI來生成行銷素材、撰寫文件或回覆客服;未來,Gemini 2.5「Computer Use」可能直接操作CRM、會計或ERP系統,執行任務層級的自動化。
對開發者而言,目前開放的API預覽版提供了實驗性機會,可測試AI在不同軟體環境中的行為與安全邊界。Google强調,系統設計中包含多層安全控制,確保模型在獲得明確授權的環境下執行操作,不會擅自改動使用者資料。
從文字生成到圖像識別,再到「懂得用電腦」的智慧代理,這次的更新標誌著AI正邁向更人性化也更實務的方向。對一般使用者來說,未來也許不需再親手開啟應用程式、點擊選項,只要一句指令:「幫我整理這份資料」,電腦便能由AI自動完成,Gemini 2.5「Computer Use」不只是技術升級,更像是人機互動邁入新階段的開始,AI將不只是回答問題的助手,而是實際能「代勞」的工作夥伴。
資料來源:The Keyword
這篇文章 Google最新AI Gemini 2.5可以幫你逛網站!點連結、自動填表都不是問題 最早出現於 科技島-掌握科技新聞、科技職場最新資訊。
最新科技新聞
-
-
旗下社群媒體X遭重罰 馬斯克反擊:歐盟應被廢除
(1 天前) -
燦坤3C家電「歲末暖心感謝祭」全館滿5千 抽市值6萬「亞洲不限航點」機票 雙12期間限定祭滿額「好禮感謝您」
(1 天前) -
全國電子推「聖誕歡購1212」指定大家電65折起、滿額1元加購Dyson最划算
(1 天前) -
《怪物彈珠》激獸神祭新角色「壽限無」霸氣登場!「正宗」「麒麟兒」MV造型解禁!聖誕節活動同步進行中!
(1 天前)




