>
正文
Gemini 3.5 Flash原生集成PC控制功能
2026-06-25 11:34

Woofun AI 獲悉,谷歌已將 "Computer Use" 功能原生集成至旗艦模型 Gemini 3.5 Flash 中。此前開發人員需依賴專用的 Gemini 2.5 Computer Use 模型執行代理任務,現在用戶可直接通過 Gemini API 或谷歌雲 Gemini 企業代理平臺(原 Vertex AI)控制設備,從而簡化代理程序開發流程。

該內置工具利用瀏覽器、移動設備或桌面環境的屏幕截圖進行視覺識別與步驟推理,生成鼠標點擊、鍵盤輸入等操作指令,以完成軟件迴歸測試等長流程自動化任務。爲便於調試,模型在指令中添加 "意圖" 字段說明邏輯依據。針對指令注入風險,谷歌進行了對抗性訓練,並提供人工審覈不可逆操作及自動終止異常任務兩項保護措施。目前 Browserbase 提供在線演示,谷歌也在 GitHub 開源了參考實現代碼。

免責聲明:本內容為作者獨立觀點,不代表平臺立場。未經允許不得轉載,文中內容僅供參考,不作為實際操作建議,交易風險自擔。
標簽:
Gemini 3.5 Flash
Gemini 2.5 Computer Use
Gemini API
Google Cloud Gemini Enterprise Agent Platform
Vertex AI platform
Browserbase
computer-use-preview
Google
分享:
back