Gemini 3.5 Flash原生集成PC控制功能

2026-06-25 11:34

Woofun AI 获悉，谷歌已将 "Computer Use" 功能原生集成至旗舰模型 Gemini 3.5 Flash 中。此前开发人员需依赖专用的 Gemini 2.5 Computer Use 模型执行代理任务，现在用户可直接通过 Gemini API 或谷歌云 Gemini 企业代理平台（原 Vertex AI）控制设备，从而简化代理程序开发流程。

该内置工具利用浏览器、移动设备或桌面环境的屏幕截图进行视觉识别与步骤推理，生成鼠标点击、键盘输入等操作指令，以完成软件回归测试等长流程自动化任务。为便于调试，模型在指令中添加 "意图" 字段说明逻辑依据。针对指令注入风险，谷歌进行了对抗性训练，并提供人工审核不可逆操作及自动终止异常任务两项保护措施。目前 Browserbase 提供在线演示，谷歌也在 GitHub 开源了参考实现代码。

免责声明：本内容为作者独立观点，不代表平台立场。未经允许不得转载，文中内容仅供参考，不作为实际操作建议，交易风险自担。

热门资讯

CZ 盛赞免 KYC 模式，却暗指其法律风险成最大软肋

RWA 规模激增 500% 却仅 10% 进 DeFi

过渡期倒计时：巨头撤回申请，合规洗牌加速

83% 美股名义归属同一机构，链上确权能否破局

MIM 暴跌至 49 美分：DeFi 借贷平台紧急加息自救

比特币跌破 6 万：63.5 亿 ETF 赎回引爆抛压

估值一年翻八倍：预测市场引爆监管风暴

裁撤两成员工后，以太坊基金会重塑五大功能层

推理成本腰斩背后：AI 算力军备竞赛与供应链重构

毛利率84.9%碾压巨头，美光锁定2027年高价