谷歌联合发布论文：AI 代理应被视为不可信任组件

2026-05-26 14:11

5 月 20 日，谷歌、Gray Swan AI、EmbraceTheRed 及多所顶尖大学的研究人员联合发布了一项关键研究，重新定义了人工智能智能体的安全范式。该论文明确指出，为基于人工智能的智能体提供安全保障必须贯穿整个系统架构，而非仅仅局限于模型本身的优化。研究人员强调，社区目前普遍采用的提升模型鲁棒性的方法已显不足，必须引入系统安全领域的技术来构建防御体系，并将 AI 智能体从根本上视为不可信任的组件，以有效防止系统故障及恶意行为者的攻击。

随着 AI 智能体在加密货币用户群体中的普及度飙升，行业高管预测其应用规模将在未来几年呈爆发式增长。Circle 首席执行官 Jeremy Allaire 早在今年 1 月便预测，五年内将有数十亿个 AI 智能体代表用户执行各类操作。面对这一趋势，午方 AI 梳理发现，研究人员通过分析多种攻击案例后提炼出三种核心机制，能够有效阻止大部分攻击行为。这些机制要求智能体必须明确区分指令与不可信任的数据，防止攻击者通过数据注入恶意指令；

同时，智能体应仅被赋予完成特定任务所需的最低权限，严禁拥有完全访问权；

此外，系统需严格控制敏感信息的传输路径，杜绝由智能体自主决定信息去向，确保敏感数据不会流向不安全节点。

近期发生的一起安全事件进一步印证了上述理论的紧迫性。基于 AI 技术的加密货币交易辅助工具 Bankr 在检测到攻击者侵入至少 14 个钱包后，立即暂停了所有交易操作。安全专家推测，该智能体可能已被黑客利用。目前，AI 智能体已广泛应用于构建 Web3 应用程序、发行代币以及自主与各类服务及协议交互，部分平台甚至开始探索利用 AI 技术进行自动化交易。午方 AI 注意到，区块链情报公司 Merkle Science 首席分析师 Aaron Ratcliff 去年曾指出，若系统设计得当，允许 AI 智能体访问钱包反而能增加系统可靠性，但这建立在严格的安全前提之上。

Aaron Ratcliff 强调，在智能体执行任何交易前，系统必须具备识别恶意行为、设置滑点限制、识别欺诈性代币及实时审核合约内容的能力。

同时，必须对用户的输入指令进行隔离处理，以防止恶意代码注入并阻断中间人攻击。这一观点与论文中提出的系统级防御理念不谋而合，即安全不能依赖单一环节，而需构建全链路的防护网。

Sahara AI 联合创始人 Sean Ren 从开发视角补充了具体实施路径。他指出，当模型上下文协议设置正确时，这确实是保障系统安全的黄金标准，但用户仍需密切关注 AI 智能体的每一项操作。午方 AI 分析认为，Sean Ren 所描述的机制实际上是将智能体定位为 AI 模型与用户钱包之间的“看门人”。在这种架构下，智能体仅能执行经过授权的具体操作，例如查看账户余额或准备付款请求供用户确认，而无法随意转移资金或更改钱包设置，从而在功能便利性与资产安全性之间找到了关键平衡点。

免责声明：本内容为作者独立观点，不代表平台立场。未经允许不得转载，文中内容仅供参考，不作为实际操作建议，交易风险自担。

WOOFUN.AI 你的加密智能助理。以智能技术重构加密体验，化繁为简，打破专业门槛，让每个人都能安心、聪明、快乐地拥抱数字未来。

iOS

Google Play

Android Apk

市场生态 Alpha 失乐园评级资讯快讯日历交易所钱包