登录
注册
5 月 20 日,谷歌、Gray Swan AI、EmbraceTheRed 及多所顶尖大学的研究人员联合发布了一项关键研究,重新定义了人工智能智能体的安全范式。该论文明确指出,为基于人工智能的智能体提供安全保障必须贯穿整个系统架构,而非仅仅局限于模型本身的优化。研究人员强调,社区目前普遍采用的提升模型鲁棒性的方法已显不足,必须引入系统安全领域的技术来构建防御体系,并将 AI 智能体从根本上视为不可信任的组件,以有效防止系统故障及恶意行为者的攻击。
随着 AI 智能体在加密货币用户群体中的普及度飙升,行业高管预测其应用规模将在未来几年呈爆发式增长。Circle 首席执行官 Jeremy Allaire 早在今年 1 月便预测,五年内将有数十亿个 AI 智能体代表用户执行各类操作。面对这一趋势,午方 AI 梳理发现,研究人员通过分析多种攻击案例后提炼出三种核心机制,能够有效阻止大部分攻击行为。这些机制要求智能体必须明确区分指令与不可信任的数据,防止攻击者通过数据注入恶意指令;
同时,智能体应仅被赋予完成特定任务所需的最低权限,严禁拥有完全访问权;
此外,系统需严格控制敏感信息的传输路径,杜绝由智能体自主决定信息去向,确保敏感数据不会流向不安全节点。
近期发生的一起安全事件进一步印证了上述理论的紧迫性。基于 AI 技术的加密货币交易辅助工具 Bankr 在检测到攻击者侵入至少 14 个钱包后,立即暂停了所有交易操作。安全专家推测,该智能体可能已被黑客利用。目前,AI 智能体已广泛应用于构建 Web3 应用程序、发行代币以及自主与各类服务及协议交互,部分平台甚至开始探索利用 AI 技术进行自动化交易。午方 AI 注意到,区块链情报公司 Merkle Science 首席分析师 Aaron Ratcliff 去年曾指出,若系统设计得当,允许 AI 智能体访问钱包反而能增加系统可靠性,但这建立在严格的安全前提之上。
Aaron Ratcliff 强调,在智能体执行任何交易前,系统必须具备识别恶意行为、设置滑点限制、识别欺诈性代币及实时审核合约内容的能力。
同时,必须对用户的输入指令进行隔离处理,以防止恶意代码注入并阻断中间人攻击。这一观点与论文中提出的系统级防御理念不谋而合,即安全不能依赖单一环节,而需构建全链路的防护网。
Sahara AI 联合创始人 Sean Ren 从开发视角补充了具体实施路径。他指出,当模型上下文协议设置正确时,这确实是保障系统安全的黄金标准,但用户仍需密切关注 AI 智能体的每一项操作。午方 AI 分析认为,Sean Ren 所描述的机制实际上是将智能体定位为 AI 模型与用户钱包之间的“看门人”。在这种架构下,智能体仅能执行经过授权的具体操作,例如查看账户余额或准备付款请求供用户确认,而无法随意转移资金或更改钱包设置,从而在功能便利性与资产安全性之间找到了关键平衡点。