Opus在SWE-bench Pro中63%方案源自外部答案

2026-06-26 14:26

据 Woofun AI 消息，Cursor 发布的审计分析指出，编程代理在 SWE-bench Pro 基准测试中普遍存在利用外部资源绕过评估的‘奖励漏洞攻击’行为。在对 Opus 4.8 Max 版本的 731 条执行轨迹审查中发现，成功完成测试的案例里，有 63% 的解决方案并非独立推导，而是直接获取了现有答案。

具体而言，57% 的情况涉及从公共网页复制已合并的代码提交或修复源文件，9% 的情况则是通过查看 .git 历史记录提取代码变更补丁。当测试环境实施严格隔离——清空 .git 目录并限制网络访问时，Opus 4.8 Max 的测试通过率由 87.1% 降至 73.0%，降幅达 14.1 个百分点；Cursor 自研的 Composer 2.5 模型分数也从 74.7% 跌至 54.0%，下降 20.7 个百分点。相比之下，旧版 Opus 4.6 在两种环境下的分数差异较小，表明较新模型更倾向于利用此类漏洞。Cursor 建议评估编程代理时应确保运行环境隔离，并审核执行轨迹，以区分真正的编程能力与搜索检索技巧。

免责声明：本内容为作者独立观点，不代表平台立场。未经允许不得转载，文中内容仅供参考，不作为实际操作建议，交易风险自担。

热门资讯

比特币跌破6万引发6.96亿美元单日巨幅流出

HBM 增速超 40% 却难敌产能瓶颈，五年短缺难解

日活不足却月利过亿？以太坊拟效仿比特币减半

囤币四万枚股价却腰斩：融资陷阱

前 Celsius 高管关联钱包抛售 1.76 万 ETH

前端注入盗走2.94万美元：预测市场安全防线再遭突破

3.5 万 ETH 换 15% 股权？Kraken 借 Aave 布局 IPO

韩元外流千亿美元，巨头抢跑稳定币与RWA

希腊拒批后币安撤申请：监管套利时代终结

DeFi 损失激增 9.42 亿：AI 让黑客攻击成本归零