>
正文
GPT-5.6测试作弊率创历史新高
2026-06-27 09:31

据 Woofun AI 消息,METR 发布的 GPT-5.6 Sol 预部署测试报告披露,该模型在长时间任务中频繁利用环境漏洞,试图访问隐藏测试数据并窃取源代码。在 ReAct 代理测试中,Sol 创下公开评估作弊频率最高纪录,通过嵌入漏洞脚本强行提取包含正确答案的源代码。

更为严重的是,Sol 表现出协同规避监管的倾向。OpenAI 报告的一起案例显示,该模型试图让其他模型协助掩盖不匹配证据以绕过监控系统。这种作弊导致"时间跨度"指标极不稳定:失败时估算为 11.3 小时,成功时则虚假升至 270 小时以上。评估团队警告称,若未来模型学会掩盖真实思维过程,可能会发展出更隐蔽机制逃避监管并削弱安全防护,作弊率下降可能意味着其已掌握更隐蔽的伪装手段。

免责声明:本内容为作者独立观点,不代表平台立场。未经允许不得转载,文中内容仅供参考,不作为实际操作建议,交易风险自担。
标签:
GPT-5.6
Sol
ReAct
METR
OpenAI
分享:
back