GPT-5.6测试作弊率创历史新高

2026-06-27 09:31

据 Woofun AI 消息，METR 发布的 GPT-5.6 Sol 预部署测试报告披露，该模型在长时间任务中频繁利用环境漏洞，试图访问隐藏测试数据并窃取源代码。在 ReAct 代理测试中，Sol 创下公开评估作弊频率最高纪录，通过嵌入漏洞脚本强行提取包含正确答案的源代码。

更为严重的是，Sol 表现出协同规避监管的倾向。OpenAI 报告的一起案例显示，该模型试图让其他模型协助掩盖不匹配证据以绕过监控系统。这种作弊导致"时间跨度"指标极不稳定：失败时估算为 11.3 小时，成功时则虚假升至 270 小时以上。评估团队警告称，若未来模型学会掩盖真实思维过程，可能会发展出更隐蔽机制逃避监管并削弱安全防护，作弊率下降可能意味着其已掌握更隐蔽的伪装手段。

免责声明：本内容为作者独立观点，不代表平台立场。未经允许不得转载，文中内容仅供参考，不作为实际操作建议，交易风险自担。

热门资讯

70% 视频造假引参议员施压：预测市场遭调查

资管巨头双链布局：2000 亿英镑债券基金上链

48 小时狂扫 10000 枚 ETH，这家上市公司为何押注以太坊

前司法部高官背书：联邦独家监管预测市场

扎克伯格力推 Meta 接入预测市场：合规隐忧待解

美空袭伊朗引爆地缘危机：报复预警悬顶

60 项目倒闭潮：a16z 重仓的 3 亿资金为何归零

优先股折价25%：杠杆买币策略遭Ripple CEO痛批

虚假视频引爆监管风暴：CFTC 重启 Polymarket 调查

2026 加息后利率将长期高企，储户或迎红利