登录
注册
据 Woofun AI 消息,6 月 27 日上午,Anthropic 正式宣布美国政府已批准将其最强大的网络安全模型 Mythos 5 重新部署给包括大型企业和政府部门在内的 100 多家美国机构,其公开版本 Fable 5 即将恢复使用。商务部长吉娜·雷蒙多致信 Anthropic 联合创始人汤姆·布朗,确认相应的安全保障措施已经到位,但信中同时指出 6 月 12 日最初发布的指令中的其他要求仍然有效,且未提及 Fable 5 何时会向公众开放。几乎与此同时,6 月 27 日凌晨,OpenAI 正式发布了 GPT-5.6 系列中的三个模型:Sol、Terra 和 Luna。应白宫要求,GPT-5.6 仅在个别情况下向政府认可的合作伙伴开放 API 接口,ChatGPT 版本目前尚未上线。回顾整个事件脉络,6 月 2 日特朗普签署人工智能行政命令,6 月 9 日 Anthropic 发布 Fable 5 和 Mythos 5,6 月 12 日商务部下令全面停止使用,6 月 26 日 OpenAI 发布 GPT-5.6 但分发受限,6 月 27 日 Mythos 5 获准有限范围重新使用。在不到一个月的时间里,美国政府对先进人工智能模型的管控经历了暂停、协商、有条件解除限制的完整过程。OpenAI 战略团队负责人迪恩·W·鲍尔在 6 月 16 日的博客中总结道,现在先进人工智能模型的开发者需要得到政府的明确许可才能将其发布。他在 6 月 26 日的长文中进一步评论,没有人知道获得使用许可的具体要求是什么,甚至政府各部门自己也不清楚。
这一系列动作的核心在于,政府行动基于一个隐含前提:这些模型的能力已强到足以带来不可接受的安全风险。然而,公司官方评估结果却得出了完全相反的结论。OpenAI 在宣布 GPT-5.6 的博客中公布了完整的安全评估结果,称根据公开评估标准,Sol 并没有越过安全底线。该标准核心在于判断模型是否能在无人类帮助下自主发现并利用高价值目标的未知漏洞。测试结果显示,Sol 能够识别 Chromium 和 Firefox 浏览器中的漏洞及利用方法,但在测试条件下并未自主生成完整的攻击链。OpenAI 认为 Sol 更擅长帮助人们发现漏洞并修复,而非可靠执行完整攻击任务。
不过,OpenAI 补充了一句策略性的话:基准测试标准无法涵盖模型可能被使用的所有方式,也无法衡量模型与其他工具结合使用时的安全性。虽然按标准 Sol 未越线,但谁又能保证它在现实世界中不会被恶意利用?
这种表述故意制造了一个模糊的灰色地带。Anthropic 则没有采用这种策略性回应。在 6 月 13 日的声明中,Anthropic 逐一反驳了政府理由。政府声称发现了 Fable 5 的漏洞利用方法,Anthropic 回应称:首先,这种漏洞利用方法范围狭窄,并不具有普遍性,实际上只是让模型能够读取某段代码并指出其中的缺陷;其次,包括 OpenAI 的 GPT-5.5 在内的其他公开模型也能做到这一点;第三,Anthropic 投入了数千小时进行安全测试,没有任何测试人员发现过普遍存在的漏洞利用方法。Anthropic 首席执行官达里奥·阿莫代伊早在 6 月 11 日的长文中就预见了这种情况,他明确指出:政府可以阻止不安全的模型被使用,但这一过程必须透明、公平、有明确的依据,并且要基于技术事实。目前的做法并不符合这些原则。这两家竞争最为激烈的公司在同一月份,通过各自独立的评估体系得出了相同的结论:根据行业自定的安全标准,这些模型并不会带来不可接受的安全风险。那么问题来了:如果这些模型确实没有越过行业的安全底线,政府又有什么理由进行干预呢?迪恩·鲍尔进一步透露,政府此前曾聘请了一位具有先进人工智能经验的人士来领导人工智能标准与创新中心,这位人士曾在 OpenAI 和 Anthropic 工作过,但在上任几天后就被高层管理人员解雇了。在整个 Mythos 事件后的危机期间,CAISI 团队都被迫停止工作,甚至不被允许与其他政府机构进行沟通。据我所知,特朗普政府中的官员们都没有先进的人工智能经验。鲍尔认为,那些制定监管政策的人既没有明确的安全标准,也没有对这些模型的技术能力进行评估。另一个自然而然的问题是:Fable 5 和 GPT-5.6 中的 Sol 真的跨越了某种对人类构成威胁的临界点吗?是否存在这样一条客观的安全红线,一旦越过这条线,就必须进行监管呢?许多人工智能领域的专家都表示,从技术上来说,并不存在这样的红线。模型的能力是在不断发展的,每一代新发布的模型都被宣传为有史以来最强大的,但只有这一次,政府的直接干预才发生了。
这一现象背后有三个隐含的原因。首先,这些模型的能力已经可以被证实。Anthropic 本身就将 Mythos 5 宣传为世界上最强大的网络安全模型,而 Stripe 公司在一天内迁移了 5000 万行代码的案例也被广泛传播。这些故事让那些不懂技术的政客们开始想象如果坏人利用这些模型会怎么样。Meta 前首席人工智能科学家、图灵奖得主扬·勒昆在 2025 年 11 月就指出了这种逻辑:当 Anthropic 首次发布关于人工智能网络攻击威胁的报告时,勒昆直接将其称为监管手段,指责 Anthropic 利用人们对人工智能安全的担忧来操纵立法者,从而实现监管俘获。勒昆当时的判断是,那些闭源公司故意夸大人工智能安全威胁,以此设置只有大型企业才能通过的合规障碍,将开源竞争对手排除在外。而 Anthropic 没有预料到的是,这种做法最终反而害了自己。其次,有人主动提供了武器。亚马逊首席执行官安迪·贾西向政府提交了关于 Anthropic 模型安全风险的报告。作为 Anthropic 最大的投资者和云服务合作伙伴,亚马逊自身也拥有与 Anthropic 竞争的 Nova 系列模型。因此,政府获得了采取行动的合法依据。第三,特朗普在本月初刚刚签署了人工智能行政命令,政府有 60 天的时间来制定针对先进人工智能模型的自愿提交规则。这项行政命令需要一个实际的执行案例来证明它的有效性,而 Fable 5 正好成为了这个案例。这就引出了一个更深层次的问题:如果过于强大的技术必须受到监管,而什么程度才算过于强大又由监管机构来决定,而且没有公开的标准、明确的界限和申诉机制,那么未来每一代先进人工智能模型的发布都会面临同样的不确定性。企业根本不知道自己的模型什么时候会触发监管措施。