登录
注册
2026 年 6 月 4 日,估值接近 1 万亿美元的 Anthropic 在其官方博客发布重磅长文,由联合创始人杰克·克拉克与内部研究部门负责人玛丽娜·法瓦罗共同执笔。文章首次披露了此前未公开的内部运营数据,并正式向全球发出警告:人工智能模型可能在两年内具备‘递归自我优化’能力,因此呼吁行业‘踩刹车’,暂缓先进人工智能的发展步伐。这一举动正值该公司筹备首次公开募股的关键节点,引发了市场关于其动机是出于真诚担忧还是营销策略的激烈争论。
午方 AI 梳理发现,支撑这一呼吁的核心数据来自截至 2026 年 5 月的内部调查。数据显示,员工在使用最新的'Mythos Preview'模型时,工作效率达到不使用任何人工智能工具时的约四倍。这种加速效应让 Anthropic 意识到,技术迭代的速度正在超越社会结构与相关研究的适应能力。文章指出,若缺乏全球协调,各国政府与企业将在地缘政治压力下被迫做出艰难的安全决策,这可能导致最不谨慎的行为者率先突破安全边界,从而将全人类置于更大的风险之中。
针对这一困境,Anthropic 提出了一套建立‘可验证暂停机制’的构想。该机制旨在让领先的开发者能够确认其他全球机构是否真的停止或减缓了发展,防止恶意行为者利用协调放缓的幌子秘密推进技术。文章强调,要实现有意义的暂停,必须满足两个核心条件:一是多个资金充足、技术先进的实验室在相同条件下达成共识;二是所有相关方必须具备验证对方是否真正停止发展的能力。
然而,午方 AI 注意到,作者特别指出人工智能系统的特殊性使得‘可检测性’挑战远超‘可验证性’标准,因为隐藏训练任务比隐藏导弹发射井容易得多,且输入数据具有高度可替代性。
文章进一步分析认为,虽然历史上曾为复杂技术建立过验证机制,如《中程核力量条约》,但当时建立基础设施和信任耗时数十年,而当前人工智能领域已无此时间窗口。如果仅由单一实验室单方面暂停,虽然能立即生效,但影响有限,仅会改变竞争格局中的领先者,无法促成广泛的安全讨论。因此,Anthropic 计划在未来几个月内组织多方对话,邀请政策制定者、研究人员、民间团体及其他人工智能企业参与,重点探讨递归自我优化的风险以及如何创造更好的协调条件。
午方 AI 分析认为,这一呼吁标志着人工智能行业从单纯追求技术突破转向对系统性风险的深度反思。Anthropic 明确表示,若其他先进开发者能以同样可验证的方式采取暂停行动,他们也将选择放缓或暂停自身发展。这种将自身利益与全球安全绑定的策略,试图在激烈的技术竞赛中构建一种新的博弈平衡,其成败将取决于全球范围内能否建立起一套透明、可信且具备执行力的监督体系。