登录
注册
就在刚刚,Anthropic 正式宣布推出其最新旗舰模型 Claude Fable 5。该名称源自拉丁语'fabula',寓意'故事'或'传说',象征着其在人工智能领域的叙事能力。据官方披露,Claude Fable 5 在软件工程、知识处理、视觉识别及科学研究等核心维度均展现出压倒性优势。与过往版本相比,该模型在处理长上下文任务时效率显著提升,能够连续处理数百万条数据并维持高输出质量,同时具备自我记录以优化结果的能力。知名 AI 研究者 Karpathy 在体验后评价称,这一版本'非常令人兴奋',其性能跃升幅度与去年 11 月发布的 Claude 4.5 相当,堪称一次重大的版本迭代。
尽管性能卓越,但出于安全考量,Claude Fable 5 引入了动态降级机制。当模型检测到特定高风险查询或疑似被恶意利用时,会自动切换至 Claude Opus 4.8 模式进行响应。这一策略旨在平衡能力与安全,确保在 95% 的对话场景中模型性能不受影响。
与此同时,备受瞩目的尖端模型 Claude Mythos 5 已通过'Project Glasswing'计划向部分网络安全专家和基础设施提供商开放测试。午方 AI 梳理发现,这两款新模型的价格策略均发生了显著变化,虽然比预览版低了一半以上,但定价仍是 Opus 4.8 的两倍,且输入成本比 GPT-5.5 高出 1.5 倍,输出成本则高出 2/3。
在商业化落地方面,Claude Fable 5 即日起通过全渠道向所有用户开放,而 Claude Mythos 5 目前仅限 Glasswing 合作伙伴访问,未来将通过扩大的'可信访问计划'逐步推向公众。对于 Pro、Max、Team 及按席位计费的 Enterprise 订阅用户,初期可免费使用 Claude Fable 5,无需额外付费。
然而,这一免费政策将于 6 月 23 日终止,届时用户需消耗相应额度才能继续使用。Anthropic 表示,若资源允许,将延长免费期限,并计划在未来资源充足时将其重新纳入标准订阅套餐。
基准测试数据进一步印证了 Anthropic 关于'最强模型'的宣称。在软件工程领域,Claude Fable 5 展现了惊人的效率,能够将原本需数月完成的开发工作压缩至几天。例如,在一个包含 5000 万行 Ruby 代码的项目中,该模型仅用一天便完成了整个代码库的迁移,而人工完成此项任务需耗时两个多月。在 Cognition 的 FrontierCode 评估中,该模型在中等难度设置下即取得最高分,证明了其卓越的数据处理效率。
午方 AI 注意到,在知识处理与视觉任务方面,Claude Fable 5 同样表现突出。在 Hebbia 针对高级推理设计的金融基准测试中,该模型在所有参测模型中斩获最高分,尤其在基于文档的推理、图表解读及问题解决能力上显著提升。视觉方面,它能从复杂的科学图表中提取精确数据,甚至仅凭截图即可重建网页应用源代码。
此外,其对辅助工具的依赖度大幅降低,例如在无需外部辅助的情况下,Claude Fable 5 几乎能独立完成《宝可梦红宝石》游戏,而前代模型即便有工具辅助也难以通关。
在科研与长程任务领域,该模型同样展现出突破性进展。在记忆与上下文理解、药物设计、分子生物学及基因组学等方面,Claude Fable 5 能够处理数百万条长序列数据。以纸牌游戏'Slay the Spire'为例,若提供持久化文件级存储,其表现较 Claude Opus 4.8 提升三倍,进入最终关卡的频率也显著增加。利用 Claude Mythos 5,Anthropic 内部蛋白质设计专家将药物设计环节效率提升了约 10 倍。作为首个能持续提出新颖科学假设的模型,Mythos 5 在盲测中让科学家在 80% 的情况下更倾向于选择其提出的分子生物学假设,部分假设已进入实验验证阶段,甚至关于大肠杆菌蛋白质新机制的假设也在独立研究中得到证实。
面对大型语言模型自主学习速度加快引发的全球暂停 AI 发展呼声,Anthropic 在最新报告中强调已设置限制措施,明确'限制 Claude 在高级大语言模型开发任务中的效果',以强化防护。
与此同时,市场传言 OpenAI 的 GPT-5.6 也将在本周发布,AI 巨头间的新一轮技术较量即将拉开帷幕。