登录
注册
据 Woofun AI 消息,开源模型 GLM 5.2 在 alphaXiv 平台的复现性测试中展现出显著的成本优势。在复现策略优化方法论文的任务中,GLM 5.2 需自主阅读文献并修复 VeRL 开源库错误,经历 14 次失败后成功完成,消耗 265 万令牌,总成本为 6.21 美元。
相比之下,闭源旗舰模型 Claude Opus 4.8 Max 在经历 9 次失败后完成相同任务,消耗 453 万令牌,总成本达 46.35 美元。GLM 5.2 的运行成本约为 Claude Opus 4.8 Max 的八分之一。