登錄
註冊
據 Woofun AI 消息,開源模型 GLM 5.2 在 alphaXiv 平臺的復現性測試中展現出顯著的成本優勢。在復現策略優化方法論文的任務中,GLM 5.2 需自主閱讀文獻並修復 VeRL 開源庫錯誤,經歷 14 次失敗後成功完成,消耗 265 萬令牌,總成本爲 6.21 美元。
相比之下,閉源旗艦模型 Claude Opus 4.8 Max 在經歷 9 次失敗後完成相同任務,消耗 453 萬令牌,總成本達 46.35 美元。GLM 5.2 的運行成本約爲 Claude Opus 4.8 Max 的八分之一。