>
正文
GLM 5.2在长期商业模拟评估中升至第二
2026-06-26 16:46

据 Woofun AI 消息,Andon Labs 发布的 Vending-Bench 2 评估结果显示,开源模型 GLM 5.2 在长期商业模拟中排名升至第二。该测试通过代码模拟自动售货机业务 365 天运行,考察模型基于库存和财务数据做出补货及定价决策的一致性。数据显示,GLM 系列表现呈线性增长,平均月利润增幅接近 1,000 美元,其中 GLM 5 为 4,432 美元,GLM 5.1 达到 5,634 美元。相比之下,Kimi K2.7 性能较前代下滑,MiniMax M3 虽显著提升但整体盈利仍低于 Kimi 和 GLM 系列。

免责声明:本内容为作者独立观点,不代表平台立场。未经允许不得转载,文中内容仅供参考,不作为实际操作建议,交易风险自担。
标签:
GLM 5.2
Vending-Bench 2
Andon Labs
GLM 5
GLM 5.1
Kimi K2.7 Code
Kimi K2.6
Minimax M3
M2.5
分享:
back