登录
注册
据 Woofun AI 消息,Andon Labs 发布的 Vending-Bench 2 评估结果显示,开源模型 GLM 5.2 在长期商业模拟中排名升至第二。该测试通过代码模拟自动售货机业务 365 天运行,考察模型基于库存和财务数据做出补货及定价决策的一致性。数据显示,GLM 系列表现呈线性增长,平均月利润增幅接近 1,000 美元,其中 GLM 5 为 4,432 美元,GLM 5.1 达到 5,634 美元。相比之下,Kimi K2.7 性能较前代下滑,MiniMax M3 虽显著提升但整体盈利仍低于 Kimi 和 GLM 系列。