登錄
註冊
據 Woofun AI 消息,Andon Labs 發佈的 Vending-Bench 2 評估結果顯示,開源模型 GLM 5.2 在長期商業模擬中排名升至第二。該測試通過代碼模擬自動售貨機業務 365 天運行,考察模型基於庫存和財務數據做出補貨及定價決策的一致性。數據顯示,GLM 系列表現呈線性增長,平均月利潤增幅接近 1,000 美元,其中 GLM 5 爲 4,432 美元,GLM 5.1 達到 5,634 美元。相比之下,Kimi K2.7 性能較前代下滑,MiniMax M3 雖顯著提升但整體盈利仍低於 Kimi 和 GLM 系列。