>
正文
GLM 5.2在長期商業模擬評估中升至第二
2026-06-26 16:46

據 Woofun AI 消息,Andon Labs 發佈的 Vending-Bench 2 評估結果顯示,開源模型 GLM 5.2 在長期商業模擬中排名升至第二。該測試通過代碼模擬自動售貨機業務 365 天運行,考察模型基於庫存和財務數據做出補貨及定價決策的一致性。數據顯示,GLM 系列表現呈線性增長,平均月利潤增幅接近 1,000 美元,其中 GLM 5 爲 4,432 美元,GLM 5.1 達到 5,634 美元。相比之下,Kimi K2.7 性能較前代下滑,MiniMax M3 雖顯著提升但整體盈利仍低於 Kimi 和 GLM 系列。

免責聲明:本內容為作者獨立觀點,不代表平臺立場。未經允許不得轉載,文中內容僅供參考,不作為實際操作建議,交易風險自擔。
標簽:
GLM 5.2
Vending-Bench 2
Andon Labs
GLM 5
GLM 5.1
Kimi K2.7 Code
Kimi K2.6
Minimax M3
M2.5
分享:
back