美團LongCat開源VitaBench2.0評測基準

2026-06-25 20:11

據 Woofun AI 消息，美團 LongCat 團隊正式開源 VitaBench 2.0 評測基準。作爲首個面向真實生活場景的長期動態用戶建模智能體評測工具，該版本旨在系統性地評估大語言模型在長期、真實且動態的用戶互動過程中，所展現出的個性化服務能力與主動性水平。

免責聲明：本內容為作者獨立觀點，不代表平臺立場。未經允許不得轉載，文中內容僅供參考，不作為實際操作建議，交易風險自擔。

熱門資訊