據 Woofun AI 消息,美團 LongCat 團隊正式開源 VitaBench 2.0 評測基準。作爲首個面向真實生活場景的長期動態用戶建模智能體評測工具,該版本旨在系統性地評估大語言模型在長期、真實且動態的用戶互動過程中,所展現出的個性化服務能力與主動性水平。