据 Woofun AI 消息,美团 LongCat 团队正式开源 VitaBench 2.0 评测基准。作为首个面向真实生活场景的长期动态用户建模智能体评测工具,该版本旨在系统性地评估大语言模型在长期、真实且动态的用户互动过程中,所展现出的个性化服务能力与主动性水平。