美团LongCat开源VitaBench2.0评测基准

2026-06-25 20:11

据 Woofun AI 消息，美团 LongCat 团队正式开源 VitaBench 2.0 评测基准。作为首个面向真实生活场景的长期动态用户建模智能体评测工具，该版本旨在系统性地评估大语言模型在长期、真实且动态的用户互动过程中，所展现出的个性化服务能力与主动性水平。

免责声明：本内容为作者独立观点，不代表平台立场。未经允许不得转载，文中内容仅供参考，不作为实际操作建议，交易风险自担。

热门资讯