登录
注册
同益问答团队今日正式披露了 Qwen-AgentWorld。这是业界首个从连续预训练阶段即以环境建模为核心目标的原生语言世界模型,区别于在通用大模型基础上后期适配的方案。该模型基于逾 1,000 万条真实交互数据,历经 CPT→SFT→RL 三阶段训练,实现了跨领域知识迁移,并能在统一框架内处理文本及图形用户界面等多种环境。
同步发布的 AgentWorldBench 评估基准显示,Qwen-AgentWorld-397B-A17B 在整体模拟质量上位居榜首,性能优于 GPT-5.4、Claude Opus 4.8 及 Gemini 3.1 Pro。研究指出,该模型既可充当独立环境模拟器以优化强化学习效果,也可作为统一智能体基础模型,在无需微调的情况下实现零样本任务迁移,初步彰显了其构建高性能智能体的潜力。目前相关模型及工具已上线 Hugging Face 与 ModelScope 平台。