登錄
註冊
同益問答團隊今日正式披露了 Qwen-AgentWorld。這是業界首個從連續預訓練階段即以環境建模爲核心目標的原生語言世界模型,區別於在通用大模型基礎上後期適配的方案。該模型基於逾 1,000 萬條真實交互數據,歷經 CPT→SFT→RL 三階段訓練,實現了跨領域知識遷移,並能在統一框架內處理文本及圖形用戶界面等多種環境。
同步發佈的 AgentWorldBench 評估基準顯示,Qwen-AgentWorld-397B-A17B 在整體模擬質量上位居榜首,性能優於 GPT-5.4、Claude Opus 4.8 及 Gemini 3.1 Pro。研究指出,該模型既可充當獨立環境模擬器以優化強化學習效果,也可作爲統一智能體基礎模型,在無需微調的情況下實現零樣本任務遷移,初步彰顯了其構建高性能智能體的潛力。目前相關模型及工具已上線 Hugging Face 與 ModelScope 平臺。