人大发布DeNovoSWE数据集，代码Agent仓库生成率提升41.4%

2026-06-25 17:48

Woofun AI 获悉，中国人民大学高瓴人工智能学院发布首个专注于长程软件工程任务的DeNovoSWE数据集。该数据集通过Divide & Conquer与Critic & Repair机制构建，包含4,818个高质量文档到仓库的生成任务实例，旨在解决代码智能体在真实场景中从零构建完整仓库的能力瓶颈。

实验数据显示，基于DeNovoSWE训练的Qwen3-30B-A3B-Instruct模型在BeyondSWE-Doc2Repo基准上的通过率从5.8%提升至47.2%，在NL2RepoBench上从4.3%提升至23.0%。相比仅使用常规Issue级别数据训练，该数据集显著增强了模型在长程规划、架构设计及全仓库代码生成方面的性能。

免责声明：本内容为作者独立观点，不代表平台立场。未经允许不得转载，文中内容仅供参考，不作为实际操作建议，交易风险自担。

WooFun

9487 篇

文章总数

热门资讯