登录
注册
Woofun AI 获悉,中国人民大学高瓴人工智能学院发布首个专注于长程软件工程任务的DeNovoSWE数据集。该数据集通过Divide & Conquer与Critic & Repair机制构建,包含4,818个高质量文档到仓库的生成任务实例,旨在解决代码智能体在真实场景中从零构建完整仓库的能力瓶颈。
实验数据显示,基于DeNovoSWE训练的Qwen3-30B-A3B-Instruct模型在BeyondSWE-Doc2Repo基准上的通过率从5.8%提升至47.2%,在NL2RepoBench上从4.3%提升至23.0%。相比仅使用常规Issue级别数据训练,该数据集显著增强了模型在长程规划、架构设计及全仓库代码生成方面的性能。