人大發布DeNovoSWE數據集，代碼Agent倉庫生成率提升41.4%

2026-06-25 17:48

Woofun AI 獲悉，中國人民大學高瓴人工智能學院發佈首個專注於長程軟件工程任務的DeNovoSWE數據集。該數據集通過Divide & Conquer與Critic & Repair機制構建，包含4,818個高質量文檔到倉庫的生成任務實例，旨在解決代碼智能體在真實場景中從零構建完整倉庫的能力瓶頸。

實驗數據顯示，基於DeNovoSWE訓練的Qwen3-30B-A3B-Instruct模型在BeyondSWE-Doc2Repo基準上的通過率從5.8%提升至47.2%，在NL2RepoBench上從4.3%提升至23.0%。相比僅使用常規Issue級別數據訓練，該數據集顯著增強了模型在長程規劃、架構設計及全倉庫代碼生成方面的性能。

免責聲明：本內容為作者獨立觀點，不代表平臺立場。未經允許不得轉載，文中內容僅供參考，不作為實際操作建議，交易風險自擔。

WooFun

9488 篇

文章總數

熱門資訊