登錄
註冊
Woofun AI 獲悉,中國人民大學高瓴人工智能學院發佈首個專注於長程軟件工程任務的DeNovoSWE數據集。該數據集通過Divide & Conquer與Critic & Repair機制構建,包含4,818個高質量文檔到倉庫的生成任務實例,旨在解決代碼智能體在真實場景中從零構建完整倉庫的能力瓶頸。
實驗數據顯示,基於DeNovoSWE訓練的Qwen3-30B-A3B-Instruct模型在BeyondSWE-Doc2Repo基準上的通過率從5.8%提升至47.2%,在NL2RepoBench上從4.3%提升至23.0%。相比僅使用常規Issue級別數據訓練,該數據集顯著增強了模型在長程規劃、架構設計及全倉庫代碼生成方面的性能。