章节 01
DeNovoSWE数据集:长程完整代码库生成的关键突破
DeNovoSWE是面向完整代码库生成的长程软件工程数据集,含4818个高质量实例,通过沙盒化智能体工作流自动构建(采用分治与批评修复策略)。该数据集使Qwen3-30B-A3B模型在BeyondSWE-Doc2Repo基准上性能从5.8%提升至47.2%。来源:arXiv论文《DeNovoSWE: Scaling Long-Horizon Environments for Generating Entire Repositories from Scratch》(链接:http://arxiv.org/abs/2606.10728v1,发布时间2026-06-09)。