章节 01
导读:Prometheus项目——用可执行规格弥合代码修复的意图鸿沟
Prometheus项目提出创新框架,通过逆向工程从运行时故障报告中提取Gherkin可执行规格,解决自动程序修复(APR)领域的"意图鸿沟"问题。该框架实现93.97%的正确修复率,成功挽救74.4%的复杂缺陷,研究表明APR未来在于与可执行规格的对齐能力而非更大模型。
正文
一项突破性研究提出Prometheus框架,通过逆向工程从运行时故障报告中提取Gherkin规格,实现93.97%的正确修复率,并成功挽救74.4%的复杂缺陷。研究表明,自动程序修复的未来不在于更大的模型,而在于与可执行规格的对齐能力。
章节 01
Prometheus项目提出创新框架,通过逆向工程从运行时故障报告中提取Gherkin可执行规格,解决自动程序修复(APR)领域的"意图鸿沟"问题。该框架实现93.97%的正确修复率,成功挽救74.4%的复杂缺陷,研究表明APR未来在于与可执行规格的对齐能力而非更大模型。
章节 02
自动程序修复(APR)中,AI生成的补丁常与开发者原始意图存在"意图鸿沟",导致过度修复或新bug。现有缓解策略如自然语言摘要(依赖注释/文档,常缺失或过时)、对抗采样(无法确保意图一致)均缺乏确定性约束。Prometheus核心洞察:先推断正确规格,而非直接生成修复代码,借鉴行为驱动开发(BDD)理念。
章节 03
Prometheus采用三阶段协作架构:
章节 04
在Defects4J基准测试(680个Java缺陷)中:
章节 05
Prometheus的启示:
章节 06
当前局限: