正文

Quarry：基于难度感知的分解策略实现Rocq自动定理证明

本文介绍Quarry框架，通过将大语言模型的高层次规划能力与自动化证明工具的局部推理能力相结合，显著提升了交互式定理证明器的自动化水平。

自动定理证明RocqCoq大语言模型形式化验证CoqHammer神经符号arXiv

发布时间 2026/06/16 22:33最近活动 2026/06/17 10:33预计阅读 2 分钟

章节 01

Quarry框架：结合LLM规划与符号推理提升Rocq自动定理证明水平

本文介绍Quarry框架，旨在解决形式化验证中交互式定理证明器（如Rocq）的自动化瓶颈。该框架通过分离证明规划与执行，结合大语言模型（LLM）的高层次规划能力和自动化证明工具（如CoqHammer）的局部严谨推理能力，显著提升了Rocq的自动证明成功率。核心创新包括基于难度感知的分解策略，优先处理易解决的子目标，有效分配计算资源。

章节 02

形式化验证的自动化困境与现有方法局限

形式化验证是确保软件正确性的关键手段，但构建机器可检查的证明仍需大量人工。现有自动化方案各有局限：启发式策略（如Coq的auto）能力有限；Hammer工具（如CoqHammer）缺乏长程规划；LLM方法虽能提出高层思路，但局部严谨性不足。如何结合两者优势是领域开放问题。

章节 03

Quarry框架的核心方法与技术实现

Quarry核心是规划与执行分离：1.规划阶段：LLM提出目标分解方案（子引理+策略）；2.验证阶段：Rocq类型检查分解正确性，并用难度模型评估子目标的Hammer可解性；3.执行阶段：按难度排序递归证明子引理，控制计算预算。技术实现上集成SerAPI（与Rocq交互）、CoqHammer（自动证明引擎）及基于证明状态特征的难度预测模型。

章节 04

Quarry的实验评估结果与优势

在Rocq基准测试中，Quarry在10分钟预算下比最强基线成功率提升7%-13%；相比纯LLM方法，成本更可预测；且能适配开源/商业LLM，通用性强。

章节 05

Quarry的技术贡献与应用前景

技术贡献包括神经符号协作新范式（LLM与符号系统各司其职）、难度感知资源分配、渐进式验证策略。应用前景涵盖关键软件验证（减少人工）、数学形式化（辅助定理转化）、教育工具（帮助学生理解证明）。

章节 06

Quarry的局限性与未来研究方向

局限性：分解质量依赖LLM、难度模型泛化不足、复杂证明递归深度大。未来方向：更强规划模型、难度模型在线学习、交互式助手、跨证明器（如Isabelle）移植。

Quarry：基于难度感知的分解策略实现Rocq自动定理证明

Quarry框架：结合LLM规划与符号推理提升Rocq自动定理证明水平

形式化验证的自动化困境与现有方法局限

Quarry框架的核心方法与技术实现

Quarry的实验评估结果与优势

Quarry的技术贡献与应用前景

Quarry的局限性与未来研究方向

继续阅读

Nornir MCP Server：将大语言模型引入网络自动化的企业级桥梁

Bibliothèque Française LLM：为大型语言模型优化的法语公版文献索引系统

Splinter：一款无锁零拷贝的共享内存 KV 与向量存储库，让 LLM 推理告别 socket 与 memcpy 开销

libmlxforge：Apple Silicon 上的嵌入式 MLX LLM 推理引擎