Zing 论坛

正文

PromeFuzz:基于大语言模型的知识驱动模糊测试驱动生成工具

ACM CCS 2025研究项目,利用大语言模型自动生成模糊测试驱动程序,提升软件安全测试效率

模糊测试大语言模型软件安全漏洞挖掘ACM CCS自动化测试Fuzzing
发布时间 2026/04/29 15:35最近活动 2026/04/29 15:48预计阅读 2 分钟
PromeFuzz:基于大语言模型的知识驱动模糊测试驱动生成工具
1

章节 01

【导读】PromeFuzz:基于大语言模型的知识驱动模糊测试工具核心介绍

PromeFuzz是ACM CCS 2025的研究项目,针对模糊测试中驱动程序编写耗时、易遗漏关键场景的痛点,利用大语言模型(如Claude、GPT-4)的知识能力自动生成高质量测试驱动,显著提升软件安全测试效率,降低高质量模糊测试的技术门槛。

2

章节 02

项目背景:模糊测试驱动的痛点与核心思想

模糊测试依赖高质量驱动程序,但人工编写需深入理解代码接口、数据格式与约束,耗时且易漏关键场景。PromeFuzz引入知识驱动方法,让大语言模型理解源代码语义(函数签名、类型、控制流等),基于其内化的编程与安全知识生成有效驱动,区别于传统模板/规则方法。

3

章节 03

系统架构:从源码到模糊测试的自动化流程

  1. 源码预处理与知识提取:通过Clang/LLVM获取编译配置,解析函数签名、结构体等,构建项目知识库;2. LLM驱动生成:基于精确性、安全性、探索性原则设计提示词,支持Claude Sonnet/GPT-4o等模型;3. 驱动选择优化:评估候选驱动的参数完整性、错误处理等,编译带ASan和覆盖率工具的二进制;4. 模糊测试执行:用libFuzzer运行驱动,收集覆盖率、崩溃信息与语料库。
4

章节 04

技术亮点:扩展支持与性能优化

  • 扩展27个开源项目配置(网络协议、图像处理、压缩算法等);- 内置基准测试框架,支持JSONL清单定义测试用例,便于工具对比;- Python3.11优化,修复兼容性问题,Numba JIT加速关键路径,速度提升约30倍。
5

章节 05

实际应用场景:多领域安全测试

  • 开源审计:针对curl、openssl等关键库生成驱动,发现内存漏洞;- CI/CD集成:代码变更后自动模糊测试,早期发现回归漏洞;- 安全研究:作为基准工具评估新模糊测试算法的有效性。
6

章节 06

安装与使用指南

  1. 安装系统依赖:clang、llvm-dev、libclang-dev、cmake、bear;2. 创建Python虚拟环境并安装依赖;3. 运行setup.sh构建C++预处理器;4. 配置Anthropic/OpenAI API密钥;5. 准备JSONL测试清单,运行setup_and_run_all.sh启动流程。
7

章节 07

局限性与未来方向

局限性:依赖编译数据库(复杂项目可能困难)、LLM API成本、生成质量随机波动;未来方向:支持本地开源LLM、引入覆盖率反馈优化驱动、增强复杂状态API支持。

8

章节 08

总结:PromeFuzz的价值

PromeFuzz结合大语言模型与模糊测试技术,自动化驱动生成降低测试门槛,提升覆盖率与漏洞发现能力,适合开发团队、安全研究人员及开源维护者使用。