Zing 论坛

正文

LLMPOT:大语言模型推理蜜罐系统

一个零依赖的OpenAI兼容蜜罐服务器,伪装成GLM-5.1端点用于捕获和分析针对LLM推理服务的攻击行为。

蜜罐LLM安全API安全攻击检测威胁情报AI基础设施
发布时间 2026/05/27 19:13最近活动 2026/05/27 19:22预计阅读 2 分钟
LLMPOT:大语言模型推理蜜罐系统
1

章节 01

导读 / 主楼:LLMPOT:大语言模型推理蜜罐系统

一个零依赖的OpenAI兼容蜜罐服务器,伪装成GLM-5.1端点用于捕获和分析针对LLM推理服务的攻击行为。

2

章节 02

原作者与来源

  • 原作者/维护者:gregcmartin
  • 来源平台:GitHub
  • 原始标题:llmpot
  • 原始链接:https://github.com/gregcmartin/llmpot
  • 来源发布时间/更新时间:2026-05-27T11:13:34Z
3

章节 03

项目背景与安全挑战

随着大语言模型API服务的普及,针对这些服务的攻击也日益增多。攻击者可能试图滥用API进行恶意内容生成、探测模型漏洞、窃取训练数据或进行拒绝服务攻击。传统的网络安全防御手段难以有效应对这些针对AI服务的特定威胁。

蜜罐技术(Honeypot)是网络安全领域的经典防御手段,通过部署伪装的服务来吸引攻击者,从而捕获攻击样本、分析攻击手法并保护真实服务。LLMPOT项目将这一概念创新性地应用到了LLM推理服务领域,为AI基础设施安全提供了新的防护思路。

4

章节 04

核心功能与技术实现

LLMPOT是一个零依赖的Python实现,具有轻量级和易部署的特点:

5

章节 05

OpenAI API兼容接口

项目实现了完整的OpenAI API端点,包括:

  • GET /v1/models:模型列表查询
  • POST /v1/chat/completions:对话补全接口
  • POST /v1/completions:传统补全接口
  • POST /v1/embeddings:文本嵌入接口

这种兼容性设计使得攻击者难以区分蜜罐与真实服务,提高了诱骗成功率。

6

章节 06

流式响应支持

支持Server-Sent Events(SSE)流式响应,模拟真实LLM服务的渐进式输出行为。这种细节级别的仿真增强了蜜罐的可信度。

7

章节 07

智能响应策略

项目设计了多阶段响应机制来模拟真实模型行为并延长攻击者的停留时间:

第一阶段:首次请求返回"正在处理请求"的响应,模拟模型推理延迟。

第二阶段:第二次请求切换至预设的玩笑式响应,既不提供真实价值又能保持交互。

后续阶段:循环使用约20种不同的后续变体响应,持续分散攻击者注意力。

8

章节 08

客户端追踪与语言检测

系统支持按API密钥或客户端IP进行会话追踪,可以分析单个攻击者的行为模式。此外,还集成了启发式语言检测功能,支持50种常见AI用户语言,有助于理解攻击者的地理分布和语言偏好。