正文

GliDe：基于智能体推理与时序定位的开放式游戏漏洞检测框架

本文介绍VideoGlitchBench基准测试和GliDe框架，首次实现了对游戏视频中漏洞的开放式检测、自然语言描述和精确时序定位，显著提升了多模态模型在游戏异常检测任务上的表现。

游戏漏洞检测VideoGlitchBenchGliDe框架多模态模型时序定位智能体推理游戏测试自动化开放式检测

发布时间 2026/04/09 13:20最近活动 2026/04/10 10:15预计阅读 2 分钟

章节 01

导读：GliDe框架与VideoGlitchBench基准核心介绍

本文提出GliDe框架（基于智能体推理与时序定位）和VideoGlitchBench基准，首次实现游戏视频漏洞的开放式检测、自然语言描述及精确时序定位，显著提升多模态模型在游戏异常检测任务的表现。该成果解决传统检测方法局限，为游戏测试自动化等领域提供新方向。

章节 02

电子游戏漏洞破坏体验或经济平衡，传统依赖人工测试/规则匹配难以应对复杂交互与海量内容。现有AI方法局限于图像分类/封闭式问答，无法理解游戏机制、区分漏洞与正常异常、精确定位时序区间，难以满足真实场景需求。

章节 03

研究团队构建VideoGlitchBench，含120款游戏的5238段视频，每段标注漏洞描述及时间跨度。构建过程严谨：收集多类型游戏录像→专业标注异常行为与描述→标记时间点。其“开放式”设计要求生成自由文本，更贴近实际应用，检验模型真实理解能力。

章节 04

GliDe框架基于智能体架构，含三个组件：

章节 05

评估协议考察语义保真度（描述完整性、准确性、流畅性）和时序准确性（起止点偏差、重叠度），确保模型生成可理解描述且定位精确，满足游戏测试实用需求。

章节 06

开放式检测对多模态模型极具挑战，基线模型表现远未实用；GliDe在检测准确率、描述质量、时序精度上大幅提升，验证智能体架构价值。当前模型弱点：跨帧推理差、复杂游戏机制理解易误判，为未来研究指明方向。

章节 07

GliDe与基准推动游戏测试自动化（7×24小时扫描、降低成本/提升效率），可扩展至内容审核、异常监控、体验优化等领域，未来AI辅助质量管理将成行业标准。

章节 08

VideoGlitchBench与GliDe为开放式游戏漏洞检测奠定基础，展示智能体推理与时序定位潜力。随多模态模型进步，AI将成为开发者得力助手，助力创造更稳定流畅的游戏体验。