正文

RACE：通过创作者与编辑者双重角色建模实现细粒度AI生成文本检测

本文介绍RACE方法，通过修辞结构理论和话语单元分析，区分纯人类文本、纯AI文本、AI润色的人类文本和人类修改的AI文本，为AI内容监管提供更精细的检测方案。

AI检测文本生成修辞结构理论内容安全机器学习

发布时间 2026/04/07 01:59最近活动 2026/04/07 16:07预计阅读 2 分钟

章节 01

【导读】RACE：细粒度AI生成文本检测的创新方法

本文介绍RACE（创作者-编辑者修辞分析建模）方法，通过区分创作者与编辑者双重角色，实现对纯人类文本、纯AI文本、AI润色人类文本、人类修改AI文本四种类型的细粒度检测，为AI内容监管提供更精准的技术方案。

章节 02

随着大型语言模型快速发展，AI生成文本滥用问题日益严重，但现有检测方法多局限于二元或三元分类，无法区分"人类撰写后AI润色"和"AI生成后人类修改"两种场景，而这两类情况在政策监管中后果截然不同，亟需细粒度检测方案。

章节 03

RACE方法将文本创作解构为"创作者"和"编辑者"两个角色，不同创作模式（纯人类、纯AI、AI润色人类、人类修改AI）在这两个角色上留下独特"签名"，通过分别建模特征实现精准区分。

章节 04

RACE采用两种技术路径：1. 创作者角色：引入修辞结构理论（RST）构建文本逻辑图，捕捉人类与AI在论证组织上的系统性差异；2. 编辑者角色：聚焦基本话语单元（EDU）层面特征提取，捕捉编辑者的词汇选择、句式调整等风格痕迹。

章节 05

RACE在多基准数据集上与12种主流方法对比，四分类任务表现优异，尤其擅长区分"AI润色人类文本"和"人类修改AI文本"两类复杂场景，同时保持低误报率，适合实际部署。

章节 06

RACE的细粒度检测能力可助力欧盟AI法案、中国生成式AI服务管理暂行办法等法规执行，帮助平台实施差异化管理策略（如对AI润色人类内容宽松管理，对人类修改AI内容严格标识）。

章节 07

RACE依赖修辞结构解析和EDU分割的准确性，且需应对AI模型迭代的新生成模式。未来将扩展到多语言、多模态场景，开发更鲁棒的特征提取方法应对对抗性攻击。

章节 08

RACE通过双重角色建模突破传统分类局限，为细粒度AI内容监管提供可行技术路径，将成为维护信息生态健康的重要基础设施。