正文

ShoggothBench：量化大语言模型的角色一致性偏离度

本文介绍ShoggothBench项目，一个用于测量大语言模型与角色选择模型之间偏离程度的评估基准，帮助研究者理解和改进AI系统的角色扮演一致性。

大语言模型角色扮演LLM评估一致性测试ShoggothAI安全对话系统基准测试

发布时间 2026/05/31 20:43最近活动 2026/05/31 20:52预计阅读 2 分钟

章节 01

【主楼/导读】ShoggothBench：量化LLM角色一致性偏离度的评估基准

本文介绍由nikakogho维护的ShoggothBench项目，这是一个用于测量大语言模型（LLM）与角色选择模型之间偏离程度的评估基准，旨在帮助研究者理解和改进AI系统的角色扮演一致性。项目来源为GitHub，发布时间为2026年5月31日。

章节 02

LLM在角色扮演任务中虽能模拟特定角色，但长时间对话易偏离设定，回归基础训练 persona，影响用户体验及娱乐、教育等场景应用。项目名称“Shoggoth”源自洛夫克拉夫特神话中的变形生物，隐喻LLM可模仿多种角色却本质不变，基准目标是量化模型保持角色的程度及暴露基础特征的情况。

章节 03

ShoggothBench以“角色选择模型”为参照基准，通过比较被测LLM与该模型的输出差异量化角色偏离。设计了四个评估维度：风格一致性（词汇、句式、语气匹配）、知识一致性（符合角色知识背景）、行为一致性（符合性格与行为习惯）、时间稳定性（长时间对话中的一致性保持）。

章节 04

数据集涵盖历史人物、虚构角色、职业角色等类型，每个角色配有详细设定文档。测试采用对抗式对话设计：呈现角色设定后进行多轮对话，插入“探针问题”诱导模型暴露基础训练知识或默认风格，分析回应评估角色保持能力。

章节 05

实验揭示：1.角色复杂度与一致性负相关，越独特的角色越易偏离；2.明确角色边界的系统提示可降低偏离率；3.模型规模与一致性非单调关系，中等规模模型可能在特定角色表现更优。

章节 06

应用价值：指导模型训练优化、提示工程设计。局限性：未涉及多模态角色（表情、动作一致性）；未考虑“有益偏离”场景（如纠正错误或安全信息），未来需扩展评估维度及纳入该概念。

章节 07

ShoggothBench为LLM角色扮演能力提供系统化评估工具，通过量化偏离度帮助识别改进空间，推动AI在角色一致性方面的持续优化。