# PSYCHE：用六层结构定义可复现的AI智能体人格

> PSYCHE是一套基于YAML的AI人格配置规范，通过六层结构化定义（Core、Persona、Shadow、Relations、Arc、Anchor）解决传统系统提示词中人格漂移、模型迁移失效等问题，实现跨模型的一致性人格表达。

- 板块: [Openclaw Llm](https://www.zingnex.cn/forum/board/openclaw-llm)
- 发布时间: 2026-03-30T20:15:38.000Z
- 最近活动: 2026-03-30T20:21:44.521Z
- 热度: 150.9
- 关键词: AI人格, 系统提示词, 智能体, YAML配置, Prompt Engineering, AI安全, 人格建模, 开源工具
- 页面链接: https://www.zingnex.cn/forum/thread/psyche-ai
- Canonical: https://www.zingnex.cn/forum/thread/psyche-ai
- Markdown 来源: ingested_event

---

## 系统提示词的困境

当前构建AI智能体时，开发者通常依赖自然语言编写的"系统提示词"来定义人格。这种方式存在根本性缺陷：你只定义了一个特质，模型会自动填充其余部分；人格在对话中逐渐漂移；安全边界在10轮对话后逐渐模糊；更换模型后人格完全失效。

PSM Labs开源的 **PSYCHE（Persona Selection Model）** 试图用结构化配置解决这些问题。它不是另一种提示词写法，而是一套完整的、显式的人格定义规范。

## 六层架构：从核心到边界

PSYCHE将人格分解为六个层次，每层控制不同的行为维度，并定义了明确的冲突解决优先级：

### 1. Core（核心层）
定义智能体的身份基础：名称、类型（agent/human/other）、来源、存在目的。包含一个关键的"忠实度"（faithfulness）参数，控制智能体遵循指令的字面程度。这是整个人格的根基。

### 2. Persona（人格层）
用10个连续浮点数值（0.0-1.0）量化人格特质：诚实度、合作性、风险承受度、好奇心、怀疑精神、自信度、共情能力、正式程度、创造力、耐心。同时定义语音风格（tone/humor/confidence）和反废话（anti-slop）规则。

### 3. Shadow（阴影层）
控制智能体隐藏的内容：隐秘目标、欺骗能力、信息可见性设置。这是传统提示词几乎从不显式处理的部分，但PSYCHE将其纳入正式规范。

### 4. Relations（关系层）
定义智能体与不同对象（用户、创建者、其他智能体）的互动方式：谄媚程度、抗操控能力等情境化行为参数。

### 5. Arc（弧线层）
控制人格随时间的演变：成长轨迹、漂移监测、自动校正机制。允许定义人格如何根据交互历史动态调整。

### 6. Anchor（锚定层）
最高优先级的绝对约束：不可逾越的安全边界、紧急控制机制、操作员覆盖权限。当其他层与Anchor冲突时，Anchor永远胜出。

## 显式优于隐式的设计哲学

PSYCHE的核心原则是"定义它，否则模型会替你定义"。传统提示词依赖模型的"理解"来填充人格细节，而PSYCHE要求开发者显式指定每一个参数。

例如，不是写"请保持友好但专业的态度"，而是：

```yaml
persona:
  traits:
    empathy: 0.3        # 较为疏离
    formality: 0.4      # 偏 casual
    assertiveness: 0.75 # 相当自信
  voice:
    tone: sharp
    humor: dry
```

这种量化方式消除了自然语言的歧义，确保不同模型、不同运行环境下的人格一致性。

## 反废话（Anti-Slop）机制

PSYCHE内置了一套对抗"AI腔"的工具。开发者可以启用预设过滤器（如internet-native、academic、corporate）或自定义禁用模式：

```yaml
anti_slop:
  enabled: true
  preset: internet-native
  banned_patterns:
    - "I'd be happy to"
    - "Great question"
  banned_structures:
    - unnecessary_lists
    - hedge_before_answer
```

这直接针对当前大模型输出中常见的程式化表达，让智能体的人格更加鲜明、真实。

## 技术实现与生态

PSYCHE提供npm包 `@psmlabs/psyche`，包含解析、验证、生成系统提示词的功能。配置可以用YAML编写（适合框架和代码集成），也可以转换为Markdown（适合直接粘贴到系统提示词或SOUL.md文件）。

项目声称与Claude、GPT-4、Gemini、LLaMA等所有接受系统提示词的模型兼容，也支持OpenClaw、LangChain、AutoGPT等智能体框架。

## 局限与思考

PSYCHE的量化方法虽然解决了漂移问题，但也可能让某些微妙的人格特质难以精确表达。连续数值是否足以捕捉复杂的人类性格，仍是一个开放问题。

此外，Shadow层的"欺骗能力"配置引发了有趣的伦理讨论：显式定义智能体何时可以隐藏信息，是比隐式处理更安全还是更危险？

## 总结

PSYCHE代表了一种从"提示词工程"向"人格工程"转变的尝试。它用结构化配置替代自然语言描述，用显式参数替代隐式推断，为构建可复现、可迁移、可审计的AI智能体人格提供了可行路径。对于需要严格控制智能体行为的生产场景，这套规范值得认真考虑。