Pensieve 将 LLM 记忆重新定义为三个维度的可操作对象:
可观测性(Observability)
系统提供实时可视化界面,展示当前对话中哪些信息被纳入了模型的"工作记忆"。这包括:
- 上下文窗口中的显式记忆(最近的对话历史)
- 通过 RAG 检索到的相关历史信息
- 外部记忆存储中的匹配条目
用户不再需要猜测模型"知道"什么,而是可以直接查看影响当前回答的记忆来源。
可解释性(Interpretability)
Pensieve 不仅展示记忆内容,还解释记忆如何影响模型输出。通过注意力热图、贡献度评分等可视化手段,用户可以直观地看到:
- 哪些历史信息对当前回答贡献最大
- 模型在生成回答时"关注"了记忆的哪些部分
- 不同记忆来源之间的权重分配
这种解释能力对于建立用户对 AI 系统的信任至关重要。
可控性(Controllability)
在观测和解释的基础上,Pensieve 赋予用户管理记忆的能力:
- 选择性遗忘:用户可以标记特定信息为"不应被记住",系统将其从记忆存储中移除或降低检索优先级
- 记忆优先级调整:手动提升或降低某些信息的记忆权重,影响其在后续对话中的召回概率
- 记忆边界设定:定义对话主题或时间范围,限制模型检索记忆的范围