正文

RePAIR：交互式机器遗忘，让用户掌控大模型的知识边界

本文介绍RePAIR框架，实现交互式机器遗忘（IMU）新范式，用户可通过自然语言指令让模型在推理时遗忘特定知识。核心STAMP方法通过伪逆更新将MLP激活引导至拒绝子空间，无需训练即可实现高效、设备端的知识删除。

RePAIR机器遗忘交互式遗忘用户控制STAMP隐私保护模型修复设备端计算

发布时间 2026/04/14 22:44最近活动 2026/04/15 09:55预计阅读 2 分钟

章节 01

RePAIR：交互式机器遗忘，让用户掌控大模型知识边界（导读）

本文介绍RePAIR框架，提出交互式机器遗忘（IMU）新范式，用户可通过自然语言指令让模型在推理时遗忘特定知识。核心STAMP方法通过伪逆更新将MLP激活引导至拒绝子空间，无需训练即可实现高效、设备端的知识删除，解决大模型选择性遗忘难题，将数据控制权交还给用户。

章节 02

背景：大模型的记忆困境与现有方法局限

大模型训练吸收海量数据，易学习有害知识（如制造危险物品）、错误信息（伪科学建议）、个人隐私，且缺乏选择性遗忘机制。现有机器遗忘方法为提供商中心化，需重新训练或复杂后处理，普通用户无法自主控制数据是否被遗忘，引发隐私伦理问题。

章节 03

方法：交互式机器遗忘范式与系统架构

RePAIR提出交互式机器遗忘（IMU）范式，用户通过自然语言指令实时触发遗忘。系统含三组件：看门狗模型检测遗忘意图，外科医生模型生成修复程序（确定遗忘内容、规划步骤、生成参数修改指令），患者模型执行参数更新，实现职责分离。

章节 04

核心技术：STAMP方法的原理与优势

STAMP（Steering Through Activation Manipulation with PseudoInverse）是RePAIR核心技术，无需训练、单样本、高效。基于观察：模型知识编码在MLP激活模式中，通过伪逆更新将激活引导至拒绝子空间，使模型对相关输入拒绝回答。低秩变体降低计算复杂度，毫秒级完成，支持设备端执行。

章节 05

实验验证：效果与基线对比

在三个场景测试RePAIR：1.有害知识抑制：遗忘分数接近0，保留任务性能84.47%；2.错误信息纠正：F-RL指标0.00，彻底遗忘错误信息；3.个人数据擦除：R-RL指标0.88，精确擦除且保留无关知识。与6个基线对比，在遗忘彻底性、模型效用、效率、用户控制上表现最优。

章节 06

技术亮点与应用场景

技术亮点：1.用户自主控制，无需依赖提供商；2.无需训练，毫秒级遗忘；3.设备端执行，隐私保护；4.可扩展至多模态模型。应用场景：个人隐私保护（GDPR合规）、企业数据安全、实时事实核查、安全合规。

章节 07

局限性与未来研究方向

局限性：彻底遗忘理论未完全解决，可能间接恢复；副作用控制难（过度/不足遗忘）；对抗性攻击风险；可解释性待提升。未来方向：多模态遗忘、渐进式遗忘、可逆遗忘、联邦遗忘。

RePAIR：交互式机器遗忘，让用户掌控大模型的知识边界

RePAIR：交互式机器遗忘，让用户掌控大模型知识边界（导读）

背景：大模型的记忆困境与现有方法局限

方法：交互式机器遗忘范式与系统架构

核心技术：STAMP方法的原理与优势

实验验证：效果与基线对比

技术亮点与应用场景

局限性与未来研究方向

继续阅读

Nornir MCP Server：将大语言模型引入网络自动化的企业级桥梁

Bibliothèque Française LLM：为大型语言模型优化的法语公版文献索引系统

Splinter：一款无锁零拷贝的共享内存 KV 与向量存储库，让 LLM 推理告别 socket 与 memcpy 开销

Folkering OS：当操作系统本身就是 AI——一个能自我进化的裸机 Rust 系统