章节 01
【导读】MCircKE:基于机制电路的大语言模型知识编辑——弥合推理鸿沟的新方法
大语言模型在动态世界中面临知识更新难题,现有知识编辑方法存在'推理鸿沟'(能回忆编辑事实但无法在多步推理中应用)。MCircKE通过识别与目标知识相关的完整因果电路,采用'映射-适配'框架实现精准知识编辑,有效弥合推理鸿沟,在多跳推理任务上表现显著优于现有方法,同时最小化对模型其他知识的干扰。
正文
MCircKE通过识别因果电路实现精准知识编辑,解决模型能回忆编辑事实但无法在多步推理中应用的"推理鸿沟"问题。
章节 01
大语言模型在动态世界中面临知识更新难题,现有知识编辑方法存在'推理鸿沟'(能回忆编辑事实但无法在多步推理中应用)。MCircKE通过识别与目标知识相关的完整因果电路,采用'映射-适配'框架实现精准知识编辑,有效弥合推理鸿沟,在多跳推理任务上表现显著优于现有方法,同时最小化对模型其他知识的干扰。
章节 02
大语言模型预训练知识静态,无法适应真实世界变化(如CEO更替、科学进展),传统重训练成本高,知识编辑成为热点。
现有方法能修补孤立事实,但存在'推理鸿沟':例如更新苹果CEO为约翰·史密斯后,模型直接提问能正确回答,但多跳问题(如CEO的大学)仍基于旧知识回答。这种'能回忆不能推理'制约知识编辑实用化。
章节 03
MCircKE采用'映射-适配'范式:
章节 04
在MQuAKE-3K(多跳推理测试基准)上,MCircKE表现:
章节 05
适用于新闻、金融、医疗等快速变化领域,持续更新知识同时保持推理完整性。
精准编辑适合细粒度定制(如用户个性化知识)或隐私敏感信息注入。
明确映射知识对应的电路,增强模型可解释性,助力AI安全(如检测消除有害知识)。
章节 06