Zing 论坛

正文

联邦检索增强生成:在可信执行环境中实现隐私保护的大模型推理

本文介绍了一种安全的联邦RAG架构,该架构结合Flower框架与可信执行环境(TEE),实现了跨数据孤岛的知识检索与聚合,同时保护数据隐私。研究提出了级联推理机制,可在不牺牲机密性的前提下利用第三方模型增强推理能力,为医疗、金融等敏感领域的隐私保护AI应用提供了新思路。

联邦学习RAG可信执行环境隐私保护大语言模型Flower框架机密计算医疗AI
发布时间 2026/03/26 20:23最近活动 2026/03/28 06:51预计阅读 2 分钟
联邦检索增强生成:在可信执行环境中实现隐私保护的大模型推理
1

章节 01

【主楼/导读】联邦检索增强生成:隐私保护大模型推理的创新架构

本文介绍了一种结合Flower框架与可信执行环境(TEE)的安全联邦RAG架构,解决跨数据孤岛的知识检索与聚合问题,同时保护数据隐私。核心创新包括本地检索+机密聚合、级联推理机制、基于Flower CRC的机密远程推理,为医疗、金融等敏感领域的隐私保护AI应用提供新思路。

2

章节 02

研究背景与现存挑战

传统RAG假设文档可集中访问,但实际中数据分散在孤岛(因监管、隐私等无法汇聚)。联邦RAG虽解决分散问题,但现有方案存在安全短板:检索结果明文传输,易被服务器泄露。

3

章节 03

核心创新与贡献

本研究的核心创新包括三点:1.本地检索与机密聚合结合:客户端本地检索,仅传结果至TEE内服务器聚合;2.级联推理:利用非机密第三方模型生成初步回答作为上下文,增强主模型推理;3.基于Flower CRC的机密远程推理:在加固TEE中运行大模型,保护提示词与上下文。

4

章节 04

技术架构与工作流程

工作流程:1.服务器(TEE内)广播查询;2.客户端本地检索top-k文档并返回结果;3.服务器用倒数排名融合算法聚合;4.构建增强上下文;5.按推理模式生成回答。

三种推理模式:独立推理(TEE内LLM处理)、级联推理(结合第三方模型辅助回答)、机密推理(Flower CRC中运行大规模LLM)。

5

章节 05

实验评估结果

实验设置:医疗场景,服务器模型SmolLM 1.7B(CPU),级联第三方模型AWS Nova Micro,机密推理模型Qwen3 235B(Flower CRC的H100),4个客户端文档库(PubMed、StatPearls等),评估基准MIRAGE。

核心发现:级联推理使SmolLM在PubMedQA提升40%、MedQA提升46%;机密推理表现最优;独立推理延迟较高但安全。

6

章节 06

安全威胁模型与假设

可信组件:硬件TEE及远程证明、数据孤岛客户端(不共享原始文档)。

不可信组件:诚实但好奇/被攻破的服务器运营商、网络攻击者(无法破解标准加密)。

范围:假设TEE实现正确,侧信道攻击不在考虑内。

7

章节 07

应用前景与意义

该架构为敏感领域提供新可能:医疗(多医院联合问答不共享患者数据)、金融(跨机构市场分析与风险评估)、企业知识管理(跨部门统一检索系统)。

8

章节 08

局限性与未来方向

局限性:聚焦医疗领域,其他领域需验证;第三方模型选择需优化;系统可扩展性待提升。未来方向:拓展应用领域、探索最优第三方模型组合、增强系统扩展性。