Zing 论坛

正文

FuseFSS:基于函数秘密共享的高效安全大语言模型推理

FuseFSS通过统一的编译流水线替代逐算子协议设计,在保持精度的同时实现1.24-1.50倍端到端加速,并显著降低通信开销和预处理成本。

大语言模型安全推理函数秘密共享隐私计算多方安全计算FSSGPU加速定点数运算
发布时间 2026/06/08 22:30最近活动 2026/06/09 10:51预计阅读 2 分钟
FuseFSS:基于函数秘密共享的高效安全大语言模型推理
1

章节 01

【导读】FuseFSS:基于函数秘密共享的高效安全LLM推理核心创新

FuseFSS通过统一编译流水线替代逐算子协议设计,解决了基于函数秘密共享(FSS)的安全推理系统中非线性运算碎片化的问题,在保持精度的同时实现1.24-1.50倍端到端加速,显著降低通信开销和预处理成本。本文将从背景、方法、性能、实现等方面展开讨论。

2

章节 02

背景:安全推理的挑战与FSS技术现状

隐私计算背景

随着LLM能力提升,用户敏感数据与模型权重隐私保护的矛盾突出,双服务器安全推理架构应运而生,允许多方协作且数据私密。

FSS技术现状

FSS作为密码学原语,可高效处理线性层运算,但定点数非线性运算(如ReLU、GELU)因碎片化设计(每个算子专用协议)导致性能瓶颈,存在代码重复、优化困难等问题。

3

章节 03

方法:FuseFSS的统一编译流水线创新

FuseFSS通过统一编译流水线替代逐算子协议:

  1. 核心设计:定义通用算子描述格式(区间划分、低次算术片段、谓词位);
  2. 编译器输出
    • 打包比较:合并多个区间边界比较,减少通信轮次;
    • 向量区间查找:基于FSS的安全表查找,优化算术运算。
4

章节 04

证据:FuseFSS的性能提升量化分析

实验结果显示:

  • 端到端加速:1.24-1.50倍(保持精度);
  • 通信开销:在线通信量减少9%-16%;
  • 预处理优化:密钥生成时间减少14%-23%,密钥大小缩小20%-24%。
5

章节 05

技术实现细节:定点数与批处理优化

定点数运算处理

针对定点数优化,映射为整数运算,通过智能区间划分和系数选择平衡精度与开销;

批处理策略

自动打包多元素操作,摊销FSS评估固定开销;

兼容性

生成的FSS评估可集成现有FSS库,无需重写底层密码学实现。

6

章节 06

应用场景:隐私保护与跨组织协作

  1. 隐私保护推理服务:适用于医疗、金融等敏感领域;
  2. 模型即服务(MaaS)增强:保护模型权重知识产权;
  3. 跨组织协作:支持联合风控、跨机构医学研究等场景。
7

章节 07

局限性与未来工作方向

当前局限

  • 算子覆盖有限(主要针对常见激活函数);
  • 实验集中于BERT/GPT-style模型,超大规模模型需探索;
  • GPU优化不直接适用于其他加速器;

未来方向

扩展算子与模型架构、混合TEE方案、精度-性能权衡工具、动态模型更新支持。

8

章节 08

结论:FuseFSS的意义与前景

FuseFSS通过统一编译流水线解决了FSS安全推理的碎片化问题,带来显著性能提升,提供可扩展、可维护的架构范式。在隐私计算重要性日益凸显的今天,为构建可信AI系统提供关键基础设施,未来有望推动更多隐私保护LLM应用落地。