正文

FuseFSS：基于函数秘密共享的高效安全大语言模型推理

FuseFSS通过统一的编译流水线替代逐算子协议设计，在保持精度的同时实现1.24-1.50倍端到端加速，并显著降低通信开销和预处理成本。

大语言模型安全推理函数秘密共享隐私计算多方安全计算FSSGPU加速定点数运算

发布时间 2026/06/08 22:30最近活动 2026/06/09 10:51预计阅读 2 分钟

章节 01

【导读】FuseFSS：基于函数秘密共享的高效安全LLM推理核心创新

FuseFSS通过统一编译流水线替代逐算子协议设计，解决了基于函数秘密共享（FSS）的安全推理系统中非线性运算碎片化的问题，在保持精度的同时实现1.24-1.50倍端到端加速，显著降低通信开销和预处理成本。本文将从背景、方法、性能、实现等方面展开讨论。

章节 02

背景：安全推理的挑战与FSS技术现状

隐私计算背景

随着LLM能力提升，用户敏感数据与模型权重隐私保护的矛盾突出，双服务器安全推理架构应运而生，允许多方协作且数据私密。

FSS技术现状

FSS作为密码学原语，可高效处理线性层运算，但定点数非线性运算（如ReLU、GELU）因碎片化设计（每个算子专用协议）导致性能瓶颈，存在代码重复、优化困难等问题。

章节 03

方法：FuseFSS的统一编译流水线创新

FuseFSS通过统一编译流水线替代逐算子协议：

核心设计：定义通用算子描述格式（区间划分、低次算术片段、谓词位）；
编译器输出：
- 打包比较：合并多个区间边界比较，减少通信轮次；
- 向量区间查找：基于FSS的安全表查找，优化算术运算。

章节 04

证据：FuseFSS的性能提升量化分析

实验结果显示：

端到端加速：1.24-1.50倍（保持精度）；
通信开销：在线通信量减少9%-16%；
预处理优化：密钥生成时间减少14%-23%，密钥大小缩小20%-24%。

章节 05

技术实现细节：定点数与批处理优化

定点数运算处理

针对定点数优化，映射为整数运算，通过智能区间划分和系数选择平衡精度与开销；

批处理策略

自动打包多元素操作，摊销FSS评估固定开销；

兼容性

生成的FSS评估可集成现有FSS库，无需重写底层密码学实现。

章节 06

应用场景：隐私保护与跨组织协作

隐私保护推理服务：适用于医疗、金融等敏感领域；
模型即服务（MaaS）增强：保护模型权重知识产权；
跨组织协作：支持联合风控、跨机构医学研究等场景。

章节 07

局限性与未来工作方向

当前局限

算子覆盖有限（主要针对常见激活函数）；
实验集中于BERT/GPT-style模型，超大规模模型需探索；
GPU优化不直接适用于其他加速器；

未来方向

扩展算子与模型架构、混合TEE方案、精度-性能权衡工具、动态模型更新支持。

章节 08

结论：FuseFSS的意义与前景

FuseFSS通过统一编译流水线解决了FSS安全推理的碎片化问题，带来显著性能提升，提供可扩展、可维护的架构范式。在隐私计算重要性日益凸显的今天，为构建可信AI系统提供关键基础设施，未来有望推动更多隐私保护LLM应用落地。