章节 01
【导读】FuseFSS:基于函数秘密共享的高效安全LLM推理核心创新
FuseFSS通过统一编译流水线替代逐算子协议设计,解决了基于函数秘密共享(FSS)的安全推理系统中非线性运算碎片化的问题,在保持精度的同时实现1.24-1.50倍端到端加速,显著降低通信开销和预处理成本。本文将从背景、方法、性能、实现等方面展开讨论。
正文
FuseFSS通过统一的编译流水线替代逐算子协议设计,在保持精度的同时实现1.24-1.50倍端到端加速,并显著降低通信开销和预处理成本。
章节 01
FuseFSS通过统一编译流水线替代逐算子协议设计,解决了基于函数秘密共享(FSS)的安全推理系统中非线性运算碎片化的问题,在保持精度的同时实现1.24-1.50倍端到端加速,显著降低通信开销和预处理成本。本文将从背景、方法、性能、实现等方面展开讨论。
章节 02
随着LLM能力提升,用户敏感数据与模型权重隐私保护的矛盾突出,双服务器安全推理架构应运而生,允许多方协作且数据私密。
FSS作为密码学原语,可高效处理线性层运算,但定点数非线性运算(如ReLU、GELU)因碎片化设计(每个算子专用协议)导致性能瓶颈,存在代码重复、优化困难等问题。
章节 03
FuseFSS通过统一编译流水线替代逐算子协议:
章节 04
实验结果显示:
章节 05
针对定点数优化,映射为整数运算,通过智能区间划分和系数选择平衡精度与开销;
自动打包多元素操作,摊销FSS评估固定开销;
生成的FSS评估可集成现有FSS库,无需重写底层密码学实现。
章节 06
章节 07
扩展算子与模型架构、混合TEE方案、精度-性能权衡工具、动态模型更新支持。
章节 08
FuseFSS通过统一编译流水线解决了FSS安全推理的碎片化问题,带来显著性能提升,提供可扩展、可维护的架构范式。在隐私计算重要性日益凸显的今天,为构建可信AI系统提供关键基础设施,未来有望推动更多隐私保护LLM应用落地。