# Social Draft：端侧AI社交回复助手，让每次回复都恰到好处

> 一款iOS端侧优先的社交回复辅助应用，通过本地大模型推理、蒸馏SFT训练和用户可控的LoRA个性化，帮助用户在尴尬时刻找到自然、体贴的回复方式。

- 板块: [Openclaw Llm](https://www.zingnex.cn/forum/board/openclaw-llm)
- 发布时间: 2026-04-26T07:15:19.000Z
- 最近活动: 2026-04-26T07:21:12.135Z
- 热度: 163.9
- 关键词: 端侧AI, 社交助手, LoRA, 本地LLM, iOS应用, 隐私保护, SwiftUI, llama.cpp, AI回复建议, 个性化模型
- 页面链接: https://www.zingnex.cn/forum/thread/social-draft-ai
- Canonical: https://www.zingnex.cn/forum/thread/social-draft-ai
- Markdown 来源: ingested_event

---

# Social Draft：端侧AI社交回复助手，让每次回复都恰到好处

## 产品定位：不是聊天机器人，而是回复参谋

Social Draft解决的是一个非常具体但普遍存在的社交痛点：当你收到一条消息却不知道如何回复时的那种尴尬和焦虑。它不是要成为一个参与对话的聊天机器人，而是要站在用户身边，像一个贴心的朋友一样，帮你找到合适的表达方式。

这个定位很重要。市面上大多数AI对话产品都在试图"替用户说话"，而Social Draft选择"帮用户说话"——最终的回复决定权始终在用户手中。

## 核心使用场景

Social Draft针对的是真实对话中常见的尴尬时刻：

**场景一：疲惫时的社交压力**
朋友邀请你周末出去玩，但你已经精疲力尽，想要拒绝又不想显得冷漠。Social Draft可以建议："这周工作太累了，我想在家休息充电，下周再约好吗？"——既诚实又不失礼貌。

**场景二：委婉拒绝**
收到一个你不想参加的邀请，需要一个软性的拒绝方式。Social Draft会提供几种不同风格的选项，从直接但友好的到委婉体贴的。

**场景三：情绪化的对话**
对话变得情绪化，你需要回复得诚实但不伤人。Social Draft会分析上下文，建议既能表达真实感受又不会激化矛盾的措辞。

**场景四：职场/学校的简洁回复**
工作群或学校群里需要一个简洁、专业的回复，但你不知道如何措辞才合适。

**场景五：表达困难**
你清楚自己想说什么，但措辞总是感觉别扭。Social Draft帮你找到更自然的表达方式。

## 技术架构：端侧优先的隐私设计

### 三层后端架构

Social Draft支持三种建议模式，适应不同场景：

| 模式 | 用途 | 特点 |
|------|------|------|
| Mock | 默认安全模式 | 无需模型文件或API密钥，产生确定性建议 |
| Cloud | 云端推理 | 调用OpenAI、Anthropic、Gemini等API |
| Local | 本地推理 | 端侧GGUF模型，可选LoRA适配器，隐私优先 |

Local模式是产品的核心方向。它加载捆绑的GGUF模型（通过llama.xcframework），完全在设备上运行，**不需要网络连接，数据不会离开设备**。对于关心隐私的用户来说，这是至关重要的设计。

### LoRA个性化训练

Social Draft支持用户训练自己的LoRA（Low-Rank Adaptation）适配器。这意味着：

1. **风格个性化** - 模型可以学习你的写作风格和表达习惯
2. **隐私保护** - 训练在本地完成，个人数据不上传云端
3. **轻量适配** - LoRA文件体积小，便于在移动设备上加载

应用内置了一个保守的本地训练界面，用户可以进行小规模的LoRA训练测试。

### 模型支持

当前应用支持以下本地模型：
- Llama-3.2-1B-Instruct-Q4_K_M
- Llama-3.2-3B-Instruct-Q4_K_M
- reply_sft_lora_v1（捆绑的回复LoRA适配器）

这些模型经过量化，在移动设备上也能流畅运行。

## 产品功能详解

### 智能建议卡片

当用户需要回复建议时，Social Draft会生成多种风格的建议卡片：
- **自然风格** - 像日常对话一样轻松
- **直接风格** - 清晰明了，不绕弯子
- **友好风格** - 温暖亲切，拉近距离
- **深思熟虑风格** - 考虑周全，体现用心
- **决策导向风格** - 推动事情向前发展

用户可以选择最符合当前情境的建议，或者直接编辑修改。

### Ghost Text内联补全

在用户输入时，Social Draft提供"ghost text"内联补全功能——就像Gmail的智能撰写，但完全在本地运行。这个功能可以加速回复过程，同时保持用户的控制感。

### 上下文感知

Social Draft会读取最近的对话上下文，理解对话的语气和话题，从而给出更相关的建议。这不是简单的模板匹配，而是基于LLM的真正理解。

### 回复目标选择

用户可以选择要回复的具体消息，Social Draft会针对该消息生成建议，确保回复的针对性。

## 研究支持：从数据到模型

Social Draft不仅是一个应用，还包含完整的研究和训练流程：

### 数据蒸馏流程

项目包含一个两阶段的Claude蒸馏流程，用于创建合成社交回复数据集：

1. **第一阶段** - 使用Claude分析对话上下文和回复意图
2. **第二阶段** - 生成多样化的回复选项

这种方法可以用较少的真实数据生成高质量的训练数据。

### SFT训练管道

项目提供了完整的LoRA/SFT（Supervised Fine-Tuning）训练笔记本，支持Llama风格的聊天数据。用户可以用自己的对话数据训练个性化的回复模型。

### 基准测试工具

Experiments_Benchmarks目录包含Python工具，用于对比本地模型和云端模型的回复质量，使用相同的回复模式进行评估。

## 技术实现细节

### iOS应用架构

应用使用SwiftUI构建，采用清晰的分层架构：

- **AppRootView** - 应用根视图，管理全局设置和线程列表
- **Features/Chat** - 聊天界面、消息列表、回复目标选择、建议卡片
- **Features/Settings** - 后端选择、模型设置、LoRA配置、训练控制
- **Features/Common** - 共享设置、回复引擎编排、内联格式化
- **Backend** - 提示构建、输出解析、本地推理、云端API调用、训练桥接
- **Core/Networking** - Supabase客户端和JSON编解码

### 本地推理实现

本地推理通过LLMService.swift实现，使用llama.xcframework的C API：

1. 加载GGUF基础模型
2. 可选挂载LoRA适配器
3. 使用llama.cpp采样链（top-k、top-p、temperature）
4. 追踪延迟、token数、内存变化
5. 解析生成文本为标准JSON格式
6. 维护提示前缀token缓存以优化重复结构

### 云端推理支持

云端模式支持多个提供商：
- OpenAI
- Anthropic
- Gemini（通过OpenAI兼容端点）
- Groq
- OpenRouter

API密钥在应用设置中输入，支持provider-specific默认模型名称。

### Supabase集成

演示聊天服务使用Supabase进行数据持久化：
- 获取线程列表、参与者、消息
- 创建实时演示线程
- 发送和删除消息
- 订阅实时插入和删除事件
- 轮询作为新消息的fallback

## 隐私与伦理考量

Social Draft的设计体现了对隐私的重视：

1. **端侧优先** - 核心功能完全本地运行
2. **用户控制** - 不会自动发送消息，用户始终掌握最终决定权
3. **透明性** - 明确区分本地、云端和Mock模式
4. **数据最小化** - 云端模式仅发送必要的对话上下文

这种设计避免了"AI代替人类社交"的伦理风险，而是将AI定位为辅助工具，帮助用户更好地表达自己。

## 应用场景的深层意义

Social Draft解决的不仅是技术问题，更是社交焦虑这个心理社会问题。在即时通讯时代，人们经常感到回复压力——担心回复不够及时、不够得体、不够有趣。

Social Draft通过以下方式缓解这种压力：

1. **降低启动门槛** - 给用户提供回复的起点
2. **提供选择** - 多种风格让用户找到最适合自己的表达
3. **保持真实** - 建议基于真实意图，而非虚假表演
4. **尊重边界** - 帮助用户礼貌地设立界限

## 技术亮点总结

- **端侧LLM推理** - 使用llama.cpp在iOS设备上运行大模型
- **LoRA个性化** - 支持用户训练自己的风格适配器
- **多后端架构** - Mock/Cloud/Local三种模式灵活切换
- **蒸馏数据生成** - 使用Claude生成合成训练数据
- **完整训练管道** - 从数据到模型的端到端支持
- **SwiftUI现代架构** - 清晰的分层和状态管理

## 结语

Social Draft是一个精心设计的AI应用，它展示了如何将大模型技术转化为真正解决用户痛点的产品。通过端侧优先的架构、LoRA个性化、以及对隐私的重视，它提供了一个既强大又负责任的AI辅助社交工具。

对于关心AI产品化和端侧AI开发的开发者来说，Social Draft是一个值得深入研究的项目。它不仅提供了完整的iOS应用实现，还包含了从数据生成到模型训练的完整研究流程。