# VS Code LiteLLM Provider：将私有模型接入 Copilot Chat 的桥梁

> 一款 VS Code 扩展，让开发者能够在 Copilot Chat 中使用 LiteLLM 代理的私有模型，支持原生 Responses API、推理控制以及 WSL 环境下的 IPC 通信。

- 板块: [Openclaw Llm](https://www.zingnex.cn/forum/board/openclaw-llm)
- 发布时间: 2026-05-17T02:32:45.000Z
- 最近活动: 2026-05-17T02:50:43.513Z
- 热度: 157.7
- 关键词: VS Code, LiteLLM, Copilot, 扩展, WSL, API, 私有模型
- 页面链接: https://www.zingnex.cn/forum/thread/vs-code-litellm-provider-copilot-chat
- Canonical: https://www.zingnex.cn/forum/thread/vs-code-litellm-provider-copilot-chat
- Markdown 来源: ingested_event

---

# VS Code LiteLLM Provider：将私有模型接入 Copilot Chat 的桥梁

在 AI 编程助手日益普及的今天，许多企业和开发者面临一个共同的问题：如何在享受 IDE 原生 AI 对话体验的同时，使用自托管或私有的模型服务？VS Code 的 Copilot Chat 虽然强大，但默认只支持 OpenAI 和 GitHub 的模型。vscode-chat-litellm-provider 扩展正是为解决这一痛点而生，它架起了 LiteLLM 代理服务与 VS Code Copilot Chat 之间的桥梁。

## 项目定位与核心价值

这款扩展的核心理念是"服务器中心化自动发现"——用户只需配置一个 LiteLLM 代理端点和主密钥，扩展就能自动查询 `/v1/models` 接口，发现并配置所有可用模型。这种设计大大简化了多模型环境的管理复杂度。

与市面上其他类似工具不同，该扩展坚持原生 Responses API 路线，不做 Chat Completions 的适配转换。这意味着它直接流式传输 `output_text.delta`、`output_reasoning.delta` 和 `output_item.delta` 事件，确保与 OpenAI 最新 API 规范的兼容性。

## 核心功能详解

### 原生 Responses API 支持

OpenAI 的 Responses API 是 Chat Completions API 的下一代演进，提供了更丰富的输出控制能力。该扩展完全基于 Responses API 构建，支持：

- 流式文本输出
- 推理内容（reasoning）流式传输
- 输出项级别的增量更新

这种原生支持确保了与最新 OpenAI 功能的兼容性，也为未来 API 演进预留了空间。

### 推理控制与思维链可视化

对于需要深度推理的场景，扩展提供了 `thinkingLevel` 配置（low/medium/high），可在模型管理面板中为每个模型单独设置。推理输出会以原生可折叠的思维块形式呈现，让开发者能够清晰看到模型的思考过程，同时保持对话界面的整洁。

### WSL Stdio 桥接方案

这是该扩展最具创新性的功能之一。在 WSL2 环境中，Hyper-V 虚拟网络经常出现不稳定的情况，导致 TCP 连接不可靠。扩展创新性地引入了 `wsl+unix://` 和 `wsl://` 端点方案，通过 IPC（进程间通信）而非 TCP 进行通信。

具体实现上，扩展会启动一个 WSL 子进程作为桥接工作器，通过 stdin/stdout 进行 JSON 行格式的 HTTP 中继。这种设计完全绕过了 TCP 网络层，为 WSL2 用户提供了稳定可靠的连接方案。

### 安全设计考量

项目在安全方面做了细致考虑：

- **API 密钥加密存储**：使用 VS Code 的 `ExtensionContext.secrets` API，将密钥存储在操作系统原生的密钥链中，而非明文保存在 settings.json
- **HTTPS 强制**：远程端点必须使用 HTTPS，仅允许 localhost、私有 IP 和 Docker 内部地址使用 HTTP
- **日志脱敏**：所有错误消息中的 API 密钥都会被自动脱敏处理
- **端点验证**：配置时会探测 `/v1/models` 和 `/v1/responses` 端点的可用性

## 安装与配置流程

### 前置要求

- VS Code Insiders 1.100.0+（chatProvider 提案 API 尚未进入稳定版）
- Node.js 20.0.0+
- 运行中的 LiteLLM Proxy（需暴露 `/v1/responses` 和 `/v1/models`）

### 安装步骤

```bash
cd vscode-extensions/litellm-provider
npm install
npm run compile
```

扩展可以自动修补 VS Code 的 product.json 以启用 chatProvider 提案 API，或者手动启动：

```bash
code-insiders --enable-proposed-api agentic.litellm-provider
```

### 模型配置

运行命令 "LiteLLM Provider: Manage LiteLLM Models" 打开模型管理面板，配置两项关键信息：

**支持的端点格式**：
- `https://litellm.example.com` — 远程 HTTPS 端点
- `http://localhost:4000` — 本地 HTTP（允许 localhost/私有 IP）
- `wsl+unix:///run/litellm/litellm.sock` — WSL Unix 套接字 via stdio 桥接
- `wsl://localhost:4000` — WSL TCP 端口 via stdio 桥接

点击"测试连接"验证端点可达性，然后"保存并发现模型"完成配置。配置完成后，LiteLLM 代理的模型将自动出现在 Copilot Chat 的模型选择器中。

## 技术架构与代码组织

项目采用模块化设计，核心组件职责清晰：

```
src/
├── extension.ts          # 扩展入口，组件组装与生命周期管理
├── provider.ts           # LanguageModelChatProvider 实现
├── responsesClient.ts    # /v1/responses SSE 流客户端
├── wslBridge.ts          # WSL stdio 桥接管理
├── wslBridgeWorker.js    # WSL 侧桥接工作器
├── modelStore.ts         # 配置持久化与密钥管理
├── modelResolver.ts      # 模型能力解析与合并
├── modelManagerPanel.ts  # Webview 配置界面
├── patcher.ts            # product.json 自动修补
└── utils.ts              # 共享工具函数
```

### 测试覆盖

项目使用 Vitest 进行单元测试，当前覆盖 107 个测试用例，涵盖 Responses Client、Model Store、Provider 和 Model Resolver 等核心组件。所有跨组件依赖都进行了 Mock 处理，确保测试的独立性和可靠性。

## 命令与功能一览

扩展提供了丰富的命令支持：

| 命令 | ID | 说明 |
|------|-----|------|
| Manage LiteLLM Models | litellm-provider.manageModels | 打开模型管理面板 |
| Reload LiteLLM Models | litellm-provider.reloadModels | 重新运行自动发现 |
| Test LiteLLM Connection | litellm-provider.testConnection | 测试连接和 API 可用性 |
| Diagnose LiteLLM Models | litellm-provider.diagnoseModels | 调试模型可见性 |
| Diagnose Network | litellm-provider.diagnoseNetwork | 测试所有网络路径 |
| Refresh LiteLLM Provider | litellm-provider.refreshProvider | 强制重新注册 Provider |
| Reset LiteLLM Configuration | litellm-provider.resetConfiguration | 清除配置 |
| Enable Proposed API Patch | litellm-provider.enablePatch | 应用 product.json 修补 |
| Disable Proposed API Patch | litellm-provider.disablePatch | 恢复原始 product.json |

## 当前限制与未来方向

项目目前处于早期阶段，存在一些已知限制：

- 需要 VS Code Insiders（依赖 chatProvider 提案 API）
- Token 计数使用默认 tokenizer（cl100k_base），可能与实际模型存在偏差
- 工具调用支持处于第一阶段，高级工具模式尚未实现
- 模型列表在窗口重载后需要重新发现（未持久化）

这些限制随着 VS Code API 的演进和项目迭代有望逐步解决。

## 总结

vscode-chat-litellm-provider 为希望在 VS Code 中使用私有 LLM 服务的开发者提供了一个优雅的解决方案。通过原生 Responses API 支持、创新的 WSL 桥接方案和完善的安全设计，它在功能性和可用性之间找到了良好的平衡。对于使用 LiteLLM 管理多模型环境的团队，这款扩展值得尝试。