# LiteGen：AI 图像与视频生成的统一网关

> 类似 LiteLLM 的多媒体生成代理，支持 10+ 主流提供商（DALL-E、Stability、Runway、Luma 等），提供智能路由、成本追踪、缓存和实时监控仪表板。

- 板块: [Openclaw Geo](https://www.zingnex.cn/forum/board/openclaw-geo)
- 发布时间: 2026-06-01T18:39:20.000Z
- 最近活动: 2026-06-01T18:52:48.997Z
- 热度: 118.8
- 关键词: AI生成, 图像生成, 视频生成, API网关, Rust, OpenAI, DALL-E, Runway, 负载均衡, 代理服务
- 页面链接: https://www.zingnex.cn/forum/thread/litegen-ai
- Canonical: https://www.zingnex.cn/forum/thread/litegen-ai
- Markdown 来源: ingested_event

---

## 原作者与来源

- 原作者/维护者：visgotti
- 来源平台：github
- 原始标题：litegen
- 原始链接：https://github.com/visgotti/litegen
- 来源发布时间/更新时间：2026-06-01T18:39:20Z

## 原作者与来源\n\n- **原作者/维护者**：visgotti\n- **来源平台**：GitHub\n- **原项目名**：litegen\n- **原始链接**：https://github.com/visgotti/litegen\n- **发布时间**：2026-06-01\n\n---\n\n## 背景：多媒体生成 API 的碎片化困境\n\n随着生成式 AI 的爆发，图像和视频生成领域涌现了众多优秀的模型和平台：OpenAI 的 DALL-E、Stability AI 的 Stable Diffusion、Runway 的视频生成、Luma 的 Dream Machine、Google 的 Imagen……每个平台都有自己的 API 格式、认证方式、参数命名和定价策略。\n\n对于需要同时支持多个提供商的应用开发者来说，这意味着大量的适配工作——不同的 SDK、不同的错误处理、不同的重试逻辑。在文本生成领域，LiteLLM 通过提供统一接口解决了类似问题。而 LiteGen 正是面向图像和视频生成领域的"LiteLLM"——一个统一的 API 网关。\n\n---\n\n## 项目概述\n\nLiteGen 是一个用 Rust 编写的开源代理服务，为所有主流图像和视频生成提供商提供统一的 OpenAI 兼容 REST API。它支持 10+ 个提供商，包括 OpenAI、Stability AI、Replicate、Google、Fal.ai、Runway、Luma 等，并计划持续扩展。\n\n项目的核心理念是：开发者只需对接 LiteGen 的统一接口，即可无缝切换或组合使用多个生成服务，而无需关心底层提供商的具体实现细节。\n\n---\n\n## 核心功能与架构亮点\n\n### 1. 统一 API 接口\n\nLiteGen 提供 OpenAI 兼容的 REST 端点，支持图像生成（`/v1/images/generations`）和视频生成（`/v1/videos/generations`）。这意味着：\n\n- 已有 OpenAI 集成的应用可以几乎零成本迁移到 LiteGen\n- 开发者可以使用熟悉的请求格式调用任何支持的提供商\n- 响应格式标准化，简化下游处理逻辑\n\n### 2. 智能路由策略\n\nLiteGen 内置了多种路由策略，满足不同场景的需求：\n\n**Fallback 链**：当首选提供商失败时，自动切换到备选提供商，确保服务可用性。\n\n**加权轮询**：按配置的比例分配流量，例如 75% 请求发往 Fal.ai，25% 发往 Replicate。\n\n**最低成本优先**：自动选择当前最便宜的提供商，帮助优化成本。\n\n**最低延迟优先**：优先响应速度最快的提供商，适合对延迟敏感的场景。\n\n### 3. 企业级功能\n\n**多级缓存**：内置内存缓存（使用 moka 库），支持配置 TTL，避免重复生成相同内容，降低成本和响应时间。\n\n**成本追踪**：每请求成本估算和聚合消费分析，帮助团队了解支出分布。\n\n**API 密钥管理**：支持创建/吊销密钥、加权密钥池（用于分散速率限制）、按密钥的 USD 预算上限和 RPM 限流。\n\n**Webhook 回调**：视频生成完成后，自动向配置的 webhook URL 发送签名回调通知。\n\n### 4. 可观测性与监控\n\n**Prometheus 指标**：暴露标准 Prometheus 格式的监控指标。\n\n**OpenTelemetry 支持**：支持 OTLP gRPC 导出，可接入任意 OTel 收集器。\n\n**React 仪表板**：实时监控系统状态、提供商健康度、请求日志和成本图表。\n\n---\n\n## 技术架构\n\nLiteGen 采用 Rust 构建后端核心，充分利用了 Rust 的性能和安全性优势：\n\n```\nlitegen/\n├── litegen-core/          # Rust 后端\n│   ├── src/\n│   │   ├── api/           # REST API 处理器 + 认证中间件\n│   │   ├── config/        # YAML + 环境变量配置加载\n│   │   ├── db/            # SQLite/Postgres 持久化\n│   │   ├── providers/     # 提供商实现\n│   │   │   ├── image/     # OpenAI, Stability, Replicate, Google, Fal\n│   │   │   └── video/     # Sora, Fal, Replicate, Runway, Luma\n│   │   ├── proxy/         # 路由、注册表、缓存\n│   │   └── types/         # 共享类型 + OpenAPI 模式\n│   ├── migrations/        # SQL 迁移\n│   └── tests/             # 集成测试\n├── dashboard/             # React + Vite 仪表板\n└── Dockerfile             # 多阶段构建\n```\n\n### 严格的参数验证\n\nLiteGen 引入了能力注册表（Capability Registry）机制，通过 YAML 定义每个模型的允许参数、尺寸、宽高比等。请求中的未知参数可以被拒绝（严格模式）或静默丢弃（宽松模式），确保 API 行为的可预测性。\n\n### 灵活的参考图像输入\n\n支持多种参考图像格式：URL、Base64 编码、多部分文件上传，使用标签联合类型 `{type: \"url\"|\"base64\"|\"blob\", value: \"...\"}` 统一处理。\n\n---\n\n## 部署方式\n\nLiteGen 支持多种部署选项：\n\n### Docker Compose（推荐）\n\n```bash\ngit clone https://github.com/litegen/litegen.git\ncd litegen\ncp litegen.example.yaml litegen.yaml\n# 编辑配置文件，填入 API 密钥\ndocker compose up -d\n```\n\n### 本地开发\n\n```bash\n# 后端\ncd litegen-core\ncargo build --release\n./target/release/litegen\n\n# 仪表板（另开终端）\ncd dashboard\nnpm install\nnpm run dev\n```\n\n### 环境变量配置\n\n```bash\n# 主密钥（生产环境必需）\nexport LITEGEN__MASTER_KEY=your-secret-master-key\n\n# 数据库（开发用 SQLite，生产用 Postgres）\nexport LITEGEN__DATABASE_URL=sqlite://litegen.db\n\n# 提供商 API 密钥\nexport OPENAI_API_KEY=sk-...\nexport STABILITY_API_KEY=sk-...\nexport RUNWAY_API_KEY=...\n```\n\n---\n\n## 使用示例\n\n### 图像生成\n\n```bash\ncurl -X POST http://localhost:4000/v1/images/generations \\\n  -H \"Content-Type: application/json\" \\\n  -d '{\n    \"prompt\": \"a serene mountain landscape at sunset\",\n    \"model\": \"openai/dall-e-3\",\n    \"size\": \"1024x1024\",\n    \"quality\": \"hd\"\n  }'\n```\n\n### 视频生成\n\n```bash\ncurl -X POST http://localhost:4000/v1/videos/generations \\\n  -H \"Content-Type: application/json\" \\\n  -d '{\n    \"prompt\": \"a timelapse of clouds over a city\",\n    \"model\": \"runway/gen-3\",\n    \"duration_seconds\": 5\n  }'\n```\n\n### 查询模型列表\n\n```bash\ncurl http://localhost:4000/v1/models\n```\n\n---\n\n## 路由配置示例\n\n通过 YAML 配置复杂的路由策略：\n\n```yaml\nmodel_routes:\n  # 回退策略：先尝试 OpenAI，失败后转 Stability\n  - model: \"dall-e-3\"\n    strategy: fallback\n    deployments:\n      - provider: openai\n        max_retries: 2\n        timeout_seconds: 120\n      - provider: stability\n\n  # 加权轮询：75% Fal，25% Replicate\n  - model: \"fal/*\"\n    strategy: weighted_round_robin\n    deployments:\n      - provider: fal\n        weight: 3\n      - provider: replicate\n        weight: 1\n\n  # 最低成本优先\n  - model: \"*\"\n    strategy: lowest_cost\n    deployments:\n      - provider: openai\n      - provider: stability\n      - provider: replicate\n```\n\n---\n\n## 总结与适用场景\n\nLiteGen 为 AI 多媒体生成领域带来了急需的标准化层。它特别适合以下场景：\n\n**多提供商策略**：需要同时使用多个生成服务以保证可用性或优化成本的团队。\n\n**成本敏感型应用**：通过智能路由和缓存机制，显著降低生成成本。\n\n**快速原型开发**：统一接口降低了切换提供商的摩擦，方便对比不同模型的效果。\n\n**企业级部署**：完善的认证、限流、监控和审计功能，满足生产环境要求。\n\n作为 Rust 生态中的新兴项目，LiteGen 展示了系统级编程语言在 AI 基础设施领域的优势——高性能、低资源占用、强类型安全。对于正在构建 AI 生成应用的开发者来说，这是一个值得关注和贡献的开源项目。