正文

完整指南：在AWS上自助部署大语言模型实验室

本文详细介绍如何使用Terraform和GitHub Actions在AWS EC2 g5实例上自动化部署完整的LLM推理环境，包括Ollama推理服务、Open WebUI聊天界面和多引擎TTS语音合成系统。

LLM大语言模型AWSTerraformOllama自助部署GPU推理TTS语音合成Open WebUI

发布时间 2026/06/08 17:13最近活动 2026/06/08 17:19预计阅读 3 分钟

章节 01

完整指南：在AWS上自助部署大语言模型实验室（导读）

本文介绍如何使用Terraform和GitHub Actions在AWS EC2 g5实例上自动化部署LLM推理环境，核心组件包括Ollama推理服务、Open WebUI聊天界面和多引擎TTS语音合成系统。该项目由carlosacchi维护（GitHub链接：https://github.com/carlosacchi/self-hosted-llm-guide），旨在解决自助部署LLM的技术障碍，实现数据隐私保护、成本可控及推理过程完全掌控。

章节 02

背景与动机

随着LLM技术发展，开发者和企业希望在私有环境部署模型，核心动机包括数据隐私、成本控制和推理过程掌控。但自助部署面临GPU驱动安装、CUDA配置、模型下载、UI开发等障碍。本项目提供自动化方案，帮助用户快速搭建生产就绪的LLM推理环境。

章节 03

项目架构与基础设施

核心组件：Ollama推理引擎（Docker化，GPU加速）、Open WebUI（端口3000）、多引擎TTS（Kokoro、XTTS-v2、Piper）、Gradio TTS管理界面（端口7860）。 网络架构：AWS VPC（10.42.0.0/16）、公有子网、互联网网关、路由表，安全组限制入站流量。 计算资源：基于AWS Deep Learning AMI（Ubuntu 22.04），支持g5系列实例（单GPU如g5.xlarge，多GPU如g5.12xlarge）。 访问控制：安全组仅允许指定IP访问22（SSH可选）、3000（WebUI）、7860（TTS）、8000（FastAPI）端口。

章节 04

部署流程详解

预置阶段：需准备AWS凭证（EC2/VPC/IAM/S3/EventBridge权限）、S3存储桶（Terraform状态）、公网IP、EC2密钥对（可选）。 GitHub Actions部署：配置仓库密钥（AWS_ACCESS_KEY_ID、AWS_SECRET_ACCESS_KEY、TF_STATE_BUCKET），支持apply/destroy操作，可选择实例规格、区域等参数。 本地Terraform部署：初始化命令（terraform init）及应用命令（terraform apply），需指定bucket、key、region、instance_type、ipv4_allowed等变量。

章节 05

TTS引擎对比与成本优化

TTS引擎：1. Kokoro（9种语音，GPU可选，低延迟）；2. XTTS-v2（21种语音+声音克隆，GPU必需，高质量）；3. Piper（多语言，纯CPU，轻量级）。 成本优化：EventBridge Scheduler每晚自动停止实例（注意EBS/弹性IP仍收费）；区域选择建议（eu-west-1性价比高，us-east-2价格低）。

章节 06

应用场景与部署后访问

应用场景：企业私有AI部署（数据敏感场景）、开发者实验环境（无API限制）、模型微调（多GPU支持）、语音应用原型开发（TTS对比）。 部署后访问：Terraform输出实例ID/IP、Open WebUI地址（http://:3000）、Gradio TTS地址（http://:7860）、SSH命令（若配置密钥）。

章节 07