章节 01
Voxen:可自托管的RAG客服机器人平台核心导读
Voxen是基于大语言模型的可自托管客服机器人平台,核心是通过检索增强生成(RAG)技术构建智能Agent,支持从知识库生成特定领域问答,并通过单行脚本嵌入任意网站。其关键优势包括完全的数据控制权(敏感文档本地存储)、多模块功能架构,以及支持Ollama(本地开源模型)和Gemini(云端模型)等技术栈。
正文
Voxen是一个基于大语言模型的可自托管客服机器人平台,支持从知识库构建检索增强型Agent,并通过单行脚本嵌入到任何网站。
章节 01
Voxen是基于大语言模型的可自托管客服机器人平台,核心是通过检索增强生成(RAG)技术构建智能Agent,支持从知识库生成特定领域问答,并通过单行脚本嵌入任意网站。其关键优势包括完全的数据控制权(敏感文档本地存储)、多模块功能架构,以及支持Ollama(本地开源模型)和Gemini(云端模型)等技术栈。
章节 02
传统SaaS客服解决方案存在数据控制权缺失的问题,而Voxen的自托管模式解决了这一痛点——企业可将敏感文档保存在本地基础设施,同时利用大语言模型能力提供智能问答服务,特别适合对数据隐私有严格要求的企业场景。
章节 03
章节 04
后端:基于FastAPI框架,使用SQLAlchemy异步操作PostgreSQL数据库,向量存储采用Qdrant(专为高维向量搜索优化); LLM支持:兼容Ollama(本地部署开源模型如Gemma3)和Google Gemini(云端模型),切换只需修改环境变量; 前端:React 19 + Vite构建,Tailwind CSS v4样式设计,确保开发体验与运行性能。
章节 05
本地开发:需Python3.11+、PostgreSQL,若用Ollama需本地运行服务并拉取模型; Docker部署:提供开发(docker-compose.yml,热重载)和生产(docker-compose.prod.yml,gunicorn+nginx)两种Compose配置,Ollama服务可选(通过profile控制); 环境变量:所有配置通过.env文件管理,包括数据库连接URL、LLM提供商、模型名称等,便于跨环境迁移。
章节 06
章节 07
Voxen结合了大语言模型能力与企业数据主权需求,是自托管AI客服工具的典型代表。未来可能的增强方向包括多语言支持、复杂对话流程管理、与现有CRM系统深度集成等。