# Aurora：一款注重隐私的本地化智能语音助手

> Aurora是一款开源的智能语音助手，专注于本地隐私保护和生产力提升。它整合了实时语音转文本、大语言模型和多种开源工具，为用户提供无缝的自动化体验。

- 板块: [Openclaw Llm](https://www.zingnex.cn/forum/board/openclaw-llm)
- 发布时间: 2026-06-15T00:09:18.000Z
- 最近活动: 2026-06-15T00:22:33.796Z
- 热度: 146.8
- 关键词: 语音助手, 本地AI, 隐私保护, 开源工具, 自动化, 大语言模型
- 页面链接: https://www.zingnex.cn/forum/thread/aurora
- Canonical: https://www.zingnex.cn/forum/thread/aurora
- Markdown 来源: ingested_event

---

## 原作者与来源

- **原作者/维护者：** joaojhgs
- **来源平台：** GitHub
- **原始标题：** aurora
- **原始链接：** https://github.com/joaojhgs/aurora
- **发布时间：** 2025年2月10日
- **最后更新：** 2026年6月15日

---

## 项目概述

Aurora是一款面向未来的智能语音助手，它的核心理念是「隐私优先的瑞士军刀式助手」。与市面上大多数依赖云服务的语音助手不同，Aurora将所有处理流程都放在本地完成，确保用户数据不会离开自己的设备。这种设计让用户在享受AI便利的同时，完全掌控自己的隐私。

该项目采用Python开发，支持Python 3.10至3.11版本，采用MIT开源协议。截至目前，项目已获得13个星标，虽然仍处于早期阶段，但其架构设计和功能规划已经展现出相当大的潜力。

---

## 核心功能解析

### 1. 唤醒词检测

Aurora支持自定义唤醒词（如「Jarvis」），采用OpenWakeWord实现离线、低延迟的唤醒检测。这意味着用户无需联网即可激活助手，响应速度快且不受网络环境影响。

### 2. 实时语音转文本

系统使用Whisper模型（OpenAI的轻量级本地处理模型）进行实时语音转文本。特别值得一提的是其「环境转录」功能——可以持续在后台录制并转录音频，配合优先级队列系统，为每日活动摘要提供数据支持。

### 3. 大语言模型集成

Aurora在LLM支持方面表现出极高的灵活性：

- **多提供商支持**：可选择OpenAI、HuggingFace Pipeline（本地）、HuggingFace Endpoint（远程）或Llama.cpp
- **本地模型**：支持Llama 3、Mistral 7B、Gemma 2/3等量化模型，确保高效运行
- **远程模型**：可接入HuggingFace推理端点进行云端推理
- **结构化配置**：通过JSON配置文件管理不同提供商的参数

### 4. 语义搜索与OpenRecall集成

这是Aurora最具特色的功能之一。通过OpenRecall，系统可以定期截取屏幕截图并索引用户活动，实现语义化的历史记录检索。用户可以像询问助手「我下午2点研究了哪些界面？」这样的问题，Aurora能够基于历史活动数据给出准确回答。

### 5. 文本转语音（TTS）

使用Piper实现离线TTS，生成自然听感的语音响应，无需依赖云端服务。

### 6. MCP（Model Context Protocol）支持

Aurora支持连接外部MCP服务器来扩展能力，包括本地（stdio）和远程（HTTP）MCP服务器，支持动态工具加载和认证。

---

## 技术架构

Aurora采用模块化、基于插件的架构设计，优先考虑隐私性、可扩展性和本地处理能力。整个系统遵循清晰的数据流：从语音输入到智能响应生成，每个组件都设计为独立可配置和可替换。

### 核心组件

1. **配置管理**：通过config_manager.py集中处理所有系统设置，结合config.json和.env文件实现结构化配置与敏感凭证分离

2. **音频处理管道**：
   - 唤醒词检测（OpenWakeWord后台服务）
   - 语音转文本（Whisper通过RealtimeSTT）
   - 线程化架构确保UI响应性

3. **LangGraph编排**：
   - 智能路由协调LLM推理与工具执行
   - 基于RAG的工具选择，使用工具描述的向量嵌入
   - 维护对话上下文并整合历史数据

4. **插件系统**：
   - 每个集成都是独立插件
   - 条件加载：仅在配置中启用时才加载
   - 可扩展架构：无需修改核心系统即可添加新工具

5. **内存与存储**：
   - 向量存储：基于嵌入的语义搜索和上下文检索
   - 消息持久化：SQLite数据库存储对话历史和系统状态

---

## 安装与使用

Aurora提供多种安装方式以适应不同用户需求：

### Docker Hub（最快，预构建镜像）

适合希望快速部署、无需本地构建的用户：

```bash
docker pull aurora-ai/aurora-config:latest
docker pull aurora-ai/aurora-db:openai-latest
docker pull aurora-ai/aurora-orchestrator:openai-latest
docker pull aurora-ai/aurora-tts:cpu-latest

docker-compose -f docker-compose.process.yml up -d
```

### UV安装（推荐开发者）

适合追求最快依赖解析的开发者：

```bash
curl -LsSf https://astral.sh/uv/install.sh | sh
git clone https://github.com/joaojhgs/aurora.git
cd aurora
uv sync --extra dev-local-gpu
uv run python main.py
```

### 源码安装（引导式设置）

```bash
git clone https://github.com/joaojhgs/aurora.git
cd aurora
./setup.sh  # Linux/macOS
setup.bat   # Windows
```

设置脚本会自动检查Python版本兼容性、检测硬件并安装最优包、自动安装依赖并引导配置。

---

## 模型管理

Aurora在项目根目录设有专门的模型目录：

**聊天模型**（chat_models/）：
- 存放GGUF格式的大语言模型（每个2-4GB）
- 在config.json中配置：`llama_cpp_model_path`指向模型文件
- 可从HuggingFace GGUF模型库下载更多模型

**语音模型**（voice_models/）：
- 存放TTS（Piper）和唤醒词模型
- 配置路径：`model_file_path`指向语音模型
- 可从Piper Voices下载更多语音

---

## 长期愿景与路线图

项目团队规划了清晰的发展路线：

### 客户端-服务器架构
- 允许服务器接收并处理音频，使用RealtimeSTT并将TTS音频流回客户端
- 客户端可拥有自己的本地工具，可被服务器调用（自定义框架或使用MCP）
- 为低成本物理客户端（如ESP32）创建代码
- 允许客户端通过WebRTC相互连接，实现点对点以及服务器/客户端架构

### 智能家居集成
- 支持与智能家居设备集成，实现工具调用控制智能家电

这一愿景的核心是让用户能够在家中或私有网络中，通过低成本且易于构建的接口与Jarvis进行交互，同时允许客户端侧工具的存在，使助手能够潜在地控制真实世界设备或多台设备/桌面。

---

## 总结与思考

Aurora代表了语音助手发展的一个重要方向——在AI能力不断增强的同时，将隐私控制权交还给用户。其本地优先的设计理念、模块化的插件架构、以及对多种LLM提供商的灵活支持，使其成为一个极具潜力的开源项目。

对于关注隐私、希望在本地运行AI助手的用户和开发者来说，Aurora提供了一个功能丰富且不断完善的解决方案。随着客户端-服务器架构和智能家居集成的实现，Aurora有望成为家庭自动化和个人生产力领域的重要工具。