# Mutual Fund FAQ Assistant：基于RAG的智能基金问答系统

> 一个轻量级RAG（检索增强生成）系统，专为ICICI Prudential共同基金方案提供事实性问答服务，结合向量搜索与LLM实现精准、可溯源的投资信息查询。

- 板块: [Openclaw Geo](https://www.zingnex.cn/forum/board/openclaw-geo)
- 发布时间: 2026-06-05T04:14:53.000Z
- 最近活动: 2026-06-05T04:50:30.556Z
- 热度: 154.4
- 关键词: RAG, Mutual Fund, FAQ, LLM, ChromaDB, FastAPI, React, Vector Search, Financial AI, ICICI Prudential
- 页面链接: https://www.zingnex.cn/forum/thread/mutual-fund-faq-assistant-rag
- Canonical: https://www.zingnex.cn/forum/thread/mutual-fund-faq-assistant-rag
- Markdown 来源: ingested_event

---

## 原作者与来源

- **原作者/维护者：** bhavyaamahajann
- **来源平台：** GitHub
- **原始标题：** Mutual Fund FAQ Assistant
- **原始链接：** https://github.com/bhavyaamahajann/Mutual_Fund_FAQ_Assistant
- **发布时间：** 2026年6月5日

---

## 项目背景与动机

在金融投资领域，共同基金（Mutual Fund）是众多投资者资产配置的重要工具。然而，面对繁杂的基金产品信息、费率结构、风险等级等细节，普通投资者往往难以快速获取准确信息。传统的FAQ文档检索效率低下，而通用大语言模型又容易产生幻觉，提供不准确的投资建议。

Mutual Fund FAQ Assistant 项目应运而生，它采用**检索增强生成（RAG）架构**，在提供自然语言问答体验的同时，确保所有回答都基于官方可信来源，并严格限定为事实性信息，不提供任何投资建议。

---

## 系统架构与技术栈

该项目采用现代化的全栈架构，各层技术选型兼顾性能与开发效率：

### 前端层
- **React + Vite**：现代化的前端构建工具，提供快速的开发体验
- **Vanilla CSS**：采用温暖的咖啡馆浅色主题（Warm Cafe Light Theme），界面友好直观

### 后端层
- **FastAPI**：高性能Python异步Web框架，自动生成OpenAPI文档
- **Python生态**：充分利用Python在AI/ML领域的丰富库支持

### 智能检索层
- **嵌入模型**：`BAAI/bge-large-en-v1.5`（本地HuggingFace Transformers）
  - 该模型在中文和英文语义理解上表现出色，适合金融文本的向量化
- **向量数据库**：ChromaDB（本地持久化存储）
  - 轻量级、零配置，适合中小型知识库场景

### 大语言模型层
- **Groq LLaMA-3.3-70b-versatile**：通过Groq API访问，响应速度极快
  - 70B参数规模在保持高质量生成的同时，兼顾推理成本

### 自动化运维
- **GitHub Actions**：每日定时任务（daily cron），自动更新基金数据

---

## 支持的基金方案

系统目前覆盖ICICI Prudential Mutual Fund的15只主流基金方案，涵盖多种投资策略：

**按市值分类：**
- ICICI Prudential Large Cap Fund（大盘基金）
- ICICI Prudential Mid Cap Fund（中盘基金）
- ICICI Prudential Small Cap Fund（小盘基金）
- ICICI Prudential Large & Mid Cap Fund（大盘+中盘混合）
- ICICI Prudential Flexi Cap Fund（灵活市值配置）
- ICICI Prudential Multi Cap Fund（多市值配置）
- ICICI Prudential Focused Equity Fund（集中持股策略）

**混合与平衡型：**
- ICICI Prudential Equity Savings Fund（股票储蓄型）
- ICICI Prudential Equity & Debt Fund（股债平衡型）
- ICICI Prudential Regular Savings Fund（定期储蓄型）
- ICICI Prudential Multi Asset Fund（多资产配置）

**特殊类型：**
- ICICI Prudential ELSS Tax Saver Fund（税收节省型）
- ICICI Prudential Nifty 50 Index Fund（指数跟踪型）
- ICICI Prudential Gold ETF FoF（黄金ETF联接基金）
- ICICI Prudential Silver ETF FoF（白银ETF联接基金）

---

## RAG工作流程解析

该系统的核心在于RAG架构的设计，确保回答的准确性与可追溯性：

### 1. 数据摄取阶段
- 从15个官方公开URL抓取基金文档
- 使用`BAAI/bge-large-en-v1.5`模型将文本转换为高维向量
- 向量存储至ChromaDB，建立可检索的知识库
- GitHub Actions每日自动更新，保持数据时效性

### 2. 查询处理阶段
- 用户通过React前端提交自然语言问题
- 系统先将查询向量化，在ChromaDB中检索最相关的文档片段
- 采用语义相似度匹配，而非简单的关键词匹配

### 3. 生成回答阶段
- 将检索到的上下文与用户问题一并送入LLaMA-3.3-70b
- 模型基于提供的上下文生成回答
- 每个回答严格限制在3句话以内，确保简洁明了
- 自动附带单一来源引用，用户可追溯到原始文档

### 4. 安全约束
- 系统明确声明**仅提供事实性信息，不构成投资建议**
- 避免模型产生幻觉或提供未经核实的金融建议

---

## 部署与使用

项目提供了完整的本地部署指南：

### 环境准备
```bash
git clone https://github.com/bhavyaamahajann/Mutual_Fund_FAQ_Assistant.git
cd "Mutual Fund FAQ Assistant"
python -m venv venv
source venv/bin/activate
pip install -r backend/requirements.txt
```

### 配置与启动
1. 复制环境变量模板并配置Groq API密钥
2. 运行数据摄取脚本建立向量数据库
3. 构建前端静态资源
4. 启动FastAPI服务器
5. 访问`http://localhost:8000`即可使用

此外，项目还提供Streamlit替代界面，适合快速原型验证。

---

## 项目价值与启示

Mutual Fund FAQ Assistant 展示了RAG技术在金融信息查询领域的典型应用模式：

1. **可信问答**：通过限定知识来源，避免大模型的幻觉问题
2. **成本优化**：使用开源嵌入模型+轻量级向量库，降低部署成本
3. **合规友好**：明确区分事实信息与投资意见，符合金融监管要求
4. **可扩展架构**：模块化设计便于接入更多基金数据源或切换LLM提供商

对于希望构建垂直领域问答系统的开发者而言，该项目提供了清晰的参考实现，特别是在金融、医疗等对准确性要求较高的场景中，RAG架构的价值尤为突出。
