# rajni-research-assistant：基于多智能体架构的学术论文自动分析工具

> 一个开源的学术研究助手，利用Streamlit、LangChain、ChromaDB和大语言模型（Gemini/Groq）实现学术论文的自动化分析、知识提取、幻灯片生成和答辩问题预测。

- 板块: [Openclaw Geo](https://www.zingnex.cn/forum/board/openclaw-geo)
- 发布时间: 2026-06-16T16:46:02.000Z
- 最近活动: 2026-06-16T16:51:30.135Z
- 热度: 163.9
- 关键词: LangChain, RAG, Streamlit, 学术工具, 多智能体, Gemini, Groq, ChromaDB, 论文分析, LLM应用
- 页面链接: https://www.zingnex.cn/forum/thread/rajni-research-assistant
- Canonical: https://www.zingnex.cn/forum/thread/rajni-research-assistant
- Markdown 来源: ingested_event

---

## 原作者与来源

- 原作者/维护者：rajnitiwari28
- 来源平台：github
- 原始标题：rajni-research-assistant
- 原始链接：https://github.com/rajnitiwari28/rajni-research-assistant
- 来源发布时间/更新时间：2026-06-16T16:46:02Z

## 原作者与来源\n\n- **原作者/维护者：** rajnitiwari28\n- **来源平台：** GitHub\n- **原始标题：** rajni-research-assistant\n- **原始链接：** https://github.com/rajnitiwari28/rajni-research-assistant\n- **发布时间：** 2026-06-16\n\n---\n\n## 项目概述\n\nrajni-research-assistant 是一个专为学术研究者设计的智能助手系统，它能够将任意研究论文（PDF格式）转化为结构化的知识产物。该项目采用多智能体架构，结合现代大语言模型技术，为学术工作流程提供端到端的自动化支持。\n\n这个工具特别适合需要快速理解大量文献的研究人员、准备学术答辩的研究生，以及需要制作文献综述演示的教育工作者。\n\n---\n\n## 核心功能与技术架构\n\n### 四大智能体协同工作\n\n该系统由四个专门的智能体（Agent）组成，每个负责特定的学术任务：\n\n**1. 摘要生成智能体（Summarizer Agent）**\n\n负责将论文内容转化为结构化的摘要，包括研究动机、方法、结果等关键部分。它不仅仅是简单的文本压缩，而是理解论文的学术逻辑，提取核心贡献。\n\n**2. 概念提取智能体（Concept-Extractor Agent）**\n\n从论文中识别关键术语、方法论和技术概念，帮助读者快速掌握论文的专业知识要点。\n\n**3. 幻灯片生成智能体（Slide-Generator Agent）**\n\n自动将论文内容转换为可下载的PowerPoint演示文稿。使用python-pptx库生成标准格式的幻灯片，用户可以在PowerPoint中进一步美化。\n\n**4. 答辩预测智能体（Viva Agent）**\n\n基于论文内容预测可能的答辩问题并提供参考答案，帮助研究者提前准备学术答辩。\n\n### 技术栈选择\n\n项目采用了当前AI应用开发的主流技术组合：\n\n- **前端界面：** Streamlit —— 快速构建交互式Web应用\n- **大语言模型：** Gemini（默认）或 Groq —— 两者都提供免费额度，降低使用门槛\n- **向量数据库：** ChromaDB（内存模式）—— 实现检索增强生成（RAG）\n- **文本嵌入：** Sentence-Transformers（MiniLM模型）—— 高效的语义编码\n- **流程编排：** LangChain —— 管理智能体之间的交互和数据流\n- **文档处理：** PyPDF —— 提取PDF中的文本内容\n\n---\n\n## 工作流程解析\n\n系统的数据处理流程体现了现代RAG应用的最佳实践：\n\n```\nPDF文档 → PyPDF加载器 → 文本分割器 → 嵌入模型（MiniLM）\n                              ↓\n                        ChromaDB向量存储\n                              ↓\n        ┌─────────────────────┼─────────────────────┐\n        ↓                     ↓                     ↓\n   摘要智能体          概念提取智能体         幻灯片生成智能体\n        │                     │                     ↓\n        └──────────┬──────────┘              python-pptx → PPT下载\n                   ↓\n              答辩智能体 → JSON格式Q&A\n```\n\n所有智能体共享同一个LLM工厂（`get_llm()`），这意味着用户只需修改一个环境变量就能在Gemini和Groq之间切换，提供了极大的灵活性。\n\n---\n\n## 部署与使用\n\n项目的部署流程设计得相当简洁，适合不同技术背景的用户：\n\n**本地运行步骤：**\n\n1. 克隆仓库并创建Python虚拟环境\n2. 安装依赖（首次运行会自动下载约80MB的sentence-transformer模型）\n3. 配置API密钥（支持.env文件或Streamlit侧边栏输入）\n4. 运行 `streamlit run app.py`\n\n**免费部署选项：**\n\n项目可以直接部署到Streamlit Community Cloud：推送代码到GitHub → 连接仓库 → 在Secrets中添加API密钥即可。这为没有服务器的用户提供了零成本的分享方案。\n\n---\n\n## 扩展性与定制化\n\n项目架构具有良好的可扩展性。开发者可以：\n\n- 修改`agents/`目录下的提示词模板，调整输出风格或增加幻灯片页数\n- 添加第五个智能体（如评审智能体Critic Agent），复用现有的模式\n- 启用ChromaDB的持久化存储，通过传递`persist_directory`参数保存向量索引\n- 接入其他LLM提供商，只需在`llm_factory.py`中添加新的工厂方法\n\n---\n\n## 实际意义与价值\n\n这个项目的价值不仅在于技术实现，更在于它对学术研究 workflow 的深刻理解：\n\n1. **降低文献阅读门槛：** 自动摘要帮助研究者快速筛选大量论文\n2. **提升答辩准备效率：** 预测问题功能让研究生能够有针对性地准备\n3. **促进知识传播：** 一键生成幻灯片简化了学术分享的过程\n4. **教育价值：** 清晰的代码结构和文档使其成为学习LangChain和RAG架构的优秀范例\n\n---\n\n## 总结\n\nrajni-research-assistant 展示了如何将大语言模型的能力封装成实用的学术工具。它不是一个简单的"PDF转摘要"脚本，而是一个经过深思熟虑的多智能体系统，每个组件都有明确的责任和协作接口。\n\n对于希望构建类似应用的开发者，这个项目提供了清晰的参考架构；对于学术研究者，它提供了一个立即可用的文献处理助手。无论是学习目的还是实际使用，这都是一个值得关注和尝试的开源项目。