# BidGenius AI：用多 Agent 系统自动化印度政府采购投标流程

> 一个面向印度政府采购市场的多 Agent AI 系统，通过 7 个专门化 Agent 的协作，将原本需要数天的投标准备工作压缩到 5 分钟内完成。

- 板块: [Openclaw Llm](https://www.zingnex.cn/forum/board/openclaw-llm)
- 发布时间: 2026-04-24T21:43:29.000Z
- 最近活动: 2026-04-24T21:52:26.780Z
- 热度: 152.8
- 关键词: 多 Agent 系统, 政府采购, PDF 解析, 招标自动化, FastAPI, Streamlit, Tavily, Exa, LLM-as-judge
- 页面链接: https://www.zingnex.cn/forum/thread/bidgenius-ai-agent
- Canonical: https://www.zingnex.cn/forum/thread/bidgenius-ai-agent
- Markdown 来源: ingested_event

---

## 印度政府采购市场的痛点

印度政府采购是一个年规模超过 15 万亿卢比（约 1800 亿美元）的巨大市场，但这个市场极度碎片化。超过 60 个独立的采购门户（eProcure、GeM、各邦电子招标平台、市政公司、国有企业）各自为政，没有统一的搜索入口。

中小企业参与政府采购面临多重障碍：

- **信息发现困难**：必须每天手动检查数十个网站才能发现相关招标机会
- **文档解析复杂**：招标文件通常是 100 多页的密集 PDF，有时是扫描件，甚至使用地方语言和印度数字
- **时间压力巨大**：错过截止日期一天就意味着完全失去机会，而从 PDF 中提取关键字段（保证金、费用、日期、范围）每份需要数小时
- **标书撰写繁琐**：编写专业投标书需要深入理解招标范围、合规要求和公司定位，通常需要数天
- **缺乏智能过滤**：搜索结果混杂着过期、不相关或非招标文档（法院命令、财务报告），浪费大量时间

## 系统概述：7 Agent 协作的完整流水线

BidGenius AI 的核心创新在于将复杂的投标流程分解为 7 个专门化的 Agent，每个 Agent 负责一个明确的任务，通过流水线方式协作完成从招标发现到标书生成的全过程。

整个流程在 5 分钟内完成，相比传统方式节省了数天的人工工作。

### Agent 分工表

| 任务 | Agent | 输入 | 输出 | 关键技术 |
|------|-------|------|------|----------|
| 1. 招标发现 | Search Agent | 关键词 + 地区 | 招标 URL 列表 | Tavily + Exa 双源搜索 |
| 2. 文档获取 | Reader Agent | 招标 URL | 原始文本 | PDF 下载 + 三级提取 |
| 3. 字段提取 | Extractor Agent | 原始文本 | 结构化 JSON | 正则优先 + 单 LLM 补充 |
| 4. 数据验证 | Validator Agent | 提取的 JSON | 清洗后的 JSON | 类型过滤 + 日期校验 |
| 5. 评分分析 | Analysis Agent | 清洗后的 JSON | 分数 + 摘要 | 加权评分规则 |
| 6. 标书生成 | Bid Agent | JSON + 公司资料 | 5 部分投标书 | LLM 生成 + 模板回退 |
| 7. 质量评估 | Judge Agent | 投标书 + 摘要 | 评分 | LLM-as-judge |

## 技术架构深度解析

### Search Agent：跨 60+ 门户的智能搜索

使用 Tavily（网络搜索）和 Exa（语义搜索）双源策略，最大化召回率。覆盖范围包括：

- **中央级**：eProcure、GeM、DefProc、MSTC
- **邦级**：马哈拉施特拉、拉贾斯坦、卡纳塔克、泰米尔纳德等
- **市政级**：孟买、浦那、班加罗尔、海得拉巴等 10+ 市政公司
- **国企**：NHAI、IREPS、NTPC、PowerGrid、ONGC 等

系统会自动检测地区名称并优先搜索相关邦级门户，同时生成时间窗口（当前月份 ±2 个月）过滤活跃招标。

### Reader Agent：三级 PDF 提取策略

政府 PDF 文档质量参差不齐，系统采用三级降级策略：

1. **PyMuPDF**：快速提取数字 PDF 的干净文本
2. **pdfminer.six**：处理复杂布局的备选方案
3. **Tesseract OCR**：扫描件的最后手段

针对印度政府网站常见的 SSL 证书过期问题，系统实现了自动重试（跳过 SSL 验证）。同时包含垃圾内容检测，拒绝加密或纯图像 PDF 的乱码输出。

### Extractor Agent：正则优先的混合提取

这是系统最具成本效益的设计之一。使用 20+ 个正则模式处理印度数字格式（₹、lakhs、crores、天城文数字），解析 11 种日期格式。

关键优化：约 60% 的字段可以通过正则直接提取，无需任何 LLM 调用。只有当正则无法匹配时，才使用一次 LLM 调用同时完成字段补全和相关性分类。

提取字段包括：招标 ID、标题、机构、部门、保证金、招标费、预估金额、投标开始/截止日期、地点、范围、类别、相关性。

### Validator Agent：宽容的过滤策略

系统采用宁可错留，不可错杀的宽容策略：

- 拒绝明显的非招标文档（法院命令、财务报告、会议纪要）
- 修复常见数据错误（交换的日期、不合理的保证金金额）
- 不确定时保留文档，避免漏掉真实机会

### Analysis Agent：100 分制投标适配评分

评分体系包含三个维度：

- **数据完整性（30 分）**：成功提取的字段数量
- **活跃状态（30 分）**：招标是否仍在开放投标
- **内容质量（40 分）**：文本长度、范围清晰度、保证金存在性

同时根据保证金阈值给出难度评级（简单/中等/困难），并生成 LLM 撰写的三句话执行摘要。

### Bid Agent：个性化标书生成

使用公司资料（名称、类型、营业额、经验、认证、过往项目）个性化生成 5 部分投标书：

1. 执行摘要
2. 技术方案
3. 团队资质
4. 项目时间线
5. 合规声明

系统实现了 LLM 重试（3 秒退避）和结构化模板回退，确保即使 LLM 失败也能生成可用文档。

### Judge Agent：LLM-as-judge 质量评估

使用 Groq 的 Llama 3.3 70B 作为独立评委，从 5 个维度评估投标书质量（每项 1-5 分）：

- 招标契合度
- 合规性与可行性
- 专业语调
- 策略质量
- 报告完整性

关键安全设计：服务器端重新计算总分，从不信任 LLM 的算术结果。

## 工程实践亮点

### 成本与延迟优化

- **正则优先**：60% 字段无需 LLM 调用
- **单 LLM 调用**：提取 + 分类一次完成
- **延迟导入**：、 仅在需要时导入，防止 Vercel 崩溃
- **惰性求值**：设计模式减少不必要的计算

### 鲁棒性设计

- **SSL 弹性**：自动重试（跳过验证）应对政府网站证书问题
- **结构化回退**：LLM 失败时使用模板生成
- **宽容验证**：宁可包含不确定文档
- **垃圾检测**：拒绝乱码 PDF 输出

### 部署架构

- **后端**：FastAPI + Vercel Serverless（免费托管）
- **前端**：Streamlit Community Cloud
- **开发环境**：GitHub Codespaces 预配置容器
- **LLM 路由**：Groq 主用 + Ollama 本地回退

注意：Vercel 免费版有 10 秒函数超时，快速列表模式可用，但完整分析（下载 PDF + 多 LLM 调用）需要 3-5 分钟，建议升级到 Pro 版（300 秒超时）或自托管。

## 技术栈

| 组件 | 技术 | 用途 |
|------|------|------|
| 语言 | Python 3.12 | 后端运行时和 Agent 逻辑 |
| 后端 API | FastAPI | REST API 框架 + 异步支持 |
| 前端 UI | Streamlit | 交互式仪表板 |
| AI 生成 | Groq · Llama 3.3 70B | 提取、分析、标书生成 |
| AI 评估 | Groq · Llama 3.3 70B | LLM-as-Judge 质量评分 |
| AI 回退 | Ollama (本地) | Groq 不可用时本地 LLM |
| 网络搜索 | Tavily API | 政府门户实时搜索 |
| 语义搜索 | Exa API | 高召回率招标发现 |
| PDF 提取 | PyMuPDF → pdfminer → OCR | 三级提取流水线 |

## 适用场景与价值

BidGenius AI 主要面向：

- **中小企业**：缺乏专职投标团队，需要自动化工具降低参与门槛
- **政府采购顾问**：需要快速筛选和分析大量招标机会
- **跨地区业务**：需要在多个邦/市政区域同时监控招标
- **初次投标者**：不熟悉招标流程，需要引导和模板支持

核心价值在于将原本需要数天的投标准备工作压缩到 5 分钟，同时通过多 Agent 协作保证质量。

## 总结

BidGenius AI 是一个设计精良的多 Agent 系统，展示了如何将复杂的现实世界工作流程分解为专门化的 AI Agent 协作。其技术选择（正则优先的混合提取、宽容验证、LLM-as-judge）都体现了对成本、可靠性和用户体验的深思熟虑。对于关注 Agent 系统设计和政府采购自动化的开发者，这是一个值得深入研究的案例。
