正文

AgriSense：融合CNN、RAG与Agentic工作流的智能农业病害检测系统

介绍AgriSense项目如何将卷积神经网络、检索增强生成和智能体工作流三种生成式AI范式相结合，构建面向农业病害诊断与治疗方案推荐的智能系统。

农业AI病害检测RAGAgentic WorkflowResNet50大语言模型智能农业计算机视觉

发布时间 2026/04/10 13:11最近活动 2026/04/10 13:23预计阅读 5 分钟

AgriSense：融合CNN、RAG与Agentic工作流的智能农业病害检测系统

章节 01

AgriSense项目导读：融合多AI范式的智能农业病害检测系统

AgriSense是一个融合卷积神经网络（CNN）、检索增强生成（RAG）与智能体工作流（Agentic Workflow）三种生成式AI范式的智能农业病害检测系统，旨在解决传统人工诊断效率低、覆盖有限的问题，提供从病害识别到治疗建议的端到端智能解决方案。

章节 02

项目背景与研究动机

农业病害的早期识别与精准防治是保障粮食安全的关键环节。传统的人工诊断方式依赖专家经验，存在识别效率低、覆盖范围有限等问题。随着深度学习和大语言模型技术的发展，将计算机视觉与自然语言处理技术相结合，构建智能化的农业病害诊断系统成为可能。

AgriSense项目正是在这一背景下诞生，它是一个课程研究项目，旨在探索如何将三种前沿的生成式AI范式——卷积神经网络视觉识别、检索增强生成和智能体工作流——有机融合，为农作物病害提供从识别到治疗建议的端到端智能解决方案。

章节 03

系统架构设计：三层模块化协作

系统架构设计

AgriSense采用了模块化的三层架构设计，每一层负责不同的功能，通过清晰的接口进行协作：

视觉识别层：基于ResNet50的CNN模型

系统使用经过PlantVillage数据集微调的ResNet50模型进行植物病害分类。PlantVillage是一个包含数万张植物叶片图像的公开数据集，涵盖了多种作物的常见病害类型。通过在大量标注数据上的训练，模型能够准确识别叶片上的病斑特征，输出病害类别预测。

ResNet50作为经典的深度残差网络，在图像分类任务上表现稳定，其残差连接设计有效解决了深层网络的梯度消失问题，使得模型在农业图像这种细粒度分类任务上也能保持较高的准确率。

知识检索层：TF-IDF驱动的RAG架构

单纯的视觉识别只能告诉用户"这是什么病"，但农民更需要知道"怎么治疗"。为此，系统引入了检索增强生成（RAG）架构，将大语言模型的生成能力与领域知识库相结合。

知识库采用Markdown和纯文本格式存储农业病害管理相关的专业内容，包括：

病害详细描述（症状表现、致病因素、易感作物）
治疗方案（化学防治和有机防治方法）
农药使用指导（剂量、施用时机、注意事项）
作物栽培管理建议

系统使用TF-IDF算法对知识库文档进行向量化索引，当用户查询时，通过计算查询与文档块的相似度，检索出最相关的top-k个文本片段。这些片段作为上下文信息注入到后续的大语言模型生成过程中，确保输出的治疗建议有据可依，有效降低了模型幻觉的风险。

智能决策层：Plan-Draft-Reflect三段式工作流

这是AgriSense最具创新性的设计。系统不满足于简单的单次检索-生成流程，而是引入了智能体工作流（Agentic Workflow）模式，通过Plan→Draft→Reflect三个阶段逐步优化输出质量：

Plan阶段：智能体首先分析用户查询，将其分解为结构化的诊断策略。例如，对于"我的番茄叶子发黄卷曲是什么原因"这样的问题，系统会规划出"识别症状特征→匹配可能病因→推荐验证方法→给出初步建议"的诊断路径。

Draft阶段：基于Plan阶段确定的策略和RAG检索到的相关知识片段，生成初步的咨询回复。回复中会自动引用知识库中的相关段落，增强可信度。

Reflect阶段：智能体对Draft阶段的输出进行自我审查，检查是否存在事实错误、逻辑漏洞或遗漏的关键信息。如果发现问题，会触发修订机制，重新生成更准确的回复。这个自我反思的过程虽然会增加约1-2秒的延迟，但能显著提升回答的事实准确性。

章节 04

技术实现细节：灵活模型与用户友好界面

技术实现细节

多LLM后端支持

系统设计上支持灵活的模型切换：

OpenAI API模式：使用GPT-4o或GPT-4o-mini，适合在线环境，提供最强的生成质量
MockLLM模式：离线演示模式，无需API密钥即可运行，适合课程展示和无网络环境

这种设计让系统既能在生产环境发挥最强性能，也能在教学和资源受限场景下正常使用。

流式交互界面

系统基于Streamlit框架构建了简洁的Web界面，支持：

图像上传与实时病害识别
自然语言对话式咨询
生成过程的流式展示
引用来源的透明展示

界面设计充分考虑了农民用户的使用习惯，力求简单直观，降低技术门槛。

章节 05

实验设计与评估方法：验证各组件贡献

实验设计与评估方法

项目建议从三个维度进行对比实验，以验证各组件的贡献：

实验一：基线LLM（无检索）

直接使用大语言模型回答农业问题，不注入任何外部知识。主要观察指标是幻觉率和事实正确性。

实验二：RAG增强（单次生成）

引入TF-IDF检索，将相关知识片段作为上下文注入提示词。观察回答相关性和忠实度（faithfulness）的改善。

实验三：完整Agentic RAG（三段式工作流）

启用完整的Plan-Draft-Reflect流程。除了前述指标外，还需测量每次请求的延迟和整体事实准确率的提升。

建议记录的评估指标包括：

回答质量评分（人工1-5分或自动化faithfulness分数）
引用正确性（回答是否准确引用了检索到的知识片段）
单次请求延迟（秒）
幻觉率（包含未经验证声明的回答百分比）

章节 06

知识库构建最佳实践：提升系统性能的关键

知识库构建最佳实践

项目文档特别强调了知识库质量对系统性能的关键影响：

内容覆盖：知识库应尽可能覆盖目标作物的常见病害类型、症状描述、致病机理、防治方法等全方位信息。内容越专业、越全面，系统的幻觉率就越低。

检索参数调优：建议将top_k设置在3-5之间。过小的值可能导致信息覆盖不全，过大的值则会引入噪声并超出模型的token限制。

结构化存储：使用Markdown格式存储知识，利用标题层级帮助系统更好地理解文档结构，提升检索的精准度。

章节 07

应用场景与社会价值：赋能农业从业者与教育

应用场景与社会价值

AgriSense的设计目标是为农业从业者提供一个可信赖的智能咨询助手：

对小农户：降低获取专业农业知识的门槛，在没有专家现场指导的情况下也能获得及时、准确的病害诊断和治疗建议。

对农业技术推广人员：作为辅助工具，帮助快速识别病害、查询防治方案，提高服务效率。

对农业教育：作为教学案例，展示如何将多种AI技术融合解决实际农业问题，培养学生的跨技术整合能力。

章节 08

技术启示与展望：跨范式融合的垂直领域应用

技术启示与展望

AgriSense项目展示了AI技术在垂直领域应用的一个重要趋势：单一技术往往难以解决复杂实际问题，需要将多种范式有机结合。计算机视觉负责"看见"，RAG负责"知道"，Agentic Workflow负责"思考"，三者协同才能提供真正有用的智能服务。

这种架构设计思路不仅适用于农业病害检测，也可以推广到医疗诊断、工业质检、法律咨询等其他需要多模态输入和知识密集型推理的领域。未来，随着多模态大模型和工具使用能力的进一步发展，这类系统的智能化水平还将持续提升。

AgriSense：融合CNN、RAG与Agentic工作流的智能农业病害检测系统

AgriSense项目导读：融合多AI范式的智能农业病害检测系统

项目背景与研究动机

项目背景与研究动机

系统架构设计：三层模块化协作

系统架构设计

视觉识别层：基于ResNet50的CNN模型

知识检索层：TF-IDF驱动的RAG架构

智能决策层：Plan-Draft-Reflect三段式工作流

技术实现细节：灵活模型与用户友好界面

技术实现细节

多LLM后端支持

流式交互界面

实验设计与评估方法：验证各组件贡献

实验设计与评估方法

实验一：基线LLM（无检索）

实验二：RAG增强（单次生成）

实验三：完整Agentic RAG（三段式工作流）

知识库构建最佳实践：提升系统性能的关键

知识库构建最佳实践

应用场景与社会价值：赋能农业从业者与教育

应用场景与社会价值

技术启示与展望：跨范式融合的垂直领域应用

技术启示与展望

继续阅读

Nornir MCP Server：将大语言模型引入网络自动化的企业级桥梁

Bibliothèque Française LLM：为大型语言模型优化的法语公版文献索引系统

Splinter：一款无锁零拷贝的共享内存 KV 与向量存储库，让 LLM 推理告别 socket 与 memcpy 开销

Folkering OS：当操作系统本身就是 AI——一个能自我进化的裸机 Rust 系统