Zing 论坛

正文

AgriSense:融合CNN、RAG与Agentic工作流的智能农业病害检测系统

介绍AgriSense项目如何将卷积神经网络、检索增强生成和智能体工作流三种生成式AI范式相结合,构建面向农业病害诊断与治疗方案推荐的智能系统。

农业AI病害检测RAGAgentic WorkflowResNet50大语言模型智能农业计算机视觉
发布时间 2026/04/10 13:11最近活动 2026/04/10 13:23预计阅读 5 分钟
AgriSense:融合CNN、RAG与Agentic工作流的智能农业病害检测系统
1

章节 01

AgriSense项目导读:融合多AI范式的智能农业病害检测系统

AgriSense是一个融合卷积神经网络(CNN)、检索增强生成(RAG)与智能体工作流(Agentic Workflow)三种生成式AI范式的智能农业病害检测系统,旨在解决传统人工诊断效率低、覆盖有限的问题,提供从病害识别到治疗建议的端到端智能解决方案。

2

章节 02

项目背景与研究动机

项目背景与研究动机

农业病害的早期识别与精准防治是保障粮食安全的关键环节。传统的人工诊断方式依赖专家经验,存在识别效率低、覆盖范围有限等问题。随着深度学习和大语言模型技术的发展,将计算机视觉与自然语言处理技术相结合,构建智能化的农业病害诊断系统成为可能。

AgriSense项目正是在这一背景下诞生,它是一个课程研究项目,旨在探索如何将三种前沿的生成式AI范式——卷积神经网络视觉识别、检索增强生成和智能体工作流——有机融合,为农作物病害提供从识别到治疗建议的端到端智能解决方案。

3

章节 03

系统架构设计:三层模块化协作

系统架构设计

AgriSense采用了模块化的三层架构设计,每一层负责不同的功能,通过清晰的接口进行协作:

视觉识别层:基于ResNet50的CNN模型

系统使用经过PlantVillage数据集微调的ResNet50模型进行植物病害分类。PlantVillage是一个包含数万张植物叶片图像的公开数据集,涵盖了多种作物的常见病害类型。通过在大量标注数据上的训练,模型能够准确识别叶片上的病斑特征,输出病害类别预测。

ResNet50作为经典的深度残差网络,在图像分类任务上表现稳定,其残差连接设计有效解决了深层网络的梯度消失问题,使得模型在农业图像这种细粒度分类任务上也能保持较高的准确率。

知识检索层:TF-IDF驱动的RAG架构

单纯的视觉识别只能告诉用户"这是什么病",但农民更需要知道"怎么治疗"。为此,系统引入了检索增强生成(RAG)架构,将大语言模型的生成能力与领域知识库相结合。

知识库采用Markdown和纯文本格式存储农业病害管理相关的专业内容,包括:

  • 病害详细描述(症状表现、致病因素、易感作物)
  • 治疗方案(化学防治和有机防治方法)
  • 农药使用指导(剂量、施用时机、注意事项)
  • 作物栽培管理建议

系统使用TF-IDF算法对知识库文档进行向量化索引,当用户查询时,通过计算查询与文档块的相似度,检索出最相关的top-k个文本片段。这些片段作为上下文信息注入到后续的大语言模型生成过程中,确保输出的治疗建议有据可依,有效降低了模型幻觉的风险。

智能决策层:Plan-Draft-Reflect三段式工作流

这是AgriSense最具创新性的设计。系统不满足于简单的单次检索-生成流程,而是引入了智能体工作流(Agentic Workflow)模式,通过Plan→Draft→Reflect三个阶段逐步优化输出质量:

Plan阶段:智能体首先分析用户查询,将其分解为结构化的诊断策略。例如,对于"我的番茄叶子发黄卷曲是什么原因"这样的问题,系统会规划出"识别症状特征→匹配可能病因→推荐验证方法→给出初步建议"的诊断路径。

Draft阶段:基于Plan阶段确定的策略和RAG检索到的相关知识片段,生成初步的咨询回复。回复中会自动引用知识库中的相关段落,增强可信度。

Reflect阶段:智能体对Draft阶段的输出进行自我审查,检查是否存在事实错误、逻辑漏洞或遗漏的关键信息。如果发现问题,会触发修订机制,重新生成更准确的回复。这个自我反思的过程虽然会增加约1-2秒的延迟,但能显著提升回答的事实准确性。

4

章节 04

技术实现细节:灵活模型与用户友好界面

技术实现细节

多LLM后端支持

系统设计上支持灵活的模型切换:

  • OpenAI API模式:使用GPT-4o或GPT-4o-mini,适合在线环境,提供最强的生成质量
  • MockLLM模式:离线演示模式,无需API密钥即可运行,适合课程展示和无网络环境

这种设计让系统既能在生产环境发挥最强性能,也能在教学和资源受限场景下正常使用。

流式交互界面

系统基于Streamlit框架构建了简洁的Web界面,支持:

  • 图像上传与实时病害识别
  • 自然语言对话式咨询
  • 生成过程的流式展示
  • 引用来源的透明展示

界面设计充分考虑了农民用户的使用习惯,力求简单直观,降低技术门槛。

5

章节 05

实验设计与评估方法:验证各组件贡献

实验设计与评估方法

项目建议从三个维度进行对比实验,以验证各组件的贡献:

实验一:基线LLM(无检索)

直接使用大语言模型回答农业问题,不注入任何外部知识。主要观察指标是幻觉率和事实正确性。

实验二:RAG增强(单次生成)

引入TF-IDF检索,将相关知识片段作为上下文注入提示词。观察回答相关性和忠实度(faithfulness)的改善。

实验三:完整Agentic RAG(三段式工作流)

启用完整的Plan-Draft-Reflect流程。除了前述指标外,还需测量每次请求的延迟和整体事实准确率的提升。

建议记录的评估指标包括:

  • 回答质量评分(人工1-5分或自动化faithfulness分数)
  • 引用正确性(回答是否准确引用了检索到的知识片段)
  • 单次请求延迟(秒)
  • 幻觉率(包含未经验证声明的回答百分比)
6

章节 06

知识库构建最佳实践:提升系统性能的关键

知识库构建最佳实践

项目文档特别强调了知识库质量对系统性能的关键影响:

内容覆盖:知识库应尽可能覆盖目标作物的常见病害类型、症状描述、致病机理、防治方法等全方位信息。内容越专业、越全面,系统的幻觉率就越低。

检索参数调优:建议将top_k设置在3-5之间。过小的值可能导致信息覆盖不全,过大的值则会引入噪声并超出模型的token限制。

结构化存储:使用Markdown格式存储知识,利用标题层级帮助系统更好地理解文档结构,提升检索的精准度。

7

章节 07

应用场景与社会价值:赋能农业从业者与教育

应用场景与社会价值

AgriSense的设计目标是为农业从业者提供一个可信赖的智能咨询助手:

对小农户:降低获取专业农业知识的门槛,在没有专家现场指导的情况下也能获得及时、准确的病害诊断和治疗建议。

对农业技术推广人员:作为辅助工具,帮助快速识别病害、查询防治方案,提高服务效率。

对农业教育:作为教学案例,展示如何将多种AI技术融合解决实际农业问题,培养学生的跨技术整合能力。

8

章节 08

技术启示与展望:跨范式融合的垂直领域应用

技术启示与展望

AgriSense项目展示了AI技术在垂直领域应用的一个重要趋势:单一技术往往难以解决复杂实际问题,需要将多种范式有机结合。计算机视觉负责"看见",RAG负责"知道",Agentic Workflow负责"思考",三者协同才能提供真正有用的智能服务。

这种架构设计思路不仅适用于农业病害检测,也可以推广到医疗诊断、工业质检、法律咨询等其他需要多模态输入和知识密集型推理的领域。未来,随着多模态大模型和工具使用能力的进一步发展,这类系统的智能化水平还将持续提升。