Zing 论坛

正文

AgriChain:面向可解释农业视觉语言模型的专家验证推理数据集

本文介绍AgriChain数据集,包含约11000张专家精选的植物叶片图像,每张图像配有疾病标签、置信度评分和专家验证的思维链推理,基于此微调的AgriChain-VL3B模型在植物病害诊断上超越了Gemini和GPT-4o等强基线。

AgriChain农业视觉语言模型植物病害诊断思维链推理可解释AI专家验证可持续农业领域专门化
发布时间 2026/04/09 13:13最近活动 2026/04/10 10:23预计阅读 2 分钟
AgriChain:面向可解释农业视觉语言模型的专家验证推理数据集
1

章节 01

AgriChain数据集:可解释农业视觉语言模型的专家验证推理资源

本文介绍AgriChain数据集,包含约11000张专家精选植物叶片图像,每张配有疾病标签、置信度评分及专家验证思维链推理。基于该数据集微调的AgriChain-VL3B模型在植物病害诊断上超越Gemini、GPT-4o等强基线,为可解释农业AI提供关键支持。

2

章节 02

农业AI面临的核心挑战:准确性与可解释性

全球每年因病虫害损失20%-40%作物产量,专业病理学家稀缺。通用视觉语言模型(VLMs)在农业应用中存在两大问题:1. 缺乏农业场景专门训练,难以识别细微病害特征;2. 黑箱式预测缺乏可解释性,难以获取农民信任。

3

章节 03

AgriChain数据集构建与模型微调方法

AgriChain数据集含11000张叶片图像,标注包括疾病标签、校准置信度评分、专家验证思维链推理。标注生成采用人机协作:GPT-4o生成草稿,农业工程师审核修正,确保专业一致。基于Qwen2.5-VL-3B微调的AgriChain-VL3B模型,通过多任务学习同时进行病害分类与推理生成,提升准确性与可解释性。

4

章节 04

实验结果:AgriChain-VL3B超越通用大模型并具备高可解释性

测试集上AgriChain-VL3B取得73.1%Top-1准确率,宏平均F1=0.466,加权F1=0.655,显著超越Gemini 1.5 Flash、Gemini2.5 Pro、GPT-4o Mini等通用模型。其生成的推理解释与专家推理高度对齐,稳定引用关键视觉线索,兼具可信度与教育价值。

5

章节 05

技术贡献与对可持续农业的意义

技术贡献:1. 首批大规模带专家思维链标注的农业VL数据集;2. 人机协作标注流程实现scalable领域知识获取;3. 证明专门化微调可超越通用大模型。对可持续农业意义:减少农药滥用、促进农业知识传播、降低AI准入门槛,推动技术普惠。

6

章节 06

当前局限与未来研究方向

局限:数据集以叶片为主,覆盖作物部位有限;地域气候针对性强,跨地域泛化待验证。未来方向:扩展数据集至更多作物部位与类型;融合多模态数据(图像+传感器+气象);开发移动端应用方便农民使用。