章节 01
AgriChain数据集:可解释农业视觉语言模型的专家验证推理资源
本文介绍AgriChain数据集,包含约11000张专家精选植物叶片图像,每张配有疾病标签、置信度评分及专家验证思维链推理。基于该数据集微调的AgriChain-VL3B模型在植物病害诊断上超越Gemini、GPT-4o等强基线,为可解释农业AI提供关键支持。
正文
本文介绍AgriChain数据集,包含约11000张专家精选的植物叶片图像,每张图像配有疾病标签、置信度评分和专家验证的思维链推理,基于此微调的AgriChain-VL3B模型在植物病害诊断上超越了Gemini和GPT-4o等强基线。
章节 01
本文介绍AgriChain数据集,包含约11000张专家精选植物叶片图像,每张配有疾病标签、置信度评分及专家验证思维链推理。基于该数据集微调的AgriChain-VL3B模型在植物病害诊断上超越Gemini、GPT-4o等强基线,为可解释农业AI提供关键支持。
章节 02
全球每年因病虫害损失20%-40%作物产量,专业病理学家稀缺。通用视觉语言模型(VLMs)在农业应用中存在两大问题:1. 缺乏农业场景专门训练,难以识别细微病害特征;2. 黑箱式预测缺乏可解释性,难以获取农民信任。
章节 03
AgriChain数据集含11000张叶片图像,标注包括疾病标签、校准置信度评分、专家验证思维链推理。标注生成采用人机协作:GPT-4o生成草稿,农业工程师审核修正,确保专业一致。基于Qwen2.5-VL-3B微调的AgriChain-VL3B模型,通过多任务学习同时进行病害分类与推理生成,提升准确性与可解释性。
章节 04
测试集上AgriChain-VL3B取得73.1%Top-1准确率,宏平均F1=0.466,加权F1=0.655,显著超越Gemini 1.5 Flash、Gemini2.5 Pro、GPT-4o Mini等通用模型。其生成的推理解释与专家推理高度对齐,稳定引用关键视觉线索,兼具可信度与教育价值。
章节 05
技术贡献:1. 首批大规模带专家思维链标注的农业VL数据集;2. 人机协作标注流程实现scalable领域知识获取;3. 证明专门化微调可超越通用大模型。对可持续农业意义:减少农药滥用、促进农业知识传播、降低AI准入门槛,推动技术普惠。
章节 06
局限:数据集以叶片为主,覆盖作物部位有限;地域气候针对性强,跨地域泛化待验证。未来方向:扩展数据集至更多作物部位与类型;融合多模态数据(图像+传感器+气象);开发移动端应用方便农民使用。