章节 01
PestLife基准导读:首次聚焦水稻虫害生命周期感知的多模态评测
华南农业大学团队发布PestLife基准,这是首个将虫害生长阶段识别纳入多模态大模型评测体系的基准。通过三级分层框架系统评估39个SOTA模型,揭示阶段识别是当前农业AI的显著瓶颈。该基准旨在弥合模型评测与实际农业应用需求的鸿沟,推动智慧农业的精准虫害管理。
正文
华南农业大学团队发布PestLife基准,首次将虫害生长阶段识别纳入多模态大模型评测体系,通过三级分层框架系统评估39个SOTA模型,揭示阶段识别是当前农业AI的显著瓶颈。
章节 01
华南农业大学团队发布PestLife基准,这是首个将虫害生长阶段识别纳入多模态大模型评测体系的基准。通过三级分层框架系统评估39个SOTA模型,揭示阶段识别是当前农业AI的显著瓶颈。该基准旨在弥合模型评测与实际农业应用需求的鸿沟,推动智慧农业的精准虫害管理。
章节 02
全球水稻种植面临严峻虫害威胁,精准防控需识别害虫种类及生长阶段(不同阶段危害与防治策略差异大)。当前依赖专家经验效率低,基层普及难。多模态大模型为农业智能化提供路径,但现有评测将害虫识别简化为单一分类,忽略生命周期感知,导致模型实验室表现与田间应用脱节。
章节 03
PestLife的核心创新是三级能力维度(物种识别S、阶段识别T、知识应用K)及三级分层评测框架(Level1单能力、Level2双能力组合、Level3端到端综合)。数据集构建严格:多渠道收集35种水稻害虫1195张图像(经聚类去冗余、专家核验),生成12305组问答对(分层设计、多阶段过滤、专家校验),并设持续扩展的众包机制。
章节 04
对39个SOTA模型(32多模态+7纯文本)零样本评测发现:1.阶段识别(T)是显著瓶颈,即使物种识别优的模型阶段判断准确率低;2.通用视觉-语言模型在农业细粒度任务上未必领先;3.端到端推理中误差累积问题突出。控制实验验证阶段信息缺失显著降低防控建议准确性。
章节 05
PestLife填补农业垂直领域评测空白,首次纳入生命周期感知;评测结果可指导农业AI产品能力边界评估;三级框架可迁移至其他作物病虫害场景。团队已公开数据集和代码,鼓励社区扩展优化。
章节 06
PestLife标志农业AI评测从“物种识别”向“生命周期感知”转变。当前多模态模型在细粒度农业视觉任务仍有提升空间,贴近真实场景的基准将成为学术与产业的桥梁,助力农业数字化转型。