章节 01
【导读】LLM-SOTIF:大视觉语言模型在SOTIF条件下的目标检测评估
LLM-SOTIF是格拉茨工业大学ftg团队开发的开源项目,旨在系统评估大视觉语言模型(LVLMs)在SOTIF(预期功能安全)条件下的2D目标检测性能。该研究构建了SOTIF基准测试集,对比主流LVLMs(含开源与闭源),提供性能分析框架及开源实现,为自动驾驶等安全关键应用的视觉感知系统选型与改进提供重要性能基准。
正文
一项针对大视觉语言模型在 SOTIF(预期功能安全)条件下进行 2D 目标检测的对比评估研究,为自动驾驶等安全关键应用中的视觉感知系统提供了重要的性能基准。
章节 01
LLM-SOTIF是格拉茨工业大学ftg团队开发的开源项目,旨在系统评估大视觉语言模型(LVLMs)在SOTIF(预期功能安全)条件下的2D目标检测性能。该研究构建了SOTIF基准测试集,对比主流LVLMs(含开源与闭源),提供性能分析框架及开源实现,为自动驾驶等安全关键应用的视觉感知系统选型与改进提供重要性能基准。
章节 02
大视觉语言模型(LVLMs)在通用视觉任务表现出色,但安全关键应用(如自动驾驶)中的性能需深入评估。SOTIF(ISO21448标准)关注系统正常运行时因性能限制导致的安全风险,如恶劣天气下检测失败、罕见目标误识别等。LLM-SOTIF项目旨在填补LVLMs在SOTIF场景下的评估空白。
章节 03
除标准检测指标(mAP/Recall/Precision)外,重点关注:
探索零样本、少样本、链式思维、结构化输出等提示对性能的影响。
章节 04
章节 05
采用针对自动驾驶场景优化的提示,要求模型以JSON格式返回目标类别、边界框、置信度。
章节 06
章节 07
章节 08
LLM-SOTIF首次系统评估了LVLMs在SOTIF条件下的目标检测性能,揭示了当前技术的优势与局限。该研究为安全关键应用(如自动驾驶)的视觉感知系统选型、改进提供了宝贵参考,对工程师和研究者具有重要实践指导意义。随着LVLMs发展,此类安全评估将愈发重要。