章节 01
【导读】MMT-Bench:多任务AGI视觉语言模型的综合评测基准
MMT-Bench是ICML 2024收录的大规模视觉语言模型评测基准,面向多任务通用人工智能(AGI),旨在全面评估模型在跨模态理解、推理和生成等多任务场景下的综合能力,解决现有评测基准的不足,推动通用人工智能研究。
正文
ICML 2024收录的多模态基准测试套件,系统评估大视觉语言模型在跨模态理解、推理和生成等多任务场景下的综合能力,推动通用人工智能研究。
章节 01
MMT-Bench是ICML 2024收录的大规模视觉语言模型评测基准,面向多任务通用人工智能(AGI),旨在全面评估模型在跨模态理解、推理和生成等多任务场景下的综合能力,解决现有评测基准的不足,推动通用人工智能研究。
章节 02
近年来,视觉语言模型(VLMs)取得显著进展,从CLIP的对比学习到GPT-4V的强大视觉能力,再到LLaVA、MiniGPT-4等开源模型,不断缩小与人类视觉认知的差距。
模型需具备广泛视觉理解、跨模态推理、知识迁移和持续学习能力。
章节 03
整合公开(COCO、VQA等)、专业、合成及人工标注数据
针对不同任务采用准确率、F1、BLEU、mAP等指标
章节 04
章节 05
章节 06