章节 01
【导读】多模态大语言模型评测基准全景综述:200+基准的系统梳理与未来展望
标题:多模态大语言模型评测基准全景综述:200+基准的系统梳理与未来展望 来源:腾讯联合北京大学、新加坡国立大学、东南大学、南京大学团队(原作者/维护者:swordlidev),发布于GitHub(链接:https://github.com/swordlidev/Evaluation-Multimodal-LLMs-Survey),发布时间2026-05-26。 核心观点:本文系统综述200+多模态大语言模型(MLLM)评测基准,涵盖感知理解、认知推理、特定领域应用、关键能力与多模态扩展五大维度,为MLLM系统性评估提供全面研究框架与方向指引。