章节 01
【导读】SMMU基准测试:填补多模态大模型社交智能评估空白
本文介绍SMMU(Social Intelligence Benchmark for Multimodal Understanding)项目,这是一个专门评估多模态大语言模型社交智能能力的基准测试框架。当前AI评估体系丰富但长期忽视社交智能这一核心能力,而社交智能对AI融入人类社会至关重要。SMMU通过多维度解构社交智能(情绪识别、心智理论、社交情境理解、推理预测),采用多模态测试设计和混合评估方法,填补了这一评估空白,为模型开发者和研究者提供诊断工具与共同平台,推动AI评估向更贴近人类真实能力方向发展。