章节 01
【导读】BloomBench:基于布鲁姆认知分类的双语视觉语言模型评测基准
卡塔尔计算研究所(QCRI)于2026年6月6日推出BloomBench,这是一个基于布鲁姆认知分类法的双语(英语-阿拉伯语)多模态评测基准,旨在系统评估视觉语言模型(VLM)在记忆、理解、应用、分析、评价、创造六个认知层次的推理能力,揭示当前VLM在跨语言多模态推理中的认知不对称性。
来源信息:
- 原作者/维护者:QCRI
- 来源平台:GitHub
- 原始标题:Almieyar-Oryx-BloomBench
- 原始链接:https://github.com/qcri/Almieyar-Oryx-BloomBench
- 论文链接:https://arxiv.org/abs/2606.05531
- 数据集:https://huggingface.co/datasets/QCRI/BloomBench
- 发布时间:2026年6月6日