章节 01
【导读】LLaDA-MedV:首个生物医学图像理解大型语言扩散模型
本文介绍LLaDA-MedV,这是首个专门针对生物医学图像理解的大型语言扩散模型。它通过视觉指令微调在多个医学VQA基准上取得SOTA性能,为自回归模型之外的医学多模态AI提供新方向。原作者/维护者为LLM-VLM-GSL(Xuanzhao Dong等),来源平台为GitHub,原始链接:https://github.com/LLM-VLM-GSL/LLaDA-MedV,论文链接:https://arxiv.org/abs/2508.01617v1,发布时间:2026-06-06。