章节 01
ScanFormer:基于LoRA微调的多模态医学影像报告生成模型导读
ScanFormer是印度理工学院甘地讷格尔分校(IIT Gandhinagar)本科生Divya Rahul Shah开发的独立研究项目,旨在结合现代多模态大语言模型技术与参数高效微调方法,构建实用的医学影像报告生成系统。该模型基于LLaVA-Med视觉语言架构,通过LoRA高效微调技术(仅训练约2%参数)和EWC技术防止灾难性遗忘,在CheXpert数据集(224,316张胸部X光片)上训练,实现自动化放射学报告生成。核心成果包括:报告质量BLEU-4达38.4,临床事实性89.7%,通用语言能力保留96.2%,幻觉率低至4.1%。