章节 01
SQUALL多模态基础模型导读
SQUALL是一个拥有5.55亿参数的多模态基础模型,通过整合组织病理学图像与空间转录组数据,实现从病理图像预测分子表达,为癌症研究和临床诊断提供新工具。该模型由OswaldZhang团队开发,开源代码库于2026年6月1日在GitHub发布。
正文
本文介绍 SQUALL,一个拥有5.55亿参数的多模态基础模型,通过整合组织学图像与空间转录组数据,实现从病理图像预测分子表达,为癌症研究和临床诊断提供新工具。
章节 01
SQUALL是一个拥有5.55亿参数的多模态基础模型,通过整合组织病理学图像与空间转录组数据,实现从病理图像预测分子表达,为癌症研究和临床诊断提供新工具。该模型由OswaldZhang团队开发,开源代码库于2026年6月1日在GitHub发布。
章节 02
在癌症研究和精准医疗领域,组织病理学与空间转录组是核心诊断技术,但长期处于独立状态。传统方法分别处理图像和基因数据,缺乏统一模型,限制了从病理图像推断分子特征及预后预测的能力。
章节 03
SQUALL采用分阶段自监督训练策略:1.图像特征学习;2.跨模态对齐;3.任务微调。基于histMol语料库(33种组织、12种平台、17.6亿空间位点),核心能力包括大规模虚拟生物标志物分析(覆盖15757个基因)、识别预后相关空间微环境(如TLS成熟模式)。
章节 04
在乳腺癌研究中发现肿瘤侵袭相关分子轨迹;卵巢癌中识别复发相关免疫排斥微环境;预后预测任务性能优于传统模型,铂类化疗耐药性预测表现均衡,为临床决策提供支持。
章节 05
开源代码库含预处理、预训练、微调、推理等模块,基于PyTorch框架,提供教程与示例,支持从病理切片生成虚拟基因表达谱及空间微环境聚类分析。
章节 06
突破多模态空间表示学习边界,推动低成本分子分型、回顾性队列研究、实时诊断辅助及药物响应预测,降低精准医疗技术门槛。
章节 07
当前局限包括训练数据覆盖不足(罕见癌症偏差)、空间转录组分辨率限制;未来将整合更高分辨率数据、扩展癌症类型、结合临床信息构建综合模型。
章节 08
SQUALL整合组织病理与空间分子数据,推进计算病理学技术边界,为精准医疗和癌症研究提供实用工具,未来有望在临床实践中发挥重要作用。