Zing 论坛

正文

WamGLM:面向晶圆缺陷检测的多模态大语言模型

WamGLM结合原型监督对比学习与多轮对话框架,实现晶圆图缺陷的端到端识别与深度信息查询,在半导体制造质量管控领域展现多模态大模型的专业应用潜力。

多模态大语言模型晶圆缺陷检测半导体制造WamGLM对比学习多轮对话工业AI质量管控
发布时间 2026/05/12 16:26最近活动 2026/05/12 16:55预计阅读 2 分钟
WamGLM:面向晶圆缺陷检测的多模态大语言模型
1

章节 01

WamGLM:面向晶圆缺陷检测的多模态大语言模型导读

WamGLM是针对晶圆缺陷检测设计的多模态大语言模型,结合原型监督对比学习与多轮对话框架,实现晶圆图缺陷的端到端识别与深度信息查询,在半导体制造质量管控领域展现专业应用潜力。其核心创新在于视觉缺陷识别与自然语言问答能力的深度融合,为工业AI应用提供方法论参考。

2

章节 02

半导体制造质量管控的挑战与需求

半导体制造是精密资本密集型产业,晶圆质量决定产品良率。传统深度学习视觉模型虽能分类缺陷,但难以应对动态查询(如缺陷类型、成因、工艺调整、批次关联等)。这些问题需要模型具备图像理解、工艺知识关联及多轮推理能力,而多模态大语言模型(MLLMs)具备此潜在优势。

3

章节 03

WamGLM的技术架构与训练策略

技术架构

WamGLM采用端到端多模态架构:视觉编码器提取晶圆图特征,跨模态投影层对齐语言空间,语言模型主干生成回复,避免流水线误差累积。

原型监督对比学习(PSCL)

针对缺陷类别不平衡与类内多样性,PSCL学习类别原型向量,通过对比损失优化类内紧凑性与类间可分性,提升特征判别性。

WaferMapVMQA数据集

构建首个大规模晶圆缺陷多轮问答数据集,通过LLM交互生成专业对话,经人工审核确保质量,涵盖缺陷分类、成因分析等场景。

两阶段训练

1.视觉微调:用PSCL优化缺陷特征;2.语言微调:用WaferMapVMQA训练多轮对话能力,分离训练避免干扰。

4

章节 04

WamGLM的实验验证与性能表现

在真实晶圆数据集上验证:

  • 缺陷识别:优于现有方法,PSCL增强稀有缺陷与变体识别能力;
  • 信息查询:准确理解意图,多轮对话处理复杂追溯查询;
  • 消融实验:移除PSCL导致准确率下降,跳过视觉微调则图像理解不足,验证策略有效性。
5

章节 05

WamGLM的应用场景与产业价值

  • 在线质量监控:集成设备实时识别缺陷,自然语言回答操作员查询,降低专业依赖;
  • 缺陷根因分析:多轮查询追溯成因,关联工艺参数加速问题解决;
  • 知识传承:新员工通过交互学习缺陷知识,提升培训效率;
  • 历史数据挖掘:自然语言查询历史批次,发现质量趋势与优化机会。
6

章节 06

WamGLM的技术启示与扩展性

  • 领域专用模型:通用模型难满足工业精度,领域模型通过针对性数据与训练提升性能;
  • 原型学习普适性:PSCL适用于类内多样性与数据不平衡的视觉任务;
  • 对话数据构建:LLM交互生成领域对话可扩展到其他垂直领域,降低数据成本;
  • 三位一体融合:视觉感知、语言交互、领域知识深度融合是工业AI关键。
7

章节 07

WamGLM的局限性与未来方向

局限:仅针对晶圆图,对SEM图像等泛化待验证;上下文长度有限;罕见缺陷表现不佳。 未来方向:扩展支持更多半导体图像;引入检索增强生成连接实时数据库;开发模型解释能力;探索轻量化边缘部署。

8

章节 08

WamGLM研究总结

WamGLM通过PSCL提升视觉识别,构建多轮对话数据集注入领域知识,实现晶圆缺陷端到端识别与深度查询。为半导体质量管控提供新工具,也为工业多模态AI应用提供方法论:领域专用模型、针对性训练策略、高质量数据集是转化通用AI为工业价值的关键。