欢迎访问装备制造资讯网!

装备制造资讯网

您现在的位置是: 首页 > 制造技术 >详情

晶圆制造应用架构及技术(通用晶圆生产系统的监控架构,具有怎样的分布性?)

发布时间:2024-02-29 09:31:53 制造技术 664次 作者:装备制造资讯网

文|奇迹末班车

编辑|奇迹末班车

晶圆制造应用架构及技术(通用晶圆生产系统的监控架构,具有怎样的分布性?)

前言

半导体制造代表了世界上最高水平的微细加工,晶圆生产是半导体制造中的关键步骤,包括光刻、刻蚀、沉积、化学机械平坦化(CMP)、氧化、离子注入、扩散等许多复杂工艺,刻蚀、沉积、氧化等工艺导致在具有不平坦表面的晶圆中,包括更高的台阶和更大的沟槽,CMP技术是构建晶圆结构的重要方式。

材料去除率

材料去除率(MRR)是CMP工艺中的一个关键变量,每片晶圆都需要抛光到目标厚度,因此,需要准确的MRR估计来准确设置抛光时间。

然而,MRR测量困难且成本高,同时可能对晶圆造成损坏,在这个阶段,MRR依靠工程经验和频率非常低的实际测量作为参考来完成设置和调整。(例如,一批次只选择一个晶圆进行测量,或者以固定的时间间隔测量一个晶圆)

在工业生产中,为了准确估计一个重要但难以测量的变量,习惯对该变量与容易获取的环境变量、设备参数、中间变量等之间的关系进行建模,用物理规律或方法完成预测,此过程称为虚拟计量(VM)。

VM由两种主要形式组成:基于物理的模型和基于数据的模型,基于物理的模型通过分析过程的物理和化学反应来建立数学表达式。

一些现有的基于物理的模型通过分析CMP过程的物理和化学反应来构建基于全局的数学表达式,其他模型侧重于某些变量在CMP过程中的作用以及对MRR的影响,然而,CMP过程涉及的变量太多,以至于明确的数学表达式和基于物理的模型很难涵盖所有这些变量。

同时,CMP过程的持续时间很长,在一个运行周期中,CMP过程经过多个运行点,将过程分为多个阶段,不同阶段变量之间的不同关系也导致物理模型的不断变化。

基于全局的物理模型很难在过程变化方面进行详细描述,随着数据科学的不断发展,单个机器学习模型不适合CMP过程,因此一些研究使用了堆叠模型。

CMP过程连续运行,需要动态预测MRR,结合k最近邻(kNN)和高斯过程回归(GPR)动态预测MRR,其中kNN搜索历史数据作为参考样本,多任务高斯过程(MTGP)模型结合了训练数据和参考样本信息。

另一种动态预测模型,来自历史数据的参考样本通过支持向量回归(SVR)与数据样本融合,粒子滤波器(PF)估计和更新预测结果并确保模型能够跟踪变化CMP过程。

基于物理模型和数据模型相结合的预测方法,推导出MRR的公式,该模型考虑了抛光垫、磨料和晶片之间的接触,公式中的抛光垫表面拓扑项是使用RF估算的。

基于先验获得的知识和晶圆分类的物理模型应用晶圆和抛光设备之间的动力学和接触,他们还提出分类和回归方法,其中通过下采样和扩展获得特征提取剂量和压力变量,这些方法将CMP过程的物理分析添加到数据模型中,然而,与基于物理的VM模型类似,物理分析侧重于一些重要变量,但不能涵盖所有变量对MRR的影响。

神经网络和深度学习的研究提供了新的思路,使用自动编码器和k均值聚类来确定训练样本的特征空间,并将编码器-解码器的重建损失和聚类误差结合起来形成损失函数。

将超图卷积网络应用于MRR预测,在数据预处理阶段,采用分段聚合近似(PAA)方法进行时间序列对齐和降维,在预测阶段,使用超图模型来表示设备和变量之间的复杂关系,马吉平托等。

使用深度学习方法对具有空间和时间演化的光发射光谱(OES)图像进行建模,以构建视觉2D数据的VM模型,设计了一个结合CNN和高斯过程回归(GPR)的VM模型,以解决VM模型和特征之间的不匹配问题,使用CNN进行特征提取,用GPR进行质量变量的预测,深度学习方法可以充分挖掘过程特征和变量之间的关系,但需要大量数据,否则,存在过度拟合的风险,但是,由于测量MRR比较困难,因此CMP工艺的数据较少。

关于已建立的MRR预测方法,有一些改进点,首先,CMP过程是一个批处理过程,其过程数据具有三个维度:批次、变量和时间。

同时CMP过程涉及多个阶段,工作点随着时间的推移而变化,不同批次和阶段的持续时间并不相同。大多数现有的预测方法提取过程的整体特征而忽略阶段特征。

其次机器学习的特征提取仅涉及统计特征,以及持续时间和最近邻等其他特征,对CMP工艺数据中的深层特征和深层信息的挖掘不够充分,而且值得注意的是,由于MRR不易测量,大量晶圆缺少MRR而成为未标记样品。

有一种用于MRR预测的半监督深度核主动学习方法,主要贡献如下:

首先,半监督主动学习框架可以充分开发和利用有关未标记样本的信息,在此框架下,半监督回归将未标记样本的不确定性纳入损失函数,而主动学习(AL)可以弥补SSR中样本代表性和多样性不足的弱点。

其次,基于聚类的相位划分和相位匹配算法用于提取相位特征,神经网络通过复杂的网络连接对复杂的多相过程进行更深入的识别和拟合,我们基于CMP过程数据的实验表明,所提出的方法在MRR的预测精度方面取得了良好的效果。

在实际生产中,许多批处理过程具有多阶段和不等长的特点,并且存在大量未标记的样本,因此,所提出的方法可以扩展到这些过程,在特征提取阶段,使用相位划分和相位匹配提取特征数据,在预测阶段,结合DKL、SSR和AL进行预测。

半监督深度核主动学习

值得注意的是,由于对MRR进行抽样检测,大量样本漏掉了MRR,应注意使用标记和未标记样本的半监督回归(SSR)方法,SSR被分为四类:半监督核回归、多视图回归、图正则化回归和半监督GPR。

其中,半监督GPR模型由对数似然函数中的两个分量组成:自变量和因变量与标记样本基于请求参数的联合分布,以及与未标记样本基于请求参数的联合分布似然函数参数,通过推导得到最大化对数似然函数的参数值。

结合深度学习和高斯过程的半监督深度核学习(SSDKL)方法以深度神经网络(DNN)为核函数,优化目标函数同时包括对数似然函数和未标记的预测方差样本,后者被用作正则化项以抑制模型的过度拟合。

在SSR中,通过添加预测方差作为损失函数的正则化项来捕获未标记样本的信息,与基于协同训练的SSR相比,SSDKL中的未标注样本和伪标签并没有加入到标注样本集中,而是通过改变损失函数,对模型的参数产生影响。

未标记的样本为模型改进提供了信息基础,但没有考虑代表性和多样性,同时SSR中的少量标记样本很可能分布不均,无法完全覆盖样本的整体分布,主动学习(AL)可以弥补这一弱点,AL允许模型自己选择重要的样本,从而以更少的训练样本获得更高的性能。

分布式监管架构的实现

许多文章都解决了在PLC中实施模块化监控方案的问题,已经使用符合国际标准IEC61131–3(2013)的梯形图介绍了实时工业控制器(例如PLC)的各种模块化监控方案的实现。

具体地说,每个本地控制单元都实现了特定数量的具有预定义复杂性的监管者,每个本地控制单元的监控器可以通过经典梯形图或使用梯形图或基于结构化文本的语言的功能块来实现。

它们可以很容易地在IEC61499功能块的事件驱动架构中实现,带有参数输入/输出信号,此处提出的监督控制体系结构的上述特征有助于监督者的实施,因为它们可以通过为每个监督者开发一个库而轻松地在功能块中进行编程,显然,对于制造过程的任何可能扩展,可以使用这些库轻松实现相应的控制方案。

结语

半监督深度核主动学习(SSDKAL)方法。在每一轮迭代中,结合使用QBC和GS样本选择策略。

QBC侧重于模型对查询样本的性能提升,即信息量,而GS则考虑了代表性和多样性,训练过程首先使用少量标记样本训练一组SSDKL回归器。

所有回归器都根据未标记样本进行预测,选择方差最大的一组样本,并从该集合中选择离现有标记样本最远的未标记样本子集,该子集中的样本标签被查询并添加到标记样本集中。