技术计算机辅助设计 (TCAD) 仿真涵盖工艺与器件仿真,对现代半导体制造至关重要。它支持“虚拟制造”,使工程师能够在投入昂贵的物理制造前,以数字化方式设计、构建和测试晶体管及集成电路。该方法可将开发周期从数年显著缩短至数月,并节省数十亿美元的试验性制造成本。
然而,这些模拟需要大量计算资源,可能耗时长达数周才能完成,从而延误制造的截止日期。AI 增强型 TCAD 是应对这一挑战的关键解决方案。这正是 NVIDIA PhysicsNeMo 和 NVIDIA Apollo 的用武之地。借助 PhysicsNeMo 框架,开发者能够利用先进的工程与科学模拟架构构建高保真代理模型。Apollo 于上月在 SC25 发布,通过提供特定领域的预训练模型,进一步简化了这一流程,已于上月在 SC25 公布。
全球领先的内存芯片制造商之一 SK hynix 的工程师正利用 AI 物理特性,开发高保真替代模型,以加速半导体芯片设计与制造中的器件及工艺仿真。借助 NVIDIA PhysicsNeMo 框架,工程师加快了专有 AI 模型的开发进程,为器件设计与制造领域的重大创新提供了有力工具。
在本博客中,我们将为您介绍如何开始使用 PhysicsNeMo 开发自定义模型,并分享 SK hynix 的 TCAD Intelligence 团队如何利用 PhysicsNeMo 加速其 AI 物理模型的开发进程。
将 AI 物理特性应用于 TCAD
TCAD 是软件仿真的专业领域,用于对半导体器件的制造过程及物理特性进行建模与优化。通常分为两个主要部分:工艺 TCAD 与器件 TCAD。工艺 TCAD 模拟芯片制造中的物理和化学步骤,例如沉积、光刻、蚀刻和离子注入。而器件 TCAD 则基于工艺仿真所预测的最终三维结构,对其电学行为进行建模。从原子级的密度泛函理论(DFT)仿真到腔室级的计算流体动力学(CFD)仿真,工程师可根据不同应用需求选择相应的仿真解决方案。
AI 增强型 TCAD 为半导体制造商带来了根本性的颠覆性机遇。随着晶体管尺寸缩小至纳米级别,其行为复杂性显著增加,精确模拟在设计新一代器件时变得不可或缺,但同时也导致模拟成本大幅上升。
AI 代理模型可以使用 NVIDIA PhysicsNeMo 创建,这是一种基于深度学习的超快仿真副本,替代了速度较慢的传统物理仿真方法。该方法可将模拟时间从数小时缩短至几毫秒,显著加速半导体器件的设计与优化,使工程师能够探索更广泛的设计可能性。
PhysicsNeMo 提供 Python 模块,用于构建经过优化且可扩展的训练与推理工作流,以支持 AI 代理的开发与部署。该框架集成了面向科学与工程领域定制的多种 AI 模型,并实现了物理知识与数据的有效融合。
对于探索使用神经算器、图神经网络(GNN)或转换器的 AI 物理研究人员和开发者,以及对物理信息神经网络或其混合方法感兴趣的研究人员和开发者,PhysicsNeMo 提供了一个经过优化的堆栈,支持大规模模型训练。工程师可利用 PhysicsNeMo 中的必要构建模块,减少从零开始开发的需求,从而降低设计复杂 AI 方法的工作量,转而专注于结合自身领域专长,为特定物理问题开发替代性模型。
开始使用 PhysicsNeMo
要开始使用 PhysicsNeMo 构建 AI 代理,较为简便的方法是采用其中一个参考应用程序的 recipe。这些示例为您提供了包含训练代码和数据的完整工作模板。以下是以官方示例为指南时,您将遵循的一般分步路径。
- 安装 PhysicsNeMo: 首先,您需要设置环境。
- 较为简便的方法是使用官方的 NVIDIA NGC 容器,该容器已预装所有依赖项(如 PyTorch、CUDA 等)。接着,克隆 PhysicsNeMo GitHub 存储库,以获取相关的参考应用 recipe。
- 如果您已配置好 PyTorch 的开发环境,也可按照此处列出的步骤,从源代码进行 pip 安装。
- 假设您希望为 TCAD CFD 模拟开发基于 GNN 的替代模型,可以从“流”示例开始。复制示例后,即可基于您的自定义数据调整训练流程。
- 您还可利用自定义数据评估其他模型架构,例如 DoMINO 或 Transolver。
- 借助 PhysicsNeMo recipe 中内置的分布式功能,可将上述任一架构扩展至完整的 3D 芯片级仿真。
我们来看看 SK hynix 的工程师如何在众多 TCAD 用例中应用 PhysicsNeMo。
SK hynix 如何将 AI 物理特性用于 TCAD
总部位于韩国的 SK hynix 是高带宽内存 (HBM) 的主要生产商,HBM 是先进 AI 加速器和 GPU 的关键组件。其产品广泛应用于数据中心服务器、PC、智能手机以及新一代 AI 系统,对各类电子产品均至关重要。
该公司的工程师通过开发高保真代理模型,率先将人工智能应用于物理特性仿真,以加速设备与工艺的模拟。借助 NVIDIA PhysicsNeMo 框架,他们快速优化了自有的人工智能模型。例如,SK hynix TCAD 智能团队在用于蚀刻工艺的 AI 代理模型方面开展了重要工作,该工艺在半导体前道制造,尤其是先进存储技术中,正变得愈发关键。通过采用预测性建模来指导蚀刻过程,SK hynix 旨在加快新一代存储器件的开发进程。
准确预测蚀刻过程中的时变结构对于 SK Hynix 至关重要。尽管神经运算符具有一定优势,但通常需要大量数据,且在数据稀缺的情况下表现不佳。为应对这一挑战,SK hynix 采用了一种基于图神经网络(GNN)的图网络模拟器(GNS)架构,该架构融合了数值时间步进方法,能够高效地建模几何结构随时间的演变。GNS 通过捕捉局部相互作用,以极少的训练数据即可表达关键的物理特性。然而,现有的 GNS 模型在模拟蚀刻过程方面仍存在不足,因此有必要开发更先进的 AI 模型,以提升模拟的准确性与效率。
| 方法改进 | 改进 |
| 降低 MeshGraphNet (MGN) 内存需求 | 内存需求降低 |
| 采用倒角损失以加快速度计算 | 训练损失减少 |
| 在每个迭代步骤中进行重新网格化 | 推理准确性提升 |
| 优化特征选择 | 推理准确性提升 |
| 引入多尺度消息传递 | 训练损失减少 |
| 在每个迭代步骤中更新材质特征 | 推理准确性提升 |
SK hynix 的 TCAD Intelligence 团队认为,AI 增强型 TCAD 将成为推动半导体行业提升研究生产力的关键因素。借助 AI 加速的 TCAD 预测,工程师将能够切实评估由数十种配方组合所产生的数以万计的工艺方案。这一进展使 TCAD 能够超越定性指导,发展为半导体研发中的量化优化框架。
使用 PhysicsNeMo 框架和 GPU 加速库开发的各类 AI 模型,在高效实现这些功能方面发挥着关键作用。
如何开始使用 NVIDIA PhysicsNeMo
如果您是 TCAD 应用开发者或 AI 物理研究人员,PhysicsNeMo 将成为您加速 AI 模型开发的有力工具。您无需从零开始构建所有内容,而是可以借助 PhysicsNeMo 的模组与模型架构,以更快的速度和更高的效率打造企业级物理 AI 解决方案。
SK hynix 的 TCAD 工程师采用这种方法,将其领域的专业知识和工作重点集中于高效地对问题进行建模以及构建精准的模型,而非耗费精力在低级库上编写训练流程。
您可以使用以下资源了解更多信息:
- NVIDIA PhysicsNeMo 产品页面
- PhysicsNeMo GitHub 资源库
- 用户指南
- 示例:
- 在 Hugging Face 上探索 Jupyter Notebook
- 完整的参考示例库:参考示例库
- 自主培训课程: 借助 NVIDIA AI 物理技术加速计算机辅助工程 (CAE)
Yiyi Wang 和 Alexey Kamenev 为本博客所介绍的项目作出了贡献。