如何在 ComfyUI 中构建、运行和扩展高质量的创作者工作流

如今，创意和可视化团队可以利用更精简的团队制作更多格式的素材。生成式 AI 可以加速这项工作，将曾经需要数小时手动工作的任务压缩到可重复的自动化流程中。

ComfyUI 是一款基于节点的开源创意工具，可在 NVIDIA RTX GPU 上本地运行。它将图像生成、视频合成和语言模型整合为可由团队自定义和扩展的工作流，无需依赖云端，也无需让数据离开本地设备。

本指南介绍了 NVIDIA GenAI 创作者工具包中的三个可直接投入生产的工作流，内容源自 NVIDIA GTC 2026 DLI 课程在 ComfyUI 中创建用于设计与可视化的生成式 AI 工作流。每个工作流均独立运行，并在 NVIDIA RTX 平台上本地执行。

视频 1. NVIDIA RTX 上的 ComfyUI 加速生成式 AI 创意工作流

您将完成的任务

在本指南的最后，您将获得：

将图像解构为单独的层 (前景层、中间层和背景层)，每个层都有一个干净的 Alpha 蒙版，可引入任何合成工具
从照片中删除不需要的物体—并让 AI 无缝填充应该存在的物体，而无需触及图像的其余部分
将照片转换为纹理3D模型 (仅支持Windows)——可打开.GLB格式的3D文件，并用作预览或布局的起点。

每个工作流作为预构建的节点图直接加载到 ComfyUI 中。上传图像，单击“Run” (运行) ，然后获取结果。

开始之前需要了解的内容

使用 Web 浏览器和文件上传时的基本舒适度
从命令行运行脚本，为初学者提供良好的使用体验
无需 ComfyUI 经验 – 工作流程是预先构建的，您可以加载并运行它们
熟悉图像概念 (层、蒙版、Alpha 通道) 会有所帮助，但并非必需

预备知识

硬件要求：

Windows：NVIDIA RTX GPU，24 GB VRAM，推荐 32 GB 或更高
Linux：NVIDIA RTX GPU，32 GB VRAM，推荐 48 GB 或更高
为这些工作流程所需的模型提供 150 GB 可用磁盘空间

软件要求：

要求：Windows 或 Ubuntu Linux 操作系统
必填项：Git (在此处安装)
需要：ComfyUI (适用于 Windows 的桌面应用程序或Linux 的手动安装)
3D 对象工作流程（模块 08）所需内容： huggingface.co/Facebook/dinov3-vitl16-pretrain-lvd1689m，登录后点击“Agree and access repository”（同意并访问存储库）

时间和风险

预计时间: 30 分钟实战 (首次运行时模型下载量 > 50GB)
风险级别: 低
- 对于您的输入图像，这三个工作流程均为只读模式，不会对原始文件进行任何修改。
- 生成的输出将保存在计算机上 ComfyUI 的 output/ 目录中。
- 回滚说明：安装程序仅向 ComfyUI 安装目录添加文件（包括自定义节点、工作流程和模型）。如需撤销操作，只需从 custom_nodes/ 中删除新增的文件夹，并从 models/ 中删除已下载的模型。

详细说明

第 1 步：安装工作流程

Windows – 打开命令提示符 (在“Start Menu” (开始菜单) 中搜索“cmd”) 并运行：

(小贴士：别忘了前往 huggingface.co/facebook/dinov3-vitl16-pretrain-lvd1689m，登录后提前点击“Agree and access repository”以同意并访问存储库。)

git clone https://github.com/NVIDIA/NVIDIA-GenAI-Creator-Toolkit
cd NVIDIA-GenAI-Creator-Toolkit
install.bat C:\path\to\ComfyUI --modules 02,03,08

传递 ComfyUI 安装位置，即您在设置桌面应用时选择的文件夹。其中包含您的 .venv、models 和 custom_nodes\ 文件夹。

不确定它在哪里？查看桌面应用程序设置 > 关于 > 参数：- base-directory C：\ path \ to \ your \ installation-location

Linux – 完整说明请参见：NVIDIA-GenAI-Creator-Toolkit/LINUX_COMFYUI_INSTALLATION.md at main · NVIDIA/NVIDIA-GenAI-Creator-Toolkit，项目主目录位于：@NVIDIA/NVIDIA-GenAI-Creator-Toolkit

git clone https://github.com/NVIDIA/NVIDIA-GenAI-Creator-Toolkit
cd NVIDIA-GenAI-Creator-Toolkit
bash install.sh /path/to/ComfyUI --modules 02,03

安装程序会负责一切：下载 AI 模型 (总计约 150 GB) ，安装所需的插件，并将工作流程复制到 ComfyUI 中。这可能需要 30 – 60 分钟，具体时间取决于您的互联网连接情况。

完成后，启动 ComfyUI。

第 2 步：将图像分解为多个层

将照片拆分为独立的 PNG 图层（前景、中景和背景），每层均具有清晰的透明背景。可直接导入 Photoshop、After Effects、DaVinci Resolve 或其他支持图层的软件中使用。

打开工作流程：在 ComfyUI 中，点击顶部菜单的Browse Templates，然后在 NVIDIA Creative Workflows（创意工作流程）部分找到02-image-deconstruction（02 图像解构），点击即可打开。

运行：

在“加载图像”框中，上传一张主题清晰的照片（如肖像、产品、建筑摄影，或前景与背景均包含物体的场景）。
单击 Run (运行) 。

就是这样。无需遮罩 – AI 会自动读取图像深度。

预期效果：3 – 4 个 PNG 文件，每层一个，每个都有其他层所在的透明区域。将背景层填充到过去的前景位置。

(小贴士：深度清晰的照片最适合拍照，比如一个人站在墙上、一个产品放在桌子上、一个面向天空的建筑物。由于 AI 无法读取深度，因此扁平、统一的图像不会分割成有趣的图层。)

其他详细信息： NVIDIA-GenAI-Creator-Toolkit/workflows/02-image-deconstruction（主页面） NVIDIA/NVIDIA-GenAI-Creator-Toolkit

深入了解

将其与动态图形工作流搭配使用：分别为每层制作动画以获得视差效果，或者在不影响整个图像的情况下调整每层的颜色分级以改变氛围。

第 3 步：从照片中移除物体

您要制作的内容：删除背景中的人物、徽标、杂物等不需要元素的照片，并将其替换为属于这些元素的照片。

打开工作流：在 ComfyUI 中，点击Browse Templates（浏览模板），找到03-targeted-inpainting，然后点击打开。

运行它。

在“Load Image” (加载图像) 框中，单击以上传您要编辑的照片。
右键单击图像缩略图，即可在“Mask Editor”（遮罩编辑器）中打开。使用画笔在需要移除的物体上涂白色，白色代表“修改”，黑色代表“保留”。完成后，点击Save（保存）。
单击 Run (运行) (或 Queue Prompt (排队提示)) 。

注意事项：您的照片上已涂绘的区域被清理干净并填充完毕。结果会保存到 ComfyUI 的 output/ 文件夹中。

小贴士： 绘画时将物体画得稍大一些——给 AI 留出边框通常能获得更清晰的效果。如果填充效果不理想，可尝试在文本提示中补充应包含的内容，例如“木制地板”或“纯白色墙面”。

如果没有任何变化：您可能忘了给口罩上色。返回，右键单击图像，然后在再次运行之前进行绘制。

其他详细信息： NVIDIA-GenAI-Creator-Toolkit/workflows/03-targeted-inpainting（主页面）NVIDIA/NVIDIA-GenAI-Creator-Toolkit

深入了解

此工作流还支持添加内容。只需在文本提示中描述物体，并在希望物体出现的位置进行涂色，AI 就会将其生成到场景中，并自动匹配周围图像的光照和风格。

第 4 步：将照片转换为 3D 模型

仅限 Windows。 此工作流程需要 Windows。Linux 支持目前不可用。

您要创建的内容：根据任意物体的一张照片生成带纹理的 3D 模型（GLB 文件），可在 Blender、游戏引擎或任何 3D 应用中打开，用于预览、布局或进一步编辑。

运行前提示——需额外完成一步：该工作流中的 AI 模型需要获得 Meta 的免费账户授权。请访问 huggingface.co/facebook/dinov3-vitl16-pretrain-lvd1689m，登录后点击 Agree and access the repository。审批通常需要 24 至 48 小时。安装程序在尝试下载前会提醒您完成此步骤。

打开工作流程： 在 ComfyUI 中，点击 Browse Templates（浏览模板），找到 08-image-to-3d（08-image-to-3d）。

运行：

在“加载图像”框中上传物体的照片——例如家具、道具、鞋子或雕塑。初次尝试时，建议选择背景简单、物体清晰的图片，效果更佳。
单击 Run (运行) 。

精彩内容：3D 模型与照片的形状和表面精准匹配。工作流程中可在 ComfyUI 内直接查看旋转预览。输出结果包含 GLB 文件，可在 Blender 中通过文件 > 导入 > glTF功能打开使用。

(小贴士：照片越清晰，模型就越好。在朴素背景下拍摄，确保整个物体清晰可见，并避免极端角度。正面或 3/ 4 角度截图为 AI 提供了最适合的处理方式。)

其他详细信息： NVIDIA-GenAI-Creator-Toolkit/workflows/08-image-to-3d（主目录）NVIDIA/NVIDIA-GenAI-Creator-Toolkit

第 5 步：清理

完成后，停止 ComfyUI 以释放 GPU 显存和系统资源。

Windows：从系统托盘或任务栏中关闭 ComfyUI Desktop App。Linux：在运行 ComfyUI 的终端中按 Ctrl+ C。

您生成的输出将保留在 ComfyUI 的 output/ 目录中，所有下载的模型将保留在 ComfyUI/models/ 目录中。不会删除任何内容。

要释放磁盘空间，请使用 --clean 删除模块的模型文件。与其他已安装模块共享的模型会自动保留。

# Windows:
install.bat C:\path\to\ComfyUI --clean --modules 02,03

# Linux:
bash install.sh /path/to/ComfyUI --clean --modules 02,03

要重启并从上次中断的位置继续，请再次启动 ComfyUI 并重新加载工作流。

下一步

这三个工作流是连接更多工作流的切入点。以下是您准备好深入了解的内容：

AI 提示增强：创建一个智能体，将初步的创意提示优化为适合模型的精准描述，并自动生成图像，让您即时查看优化前后的差异。

360° 环境与 HDRI 生成: 拍摄任意照片，即可为 Unreal、Blender、V-Ray 或 Arnold 生成可直接用于生产的 HDRI 光照，无需场景捕捉。
从 Playblast 生成电影级视频：只需输入 Blender 中的平面灰盒渲染和一张风格参考图，即可获得光照完善的风格化视频镜头。无需重新制作动画，更换风格图即可尝试多种艺术风格。

PBR材质流程: 从任意图像中提取干净且无缝的纹理，并生成完整的PBR材质贴图组，包括反射率、粗糙度、金属度、法线和高度贴图。

如需安装其他模块，请使用 NVIDIA-GenAI-Creator-Toolkit/workflows 中的模块编号重新运行安装程序，系统将自动跳过已安装的节点。

Windows：

install.bat C:\path\to\ComfyUI --modules 01,04,05

Linux：

bash install.sh /path/to/ComfyUI --modules 01,04,05

完整的 DLI 课程涵盖了所有工作流程，包括深度文档、示例素材和顶点项目，将它们链接到一个完整的生产流程中。

故障排除

症状	原因	修复
ComfyUI 将在 127.0.0.1:8188 下无法加载	ComfyUI 未运行	Windows：从开始菜单或桌面快捷方式启动 ComfyUI 桌面应用程序。Linux：来自 ComfyUI 目录的源 venv/bin/activate&& python main.py
install.bat 不产生任何输出	在 Git Bash 或 PowerShell 中运行	打开命令提示符 (cmd.exe) ，然后运行：install.bat C：\ path \ to \ ComfyUI
工作流加载，但节点显示为红色/ 缺失	未安装自定义节点	运行 install.bat/install.sh 并重启 ComfyUI。或使用 ComfyUI Manager > 安装缺少的自定义节点
ComfyUI 显示“未找到模型”错误	模型文件丢失或仍在下载	使用 – modules 0203，08 重新运行安装程序，重试模型下载。请查看每个模块的 models.md，获取手动下载链接
队列运行，但输出图像看起来没有变化 (工作流程 1)	无遮罩涂料	右键单击“Load Image” (加载图像) 节点 Open in MaskEditor 中的图像缩略图。在要更改的区域上绘制白色，然后在排队前单击“Save” (保存)
修补填充看起来不自然或模糊	模型需要更多关于要填充内容的上下文	在文本调节节点中添加描述 – 描述蒙版区域应显示的内容 (例如，“木制地板”、“墙面”、“草地”)
图像分解仅生成 1 – 2 层 (工作流程 2)	图像的深度复杂性较低	使用具有清晰主题背景分离的照片。具有明显近/ 远深度的图像最适合
Trellis2 输出网格有孔或缺少几何图形 (工作流程 3)	物体被部分遮挡或以极端角度拍摄	使用完整物体可见的照片，理想情况下是使用简单的背景。正面或 3/ 4 角度截图可生成最清晰的几何图形
工作流程 3 失败，首次运行时出现模型错误	尚未下载 DINOv3 模型	在接受 Meta 的数据协议huggingface.co/facebook/dinov3-vitl16-pretrain-lvd1689m然后重新运行安装程序。审批通常在 24 – 48 小时内完成。

表 1. ComfyUI 工作流的错误排查：问题和补救措施

借助 NVIDIA RTX™，探索适用于创意工作流程的 NVIDIA RTX PRO 工作站和 GeForce RTX GPU。

如何在 ComfyUI 中构建、运行和扩展高质量的创作者工作流

您将完成的任务

开始之前需要了解的内容

预备知识

硬件要求：

软件要求：

时间和风险

详细说明

第 1 步：安装工作流程

第 2 步：将图像分解为多个层

深入了解

第 3 步：从照片中移除物体

深入了解

第 4 步：将照片转换为 3D 模型

第 5 步：清理

下一步

故障排除

标签

关于作者