从 Microsoft Office 等生产力软件到更复杂的设计和工程工具,AI 集成正在重新定义主流企业应用。这种转变要求现代数据中心超越单一用途的孤岛。
对于开发者而言,获得专用 GPU 计算的权限通常会成为瓶颈。虚拟机 (VM) 可根据特定项目需求提供安全、隔离且可扩展的环境,从而解决部分此类挑战。但是,将整个物理 GPU 专用于单个 VM 对于混合或轻量级工作负载而言效率极低。
这正是 NVIDIA 多实例 GPU (MIG) 技术必不可少的地方。借助 MIG,单个物理 GPU 在硬件级别被划分为多个完全独立的实例,每个实例都具有有保证的内存、缓存和计算核心。对于开发团队而言,这可确保可预测、不妥协的服务质量 (QoS) 。这意味着,多个开发者可以在同一物理服务器上同时训练 AI 模型、运行仿真或渲染图形,而无需争夺资源或干扰彼此的工作负载。
NVIDIA RTX PRO 4500 Blackwell 服务器版 GPU 具有 32 GB 的高速 GDDR7 显存,最多可支持两个 MIG 实例,而新发布的 NVIDIA vGPU 20 软件可大幅提升性能,从而跨虚拟化企业数据中心加速各种工作负载。它们可以同时为从日常生产力到轻量级 AI 开发的方方面面提供支持。
本文将介绍如何使用 NVIDIA vGPU 和 NVIDIA RTX PRO 4500 Blackwell Server Edition 部署虚拟机 (VM) 。它涵盖了使用 vGPU 设置 MIG、企业工作负载的大小调整、性能比较和补充功能。
为 vGPU 配置 RTX PRO 4500 Blackwell 服务器版本
采用 MIG 技术的 RTX PRO 4500 Blackwell Server Edition GPU 彻底改变了虚拟化工作负载。该解决方案允许将单个物理 GPU 安全地划分为两个独立的 GPU 实例,每个实例均提供专用的 16 GB GPU 帧缓存。这使管理员能够精确分配专用 GPU 资源,确保为各种虚拟机提供有保证的服务质量。
要遵循本文中的教程,请确保您的环境符合表 1 中概述的核心要求。本教程使用 VMware vSphere 设置 MIG 和 vGPU。
| 要求 | 详细信息 |
| GPU | NVIDIA RTX PRO 4500 Blackwell 服务器版本 |
| 服务器 | 一个NVIDIA 认证系统经过全面验证和认证,可运行搭载 NVIDIA vGPU 和 MIG 的 RTX PRO 4500 Blackwell GPU |
| Hypervisor | 请参阅NVIDIA vGPU v20 支持的服务器虚拟化平台列表 |
| 软件 | NVIDIA vGPU v20 版本 |
为 vGPU 和 MIG 配置文件配置 vSphere
此步骤将介绍配置 hypervisor 设置以启用 vGPU 和混合配置文件功能的过程。然后,将 4 GB 配置文件附加到 RTX PRO 4500 Blackwell 服务器版 GPU 的 MIG 切片上。本教程在主机上提供三个 VM。将配置具有 4Q 配置文件的 Windows 11 VM 来演示此过程。请注意,VMware Cloud Foundation (VCF) 即将支持 MIG 中的时间片。
从 vSphere Web 界面开始。
- 选择主机: 导航至运行 RTX PRO 4500 Blackwell Server Edition GPU 的 ESXi 主机
- 配置 PCI 设备: 导航至配置 -> 硬件 -> PCI 设备
- 查找 GPU: 在 PCI 设备列表中找到 RTX PRO 4500 Blackwell Server Edition 显卡

配置 vGPU 模式和混合大小的配置文件
接下来,调整 RTX PRO 4500 Blackwell Server Edition GPU 的“Graphics Device” (图形设备) 设置。
- 设备类型: 选择“Shared Direct” (直接共享)
- vGPU 模式: 选择“Mixed Size” (混合大小) 以在同一 MIG 实例上运行不同大小的 vGPU 配置文件

附加 MIG 支持的 vGPU 配置文件
初始 VM 创建完成后,下一步是连接由 MIG 支持的 vGPU 配置文件。为此,请先确保 VM 已关闭。打开 VM 设置,选择“Add New Device” (添加新设备) ,然后选择“PCI Device” ( PCI 设备) 。

在此场景中,分配由 MIG 切片支持的 vGPU 配置文件。RRO 4500 Blackwell Server Edition GPU 最多支持两个 MIG 切片。每个切片都可以容纳各种 vGPU 配置文件。
如图 4 所示,选择 nvidia_rtx_pro_4500_blackwell_dc-1-4q 配置文件,即 4 GB 配置文件。配置文件名称中出现 _dc-1- 表示此单个 vGPU 由 RTX PRO 4500 Blackwell Server Edition GPU 上的一个 MIG 切片提供支持。

VM 设置现已配置完毕后,New PCI 设备将显示由 MIG 支持的 vGPU 配置文件 (图 5) 。现在,您可以启动 VM。

为各种企业工作负载调配 VM
NVIDIA RTX PRO 4500 Blackwell 服务器版 GPU 与 vGPU 软件搭配使用时,可建立一个灵活的虚拟平台,IT 组织可以利用该平台来加速各种主流企业工作负载。作为演示,我们的团队配置了三个不同的 VM,每个 VM 都使用不同的 MIG 支持的 vGPU 配置文件 – 3B、4Q 和 16Q。这些特定的配置文件通常非常适合知识工作、入门级工作站、数据科学或机器学习任务等应用。
如需进一步探索,请在 RTX PRO 4500 Blackwell GPU 所在的服务器虚拟化平台主机上运行 nvidia-smi。nvidia-smi 实用程序是 NVIDIA 系统管理接口,这是一种对于监控和管理 NVIDIA GPU 至关重要的命令行工具。通过在 ESXi 主机上运行,管理员可以查看实时运行状态,包括有关 GPU 显存利用率、当前温度以及 MIG GPU 实例和其中运行的 vGPU 配置文件的配置和状态的详细信息。

nvidia-smi 命令行实用程序监控 GPU 和 MIG 状态MIG GPU 实例 1 正在运行 16Q vGPU 配置文件。MIG GPU 实例 2 同时托管 4Q vGPU 配置文件 (如本示例的 nvidia-smi 输出所示) 和示例性 3B vGPU 配置文件。
需要安装合适的 Windows 11 vGPU 驱动程序。请务必禁用任何会干扰 NVIDIA 客户机驱动程序操作的软件模拟图形。使用 Omnissa Horizon 或 RDP 等远程协议连接到 VM。连接后,打开“Windows Device Manager” ( Windows 设备管理器) 并查看“Display Adapters” (显示适配器) 。验证 VM 是否使用 MIG 支持的 vGPU 配置文件 (如本教程之前的配置) 。

另一个实验涉及运行 dxdiag 实用程序。您可以通过 Windows 搜索栏或在命令提示符下输入 dxdiag 来访问此工具。主图形设备应标识为 RTX PRO 4500 Blackwell DC-1 -4Q 配置文件。

NVIDIA 的 vGPU 解决方案架构师尝试在单独的 VM 上同时运行两个应用程序,这证明了 RTX PRO 4500 Blackwell GPU (采用 MIG 支持的 vGPU) 的通用性。一台 VM 托管了在 Linux Docker 容器中运行的基于 CUDA 的粒子模拟,而另一台 VM 则为知识工作者提供了 Windows 11 桌面。这两种截然不同的工作负载同时执行。

使用 NVIDIA RTX PRO 4500 Blackwell 服务器版本加速工作负载
对于目前使用 NVIDIA Ampere ( A 系列) 或 NVIDIA Ada Lovelace ( L 系列) 架构的组织而言,采用 NVIDIA RTX PRO 4500 Blackwell 服务器版本 是一次变革性的飞跃,而不是边际收益,特别是对于 AI 增强型应用而言。具体而言,在虚拟化环境中,与 NVIDIA L4 相比,RTX PRO 4500 Blackwell 服务器版本 在 4K 设置下可为图形工作负载提供近 1.9 倍的加速。

即使组织正在扩展其基础架构,企业知识工作者也需要快速响应的交互式桌面体验。RTX PRO 4500 Blackwell 服务器版 GPU 提供了专为这些部署设计的现代平台。Blackwell 架构引入了 MIG 等功能,可在空间上对 GPU 进行分区,从而为虚拟桌面提供可预测的性能、更高的资源利用率和可靠的服务质量。除了原始计算和分区之外,RTX PRO 4500 Blackwell 还可提供更高的 NVENC 吞吐量,从而实现更高效的远程显示串流。
随着 vGPU 20.0 的发布,RTX PRO 4500 Blackwell 服务器版与主流虚拟化平台完全集成,为企业 IT 环境提供了无缝的部署就绪型解决方案。此更新可确保 IT 管理员能够在其数据中心部署中利用 RTX PRO 4500 Blackwell Server Edition 架构的先进功能。
vGPU 20 中的更多增强功能
除了支持 NVIDIA RTX PRO 4500 Blackwell Server Edition 之外,vGPU 20 还引入了以下增强功能,旨在加速现代应用程序并确保在虚拟化环境中实现一致的性能:
- 全新 NVIDIA AI 虚拟工作站 (vWS) 工具包: 在基于 NVIDIA RTX PRO Blackwell Server Edition 运行的 vWS 环境中部署用于视频搜索和摘要 (VSS) 的 NVIDIA AI Blueprint
- 异构 vGPU 的固定比例调度: 无论物理 GPU 上的其他实例如何,均可确保每个 vGPU 实例的调度持续时间和频率保持一致
- vGPU 支持 VergeOS: 通过其用户界面在私有云操作环境中自动管理 GPU 驱动程序、vGPU 配置文件分配和 MIG 配置
- Wayland 支持: 适用于基于 Linux 的虚拟机的显示服务器协议
- 液冷 GPU 支持 for NVIDIA RTX PRO 6000 Blackwell 服务器版本
NVIDIA vGPU 和 NVIDIA Blackwell 在云端的可用性
GPU 虚拟化为企业提供了一种经济高效的方式,使其可以随时随地通过 VM 访问必要的 GPU 资源,同时仅利用所需的容量。对于需要高 GPU 显存的高要求 AI 和视觉计算任务,主要的云服务器提供商现在提供 NVIDIA vGPU 和 NVIDIA Blackwell 驱动的实例:
- Google Cloud: 宣布推出由 NVIDIA RTX PRO Blackwell Server Edition 提供支持的部分 G4 虚拟机预览版. 这些支持 vGPU 的配置包括 12 GB、24 GB、48 GB 和 96 GB 配置文件,支持从串流服务到高保真 3D 渲染和机器人传感器仿真等用例。
- Microsoft Azure:NCv6 系列由 NVIDIA RTX PRO 6000 提供支持,将提供支持 NVIDIA vGPU 的部分和完整 GPU 选项,最高支持双 96 GB。
开始使用 NVIDIA Blackwell 和 NVIDIA vGPU
利用 NVIDIA Blackwell 虚拟化的强大功能转变数据中心,迎接 AI 驱动的企业计算时代。通过利用 NVIDIA RTX PRO 4500 Blackwell Server Edition 和 NVIDIA vGPU 20,您的组织可以使用其现有的、经过验证的基础设施来支持越来越多的应用程序,因为每个应用程序都越来越多地集成 AI 功能。
准备好发现不同了吗?申请 NVIDIA vGPU 软件的 90 天免费试用。