在 NVIDIA JetPack 7.2 中部署具有高显存效率的边缘代理就绪型 AI

随着 AI 智能体从数字世界转向物理环境，他们可以轻松使用 NVIDIA Jetson，通过优化的内存和性能加速现实世界的部署。

NVIDIA JetPack 7.2 直接支持 NVIDIA NemoClaw 的单命令部署，这是一个开源堆栈，可为 OpenClaw 添加隐私和安全控制。它引入了适用于 Jetson 的 NVIDIA 智能体技能 ——Jetson 设备端技能和 Jetson BSP 技能 ——并将最新的计算堆栈和代理功能扩展到 NVIDIA Jetson Orin。Jetson 软件定义平台使这一切成为可能：相同的硬件会继续为每个软件版本提供更多价值。

本文将介绍 JetPack 7.2 版本的新特性和功能，其中还包括：

NVIDIA 多实例 GPU (MIG) 支持 NVIDIA Jetson Thor ，可实现确定性的多工作负载执行
官方 Yocto Project 支持自定义 Linux 发行版，可进一步提高系统效率
适用于 Jetson AGX Orin 32 GB 的超级模式，可在边缘实现更高的 AI 性能和成本效益

这些更新共同帮助开发者充分利用现有的 Jetson 硬件，加快产品上市速度，并降低总体拥有成本。

NVIDIA JetPack 7.2 软件如何支持代理？

借助 JetPack 7.2，Jetson 开箱即用，支持 NemoClaw。JetPack 7.2 预先配置了所需的依赖项和软件堆栈，因此您可以在 Jetson 上部署和运行基于 NemoClaw 的工作流，而无需手动设置环境。这使您能够轻松构建跨机器人、工业自动化、视觉智能体和边缘 AI 系统的代理式物理 AI应用。

要在运行 JetPack 7.2 的 Jetson 设备上安装 NemoClaw，请运行以下单个命令：

curl -fsSL nvidia.com/nemoclaw.sh | bash

JetPack 7.2 中适用于 Jetson 的 NVIDIA 智能体技能

JetPack 7.2 还为开发者提供了使用 AI 智能体构建和优化 Jetson 软件堆栈的 Jetson 智能体技能。智能体技能是一组可重复的、智能体可执行的指令，定义了要调用的工具、要生成的输出以及如何验证结果。开发者无需手动配置开发流程的每个步骤，而是可以通过智能体利用智能体技能自动处理这些任务。

Jetson 智能体技能将这种模式专门应用于 Jetson 软件开发工作流。这些智能体驱动的工作流有助于自动执行常见的开发任务，例如 Jetson Linux 自定义、内存优化、模型基准测试和部署配置。通过设备端和 BSP 端实施，开发者可以利用智能体技能降低开发复杂性，并在 Jetson 平台上加速从原型设计到生产部署的过程。

JetPack 7.2 包含三类技能：

Jetson Linux 自定义技能： 指导智能体为自定义载板从头开始构建和自定义 BSP。这包括为特定硬件设计配置 I/ O、时钟设置、风扇控制、电源配置文件或任何其他模块。以前需要数周人工完成的任务可以由智能体处理，从而缩短定制 Jetson 设计的上市时间。
内存优化技能： 优化整个软件堆栈的内存使用情况。这些技能可以调整整个堆栈，启动引导加载程序内存分配，优化内核内存保留，减少冗余用户空间进程，并帮助为给定工作负载构建内存效率最高的软件配置。这使得更强大的工作负载能够在较低内存配置上运行，从而直接降低总体拥有成本 (TCO) 。
模型基准测试技能：帮助您为用例确定最佳模型配置。这些技能涵盖模型基准测试、推理优化和 Jetson 诊断。例如，构建基于 NemoClaw 的应用的开发者可以使用这些技能来确定哪个模型在目标设备上运行特定任务的效率最高。

除了这三类技能外，NVIDIA 还推出了一些技能，帮助智能体使用 NVIDIA DeepStream 和 NVIDIA Metropolis 视频搜索和总结 (VSS) Blueprint 构建视觉管线。

如需了解详情并开始使用，请在 GitHub 上查看 Jetson 设备端技能和 Jetson BSP 技能。

Jetson Thor 上的 MIG 可为混合关键工作负载实现 GPU 分区

Jetson Thor 上的 JetPack 7.2 引入了对 MIG 的支持，允许将集成的 NVIDIA Blackwell GPU 划分为两个具有专用计算、缓存和内存带宽的独立 GPU 实例。这使得多个 AI 工作负载能够以可预测的性能和最小的干扰同时运行。

与 JetPack 7 中的抢占式 RT 内核相结合，MIG 有助于为混合关键度系统创建更确定的执行环境。工作负载确定性对于物理 AI 系统如人形机器人、自主机器、工业自动化，和医疗设备至关重要。这是因为感知、规划、控制、生成式 AI，和安全工作负载通常共享一个 SoC，其中资源争用会在时间敏感型工作流中引入延迟抖动。

借助 Jetson Thor 上的 MIG，开发者可以将 GPU 资源专用于延迟敏感型机器人工作负载，同时在单独的分区上运行尽力而为的 AI 推理或生成式 AI 模型。这有助于为感知、传感器融合、运动规划和安全监控等工作负载保持可预测的延迟和服务质量。JetPack 7.2 在 Jetson Thor 上支持两个 MIG 分区：

更大的 AI 和图形分区，用于推理、渲染、可视化和常规 NVIDIA CUDA 工作负载 ( 12 个 SM，1536 个 CUDA 核心)
第二个独立的计算分区，用于机器人、控制、感知或安全关键型工作负载 ( 8 个 SM，1024 个 CUDA 核心)

可以使用标准 CUDA 运行时控件和 NVIDIA Container Toolkit 集成将应用、容器和服务分配给特定的 MIG 分区。这对于在不同时间域运行多个 AI 工作流的新一代人形机器人尤为重要，因为在这些领域中，控制循环、AI 感知和生成式 AI 推理必须在单个嵌入式平台上可靠地共存。

通过将数据中心级 GPU 分区引入嵌入式 AI 计算，JetPack 7.2 可实现更强大的边缘 AI 系统，并提高现实世界部署的可预测性和可靠性。详细了解 Jetson Thor 上的 MIG。

介绍 NVIDIA Jetson 上的 Yocto Project 支持

从 JetPack 7.2 开始，NVIDIA 在 Jetson 上提供官方的 Yocto 项目支持，包括经过验证的配方和参考图像。 Yocto 项目是一个开源 Linux 基金会项目，提供用于为嵌入式硬件架构构建自定义 Linux 发行版的工具。

现在，NVIDIA 以常规发布节奏引领 OE4T 层的路线图贡献。NVIDIA 拥有 CI/ CD 工作流和 SQA，并为 Jetson 开发者套件发布经过验证的参考图像。开发者可以访问技术文档和专门的论坛支持。

Yocto 项目为 Jetson 开发者带来三大核心优势：

可定制性：使您能够构建紧密定制的镜像，仅包含所需的服务、驱动和库，而无需调整 NVIDIA Ubuntu L4T 镜像。这可减少显存占用并优化目标应用程序的系统性能。
可再现性: Yocto Project 可在运行中生成相同的镜像构建，从而简化调试、测试和认证工作流程。这在医疗和工业部署等受监管领域尤为重要。
开放的生态系统。 访问数千个适用于 AI 框架、工业协议和自定义中间件的方案和社区层。

如需帮助您决定何时使用 L4T/ JetPack 与 OE4T/ Yocto Project，请参阅图 3 中的开发者决策指南。

借助 Jetson 上 Yocto Project 的官方支持，NVIDIA 还建立了一个由分销合作伙伴、ISV 和 ODM 组成的强大生态系统，以加速和简化 Jetson 平台上的 Yocto Project 开发。这些合作伙伴提供一系列产品，包括生产就绪型 Linux 发行版、BSP 定制、长期支持、集群管理解决方案、多媒体和 ISP 专业知识，以及以安全为重点的集成。

公司如 Konsulko Group 和 Peridio 提供完整的操作系统解决方案，如 Konsulko Orca OS 和 Avocado OS，而 Balena 专注于基于容器的车队管理和大规模部署。其他 NVIDIA 合作伙伴包括 Neurealm、RidgeRun 和 Wind River，他们提供广泛的工程和 NRE 服务，在嵌入式 Linux、BSP 定制、多媒体流程和长期平台支持方面拥有深厚的专业知识。该生态系统使开发者能够在 Jetson 上快速部署、定制和扩展基于 Yocto 的解决方案。

除分销合作伙伴和 ISV 外，NVIDIA 还与强大的合作伙伴生态系统紧密合作，帮助客户在 AAEON、Advantech、Antmicro、ASUS、AVerMedia、Connect Tech、EDOM 和 YUAN 等 Jetson 平台上加速产品开发和部署，提供广泛的硬件解决方案，包括载板、边缘 AI 系统、工业嵌入式平台、视频捕获解决方案和针对 Jetson 优化的参考设计。这些合作伙伴使开发者能够通过为机器人、工业自动化、智慧城市、医疗健康、零售和其他嵌入式 AI 应用量身定制的硬件平台，快速对生产就绪型 AI 和边缘计算解决方案进行原型设计和扩展。

统一 Jetson 堆栈并释放更多性能

JetPack 7.2 将基于 Ubuntu 24.04、内核 6.8 和 CUDA 工具包 13.0-基于计算堆栈 (与 Jetson Thor 一起推出) 扩展到 Jetson Orin 系列，将这两个平台引入一个统一的软件基础。借助跨 Orin 和 Thor 的通用堆栈，您可以在整个 Jetson 产品组合中无缝部署新的 AI 应用，同时利用新的 CUDA 功能、库和性能优化。

这种统一的方法显著减少了支持多个硬件平台所需的工程工作，简化了应用开发、验证、部署和长期车队维护。

JetPack 7.2 还为 Jetson AGX Orin 32 GB 引入了新的超级模式，解锁了更高的 GPU 和电源配置，使其性能更接近 Jetson AGX Orin 64 GB。通过将 GPU 频率从 930 MHz 增加到 1.3 GHz，并实现更高的功耗范围，最高可达 60W，Super Mode 可将 AI 性能从 200 TOPS 提升到 241 TOPS，比标准 AGX Orin 32 GB 配置提高 20% 以上。

此增强功能使客户能够使用 Jetson AGX Orin 32 GB 实现近乎旗舰的 AGX Orin 64 GB 性能，同时将模组成本降低 45%。新的 Super Mode 使 32 GB 模组成为生成式 AI、机器人和边缘 AI 部署的经济高效选择。

	Jetson AGX Orin 32 GB	Jetson AGX Orin 32GB Super	Jetson AGX Orin 64 GB
Nemotron3 Nano 30B A3B	31	37	40
Cosmos Reason 2 8B	9	10	10
Qwen 3.5 4B	24	27	28
Qwen 3.5 9B	13	15	17
Qwen 3.6 27B	4	5	7
Gemma 4 E4B	25	29	32

表 1. 在 Jetson AGX Orin 32 GB、Orin 32 GB Super 和 Orin 64 GB 上以词元/s 的速度实现生成式 AI 模型性能

开始使用 NVIDIA JetPack 7.2

JetPack 7.2 通过软件通过相同的 Jetson 硬件提供更多价值。随着代理式 AI 走向边缘，内存成本仍然是生产部署中的实际限制，此版本直接解决了这两个问题。

其功能包括 NVIDIA NemoClaw 的单命令部署、适用于 Jetson 的内存和工作流优化智能体技能、适用于精简和可复制生产构建的官方 Yocto Project 支持，以及适用于确定性多工作负载执行的 Jetson Thor 上的 MIG。借助 JetPack 7.2，您可以在现有硬件上完成更多工作，同时在边缘构建功能日益强大的代理式工作负载。

下载 JetPack 7.2，开始在边缘部署代理式 AI。如有疑问和社区支持，请访问 NVIDIA 开发者论坛。

与 NVIDIA 创始人兼首席执行官黄仁勋一起参加 NVIDIA GTC 台北 2026 主题演讲，并通过相关会议了解更多信息。