NVIDIA Metropolis

NVIDIA Metropolis 是一套由模型、库和蓝图组成的解决方案，提供从边缘到云端构建、部署和扩展视频分析 AI agents 和应用所需的一切组件。借助它，你可以轻松将真实环境中的原始视频和传感器数据转化为实时且可付诸行动的洞察。这样一来，组织不仅能够更好地理解物理空间中正在发生的情况并进行智能响应，还能在规模、吞吐量、成本效率以及产品落地速度方面获得出色表现。

开始使用

 加入论坛

Metropolis 的工作原理

Metropolis 提供了一个连贯的端到端软件构建块堆栈，可处理从视频摄取到见解生成，再到高级代理式 AI 驱动的分析等各种任务。这些组件可以在整个计算范围内 (边缘、本地服务器或云端) 持续部署，因此相同的应用程序可以在靠近数据生成位置或大规模集中运行。

图像替代文本

借助 NVIDIA VSS Blueprint 和技能进行大规模代理式视频搜索

深入了解代理式搜索、模块化设计、参考工作流等方面的全新 VSS 3.0 技能。

试用 VSS 技能阅读博客

借助 NVIDIA DeepStream 技能创建视觉 AI 应用

了解如何使用简单的自然语言提示生成完整的、GPU 加速的 NVIDIA DeepStream 视频分析流程。

试用 DeepStream 技能

阅读博客

借助 NVIDIA TAO 技能微调视觉 AI 模型

试用一套智能体技能和工具，借助自然语言提示微调视觉 AI 模型。

试用 TAO 技能

借助智能体技能解决训练数据挑战

使用智能体技能快速生成用于视觉检查的合成数据，或增强边缘案例的视频。

试用有缺陷的图像生成技能试用视频增强技能

Metropolis 入门

开始使用最新的 Metropolis 视觉语言和视觉基础模型。

NVIDIA Cosmos

了解首个 OmniModel，它可以查看、推理、生成多种结果，并教会物理智能体如何在现实世界中行动。

立即试用

视觉 AI NIM

探索经 GPU 优化的微服务，这些微服务通过简单的 API 提供即用型视觉和多模态模型。

试用 NVIDIA NIM™ API

嵌入

使用 Cosmos Embed、C-RADIO 和 NV-CLIP 等 NVIDIA 模型，将图像、视频和文本转换为向量表示，以实现物理 AI 和多模态理解。

探索 Cosmos 嵌入

探索 C-RADIO

探索 NV-CLIP

使用特定领域的数据对您的视觉 AI 模型进行后期训练，以提高准确性。

Cosmos Cookbook

通过监督式微调和强化学习，获取训练后 Cosmos WFM 的方法。

了解详情

TAO

探索一套智能体技能和工具，借助编码智能体和自然语言提示微调视觉 AI 模型。

了解详情

开始使用基础 Metropolis 框架开发视觉 AI 应用。

用于视频搜索和摘要 (VSS) 的 NVIDIA Metropolis Blueprint

借助 VSS Blueprint，您可以构建可定制的视频分析 AI 智能体，通过无缝的边缘到云集成提供强大的见解。VSS 还提供了使用编码智能体根据简单的自然语言提示构建这些智能体的技能。

立即试用

NVIDIA DeepStream

这是一个完整的流分析工具包，用于基于 AI 的多传感器处理以及视频、音频和图像理解。

了解详情

生成高质量的合成数据，安全高效地训练 AI 模型。

物理 AI 数据集

借助经过验证的开源数据集，在行业、城市、机器人和自主系统中训练视觉 AI，解锁数据瓶颈，该数据集现已在 Hugging Face 上免费提供。

探索 NVIDIA 物理 AI 数据集

用于合成数据生成的智能体技能

使用您自己的视频或图像数据构建合成数据生成工作流。然后，使用 Cosmos 开放 WFM 对其进行筛选、增强和评估，以加速视觉 AI 模型开发。

试用有缺陷的图像生成技能

试用视频增强技能

Isaac Sim

使开发者能够从复杂的 3D 环境中创建逼真的合成数据，以训练视觉 AI 模型。

在 Isaac SIM 上开始使用活动和演员生成 ›

入门套件

开发视频分析 AI 智能体

通过计算机视觉和实时视觉推理，构建能够看到、理解世界并与之交互的智能系统。

构建视觉推理工作流

使用 DeepStream 开发流式传输工作流，以提取视频、预处理帧并运行优化的视觉 AI 模型。

为智慧城市和仓库运营构建智能体

通过样本数据、定制提示和报告模板，探索优化的 VSS 蓝图配置示例。

后训练视觉语言模型

在特定任务的多模态数据上优化视觉语言模型，使其更好地将视觉理解与特定领域的概念和指令保持一致。

微调视觉基础模型

使用目标领域数据调整强大的预训练视觉主干，以便他们专注于您的任务，同时保持广泛的视觉理解。

生成合成数据

创建合成图像和视频，以扩展训练数据集、降低采集成本，并提高各种场景中视觉模型的稳健性。

伦理 AI

NVIDIA 认为值得信赖的 AI 是一项共同的责任，我们制定了相关政策和实践来支持各种 AI 应用的开发。根据我们的服务条款下载或使用时，开发者应与其支持的模型团队合作，确保此模型满足相关行业和用例的要求，并解决不可预见的产品滥用问题。

有关此模型道德因素的更多详细信息，请参阅模型卡可解释性、偏差、安全性和隐私子卡。请报告安全漏洞或 NVIDIA AI 问题单击此处。

开发、部署和扩展支持 AI 的视频分析应用
NVIDIA Metropolis。

开始使用

NVIDIA Metropolis

Metropolis 的工作原理

借助 NVIDIA VSS Blueprint 和技能进行大规模代理式视频搜索

借助 NVIDIA DeepStream 技能创建视觉 AI 应用

借助 NVIDIA TAO 技能微调视觉 AI 模型

借助智能体技能解决训练数据挑战

Metropolis 入门

开始使用最新的 Metropolis 视觉语言和视觉基础模型。

NVIDIA Cosmos

视觉 AI NIM

嵌入

使用特定领域的数据对您的视觉 AI 模型进行后期训练，以提高准确性。

Cosmos Cookbook

TAO

开始使用基础 Metropolis 框架开发视觉 AI 应用。

用于视频搜索和摘要 (VSS) 的 NVIDIA Metropolis Blueprint

NVIDIA DeepStream

生成高质量的合成数据，安全高效地训练 AI 模型。

物理 AI 数据集

用于合成数据生成的智能体技能

Isaac Sim

入门套件

开发视频分析 AI 智能体

构建视觉推理工作流

为智慧城市和仓库运营构建智能体

后训练视觉语言模型

微调视觉基础模型

生成合成数据

更多资源

探索开发者论坛

注册接收开发者时事新闻

加入 NVIDIA 开发者计划

伦理 AI