面向开发者的 NVIDIA Metropolis

查看一系列先进的开发者工作流和工具,这些工作流和工具可提供出色的规模、吞吐量、成本效益和更快的生产时间。它提供了从边缘到云端构建、部署和扩展视觉 AI 智能体和应用所需的一切。


开始使用
 A diagram showing NVIDIA Metropolis with a host of SDKs and developer tools

单击查看大图

查看所有优势

更快的构建速度

使用和调整高性能视觉基础模型,为您的独特行业简化 AI 训练。 NVIDIA AI Blueprint 和云原生模块化微服务旨在帮助您加速开发。

降低成本

功能强大的 SDK (包括 NVIDIA TensorRT™、DeepStream 和 TAO 工具套件) 可降低整体解决方案成本。在 NVIDIA 平台和基础设施上生成合成数据、提高准确性、更大限度地提高推理吞吐量并优化硬件使用率。

灵活部署

使用 NVIDIA 推理微服务 (NIM™) 、云原生 Metropolis 微服务和容器化应用进行灵活部署,为本地、云或混合部署提供选项。

功能强大的工具
支持 AI 的视频分析

Metropolis SDK 套件为 AI 应用开发和部署提供了各种起点。



先进的视觉语言模型和视觉基础模型

访问各种先进的 AI 模型,构建视觉 AI 应用,将视觉和语言结合在一起,实现交互式视觉问答。视觉语言模型 (VLM) 是能够理解和处理视频、图像和文本的多模态生成式 AI 模型。计算机视觉基础模型 (包括视觉转换器 (ViT)) 可分析和解释视觉数据,以创建嵌入或执行物体检测、分割和分类等任务。


查看适用于视觉的 NVIDIA NIM
A vision language model that generates text output for video insights
The NVIDIA Train, Adapt, and Optimize (TAO) Toolkit

TAO 工具套件

训练、适应和优化 (TAO) 工具包是一种低代码 AI 模型开发解决方案,可让您利用迁移学习的强大功能,使用自己的数据微调 NVIDIA 预训练视觉语言模型和视觉基础模型,并优化推理,而无需 AI 专业知识或大型训练数据集。


详细了解 TAO 工具套件

AI Agent Blueprints

用于视频搜索和摘要 (VSS) 的 NVIDIA AI Blueprint 借助生成式 AI、视觉语言模型 (VLM) 、大语言模型 (LLM) 和 NVIDIA NIM,轻松开始构建和定制视频分析 AI 智能体。视频分析 AI 智能体通过自然语言分配任务,可以处理大量视频数据,以提供关键见解,帮助各行各业优化流程、提高安全性并降低成本。

基于该蓝图构建的 AI 智能体可以大规模分析、解释和处理视频数据,生成视频摘要的速度比手动浏览视频快 200 倍。该蓝图可以通过整合各种生成式 AI 模型和服务来加速 AI 智能体的开发,并通过各种 NVIDIA 和第三方 VLM/ LLM 以及从边缘到云的优化部署选项提供了很大的灵活性。


查看用于视频搜索和摘要的 NVIDIA AI Blueprint
Use NVIDIA AI Blueprint for video search and summarization
NVIDIA NIM are easy to use, cloud-native microservices for inferencing

NVIDIA NIM

NVIDIA NIM ( NVIDIA 推理微服务) 是一套易于使用的微服务,旨在跨云数据中心安全可靠地部署高性能 AI 模型推理。和工作站。NIM 支持各种 AI 模型 (包括基础模型、LLM、VLM 等) ,可确保使用行业标准 API 在本地或云端进行无缝、可扩展的 AI 推理。


查看适用于视觉的 NVIDIA NIM

Metropolis 微服务

Metropolis 微服务为开发视觉 AI 应用和解决方案提供强大、可定制的云原生基础模组。它们专为在 NVIDIA 云和数据中心 GPU 以及 NVIDIA Jetson Orin™ 边缘 AI 平台上运行而构建。


了解详情
Use Metropolis microservices to develop vision AI applications.
NVIDIA DeepStream SDK is a complete streaming analytics toolkit

DeepStream SDK

NVIDIA DeepStream SDK 是基于 GStreamer 的完整流分析工具包,用于基于 AI 的多传感器处理以及视频、音频和图像理解。它是构建 IVA 应用和服务的视觉 AI 开发者、软件合作伙伴、初创公司和 OEM 的理想之选。


详细了解 DeepStream SDK

NVIDIA Omniverse

NVIDIA Omniverse™ 可帮助您集成 OpenUSDNVIDIA RTX™ 渲染技术,以及 物理 AI 集成到现有软件工具和仿真工作流中进行开发和测试 数字孪生。您可以将其与自己的软件结合使用,构建驱动机器人的 AI 机器人大脑,通过摄像头、设备等实现 Metropolis 感知,从而实现持续开发、测试和优化。

借助 Omniverse Replicator,您可以更轻松地大规模生成物理属性准确的 3D 合成数据,或构建自己的数据 合成数据 工具和框架。引导感知 AI 模型训练,实现准确的 Sim2Real 性能,而无需手动整理和标记真实数据。


详细了解 Omniverse Replicator
 An autonomous mobile robot in action in a warehouse
Use NVIDIA Cosmos generative world foundation models to build physical AI systems

NVIDIA Cosmos

NVIDIA Cosmos™ 是一个先进的生成式 AI 平台 世界基础模型( WFM) 、高级标记器、护栏以及加速数据处理和管护流程,旨在加速 物理 AI 系统。


详细了解 NVIDIA Cosmos

NVIDIA 物理 AI 数据集

利用此开源数据集解决智能空间、机器人和自动驾驶汽车开发方面的数据瓶颈。统一集合由用于构建 NVIDIA 物理 AI 解决方案的经过验证的数据组成,现在可供开发者在 Hugging Face 上免费获取。


立即开始构建
NVIDIA Physical AI dataset for smart spaces, robot, and autonomous vehicle development

使用和微调经过优化的 AI 模型

先进的视觉语言模型和视觉基础模型

访问各种先进的 AI 模型,构建视觉 AI 应用,将视觉和语言结合在一起,实现交互式视觉问答。视觉语言模型 (VLM) 是能够理解和处理视频、图像和文本的多模态生成式 AI 模型。计算机视觉基础模型 (包括视觉转换器 (ViT)) 可分析和解释视觉数据,以创建嵌入或执行物体检测、分割和分类等任务。


查看适用于视觉的 NVIDIA NIM
A vision language model that generates text output for video insights
The NVIDIA Train, Adapt, and Optimize (TAO) Toolkit

TAO 工具套件

训练、适应和优化 (TAO) 工具包是一种低代码 AI 模型开发解决方案,可让您利用迁移学习的强大功能,使用自己的数据微调 NVIDIA 预训练视觉语言模型和视觉基础模型,并优化推理,而无需 AI 专业知识或大型训练数据集。


详细了解 TAO 工具套件

构建功能强大的 AI 应用

AI Agent Blueprints

用于视频搜索和摘要 (VSS) 的 NVIDIA AI Blueprint 借助生成式 AI、视觉语言模型 (VLM) 、大语言模型 (LLM) 和 NVIDIA NIM,轻松开始构建和定制视频分析 AI 智能体。视频分析 AI 智能体通过自然语言分配任务,可以处理大量视频数据,以提供关键见解,帮助各行各业优化流程、提高安全性并降低成本。

基于该蓝图构建的 AI 智能体可以大规模分析、解释和处理视频数据,生成视频摘要的速度比手动浏览视频快 200 倍。该蓝图可以通过整合各种生成式 AI 模型和服务来加速 AI 智能体的开发,并通过各种 NVIDIA 和第三方 VLM/ LLM 以及从边缘到云的优化部署选项提供了很大的灵活性。


查看用于视频搜索和摘要的 NVIDIA AI Blueprint
Use NVIDIA AI Blueprint for video search and summarization
NVIDIA NIM are easy to use, cloud-native microservices for inferencing

NVIDIA NIM

NVIDIA NIM ( NVIDIA 推理微服务) 是一套易于使用的微服务,旨在跨云数据中心安全可靠地部署高性能 AI 模型推理。和工作站。NIM 支持各种 AI 模型 (包括基础模型、LLM、VLM 等) ,可确保使用行业标准 API 在本地或云端进行无缝、可扩展的 AI 推理。


查看适用于视觉的 NVIDIA NIM

Metropolis 微服务

Metropolis 微服务为开发视觉 AI 应用和解决方案提供强大、可定制的云原生基础模组。它们专为在 NVIDIA 云和数据中心 GPU 以及 NVIDIA Jetson Orin™ 边缘 AI 平台上运行而构建。


了解详情
Use Metropolis microservices to develop vision AI applications.
NVIDIA DeepStream SDK is a complete streaming analytics toolkit

DeepStream SDK

NVIDIA DeepStream SDK 是基于 GStreamer 的完整流分析工具包,用于基于 AI 的多传感器处理以及视频、音频和图像理解。它是构建 IVA 应用和服务的视觉 AI 开发者、软件合作伙伴、初创公司和 OEM 的理想之选。


详细了解 DeepStream SDK

利用模拟和合成数据增强训练

NVIDIA Omniverse

NVIDIA Omniverse™ 可帮助您集成 OpenUSDNVIDIA RTX™ 渲染技术,以及 物理 AI 集成到现有软件工具和仿真工作流中进行开发和测试 数字孪生。您可以将其与自己的软件结合使用,构建驱动机器人的 AI 机器人大脑,通过摄像头、设备等实现 Metropolis 感知,从而实现持续开发、测试和优化。

借助 Omniverse Replicator,您可以更轻松地大规模生成物理属性准确的 3D 合成数据,或构建自己的数据 合成数据 工具和框架。引导感知 AI 模型训练,实现准确的 Sim2Real 性能,而无需手动整理和标记真实数据。


详细了解 Omniverse Replicator
 An autonomous mobile robot in action in a warehouse
Use NVIDIA Cosmos generative world foundation models to build physical AI systems

NVIDIA Cosmos

NVIDIA Cosmos™ 是一个先进的生成式 AI 平台 世界基础模型( WFM) 、高级标记器、护栏以及加速数据处理和管护流程,旨在加速 物理 AI 系统。


详细了解 NVIDIA Cosmos

NVIDIA 物理 AI 数据集

利用此开源数据集解决智能空间、机器人和自动驾驶汽车开发方面的数据瓶颈。统一集合由用于构建 NVIDIA 物理 AI 解决方案的经过验证的数据组成,现在可供开发者在 Hugging Face 上免费获取。


立即开始构建
NVIDIA Physical AI dataset for smart spaces, robot, and autonomous vehicle development



开发者资源

Learn how to build a video search and summarization agent

构建视频搜索和摘要智能体

了解如何使用 NVIDIA AI Blueprint 进行视频搜索和摘要,无缝构建 AI 智能体,以实现长视频理解。

阅读博客
A vision language model workflow

VLM 参考工作流

查看构建多模态视觉 AI 智能体的高级工作流程。

阅读博客
Security alert on detecting a person without wearing a helmet

VLM 提示指南

了解如何为单图像、多图像和视频理解用例有效地提示 VLM。

阅读博客
Learn how to build a agentic video workflow

构建代理式视频工作流

了解如何构建包含音频输入、用于视频搜索的语音输出和摘要的工作流。

阅读博客

查看所有 Metropolis 技术博客

点播查看 NVIDIA GTC 演讲

借助 NVIDIA Metropolis 开发、部署和扩展支持 AI 的视频分析应用。


开始使用