NVIDIA Metropolis
NVIDIA Metropolis 是一套由模型、库和蓝图组成的解决方案,提供从边缘到云端构建、部署和扩展视频分析 AI agents 和应用所需的一切组件。借助它,你可以轻松将真实环境中的原始视频和传感器数据转化为实时且可付诸行动的洞察。这样一来,组织不仅能够更好地理解物理空间中正在发生的情况并进行智能响应,还能在规模、吞吐量、成本效率以及产品落地速度方面获得出色表现。
Metropolis 的工作原理
Metropolis 提供了一个连贯的端到端软件构建块堆栈,可处理从视频摄取到见解生成,再到高级代理式 AI 驱动的分析等各种任务。这些组件可以在整个计算范围内 (边缘、本地服务器或云端) 持续部署,因此相同的应用程序可以在靠近数据生成位置或大规模集中运行。

借助 NVIDIA DeepStream 技能创建视觉 AI 应用
了解如何使用简单的自然语言提示生成完整的、GPU 加速的 NVIDIA DeepStream 视频分析流程。
试用 DeepStream 技能Metropolis 入门
开始使用最新的 Metropolis 视觉语言和视觉基础模型。
嵌入
使用 Cosmos Embed、C-RADIO 和 NV-CLIP 等 NVIDIA 模型,将图像、视频和文本转换为向量表示,以实现物理 AI 和多模态理解。
使用特定领域的数据对您的视觉 AI 模型进行后期训练,以提高准确性。
开始使用基础 Metropolis 框架开发视觉 AI 应用。
生成高质量的合成数据,安全高效地训练 AI 模型。
物理 AI 数据集
借助经过验证的开源数据集,在行业、城市、机器人和自主系统中训练视觉 AI,解锁数据瓶颈,该数据集现已在 Hugging Face 上免费提供。
探索 NVIDIA 物理 AI 数据集用于合成数据生成的智能体技能
使用您自己的视频或图像数据构建合成数据生成工作流。然后,使用 Cosmos 开放 WFM 对其进行筛选、增强和评估,以加速视觉 AI 模型开发。
入门套件
开发视频分析 AI 智能体
通过计算机视觉和实时视觉推理,构建能够看到、理解世界并与之交互的智能系统。
构建视觉推理工作流
使用 DeepStream 开发流式传输工作流,以提取视频、预处理帧并运行优化的视觉 AI 模型。
后训练视觉语言模型
在特定任务的多模态数据上优化视觉语言模型,使其更好地将视觉理解与特定领域的概念和指令保持一致。
生成合成数据
创建合成图像和视频,以扩展训练数据集、降低采集成本,并提高各种场景中视觉模型的稳健性。
更多资源
伦理 AI
NVIDIA 认为值得信赖的 AI 是一项共同的责任,我们制定了相关政策和实践来支持各种 AI 应用的开发。根据我们的服务条款下载或使用时,开发者应与其支持的模型团队合作,确保此模型满足相关行业和用例的要求,并解决不可预见的产品滥用问题。
有关此模型道德因素的更多详细信息,请参阅模型卡 可解释性、偏差、安全性和隐私子卡。请报告安全漏洞或 NVIDIA AI 问题单击此处。
开发、部署和扩展支持 AI 的视频分析应用
NVIDIA Metropolis。