计算机视觉

计算机视觉 (CV) 是人工智能的一个领域，可让计算机和系统从数字图像、视频和其他视觉输入中获取有意义的信息。它使智能摄像头等设备能够采集、处理、分析和解读图像和视频。智能视频分析、图像/ 视频检测和识别以及 3D 重建等 CV 应用已对各行各业的公司产生巨大影响。

从零售、安全、医疗健康和建筑到制造、消费互联网和汽车，计算机以与人们相同的方式识别和分析照片和视频中的物品具有巨大优势。 NVIDIA 的高性能、低能耗解决方案使开发者能够加快计算机视觉管道的每个部分，以便在生产环境中进行部署，从边缘到云和数据中心。他们现在可以快速构建和部署先进的模型，提供实时图像和视频处理所需的高吞吐量和低延迟解决方案。

广泛的用例

自动驾驶汽车和机器人

识别潜在碰撞并采取预防措施以避免事故，从而提高自动驾驶汽车和机器人系统的安全性和效率。

智慧城市和城市规划

检测和分割道路、建筑物、公园和公共设施等各种城市特征，为城市规划师和建筑师提供有价值的见解。

医疗健康和生命科学

分析和解释放射学图像和基因组序列等复杂的医疗数据，实现更精确的诊断、个性化治疗计划和创新研究。

媒体和娱乐

自动执行内容分析，利用动作捕捉制作更逼真的动画，并打造沉浸式虚拟现实体验，以增强艺术表现力并深化观众参与度。

改变行业的优势

NVIDIA computer vision software enables intelligent automation in various industries

智能自动化

使用计算机视觉来解释和理解视觉数据，使机器能够执行传统上由人类完成的任务。

NVIDIA computer vision software improves quality control processes

改进质量控制

使用计算机视觉识别生产线中的缺陷、异常或不一致之处，从而提高产品质量并减少浪费，从而增强质量控制流程。

NVIDIA computer vision software supports object detection and tracking

物体检测和追踪

监控和分析交通流量，检测车辆、行人和骑车者。这些数据有助于优化交通信号、管理拥堵并提高整体运输效率。

NVIDIA computer vision software promotes public safety and security

公共安全和安保

实时检测和跟踪物体，以提醒当局注意行人的潜在安全隐患 (例如乱跑者或人行道上的障碍物) ，从而营造更安全的行走环境。

端到端计算机视觉解决方案

Learn about computer vision SDKs and libraries

计算机视觉 SDK 和库

NVIDIA 提供一系列加速的 CV SDK 和库，可加速从边缘到云的生产部署流程的每个部分。我们的 SDK 和库已实现生产就绪，可以轻松进行调整以满足您的独特需求。这为您提供了灵活性和可靠性，将强大的视觉感知功能集成到您的应用中。

了解详情

Explore computer vision solutions in all industries.

行业解决方案

NVIDIA 提供多种行业特定的计算机视觉软件产品和平台。无论您的应用是什么，总有一款 SDK 可以满足您的挑战。

医疗健康：NVIDIA Clara™
机器人开发：NVIDIA Isaac Sim™
汽车：NVIDIA DRIVE®
虚拟形象：NVIDIA Avatar Cloud Engine ( ACE)
视频会议：NVIDIA Maxine
工业：NVIDIA Metropolis

Learn about NVIDIA’s latest computer vision research and development

计算机视觉研究

了解我们的计算机视觉研究工程师和数据科学家一直在解决哪些问题。

阅读我们的最新出版物

Explore universal standard description (USD) for computer vision

适用于计算机视觉的 USD

NVIDIA Omniverse™ 是 AI 的数据工厂，可用于生成合成数据并在仿真环境中验证 AI 模型 Omniverse Replicator。这个模块化开发平台基于 (OpenUSD) ，一个可扩展的开放式 3D 框架。借助 OpenUSD，开发者可以利用 3D 仿真环境的强大功能，构建 AI 应用，为机器人、自动驾驶汽车等提供动力支持。

详细了解 Omniverse Replicator

计算机视觉技术

大多数技术都始于模型或数学算法，这些模型或算法已使用大量数据进行训练，以完成特定任务。一些常见技术包括：

分类

分类涉及识别图像或视频帧中的物体。这些模型通常使用大型数据集进行训练，以识别简单的物体 (如狗、猫、椅子) 或非常具体的物体 (如道路场景中的车辆类型) 。分类输出的质量取决于所使用的训练数据。训练数据的数量和多样性越多，精度就越高。

检测

检测涉及在图像或视频帧中定位和定位一个或多个物体。该算法会在检测到的物体周围输出一个矩形框，以指明其在图像中的位置。物体检测器经过训练后，可用于检测图像或视频帧中的汽车、道路标志、人员或其他感兴趣的物体。

分割

分割是指通过为图像中的每个像素分配标签，精确定位图像中感兴趣的物体或区域。这样，具有相同标签的像素具有相似的特征，例如颜色或纹理。分割模型常用于医学成像，用于执行自动检测磁共振成像 (MRI) 扫描中的肿瘤等任务。

开始使用计算机视觉技术

查找常见问题解答

计算机视觉不仅仅是研究。它提供了改变生活的现实解决方案。 NVIDIA 在人工智能和高性能计算方面的深厚专业知识为有意义地影响世界提供了无限的机会。

计算机视觉技术常见问题解答

Get started with Frequently Asked Questions

图像分割入门

首次接触计算机视觉？开始学习 NVIDIA 深度学习培训中心 (DLI) 提供的有关图像分割的两小时免费课程。您将了解如何通过将图像分割与其他计算机视觉挑战进行比较，分割 MRI 图像以测量心脏的各个部分。我们将试验 TensorFlow 工具 (例如 TensorBoard 和 TensorFlow Keras Python API) ，并学习实施有效的模型性能评估指标。

开始使用