NVIDIA 视频编解码器 SDK
API 综合套装,包含高性能工具、样本和文档,适用于 Windows 和 Linux 的硬件加速型视频编码和解码。

NVIDIA GPU 包含一个或多个基于硬件的解码器和编码器(独立于 CUDA Core),可为几种热门的编解码器提供基于硬件的全加速视频解码和编码。由于卸载了解码/编码工作流,图形引擎和 CPU 可以有更多的时间执行其他操作。
用于视频解码和编码的 GPU 硬件加速器引擎(前者简称 NVDEC,后者简称 NVENC)比实时视频处理速度更快,非常适合用于转码应用以及视频播放应用。

* 该图展示对 NVIDIA Ampere GPU 系列的支持
** 硬件不对 4:2:2 提供原生支持
*** 是否支持视编解码器而定
从 Kepler 这一代开始,NVIDIA GPU 包含基于硬件的编码器(简称为 NVENC),可提供基于硬件的全加速视频编码,且独立于图形性能。由于计算复杂的编码工作流完全卸载至 NVENC,图形引擎和 CPU 可以有更多的时间执行其他操作。例如,在游戏录制和直播过程中(如使用 Open Broadcaster Software (OBS) 在 Twitch.tv 上直播),编码工作流完全卸载至 NVENC,从而使图形引擎带宽可全部用于游戏渲染。借助 NVENC,我们可以:
- 在不使用 CPU 的情况下以高质量和超低延迟对游戏和应用进行编码和串流
- 针对存档、OTT 串流、网络视频进行高质量编码
- 以超低功耗对每个流进行编码(瓦特/流)
注意:图表展示了 NVENC 在 NVIDIA 数据中心 A10、Tesla T4 和 Tesla P4 GPU 上的性能,背景信息如下:
- 节省的比特率表示为基于 PSNR 的 BD-BR 百分比(使用 FFmpeg 计算),是各种内容(数百个视频片段)的平均值
- 2010 年推出了新的高质量预设,以便借助 GPU 实现更大规模的扩展。由于 Turing 代产品为编码质量带来了显著提升,我们选用不同的质量预设,以便在同一图表上与上一代 GPU 进行比较
- 为清楚起见,我们在基准图中只呈现了数据中心 GPU,但具有相同架构的同等工作站的 GPU 性能与之类似
如需深入了解硬件硬件详情、用于生成上述数据的流程和软件配置,请参阅此详情文档。
GPU | H.264 (AVCHD) YUV 4:2:0 | H.264 (AVCHD) YUV 4:4:4 | H.264 (AVCHD) 无损 | H.265 (HEVC) YUV 4:2:0 | H.265 (HEVC) YUV 4:4:4 | H.265 (HEVC) 无损 | ||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|
最大色深 | 最高分辨率 | 最大色深 | 最高分辨率 | 最大色深 | 最高分辨率 | 最大色深 | 最高分辨率 | 最大色深 | 最高分辨率 | 最大色深 | 最高分辨率 | |
Maxwell(第一代)* | 8 位 | 4096 x 4096 | 8 位 | 4096 x 4096 | 8 位 | 4096 x 4096 | N/A | N/A | N/A | N/A | N/A | N/A |
Maxwell(第 2 代) | 8 位 | 4096 x 4096 | 8 位 | 4096 x 4096 | 8 位 | 4096 x 4096 | 8 位 | 4096 x 4096 | N/A | N/A | N/A | N/A |
Maxwell (GM206) | 8 位 | 4096 x 4096 | 8 位 | 4096 x 4096 | 8 位 | 4096 x 4096 | 8 位 | 4096 x 4096 | 8 位 | 4096 x 4096 | 8 位 | 4096 x 4096 |
Pascal | 8 位 | 4096 x 4096 | 8 位 | 4096 x 4096 | 8 位 | 4096 x 4096 | 10 位 | 8192 x 8192** | 10 位 | 8192 x 8192** | 10 位 | 8192 x 8192** |
Volta | 8 位 | 4096 x 4096 | 8 位 | 4096 x 4096 | 8 位 | 4096 x 4096 | 10 位 | 8192 x 8192 | 10 位 | 8192 x 8192 | 10 位 | 8192 x 8192 |
Turing | 8 位 | 4096 x 4096 | 8 位 | 4096 x 4096 | 8 位 | 4096 x 4096 | 10 位 | 8192 x 8192 | 10 位 | 8192 x 8192 | 10 位 | 8192 x 8192 |
Ampere (A100) | 无 | 无 | 无 | 无 | 无 | 无 | 无 | 无 | 无 | 无 | 无 | 无 |
Ampere (非 A100) | 8 位 | 4096 x 4096 | 8 位 | 4096 x 4096 | 8 位 | 4096 x 4096 | 10 位 | 8192 x 8192 | 10 位 | 8192 x 8192 | 10 位 | 8192 x 8192 |
** GP100 除外(限于 4K 分辨率)
NVIDIA GPU 包含基于硬件的解码器 (NVDEC),可为几种热门的编解码器提供基于硬件的全加速视频解码。由于解码工作流完全卸载至 NVDEC,图形引擎和 CPU 可以有更多的时间执行其他操作。NVDEC 比实时解码速度更快,非常适合用于转码应用以及视频播放应用。
借助 NVDECODE API,软件开发者能够配置此专用硬件视频解码器。此专用加速器支持在 Windows 和 Linux 平台上对以下视频编解码器进行硬件加速解码:MPEG-2、VC-1、H.264 (AVCHD)、H.265 (HEVC)、VP8、VP9 和 AV1(参阅下表,了解各代 GPU 的编解码器支持)。

GPU | *H.265 (HEVC) 4:4:4 | H.265 (HEVC) 4:2:0 | H.264 (AVCHD) 4:2:0 | VP9 | VP8 | MPEG-2 | VC-1 | AV1 | ||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
最大色深 | 最高分辨率 | 最大色深 | 最高分辨率 | 最大色深 | 最高分辨率 | 最大色深 | 最高分辨率 | 最大色深 | 最高分辨率 | 最大色深 | 最高分辨率 | 最大色深 | 最高分辨率 | 最大色深 | 最高分辨率 | |
Kepler | N/A | N/A | N/A | N/A | 8 位 | 4096 x 4096 | N/A | N/A | N/A | N/A | 8 位 | 4080 x 4080 | 8 位 | 2048 x 1024 | N/A | N/A |
Maxwell(第一代)* | N/A | N/A | N/A | N/A | 8 位 | 4096 x 4096 | N/A | N/A | N/A | N/A | 8 位 | 4080 x 4080 | 8 位 | 2048 x 1024 | N/A | N/A |
Maxwell(第 2 代) | N/A | N/A | N/A | N/A | 8 位 | 4096 x 4096 | N/A | N/A | 8 位 | 4096 x 4096 | 8 位 | 4080 x 4080 | 8 位 | 2048 x 1024 | N/A | N/A |
Maxwell (GM206) | N/A | N/A | 10 位 | 4096 x 2304 | 8 位 | 4096 x 4096 | 8 位 | 4096 x 2304 | 8 位 | 4096 x 4096 | 8 位 | 4080 x 4080 | 8 位 | 2048 x 1024 | N/A | N/A |
Pascal | N/A | N/A | 12 位 | 8192 x 8192** | 8 位 | 4096 x 4096 | 12 位**** | 8192 x 8192** | 8 位 | 4096 x 4096*** | 8 位 | 4080 x 4080 | 8 位 | 2048 x 1024 | N/A | N/A |
Volta | N/A | N/A | 12 位 | 8192 x 8192 | 8 位 | 4096 x 4096 | 12 位 | 8192 x 8192 | 8 位 | 4096 x 4096 | 8 位 | 4080 x 4080 | 8 位 | 2048 x 1024 | N/A | N/A |
Turing | 12 位 | 8192 x 8192 | 12 位 | 8192 x 8192 | 8 位 | 4096 x 4096 | 12 位 | 8192 x 8192 | 8 位 | 4096 x 4096 | 8 位 | 4080 x 4080 | 8 位 | 2048 x 1024 | N/A | N/A |
Ampere (A100) | 12 位 | 8192 x 8192 | 12 位 | 8192 x 8192 | 8 位 | 4096 x 4096 | 12 位 | 8192 x 8192 | 8 位 | 4096 x 4096 | 8 位 | 4080 x 4080 | 8 位 | 2048 x 1024 | N/A | N/A |
Ampere (非 A100) | 12 位 | 8192 x 8192 | 12 位 | 8192 x 8192 | 8 位 | 4096 x 4096 | 12 位 | 8192 x 8192 | 8 位 | 4096 x 4096 | 8 位 | 4080 x 4080 | 8 位 | 2048 x 1024 | 10 位 | 8192 x 8192 |
* GM108 除外(不支持)
** 最高分辨率支持仅限于选定的 Pascal 芯片
*** VP8 解码支持仅限于选定的 Pascal 芯片
**** VP9 10/12 位解码支持仅限于选定的 Pascal 芯片
合作伙伴和示例
Blackmagic 是一家领先的创意视频技术制造商。Blackmagic 专注于质量和稳定性,以其编解码器和基于 Blackmagic 软硬件而打造的经济、有效高端编辑工作站闻名于世。
Comprimato 是一个 JPEG2000 软件编解码器工具包,可提供媒体娱乐和地理空间成像技术公司级栩栩如生的画面,使用户获得更好的体验并更准确地制定决策。这款超高清软件编解码器符合 JPEG2000 标准,可利用 GPU 和 CPU 的超级计算能力将视频和图像压缩速度提高 10 倍。Comprimato 可节省 70% 的基础架构成本,将开发周期缩短 50%,还可创造新的收入来源,如超高清、高动态范围 (HDR) 和高帧率 (HFR) 视频等。
DELTACAST 为专业电视广播市场开发先进产品,提供一系列经济高效的显卡。这些显卡可与 SDK 软件结合用于 OEM 产品,从而打造出专业的广播自定义解决方案和产品。
Erlyvideo LLC 自 2010 年起便一直专注于开发串流视频软件。该公司的电信级服务器解决方案可帮助业务客户截取、处理、转码、存档,并为数百万名订阅者提供视频内容。Erlyvideo LLC 正在努力研发可靠且优质的产品,从而真正满足客户需求。目前超 100 个国家/地区的客户使用其产品构建 IPTV/OTT、CDN 和视频监控即服务 CCTV 系统。
Flussonic Media Server 是用于启动高负载视频流服务的多用途软件解决方案。借助 Flussonic Media Server,您可以设置任何规模的端到端视频流工作流。Flussonic 可以以几乎任何格式、编解码器和分辨率让视频流进出,对传入的流进行处理和转码,并为订阅者提供精彩的视频内容,从而让企业从更先进、更高效的视频流平台中获益。
三十年来,MainConcept 一直是制作、直播和广播行业首屈一指的视频和音频编解码器、插件和应用提供商。MainConcept 支持从提取到交付的稳健视频工作流,是全球各顶尖品牌的理想之选。
MainConcept® Hybrid GPU HEVC 编码器将市场领先的 MainConcept® HEVC 软件编码器与 NVIDIA RTX 架构的出色性能相结合,既能实现高质量输出,也能快速进行硬件编码。借助 MainConcept 可靠且经过市场验证的比特率控制和高质量编码算法以及 NVIDIA 的处理能力,MainConcept Hybrid GPU HEVC 编码器能以更快的速度提供可达 8K 的出色画质。

详细了解 MainConcept Hybrid GPU HEVC 编码器“通过在硬件中访问 HEVC/H.265 视频编码,客户可以在利用 NVIDIA GPU 计算能力的同时,继续在具有丰富的多路复用器和辅助组件产品系列的知名 MainConcept 环境中工作。使用 NVIDIA GPU 进行 HEVC/H.265 编码可增加服务器密度,以实现在一个系统上处理多个视频流,同时仍有足够的 CPU 资源可供应用使用。” MainConcept 技术许可和全球销售高级副总裁 Deacon Johnson
Medialooks 成立于 2005 年,为广播客户提供高级软件开发套件,以帮助快速构建播出自动化、虚拟演播室和视频截取解决方案。Medialooks 的客户包括 PlayBox Technologies、Arvato Systems、Masterplay、Winjay、Etere、Axel Technology、Xeus Media、Wolftech 和 Broadcast Play。
Multicamera.Systems LLC 可为机器视觉摄像头开发视频采集和录制软件,服务于科学实验室、VR、运动分析自动驾驶汽车和军事等各行业。得益于 Multicamera.Systems LLC 的专属“GPUSqueeze”库(支持多 GPU 视频压缩),“The Recorder”软件是市场上唯一能以每秒数千帧的速度录制 h.26x 压缩视频的软件。此库现已面向第三方开发者提供。
“The Recorder”软件的主要功能包括:
- 对多摄像头和多 PC 设置的强力支持
- 兼容所有类型的机器视觉摄像头:USB-Vision、GigE-Vision、CoaXPress 和 CLHS
- 通过实时视频流完全远程控制录制系统
- 以任何帧率将视频录制成未压缩的 M-JPEG 和 H.26x 格式
- 轻松集成用户自己的模组,实现在线和离线图像处理
“GPUSqueeze”库的主要功能包括:
- 轻松集成至用户自己的应用中,实现高速和多流视频编码和转码
- 接受拜耳 (Bayer) 图像并执行高质量的去马赛克操作
- 完全在 GPU 上完成所有图像处理,且性能会随系统中 GPU 数量的增加而线性扩展
- 支持混合 GPU 配置(例如 GTX 1660 + RTX 2080),为最终用户提供额外的灵活性并节省成本


“借助 NVIDIA 的高性能视频引擎与 CUDA,Multicamera.Systems LLC 得以成功开发“GPUSqueeze”库,并让“The Recorder”软件用户能够高速录制视频。这两者的结合还可以显著提高开发中的视频编码或转码应用的性能。” Multicamera.Systems LLC 创始人兼总监 Dmitry Semiannikov
访问 Multicamera.systems 获取有关“GPUSqueeze”库的更多信息
访问 Medialooks 获取有关“The Recorder”软件的详细产品信息
Norpix 可用于为科学、机器视觉、军事和通用数字视频采集应用开发数字视频录制软件。该公司旗下用于单台或多台摄像机采集的 DVR 软件 Streampix 曾创下行业销量第一的佳绩。Norpix 还开发了在 NVIDIA GPU 上运行的 SDK 和 CUDA JPEG 压缩库。
产品优势包括:
- 以从 1% 到 99% 的质量系数实时截取有损 JPEG
- 单色压缩至高可达 30 亿像素
- 彩色压缩至高可达 22 亿像素
- 兼容 usb3Vision、GigE Vision、10 GigE Vision、Camera Link 和 CoaXPress 摄像头
- 支持多个 NVIDIA GPU,可在多个摄像头上实现并行处理负载均衡
- 支持独立 C/C++ 库和运行时
NVIDIA GeForce NOW™ 是一项按需服务,可将用户连接至 NVIDIA 云游戏超级计算机,以高达 1080p 的分辨率和每秒 60 帧的速率将 PC 游戏串流至 SHIELD 设备。
OBS Studio 是一款免费的开源软件,专为高效截取、合成、编码、录制和直播视频内容而设计。
总部位于中国香港,在菲律宾马尼拉设有开发中心。SplitmediaLabs 拥有庞大的客户群体,超 800 万人和企业使用其产品来发展社区、创造创新内容,并与世界各地的其他参与者建立联系。自 2009 年创建以来,SplitmediaLabs 开发了 XSplit、Challonge 和 Player.me 软件,帮助开创了游戏直播的新时代。
XSplit Broadcaster:一款简单而强大的直播和录制软件,在全球拥有海量用户,是制作和提供丰富视频内容的理想解决方案。
“借助 NVIDIA NVENC,用户可以轻松使用 XSplit 直播单个 PC 游戏。通过原生集成 NVIDIA 视频编解码器 SDK,XSplit 能够将录制和直播的视频编码从 CPU 卸载到 GPU,使用户能够在不影响游戏画质的情况下制作高质量内容。” SplitmediaLabs Limited 开发者关系总监 Miguel Molina
Streamline 是专为优质的端到端白标直播系统而设计的参考系统,涵盖从 HDMI/HD-SDI 截取到 CDN 上的播放器的全部内容,支持 Web、iOS 和 Android 设备。Streamline 使用商品计算机硬件、免费软件和 AWS,是一种学习如何构建高质量直播系统的经济实惠的方式。
Telestream® 擅长提供让所有观众都可观看视频内容的产品,而无论其创造、传播或观看方式如何。Telestream 的产品涵盖整个数字媒体生命周期(从截取到观看,从普通消费者到高端专业人士),包括桌面组件、跨平台应用,以及完全自动化的企业级数字媒体转码和工作流系统。Telestream 使各种商业环境中的用户都能成功利用其视频内容的价值。
Wowza Media Systems™ 是公认的直播黄金标准,在 170 余个国家/地区拥有超 22,000 位客户。通过降低向设备传输视频和音频的复杂性,Wowza™ 使企业组织能够扩大自身影响范围,在教育、直播等行业更加深度吸引用户。Wowza 产品提供稳健、可自定义且可扩展的串流解决方案和功能强大的 API 和 SDK,满足企业组织不断变化的串流需求,深受全球服务提供商、直接客户和合作伙伴信赖。Wowza 是一家私营公司,成立于 2005 年,总部位于美国科罗拉多州。
视频编解码器 SDK 的实际应用

随着越来越多的人居家办公,这让视频编辑者面临巨大挑战,他们必须以全新方式交付内容。许多人都在使用……
了解详情
详细了解 NVIDIA 视频编解码器 SDK 和 NVIDIA Optical Flow SDK 的最新动态。Turing 和更高版本的 GPU……
立即观看