NVIDIA 视频编解码器 SDK



API 综合套装,包含高性能工具、样本和文档,适用于 Windows 和 Linux 的硬件加速型视频编码和解码。



NVIDIA GeForce Now 的工作原理是通过在数据中心中利用 NVENC 并将结果串流至终端客户端


此 SDK 包含两个硬件加速接口:
  • 用于视频编码加速的 NVENCODE API
  • 用于视频解码加速的 NVDECODE API(旧称 NVCUVID API)


  • NVIDIA GPU 包含一个或多个基于硬件的解码器和编码器(独立于 CUDA Core),可为几种热门的编解码器提供基于硬件的全加速视频解码和编码。由于卸载了解码/编码工作流,图形引擎和 CPU 可以有更多的时间执行其他操作。

    用于视频解码和编码的 GPU 硬件加速器引擎(前者简称 NVDEC,后者简称 NVENC)比实时视频处理速度更快,非常适合用于转码应用以及视频播放应用。


    * 该图展示对 NVIDIA Ampere GPU 系列的支持
    ** 硬件不对 4:2:2 提供原生支持
    *** 是否支持视编解码器而定



    NVENC:硬件加速的视频编码

    从 Kepler 这一代开始,NVIDIA GPU 包含基于硬件的编码器(简称为 NVENC),可提供基于硬件的全加速视频编码,且独立于图形性能。由于计算复杂的编码工作流完全卸载至 NVENC,图形引擎和 CPU 可以有更多的时间执行其他操作。例如,在游戏录制和直播过程中(如使用 Open Broadcaster Software (OBS)Twitch.tv 上直播),编码工作流完全卸载至 NVENC,从而使图形引擎带宽可全部用于游戏渲染。借助 NVENC,我们可以:

    • 在不使用 CPU 的情况下以高质量和超低延迟对游戏和应用进行编码和串流
    • 针对存档、OTT 串流、网络视频进行高质量编码
    • 以超低功耗对每个流进行编码(瓦特/流)

    注意:图表展示了 NVENC 在 NVIDIA 数据中心 A10、Tesla T4 和 Tesla P4 GPU 上的性能,背景信息如下:

    • 节省的比特率表示为基于 PSNR 的 BD-BR 百分比(使用 FFmpeg 计算),是各种内容(数百个视频片段)的平均值
    • 2010 年推出了新的高质量预设,以便借助 GPU 实现更大规模的扩展。由于 Turing 代产品为编码质量带来了显著提升,我们选用不同的质量预设,以便在同一图表上与上一代 GPU 进行比较
    • 为清楚起见,我们在基准图中只呈现了数据中心 GPU,但具有相同架构的同等工作站的 GPU 性能与之类似

    如需深入了解硬件硬件详情、用于生成上述数据的流程和软件配置,请参阅此详情文档

    GPUH.264 (AVCHD) YUV 4:2:0H.264 (AVCHD) YUV 4:4:4H.264 (AVCHD) 无损H.265 (HEVC) YUV 4:2:0H.265 (HEVC) YUV 4:4:4H.265 (HEVC) 无损
    最大色深最高分辨率最大色深最高分辨率最大色深最高分辨率最大色深最高分辨率最大色深最高分辨率最大色深最高分辨率
    Maxwell(第一代)*8 位4096 x 40968 位4096 x 40968 位4096 x 4096N/AN/AN/AN/AN/AN/A
    Maxwell(第 2 代)8 位4096 x 40968 位4096 x 40968 位4096 x 40968 位4096 x 4096N/AN/AN/AN/A
    Maxwell (GM206)8 位4096 x 40968 位4096 x 40968 位4096 x 40968 位4096 x 40968 位4096 x 40968 位4096 x 4096
    Pascal8 位4096 x 40968 位4096 x 40968 位4096 x 409610 位8192 x 8192**10 位8192 x 8192**10 位8192 x 8192**
    Volta8 位4096 x 40968 位4096 x 40968 位4096 x 409610 位8192 x 819210 位8192 x 819210 位8192 x 8192
    Turing8 位4096 x 40968 位4096 x 40968 位4096 x 409610 位8192 x 819210 位8192 x 819210 位8192 x 8192
    Ampere
    (A100)
    Ampere
    (非 A100)
    8 位4096 x 40968 位4096 x 40968 位4096 x 409610 位8192 x 819210 位8192 x 819210 位8192 x 8192
    * GM108 和 GP108 除外(不支持)
    ** GP100 除外(限于 4K 分辨率)


    NVDEC:硬件加速的视频解码

    NVIDIA GPU 包含基于硬件的解码器 (NVDEC),可为几种热门的编解码器提供基于硬件的全加速视频解码。由于解码工作流完全卸载至 NVDEC,图形引擎和 CPU 可以有更多的时间执行其他操作。NVDEC 比实时解码速度更快,非常适合用于转码应用以及视频播放应用。

    借助 NVDECODE API,软件开发者能够配置此专用硬件视频解码器。此专用加速器支持在 Windows 和 Linux 平台上对以下视频编解码器进行硬件加速解码:MPEG-2、VC-1、H.264 (AVCHD)、H.265 (HEVC)、VP8、VP9 和 AV1(参阅下表,了解各代 GPU 的编解码器支持)。



    GPU*H.265 (HEVC) 4:4:4H.265 (HEVC) 4:2:0H.264 (AVCHD) 4:2:0VP9VP8MPEG-2VC-1AV1
    最大色深最高分辨率最大色深最高分辨率最大色深最高分辨率最大色深最高分辨率最大色深最高分辨率最大色深最高分辨率最大色深最高分辨率最大色深最高分辨率
    KeplerN/AN/AN/AN/A8 位4096 x 4096N/AN/AN/AN/A8 位4080 x 40808 位2048 x 1024N/AN/A
    Maxwell(第一代)*N/AN/AN/AN/A8 位4096 x 4096N/AN/AN/AN/A8 位4080 x 40808 位2048 x 1024N/AN/A
    Maxwell(第 2 代)N/AN/AN/AN/A8 位4096 x 4096N/AN/A8 位4096 x 40968 位4080 x 40808 位2048 x 1024N/AN/A
    Maxwell (GM206)N/AN/A10 位4096 x 23048 位4096 x 40968 位4096 x 23048 位4096 x 40968 位4080 x 40808 位2048 x 1024N/AN/A
    PascalN/AN/A12 位8192 x 8192**8 位4096 x 409612 位****8192 x 8192**8 位4096 x 4096***8 位4080 x 40808 位2048 x 1024N/AN/A
    VoltaN/AN/A12 位8192 x 81928 位4096 x 409612 位8192 x 81928 位4096 x 40968 位4080 x 40808 位2048 x 1024N/AN/A
    Turing12 位8192 x 819212 位8192 x 81928 位4096 x 409612 位8192 x 81928 位4096 x 40968 位4080 x 40808 位2048 x 1024N/AN/A
    Ampere
    (A100)
    12 位8192 x 819212 位8192 x 81928 位4096 x 409612 位8192 x 81928 位4096 x 40968 位4080 x 40808 位2048 x 1024N/AN/A
    Ampere
    (非 A100)
    12 位8192 x 819212 位8192 x 81928 位4096 x 409612 位8192 x 81928 位4096 x 40968 位4080 x 40808 位2048 x 102410 位8192 x 8192

    * GM108 除外(不支持)
    ** 最高分辨率支持仅限于选定的 Pascal 芯片
    *** VP8 解码支持仅限于选定的 Pascal 芯片
    **** VP9 10/12 位解码支持仅限于选定的 Pascal 芯片




    合作伙伴和示例









    Adobe Premiere Pro

    Premiere Pro 是业内领先的电影、电视、社交及在线内容视频编辑应用。了解详情








    Blackmagic Design


    Blackmagic 是一家领先的创意视频技术制造商。Blackmagic 专注于质量和稳定性,以其编解码器和基于 Blackmagic 软硬件而打造的经济、有效高端编辑工作站闻名于世。

    访问 Blackmagic 获取详细产品信息








    Comprimato

    Comprimato 是一个 JPEG2000 软件编解码器工具包,可提供媒体娱乐和地理空间成像技术公司级栩栩如生的画面,使用户获得更好的体验并更准确地制定决策。这款超高清软件编解码器符合 JPEG2000 标准,可利用 GPU 和 CPU 的超级计算能力将视频和图像压缩速度提高 10 倍。Comprimato 可节省 70% 的基础架构成本,将开发周期缩短 50%,还可创造新的收入来源,如超高清、高动态范围 (HDR) 和高帧率 (HFR) 视频等。

    访问 Comprimato 获取详细产品信息








    DELTACAST Cinegy


    DELTACAST 为专业电视广播市场开发先进产品,提供一系列经济高效的显卡。这些显卡可与 SDK 软件结合用于 OEM 产品,从而打造出专业的广播自定义解决方案和产品。

    访问 DELTACAST 获取详细产品信息








    Erlyvideo LLC


    Erlyvideo LLC 自 2010 年起便一直专注于开发串流视频软件。该公司的电信级服务器解决方案可帮助业务客户截取、处理、转码、存档,并为数百万名订阅者提供视频内容。Erlyvideo LLC 正在努力研发可靠且优质的产品,从而真正满足客户需求。目前超 100 个国家/地区的客户使用其产品构建 IPTV/OTT、CDN 和视频监控即服务 CCTV 系统。

    Flussonic Media Server 是用于启动高负载视频流服务的多用途软件解决方案。借助 Flussonic Media Server,您可以设置任何规模的端到端视频流工作流。Flussonic 可以以几乎任何格式、编解码器和分辨率让视频流进出,对传入的流进行处理和转码,并为订阅者提供精彩的视频内容,从而让企业从更先进、更高效的视频流平台中获益。

    访问 Flussonic.com 获取详细产品信息








    Fastvideo


    Fastvideo 是基于 GPU 的高性能图像和视频处理领域的全球领导者。该团队包含经验丰富且高度敬业的专业人士,专注于 GPU 图像处理、算法设计和并行计算。Fastvideo 可为不同领域(包括图像和视频处理、高速成像、机器视觉和其他摄像头应用、流媒体、数字影院、3D 和 VR、直播等)提供行业领先的出色技术性能:图像压缩和解压缩(JPEG、JPEG2000、Raw Baye)、去马赛克、降噪、色调映射、色彩校正、调整尺寸、锐化、视频流编码和解码。


    访问 Fastvideo 获取详细产品信息









    Main Concept

    三十年来,MainConcept 一直是制作、直播和广播行业首屈一指的视频和音频编解码器、插件和应用提供商。MainConcept 支持从提取到交付的稳健视频工作流,是全球各顶尖品牌的理想之选。

    MainConcept® Hybrid GPU HEVC 编码器将市场领先的 MainConcept® HEVC 软件编码器与 NVIDIA RTX 架构的出色性能相结合,既能实现高质量输出,也能快速进行硬件编码。借助 MainConcept 可靠且经过市场验证的比特率控制和高质量编码算法以及 NVIDIA 的处理能力,MainConcept Hybrid GPU HEVC 编码器能以更快的速度提供可达 8K 的出色画质。


    “通过在硬件中访问 HEVC/H.265 视频编码,客户可以在利用 NVIDIA GPU 计算能力的同时,继续在具有丰富的多路复用器和辅助组件产品系列的知名 MainConcept 环境中工作。使用 NVIDIA GPU 进行 HEVC/H.265 编码可增加服务器密度,以实现在一个系统上处理多个视频流,同时仍有足够的 CPU 资源可供应用使用。” MainConcept 技术许可和全球销售高级副总裁 Deacon Johnson

    详细了解 MainConcept Hybrid GPU HEVC 编码器







    Medialooks

    Medialooks 成立于 2005 年,为广播客户提供高级软件开发套件,以帮助快速构建播出自动化、虚拟演播室和视频截取解决方案。Medialooks 的客户包括 PlayBox Technologies、Arvato Systems、Masterplay、Winjay、Etere、Axel Technology、Xeus Media、Wolftech 和 Broadcast Play。

    访问 Medialooks 获取详细产品信息








    Multicamera.Systems LLC

    Multicamera.Systems LLC 可为机器视觉摄像头开发视频采集和录制软件,服务于科学实验室、VR、运动分析自动驾驶汽车和军事等各行业。得益于 Multicamera.Systems LLC 的专属“GPUSqueeze”库(支持多 GPU 视频压缩),“The Recorder”软件是市场上唯一能以每秒数千帧的速度录制 h.26x 压缩视频的软件。此库现已面向第三方开发者提供。

    “The Recorder”软件的主要功能包括:

    • 对多摄像头和多 PC 设置的强力支持
    • 兼容所有类型的机器视觉摄像头:USB-Vision、GigE-Vision、CoaXPress 和 CLHS
    • 通过实时视频流完全远程控制录制系统
    • 以任何帧率将视频录制成未压缩的 M-JPEG 和 H.26x 格式
    • 轻松集成用户自己的模组,实现在线和离线图像处理

    “GPUSqueeze”库的主要功能包括:

    • 轻松集成至用户自己的应用中,实现高速和多流视频编码和转码
    • 接受拜耳 (Bayer) 图像并执行高质量的去马赛克操作
    • 完全在 GPU 上完成所有图像处理,且性能会随系统中 GPU 数量的增加而线性扩展
    • 支持混合 GPU 配置(例如 GTX 1660 + RTX 2080),为最终用户提供额外的灵活性并节省成本




    “借助 NVIDIA 的高性能视频引擎与 CUDA,Multicamera.Systems LLC 得以成功开发“GPUSqueeze”库,并让“The Recorder”软件用户能够高速录制视频。这两者的结合还可以显著提高开发中的视频编码或转码应用的性能。” Multicamera.Systems LLC 创始人兼总监 Dmitry Semiannikov

    访问 Multicamera.systems 获取有关“GPUSqueeze”库的更多信息
    访问 Medialooks 获取有关“The Recorder”软件的详细产品信息








    Norpix Cuda JPEG 压缩库


    Norpix 可用于为科学、机器视觉、军事和通用数字视频采集应用开发数字视频录制软件。该公司旗下用于单台或多台摄像机采集的 DVR 软件 Streampix 曾创下行业销量第一的佳绩。Norpix 还开发了在 NVIDIA GPU 上运行的 SDK 和 CUDA JPEG 压缩库。

    产品优势包括:

    • 以从 1% 到 99% 的质量系数实时截取有损 JPEG
    • 单色压缩至高可达 30 亿像素
    • 彩色压缩至高可达 22 亿像素
    • 兼容 usb3Vision、GigE Vision、10 GigE Vision、Camera Link 和 CoaXPress 摄像头
    • 支持多个 NVIDIA GPU,可在多个摄像头上实现并行处理负载均衡
    • 支持独立 C/C++ 库和运行时

    访问 Norpix 获取详细产品信息








    GeForce NOW


    NVIDIA GeForce NOW™ 是一项按需服务,可将用户连接至 NVIDIA 云游戏超级计算机,以高达 1080p 的分辨率和每秒 60 帧的速率将 PC 游戏串流至 SHIELD 设备。

    详细了解 GeForce NOW








    Open Broadcaster Software (OBS)

    OBS Studio 是一款免费的开源软件,专为高效截取、合成、编码、录制和直播视频内容而设计。

    深入了解 OBS Studio

    博客:借助为 GeForce 优化的新 OBS 和 RTX 编码器,只需单台 PC 即可进行专业级优质广播









    SplitmediaLabs


    总部位于中国香港,在菲律宾马尼拉设有开发中心。SplitmediaLabs 拥有庞大的客户群体,超 800 万人和企业使用其产品来发展社区、创造创新内容,并与世界各地的其他参与者建立联系。自 2009 年创建以来,SplitmediaLabs 开发了 XSplit、Challonge 和 Player.me 软件,帮助开创了游戏直播的新时代。

    XSplit Broadcaster:一款简单而强大的直播和录制软件,在全球拥有海量用户,是制作和提供丰富视频内容的理想解决方案。


    “借助 NVIDIA NVENC,用户可以轻松使用 XSplit 直播单个 PC 游戏。通过原生集成 NVIDIA 视频编解码器 SDK,XSplit 能够将录制和直播的视频编码从 CPU 卸载到 GPU,使用户能够在不影响游戏画质的情况下制作高质量内容。” SplitmediaLabs Limited 开发者关系总监 Miguel Molina

    详细了解 XSplit








    Streamline

    Streamline 是专为优质的端到端白标直播系统而设计的参考系统,涵盖从 HDMI/HD-SDI 截取到 CDN 上的播放器的全部内容,支持 Web、iOS 和 Android 设备。Streamline 使用商品计算机硬件、免费软件和 AWS,是一种学习如何构建高质量直播系统的经济实惠的方式。

    详细了解 Streamline








    Telestream

    Telestream® 擅长提供让所有观众都可观看视频内容的产品,而无论其创造、传播或观看方式如何。Telestream 的产品涵盖整个数字媒体生命周期(从截取到观看,从普通消费者到高端专业人士),包括桌面组件、跨平台应用,以及完全自动化的企业级数字媒体转码和工作流系统。Telestream 使各种商业环境中的用户都能成功利用其视频内容的价值。

    访问 Telestream 获取详细产品信息








    Wowza

    Wowza Media Systems™ 是公认的直播黄金标准,在 170 余个国家/地区拥有超 22,000 位客户。通过降低向设备传输视频和音频的复杂性,Wowza™ 使企业组织能够扩大自身影响范围,在教育、直播等行业更加深度吸引用户。Wowza 产品提供稳健、可自定义且可扩展的串流解决方案和功能强大的 API 和 SDK,满足企业组织不断变化的串流需求,深受全球服务提供商、直接客户和合作伙伴信赖。Wowza 是一家私营公司,成立于 2005 年,总部位于美国科罗拉多州。

    访问 Wowza 获取详细产品信息







    视频编解码器 SDK 的实际应用



    视频占据全球互联网流量的 60%。随着世界数字化程度越来越高,寻找传输视频的高效途径……

    了解详情

    随着越来越多的人居家办公,这让视频编辑者面临巨大挑战,他们必须以全新方式交付内容。许多人都在使用……

    了解详情

    详细了解 NVIDIA 视频编解码器 SDK 和 NVIDIA Optical Flow SDK 的最新动态。Turing 和更高版本的 GPU……

    立即观看

    从 Kepler 一代开始,NVIDIA GPU 便已支持硬件加速的视频编码,而所有 GPU 自……

    了解详情

    了解更多详情

    本次“专家面对面”活动是在 2020 年 GTC 大会线上活动中录制的关于视频编解码器 SDK 和 Optical Flow SDK 的问答视频。

    立即观看

    最近发布的 Turing 硬件架构的 Tensor Core,具有更出色的机器学习性能,但新的 GPU 也……

    了解详情
    NVIDIA 技术博客
    NVIDIA FFmpeg 转码指南

    使用 FFmpeg 库是对视频数据进行转码的常见做法。硬件加速显著改善了……

    了解详情



    想要将视频编解码器 SDK 与您的应用集成或利用 FFMPEG 吗?

    开始使用(下载)