Nsight Compute

NVIDIA Nsight Compute

NVIDIA Nsight™ Compute 是适用于 CUDA® 和 NVIDIA OptiX™ 的交互式分析器,可通过用户界面和命令行工具提供详细的性能指标和 API 调试。用户可以运行引导式分析,并使用可定制的数据驱动型用户界面比较结果,还可以在自己的工作流程中对结果进行后处理和分析。

开始使用

NVIDIA Nsight Compute 也可作为CUDA 工具包



观看概述视频,了解 Nsight Compute 中的引导式分析如何助力 CUDA 内核优化。
突出显示 GPU 吞吐量、线程束状态统计数据和源代码关联。


Profile CUDA 和 OptiX

对于使用 CUDA 或 OptiX 进行开发,应用程序级性能调优只是 GPU 优化的开始。在需要深入研究计算流程时,务必要同时了解硬件活动和优化硬件活动所需的理解水平。借助 NVIDIA Nsight Compute,您不必成为硬件架构专家;Nsight Compute 是一款 CUDA 和 OptiX 分析器,可检测性能问题、直观地显示这些问题,并提供 NVIDIA 工程师提供的有关如何解决这些问题的内置指导。

利用 NVIDIA Insight

Nsight Compute 旨在通过一套功能强大的工具 (与 NVIDIA 自己的见解捆绑在一起) 来协助完成繁重的内核分析任务。通过可视化硬件性能指标,它可以将传统的神秘值转换为可操作的信息。Nsight Compute 所揭示的细节级别按层次顺序排列,因此内存利用率可以向下关联到源代码的各个行。NVIDIA 自身规则集的引导式分析已融入流程的每一步,可识别常见的性能限制因素,并提供宝贵的优化建议。

自定义和协作

对于专业用户,Nsight Compute 可以通过自定义指标收集和分析工作流进行扩展。对于跨平台开发,基准比较揭示了不同 GPU 架构之间的性能差异。为便于协作,可以将依赖项和源信息导入到报告中,并与同事和团队共享。分析可通过 Nsight Compute GUI 或 CLI 在本地设备上或远程进行。Python 开发者可以利用 NVRules API 实现自动分析。Nsight Compute 针对不同的开发领域、经验水平和项目规模提供了广泛的选择。


探索主要功能

通过引导分析找到优化方案

Nsight Compute 的报告页面可让您全面了解配置文件。详细信息页面提供了一些指标,这些指标涉及 GPU 的整体利用率、性能与各种硬件概念的关联方式,并在最后提供了优化操作建议。在此过程中,我们会通过引导式分析从 NVIDIA 的最佳实践中获取有关性能问题和解决方案的见解。基准比较可直接在工具中实现高效反馈,从而了解工作负载的任何更改所带来的影响。

详细信息页面会标记低 GPU 吞吐量,并自动检测作为潜在来源的性能限制因素。

用于可视化数据传输的内存图表,其中根据利用率使用热图对管道进行着色。

检查内存工作负载

显存工作负载分析可在已配置的架构上可视化显存传输大小和吞吐量,并提供性能提升指南。热图允许用户直观地了解内存工作流中的潜在瓶颈和未充分利用情况。每个硬件单元的详细表格有助于深入了解从发起指令到执行内存访问的路径。


详细了解内存工作负载分析

将源代码与详细的指令指标关联起来

Nsight Compute 支持将效率指标向下关联到相应的各个代码行。这包括使用 PTX 和更高级别的代码 (例如 CUDA C/C++、Fortran、OpenACC 或 python) 连接组件 (SASS)。热图可视化可突出显示指标值较高的区域,以快速定位有问题的区域。扭曲停止采样可识别延迟和低效问题,而指令执行指标则表示昂贵的代码位置。这种细节使仔细的眼睛能够精确地调整性能。

指标对应于源页面中正在分析的各代码行。

可视化节点配置和连接方式的 CUDA 图形。

利用 CUDA 图形和交互式分析

交互式分析会创建一个实时会话,在该会话中可以动态查看应用程序状态,并保留对目标的完全控制权。这允许您对 API 调用进行分步、检查资源或试验不同的内核配置,以便轻松进行性能比较。探索并导出 CUDA 图形,了解其连接方式,并使用详细的硬件指标分析单个节点或整个图形。

提升 OptiX 开发

Nsight Compute 是 NVIDIA Nsight 开发者工具套件的一部分,该套件包含一系列强大的工具、库和 SDK,支持开发者利用最新的加速计算硬件构建、调试和配置软件。

加速结构查看器,左侧是分层视图,中间是图形视图,右侧是控制选项。

查看 Nsight 套件中的其他工具

Nsight Compute 是 NVIDIA Nsight 开发者工具套件的一部分;该套件包含一系列强大的工具、库和 SDK,支持开发者利用最新的加速计算硬件构建、调试和配置软件。

Nsight Graphics

NVIDIA Nsight™ Graphics 是一款支持光线追踪的独立开发者工具,可让您调试、配置和导出使用 Direct3D、Vulkan、OpenGL、OpenVR 和 Oculus SDK 构建的帧。

开始使用

Nsight 深度学习设计器

NVIDIA Nsight DL Designer 是一个集成开发环境,可帮助开发者高效设计和开发用于应用内推理的深度神经网络。

开始使用

Nsight Systems

NVIDIA Nsight Systems 是一款系统级性能分析工具,旨在实现应用算法的可视化,帮助确定需要优化的最大机会,并进行调整,以便跨任意数量或大小的 CPU 和 GPU 进行高效扩展。

开始使用

观看 Nsight 开发者工具 CUDA 教程

CUDA 开发者工具是一系列教程视频,旨在帮助您开始使用 Nsight 工具进行 CUDA 开发。它探讨了 CUDA 分析、调试和优化的关键功能。

CUDA 开发者工具|NVIDIA Nsight 工具生态系统

CUDA 开发者工具|NVIDIA Nsight 系统简介

CUDA 开发者工具|NVIDIA Nsight Compute 简介


观看 Nsight 计算会议和点播技术视频

及时了解 NVIDIA Nsight Compute 的最新动态


准备好开始使用 NVIDIA Nsight Compute 了吗?

立即下载