CUDA
2026年 4月 14日
NVIDIA NVbandwidth:测量 GPU 互连和显存性能的必备工具
在编写 CUDA 应用程序时,要编写出色的代码,您需要关注的最重要的一点是数据传输性能。这适用于单 GPU 和多 GPU 系统。
3 MIN READ
2026年 4月 9日
如何加速蛋白质组规模的蛋白质结构预测
蛋白质很少像单个单体那样独立发挥作用。大多数生物过程由与其他蛋白质相互作用的蛋白质控制,形成蛋白质配合物,
2 MIN READ
2026年 3月 16日
NVIDIA Dynamo 1.0 如何助力量产级多节点推理
推理模型的规模正在迅速增长,并且越来越多地集成到与其他模型和外部工具交互的代理式 AI 工作流中。
4 MIN READ
2026年 2月 18日
登顶 GPU 内核排行榜:借助 NVIDIA CUDA.compute 实现卓越性能
Python 在符合人体工程学的机器学习领域占据主导地位,但编写真正高效的 GPU 代码历来需要使用 C++ 编写自定义内核,
2 MIN READ
2026年 1月 21日
使用 Single Call API 简化 CUB
C++ 模板库 CUB 提供了高性能 GPU 基元算法,但其将内存估计与分配分离的传统“两阶段”API 可能带来使用上的不便。
2 MIN READ
2026年 1月 5日
深度解析 NVIDIA Rubin 平台:六款新芯片打造AI超级计算机
AI 已进入工业阶段。 最初是用于执行离散 AI 模型训练和面向人类推理的系统,现已演变为全天候运行的 AI 工厂,持续将功率、
12 MIN READ
2024年 7月 2日
使用 CRIU 实现 CUDA 应用程序检查点
CUDA 的检查点和恢复功能通过名为 cuda-checkpoint 的命令行实用程序公开,
3 MIN READ
2024年 6月 12日
在 cuBLAS 中引入分组 GEMM API 以及更多性能更新
最新版本 NVIDIA cuBLAS 库版本 12.5 将继续为深度学习(DL)和高性能计算(HPC)工作负载提供功能和性能。
2 MIN READ
2024年 5月 21日
使用 QUELO-G 和 CUDA 图进行量子力学增强型药物研发
在药物研发中,人们经常使用基于所谓经典力场的方法,并认为这些方法很有用。然而,人们也广泛认识到,力场模型中缺少一些重要的物理特性,
2 MIN READ
2024年 5月 12日
NVIDIA CUDA-Q 新功能提升量子应用程序性能
NVIDIA CUDA-Q(前身为 NVIDIA CUDA Quantum)是一个开源编程模型,旨在构建 量子加速超级计算,充分发挥 CPU、
2 MIN READ
2024年 5月 10日
具有条件节点的 CUDA 图的动态控制流
CUDA 图 可以显著提高性能,因为驱动程序能够使用任务和依赖关系的完整描述来优化执行。特别是在静态工作流中,图形可以提供难以置信的好处,
2 MIN READ
2024年 3月 27日
高效的 CUDA 调试:将 NVIDIA Compute Sanitizer 与 NVIDIA 工具扩展程序结合使用并创建自定义工具
NVIDIA Compute Sanitizer 是一款功能强大的工具,可以节省时间和精力,同时提高 CUDA 应用程序的可靠性和性能。
5 MIN READ
2024年 3月 6日
CUDA 工具包 12.4 增强对 NVIDIA Grace Hopper 和机密计算的支持
最新版本的 CUDA 工具包,即 版本 12.4,继续利用最新的 NVIDIA GPU 来推动加速计算性能。
3 MIN READ
2024年 2月 28日
针对药物研发优化 OpenFold 训练
从氨基酸序列预测 3D 蛋白质结构一直是生物信息学领域由来已久的重要问题。近年来,基于深度学习的计算方法不断涌现,并已显示出有希望的结果。
2 MIN READ
2024年 1月 5日
在某些场景中使用 cgroup 缩短 CUDA 初始化时间
在多 GPU 平台上运行的许多 CUDA 应用程序通常使用单个 GPU 来满足其计算需求。在这种情况下,应用程序会支付性能损失,
2 MIN READ
2023年 4月 14日
GROMACS 2023 中的 CUDA 图指南
GPU 随着新一代的出现而不断加快,通常情况下 GPU 上的每个活动(如内核或内存拷贝)都会很快完成。在过去,
3 MIN READ