CUDA
2026年 6月 1日
在 NVIDIA JetPack 7.2 中部署具有高显存效率的边缘代理就绪型 AI
随着 AI 智能体 从数字世界转向物理环境,他们可以轻松使用 NVIDIA Jetson,通过优化的内存和性能加速现实世界的部署。
3 MIN READ
2026年 5月 26日
借助 NVIDIA CompileIQ 自动调整功能提升内核性能
NVIDIA CompileIQ 解决了性能工程中最棘手的问题之一:找到为特定工作负载解锁最佳性能的编译器选项。 想象一下,
3 MIN READ
2026年 5月 26日
使用 NVIDIA CUDA Tile 在 C++ 中开发高性能 GPU 内核
开发者现在可以在现有的大型 C++ GPU 代码库中使用 NVIDIA CUDA Tile 编程,
6 MIN READ
2026年 5月 26日
NVIDIA CUDA 13.3 通过 C++ 中的平铺式编程、编译器自动调整和 Python 更新来增强 GPU 开发
NVIDIA CUDA 13.3 为整个 CUDA 生态系统的开发者带来了新功能和性能优化。通过在 C++ 中引入 NVIDIA CUDA…
4 MIN READ
2026年 5月 21日
借助 Slurm 拓扑感知型作业调度功能,在 NVIDIA GB200 NVL72 上实现百万兆级性能
随着AI模型的规模和复杂性持续提升,要充分发挥现代加速基础设施的性能,关键在于如何合理分配工作负载以及硬件的部署方式。
3 MIN READ
2026年 5月 21日
在电信 AI 工厂构建词元+ Metered AI 服务
全球各地的电信公司正基于主权AI工厂基于NVIDIA云合作伙伴(NCP)参考架构,建设,使政府、企业和初创公司能够以适当的控制力、
3 MIN READ
2026年 4月 14日
NVIDIA NVbandwidth:测量 GPU 互连和显存性能的必备工具
在编写 CUDA 应用程序时,要编写出色的代码,您需要关注的最重要的一点是数据传输性能。这适用于单 GPU 和多 GPU 系统。
3 MIN READ
2026年 4月 9日
如何加速蛋白质组规模的蛋白质结构预测
蛋白质很少像单个单体那样独立发挥作用。大多数生物过程由与其他蛋白质相互作用的蛋白质控制,形成蛋白质配合物,
2 MIN READ
2026年 3月 16日
NVIDIA Dynamo 1.0 如何助力量产级多节点推理
推理模型的规模正在迅速增长,并且越来越多地集成到与其他模型和外部工具交互的代理式 AI 工作流中。
4 MIN READ
2026年 2月 18日
登顶 GPU 内核排行榜:借助 NVIDIA CUDA.compute 实现卓越性能
Python 在符合人体工程学的机器学习领域占据主导地位,但编写真正高效的 GPU 代码历来需要使用 C++ 编写自定义内核,
2 MIN READ
2026年 1月 21日
使用 Single Call API 简化 CUB
C++ 模板库 CUB 提供了高性能 GPU 基元算法,但其将内存估计与分配分离的传统“两阶段”API 可能带来使用上的不便。
2 MIN READ
2026年 1月 5日
深度解析 NVIDIA Rubin 平台:六款新芯片打造AI超级计算机
AI 已进入工业阶段。 最初是用于执行离散 AI 模型训练和面向人类推理的系统,现已演变为全天候运行的 AI 工厂,持续将功率、
12 MIN READ
2024年 7月 2日
使用 CRIU 实现 CUDA 应用程序检查点
CUDA 的检查点和恢复功能通过名为 cuda-checkpoint 的命令行实用程序公开,
3 MIN READ
2024年 6月 12日
在 cuBLAS 中引入分组 GEMM API 以及更多性能更新
最新版本 NVIDIA cuBLAS 库版本 12.5 将继续为深度学习(DL)和高性能计算(HPC)工作负载提供功能和性能。
2 MIN READ
2024年 5月 21日
使用 QUELO-G 和 CUDA 图进行量子力学增强型药物研发
在药物研发中,人们经常使用基于所谓经典力场的方法,并认为这些方法很有用。然而,人们也广泛认识到,力场模型中缺少一些重要的物理特性,
2 MIN READ
2024年 5月 12日
NVIDIA CUDA-Q 新功能提升量子应用程序性能
NVIDIA CUDA-Q(前身为 NVIDIA CUDA Quantum)是一个开源编程模型,旨在构建 量子加速超级计算,充分发挥 CPU、
2 MIN READ