开发工具与技巧
2026年 4月 23日
使用生成式 AI 辅助编码在 Kaggle 比赛中获胜
2026 年 3 月,三个 LLM 智能体生成了超过 60 万行代码,运行了 850 个实验,
3 MIN READ
2026年 4月 22日
在 nvmath-python 中使用通用稀疏张量简化稀疏深度学习
在上一篇文章中,我们介绍了通用稀疏张量 (UST),使开发者能够将张量的稀疏性与其内存布局解,从而提高灵活性和性能。
4 MIN READ
2026年 4月 20日
更大限度地提高内存效率,在 NVIDIA Jetson 上运行更大的模型
开源生成式 AI 模型的迅猛发展正在推动数据中心向物理世界中运行的机器迈进。开发者渴望在边缘部署这些模型,
4 MIN READ
2026年 4月 17日
借助 NVIDIA Dynamo 实现代理式推理的全栈优化
编程智能体开始大规模编写产品级代码。 Stripe 的智能体每周生成 1300 多个 PR。 Ramp 将 30%
4 MIN READ
2026年 4月 17日
使用 OpenClaw 和 NVIDIA NemoClaw 构建更安全、始终运行的本地 AI 智能体
智能体正在从问答系统发展为长期运行的自主助手,可读取文件、调用 API 并驱动多步骤工作流。但是,
3 MIN READ
2026年 4月 16日
如何使用 NVIDIA DeepStream 编码智能体构建视觉 AI 工作流
开发实时视觉 AI 应用给开发者带来了重大挑战,通常需要复杂的数据工作流、无数行代码和漫长的开发周期。
3 MIN READ
2026年 4月 14日
使用 NVIDIA ALCHEMI 工具包为化学和材料科学构建自定义原子模拟工作流
几十年来,计算化学一直面临准确性与速度之间的拔河。密度泛函理论 (DFT) 等 Ab initio 方法提供高保真度,但计算成本高昂,
5 MIN READ
2026年 4月 14日
NVIDIA NVbandwidth:测量 GPU 互连和显存性能的必备工具
在编写 CUDA 应用程序时,要编写出色的代码,您需要关注的最重要的一点是数据传输性能。这适用于单 GPU 和多 GPU 系统。
3 MIN READ
2026年 4月 9日
使用 Slurm 在 Kubernetes 上运行大规模 GPU 工作负载
Slurm 是适用于 Linux 的开源集群管理和作业调度系统。它可以管理超过 65% 的 TOP500 系统 的作业调度。
3 MIN READ
2026年 4月 9日
使用约 30 行 Python 和 NVIDIA nvCOMP 降低检查点成本
训练 LLM 需要定期检查点。这些模型权重、优化器状态和梯度的完整快照将保存到存储中,以便在中断后恢复训练。在规模上,这些检查点变得庞大 (…
5 MIN READ
2026年 4月 7日
在机架级超级计算机上运行 AI 工作负载:从硬件到拓扑感知调度
采用 NVIDIA Blackwell 架构的 NVIDIA GB200 NVL72 和 NVIDIA GB300 NVL72…
4 MIN READ
2026年 3月 31日
借助 NVIDIA CloudXR 6.0 将高保真空间计算内容串流到任何设备
空间计算正在从可视化转向主动协作,这增加了对 XR 硬件的 GPU 需求,以实时渲染逼真、物理精准、高保真的空间内容。与此同时,
2 MIN READ
2026年 3月 31日
使用 NVIDIA CloudXR.js 构建和流式传输基于浏览器的 XR 体验
为企业用户提供高保真 VR 和 AR 体验通常需要本地应用开发、自定义设备管理和复杂的部署流程。现在,
3 MIN READ
2026年 3月 25日
使用生成模型 Proteina-Complexa 设计蛋白质结合剂
开发基于蛋白质的新疗法和催化剂涉及到设计这一富有挑战性的任务蛋白质结合剂或与目标蛋白质或小分子结合的蛋白质。
3 MIN READ
2026年 3月 23日
NVIDIA IGX Thor 为工业、医疗和机器人边缘 AI 应用提供动力支持
工业和医疗系统正在迅速增加高性能 AI 的使用,以提高工人的工作效率、人机交互和停机管理。从工厂自动化单元到自主移动平台,再到手术室,
4 MIN READ
2026年 3月 16日
NVIDIA Dynamo 1.0 如何助力量产级多节点推理
推理模型的规模正在迅速增长,并且越来越多地集成到与其他模型和外部工具交互的代理式 AI 工作流中。
4 MIN READ