开发工具与技巧
2026年 5月 26日
NVIDIA CUDA 13.3 通过 C++ 中的平铺式编程、编译器自动调整和 Python 更新来增强 GPU 开发
NVIDIA CUDA 13.3 为整个 CUDA 生态系统的开发者带来了新功能和性能优化。通过在 C++ 中引入 NVIDIA CUDA…
4 MIN READ
2026年 5月 19日
NVIDIA 认证的智能体技能为 AI 智能体提供能力治理
自主 AI 智能体的能力正不断增强。开放模型、模型上下文协议(MCP)连接的工具以及可移植技能,使得智能体更易于扩展。然而,
1 MIN READ
2026年 5月 19日
掌握代理式技术:AI 智能体评估
评估AI模型与评估AI智能体密切相关,但两者回答的问题截然不同。模型基准测试衡量的是基础模型的能力,例如理解语言、
1 MIN READ
2026年 5月 13日
用于新型材料纳米级成像 (XANI) 的加速 X 射线分析
大规模 X 射线自由电子激光 (XFEL) 能够追踪新型系统中的结构和电子动力学,包括聚变材料、半导体、电池和催化剂。
4 MIN READ
2026年 5月 8日
流式传输词元和工具:NVIDIA Dynamo 中的多回合代理线束支持
智能体交换必须保留结构化交互:助手通过一次或多次工具调用进行交错推理,随后用户轮流将相应的工具结果返回至模型上下文。
4 MIN READ
2026年 5月 7日
借助 NCCL Inspector 和 Prometheus 实现实时性能监控和快速调试
分布式深度学习依赖于 NVIDIA 集合通信库(NCCL) 实现快速可靠的 GPU 间通信。当训练速度变慢时,
3 MIN READ
2026年 4月 30日
如何在 ComfyUI 中构建、运行和扩展高质量的创作者工作流
如今,创意和可视化团队可以利用更精简的团队制作更多格式的素材。生成式 AI 可以加速这项工作,
3 MIN READ
2026年 4月 30日
使用 AI 智能体自动翻译 GPU 内核:将 cuTile Python 转换为 cuTile.jl
NVIDIA CUDA Tile(cuTile)是一种基于图块的编程模型,可让开发者以图块为单位进行操作(如加载、存储和矩阵乘积累加),
3 MIN READ
2026年 4月 23日
使用生成式 AI 辅助编码在 Kaggle 比赛中获胜
2026 年 3 月,三个 LLM 智能体生成了超过 60 万行代码,运行了 850 个实验,
3 MIN READ
2026年 4月 22日
在 nvmath-python 中使用通用稀疏张量简化稀疏深度学习
在上一篇文章中,我们介绍了通用稀疏张量 (UST),使开发者能够将张量的稀疏性与其内存布局解,从而提高灵活性和性能。
4 MIN READ
2026年 4月 20日
更大限度地提高内存效率,在 NVIDIA Jetson 上运行更大的模型
开源生成式 AI 模型的迅猛发展正在推动数据中心向物理世界中运行的机器迈进。开发者渴望在边缘部署这些模型,
4 MIN READ
2026年 4月 17日
借助 NVIDIA Dynamo 实现代理式推理的全栈优化
编程智能体开始大规模编写产品级代码。 Stripe 的智能体每周生成 1300 多个 PR。 Ramp 将 30%
4 MIN READ
2026年 4月 17日
使用 OpenClaw 和 NVIDIA NemoClaw 构建更安全、始终运行的本地 AI 智能体
智能体正在从问答系统发展为长期运行的自主助手,可读取文件、调用 API 并驱动多步骤工作流。但是,
3 MIN READ
2026年 4月 16日
如何使用 NVIDIA DeepStream 编码智能体构建视觉 AI 工作流
开发实时视觉 AI 应用给开发者带来了重大挑战,通常需要复杂的数据工作流、无数行代码和漫长的开发周期。
3 MIN READ
2026年 4月 14日
使用 NVIDIA ALCHEMI 工具包为化学和材料科学构建自定义原子模拟工作流
几十年来,计算化学一直面临准确性与速度之间的拔河。密度泛函理论 (DFT) 等 Ab initio 方法提供高保真度,但计算成本高昂,
5 MIN READ
2026年 4月 14日
NVIDIA NVbandwidth:测量 GPU 互连和显存性能的必备工具
在编写 CUDA 应用程序时,要编写出色的代码,您需要关注的最重要的一点是数据传输性能。这适用于单 GPU 和多 GPU 系统。
3 MIN READ