深入了解
2026年 6月 4日
NVIDIA Nemotron 3 Ultra 为长时间运行的智能体提供更快、更高效的推理能力
单轮聊天机器人正在演变为长时间运行的智能体,这些智能体可以进行推理、维护上下文、使用工具,并在多轮中高效运行,从而完成复杂的工作流程。 但是,
3 MIN READ
2026年 6月 4日
GPU 数据库:从并行计算到原生加速
随着传统通用计算逐渐逼近性能瓶颈,CPU 的单核效率提升已难以支撑爆发式数据增长的处理需求。在人工智能与大规模分析深度融合的当下,
2 MIN READ
2026年 6月 1日
在 NVIDIA DGX Spark 上使用更快的模型和多节点集群运行本地 AI 智能体
自主、长期运行的 AI 智能体的兴起带来了一种新型计算需求,即维护大型上下文窗口、生成并发子智能体,以及在不依赖云的情况下持续迭代的任务。
2 MIN READ
2026年 5月 31日
借助 NVIDIA Cosmos 3 开发物理 AI 推理模型、世界模型和动作模型
物理 AI 系统必须先了解现实世界,然后才能在其中发挥作用。机器人、智能汽车和智能空间需要了解其环境中发生的情况,预测接下来可能发生的情况,
5 MIN READ
2026年 5月 31日
借助 NVIDIA DOCA 芯片级安全,推进代理式 AI 的 AI 基础设施建设
AI 时代正在催生一种新型基础设施:AI 工厂。AI 工厂能将数据转化为智能,赋能规模空前的自主AI 智能体。借助加速计算,
3 MIN READ
2026年 5月 29日
DynoSim:模拟帕累托前沿
现代 LLM 服务难以调优,因为每一次部署都是一组相互作用的选择堆栈:模型后端、张量并行形状、prefill/decode 拆分、
3 MIN READ
2026年 5月 29日
如何使用 NVIDIA MCG 工具包自动生成 AI 模型文档
随着 AI 模型日益复杂,并且在包括加州 AB-2013 和欧盟《人工智能法案》在内的框架下监管审查不断加强,
2 MIN READ
2026年 5月 26日
借助 NVIDIA CompileIQ 自动调整功能提升内核性能
NVIDIA CompileIQ 解决了性能工程中最棘手的问题之一:找到为特定工作负载解锁最佳性能的编译器选项。 想象一下,
3 MIN READ
2026年 5月 26日
使用 NVIDIA CUDA Tile 在 C++ 中开发高性能 GPU 内核
开发者现在可以在现有的大型 C++ GPU 代码库中使用 NVIDIA CUDA Tile 编程,
6 MIN READ
2026年 5月 26日
借助 NVIDIA RTX PRO 4500 Blackwell 更快地运行关键基因组学和蛋白质折叠工作负载
精准医疗依赖于两项基本能力:在基因组层面了解疾病,以及在分子层面确定治疗方法。 NVIDIA 对精准医疗的贡献不仅限于加速计算,
3 MIN READ
2026年 5月 22日
大规模合成逼真的 3D 医学影像,提供经过预训练的模型
高质量的 3D 医学成像数据是现代放射学 AI 的基础,但对这些数据的访问往往受到数据稀缺、隐私限制和专家标注成本高昂的限制。因此,
3 MIN READ
2026年 5月 21日
借助 Slurm 拓扑感知型作业调度功能,在 NVIDIA GB200 NVL72 上实现百万兆级性能
随着AI模型的规模和复杂性持续提升,要充分发挥现代加速基础设施的性能,关键在于如何合理分配工作负载以及硬件的部署方式。
3 MIN READ
2026年 5月 21日
在电信 AI 工厂构建词元+ Metered AI 服务
全球各地的电信公司正基于主权AI工厂基于NVIDIA云合作伙伴(NCP)参考架构,建设,使政府、企业和初创公司能够以适当的控制力、
3 MIN READ
2026年 5月 20日
掌握智能体技术:AI 智能体定制
自主 AI 智能体 正承担着企业中的各种任务:规划物流车队路线、分类支持工单、生成代码以及编排多步骤工作流。
3 MIN READ