精选
2026年 5月 14日
NVIDIA Vera Rubin 平台如何解决代理式 AI 的纵向扩展问题
代理式推理通过引入非确定性轨迹(即AI智能体在执行任务时生成的动作、观察结果和决策),从根本上改变了推理工作负载的运行时特性。
2 MIN READ
2026年 5月 13日
借助 AI 智能体和技能,将视频转化为即时搜索、可操作的智能
在当今数据驱动的世界中,组织对视频的依赖日益增加,用以捕捉关键信息。然而,从海量视频片段中实时提取有意义的洞察仍是一大挑战。
4 MIN READ
2026年 5月 13日
用于新型材料纳米级成像 (XANI) 的加速 X 射线分析
大规模 X 射线自由电子激光 (XFEL) 能够追踪新型系统中的结构和电子动力学,包括聚变材料、半导体、电池和催化剂。
4 MIN READ
2026年 5月 12日
如何在 AI 模型服务中消除管道摩擦
从训练好的AI模型到投入生产的路径本应顺畅,但实际情况往往并非如此。许多团队花费数周时间对模型进行微调,
2 MIN READ
2026年 5月 11日
隆重推出 NVIDIA Fleet Intelligence,实现实时 GPU 车队可视化和优化
大型 GPU 集群的计算能力带来了前所未有的创新机会,并在创纪录的时间内为客户提供价值。然而,这些进步带来了各种挑战。在规模化方面,
2 MIN READ
2026年 5月 8日
借助受语法限制的解码,改进小语言模型中的 Bash 生成
Bash 是面向 AI 智能体的最灵活、最强大的接口之一。在正确的系统中,发出 、、 或 shell 工作流的模型正在生成可执行动作,
3 MIN READ
2026年 5月 8日
流式传输词元和工具:NVIDIA Dynamo 中的多回合代理线束支持
智能体交换必须保留结构化交互:助手通过一次或多次工具调用进行交错推理,随后用户轮流将相应的工具结果返回至模型上下文。
4 MIN READ
2026年 5月 7日
借助 Slurm 块调度在 NVIDIA GB200 NVL72 上实现峰值系统和工作负载效率
NVIDIA GB200 NVL72 通过在整个机架范围内扩展 NVIDIA NVLink 一致性,开创了一种全新的 GPU 集群构建方式。
3 MIN READ
2026年 5月 7日
模型量化:使用 NVIDIA Model Optimizer 进行后训练量化
模型量化是一种有效的方法,可减少显存占用并提升消费级设备(如 NVIDIA GeForce RTX GPU)上的推理性能。
2 MIN READ
2026年 5月 7日
借助 NCCL Inspector 和 Prometheus 实现实时性能监控和快速调试
分布式深度学习依赖于 NVIDIA 集合通信库(NCCL) 实现快速可靠的 GPU 间通信。当训练速度变慢时,
3 MIN READ
2026年 5月 5日
借助极致协同设计构建日益复杂的代理式系统
生成式 AI 具有爆炸性的第一章由发送请求的人类和响应的模型定义。代理式章节有所不同。 智能体不会遵循预先确定的动作序列。它们可以调用工具,
3 MIN READ
2026年 4月 30日
借助适用于 RTX 运行时的 NVIDIA TensorRT 加速虚幻引擎神经网络推理
神经网络技术越来越多地用于计算机图形,以提高图像质量、性能和简化内容创作。超分辨率、降噪和神经网络渲染等方法有助于实时引擎更高效地工作,
2 MIN READ
2026年 4月 30日
借助 NVIDIA DLSS 4.5、RTX 和 Unreal Engine 5 构建 AI 驱动的游戏
现在,游戏开发者可以开始集成 NVIDIA DLSS 4.5 动态多帧生成、6 倍多帧生成,
2 MIN READ
2026年 4月 30日
如何在 ComfyUI 中构建、运行和扩展高质量的创作者工作流
如今,创意和可视化团队可以利用更精简的团队制作更多格式的素材。生成式 AI 可以加速这项工作,
3 MIN READ
2026年 4月 30日
使用 AI 智能体自动翻译 GPU 内核:将 cuTile Python 转换为 cuTile.jl
NVIDIA CUDA Tile(cuTile)是一种基于图块的编程模型,可让开发者以图块为单位进行操作(如加载、存储和矩阵乘积累加),
3 MIN READ
2026年 4月 29日
使用 NVIDIA 企业参考架构为 AI 工厂提供支持
下一波企业生产力浪潮将以AI工厂为基础。随着企业部署能够实现大规模推理、自动化和实时决策的代理式AI系统,
2 MIN READ