NVIDIA 技术博客
-
网络/通讯借助 NVIDIA Quantum InfiniBand 实现一键式多租户安全
-
精选在 NVIDIA 上运行 DiffusionGemma,实现开发者就绪型高吞吐量文本生成
-
数据中心/云端为 AI 工厂设计生产就绪型电池能源存储系统
-
数据科学借助 NVIDIA DGX Spark Enterprise 可管理性,大规模控制 AI 基础设施的生命周期
-
数据科学模型量化:借助 NVIDIA TensorRT 将 FP8 检查点转变为高性能推理引擎
最近
2026年 6月 11日
借助 NVIDIA Quantum InfiniBand 实现一键式多租户安全
NVIDIA Quantum InfiniBand 现可在 Unified Fabric Manager (UFM)…
2 MIN READ
2026年 6月 10日
在 NVIDIA 上运行 DiffusionGemma,实现开发者就绪型高吞吐量文本生成
构建实时 AI (例如聊天助手、copilot 和代理式工作流) 的开发者通常会受到词元-by-词元生成速度的限制。这限制了响应能力,
2 MIN READ
2026年 6月 10日
为 AI 工厂设计生产就绪型电池能源存储系统
AI 工厂正在改变数据中心基础设施的功能。 与传统数据中心不同,AI 工厂旨在大规模制造智能。它们运行功率密集型训练和推理工作负载,
2 MIN READ
2026年 6月 9日
借助 NVIDIA DGX Spark Enterprise 可管理性,大规模控制 AI 基础设施的生命周期
随着 AI 基础设施的扩展,企业对运营成熟度的期望与日俱增。组织期望这些系统具备可配置、可观察、安全且可大规模管理的特点,
1 MIN READ
2026年 6月 9日
模型量化:借助 NVIDIA TensorRT 将 FP8 检查点转变为高性能推理引擎
将量化检查点转换为 NVIDIA TensorRT 引擎可以弥合模型优化与生产部署之间的差距,从而实现更快的推理速度、
4 MIN READ
2026年 6月 9日
借助 AI 智能体和 NVIDIA FLARE Auto-FL 加速联邦学习研究
联邦学习 (FL) 研究通常从一个看似简单的问题开始:我们接下来应该尝试什么?在实验开始之前,新的聚合规则、FedProx 系数、
2 MIN READ
2026年 6月 9日
借助智能体技能和 NVIDIA Nemotron 语音,更快地评估临床 ASR 模型
训练语音 AI 模型以正确识别或合成临床术语异常困难。药物名称如 Acetaminophen、Amlodipine、
3 MIN READ
2026年 6月 8日
在 NVIDIA Blackwell 上使用 NVFP4,使用 JAX 和 MaxText 更快地训练模型
对前沿 LLM 进行预训练,可归结为吞吐量。当数千个加速器的训练规模达到数万亿词元时,
3 MIN READ
增强现实/虚拟现实
2026年 6月 2日
PICO 展示PICO 4 Ultra支持 NVIDIA Isaac Teleop,共同推进标准化的开源机器人遥操方案
在NVIDIA GTC 2026 大会上,
1 MIN READ
2026年 3月 31日
借助 NVIDIA CloudXR 6.0 将高保真空间计算内容串流到任何设备
空间计算正在从可视化转向主动协作,这增加了对 XR 硬件的 GPU 需求,以实时渲染逼真、物理精准、高保真的空间内容。与此同时,
2 MIN READ
2026年 3月 31日
使用 NVIDIA CloudXR.js 构建和流式传输基于浏览器的 XR 体验
为企业用户提供高保真 VR 和 AR 体验通常需要本地应用开发、自定义设备管理和复杂的部署流程。现在,
3 MIN READ
2025年 10月 22日
使用 NVIDIA Nemotron 构建您自己的 Bash 计算机使用代理,只需一小时
如果您能够通过自然语言与计算机通信,让计算机在 Bash 终端中执行任务,而无需手动编写任何命令,该怎么办?
5 MIN READ
2025年 5月 18日
聚焦:Perfect Corp. 利用 NVIDIA TensorRT 和 NVENC 实现个性化的数字化美妆体验
增强现实 (AR) 和 AI 通过提供从虚拟试用到 AI 驱动的造型推荐等超个性化体验,正在彻底改变美妆和时尚行业。
1 MIN READ
2025年 5月 6日
借助 NVIDIA RTX PRO Blackwell 台式机 GPU 实现 Rivian 新一代XR 设计
对于不断突破 XR 界限的专业人士而言,打造身临其境的高保真体验始终充满挑战。在渲染大型数据集和驱动最新的超高分辨率高级 XR 头显设备时,
2 MIN READ
2025年 3月 5日
借助 NVIDIA Omniverse 将 AR 体验串流到 Apple iPad
最近在 MWC 巴塞罗那宣布 ,开发者现在可以将使用 NVIDIA Omniverse 构建的增强现实(AR)体验流式传输到 Apple…
1 MIN READ
2025年 2月 24日
在 NVIDIA 视频编解码器 SDK 13.0 中使用 MV-HEVC 启用立体和 3D 视图
NVIDIA 宣布在最新的 NVIDIA 视频编解码器 SDK 版本 13.0 中实施多视图高效视频编码 (MV-HEVC) 编码器。
2 MIN READ
数据科学
2026年 5月 26日
借助 NVIDIA CompileIQ 自动调整功能提升内核性能
NVIDIA CompileIQ 解决了性能工程中最棘手的问题之一:找到为特定工作负载解锁最佳性能的编译器选项。 想象一下,
3 MIN READ
2026年 5月 26日
使用 NVIDIA CUDA Tile 在 C++ 中开发高性能 GPU 内核
开发者现在可以在现有的大型 C++ GPU 代码库中使用 NVIDIA CUDA Tile 编程,
6 MIN READ
2026年 5月 7日
模型量化:使用 NVIDIA Model Optimizer 进行后训练量化
模型量化是一种有效的方法,可减少显存占用并提升消费级设备(如 NVIDIA GeForce RTX GPU)上的推理性能。
2 MIN READ
2026年 5月 7日
借助 NCCL Inspector 和 Prometheus 实现实时性能监控和快速调试
分布式深度学习依赖于 NVIDIA 集合通信库(NCCL) 实现快速可靠的 GPU 间通信。当训练速度变慢时,
3 MIN READ
2026年 4月 30日
使用 AI 智能体自动翻译 GPU 内核:将 cuTile Python 转换为 cuTile.jl
NVIDIA CUDA Tile(cuTile)是一种基于图块的编程模型,可让开发者以图块为单位进行操作(如加载、存储和矩阵乘积累加),
3 MIN READ
2026年 4月 28日
在 NVIDIA BioNeMo 中使用上下文并行性扩展生物分子建模
几十年来,计算生物学一直在简化主义妥协下运作。为了将复杂的生物系统整合到单个 GPU 的有限内存中,
2 MIN READ
2026年 4月 28日
全天候模拟循环:代理式 AI 如何保持地下工程的移动
地下行业正处于数字化发展的关键时刻。几十年来,挖掘油藏潜力一直依赖于执行必要且耗时的手动工作流程的专家。 随着数据复杂性的增加,
2 MIN READ
2026年 4月 24日
使用 NVIDIA FLARE 在无重构开销的情况下进行联合学习
联邦学习 (FL) 不再是研究的好奇心,而是对棘手限制的实际回应:最有价值的数据通常是最不可动的数据。监管边界、
3 MIN READ