数据科学

2026年 6月 9日

借助 NVIDIA DGX Spark Enterprise 可管理性，大规模控制 AI 基础设施的生命周期

随着 AI 基础设施的扩展，企业对运营成熟度的期望与日俱增。组织期望这些系统具备可配置、可观察、安全且可大规模管理的特点，

1 MIN READ

2026年 6月 9日

模型量化：借助 NVIDIA TensorRT 将 FP8 检查点转变为高性能推理引擎

将量化检查点转换为 NVIDIA TensorRT 引擎可以弥合模型优化与生产部署之间的差距，从而实现更快的推理速度、

4 MIN READ

2026年 6月 9日

借助 AI 智能体和 NVIDIA FLARE Auto-FL 加速联邦学习研究

联邦学习 (FL) 研究通常从一个看似简单的问题开始：我们接下来应该尝试什么？在实验开始之前，新的聚合规则、FedProx 系数、

2 MIN READ

2026年 5月 26日

借助 NVIDIA CompileIQ 自动调整功能提升内核性能

NVIDIA CompileIQ 解决了性能工程中最棘手的问题之一：找到为特定工作负载解锁最佳性能的编译器选项。想象一下，

3 MIN READ

2026年 5月 26日

使用 NVIDIA CUDA Tile 在 C++ 中开发高性能 GPU 内核

开发者现在可以在现有的大型 C++ GPU 代码库中使用 NVIDIA CUDA Tile 编程，

6 MIN READ

2026年 5月 7日

模型量化：使用 NVIDIA Model Optimizer 进行后训练量化

模型量化是一种有效的方法，可减少显存占用并提升消费级设备（如 NVIDIA GeForce RTX GPU）上的推理性能。

2 MIN READ

2026年 5月 7日

借助 NCCL Inspector 和 Prometheus 实现实时性能监控和快速调试

分布式深度学习依赖于 NVIDIA 集合通信库（NCCL）实现快速可靠的 GPU 间通信。当训练速度变慢时，

3 MIN READ

2026年 4月 30日

使用 AI 智能体自动翻译 GPU 内核：将 cuTile Python 转换为 cuTile.jl

NVIDIA CUDA Tile（cuTile）是一种基于图块的编程模型，可让开发者以图块为单位进行操作（如加载、存储和矩阵乘积累加），

3 MIN READ

2026年 4月 28日

在 NVIDIA BioNeMo 中使用上下文并行性扩展生物分子建模

几十年来，计算生物学一直在简化主义妥协下运作。为了将复杂的生物系统整合到单个 GPU 的有限内存中，

2 MIN READ

2026年 4月 28日

全天候模拟循环：代理式 AI 如何保持地下工程的移动

地下行业正处于数字化发展的关键时刻。几十年来，挖掘油藏潜力一直依赖于执行必要且耗时的手动工作流程的专家。随着数据复杂性的增加，

2 MIN READ

2026年 4月 24日

使用 NVIDIA FLARE 在无重构开销的情况下进行联合学习

联邦学习 (FL) 不再是研究的好奇心，而是对棘手限制的实际回应：最有价值的数据通常是最不可动的数据。监管边界、

3 MIN READ

2026年 4月 23日

使用生成式 AI 辅助编码在 Kaggle 比赛中获胜

2026 年 3 月，三个 LLM 智能体生成了超过 60 万行代码，运行了 850 个实验，

3 MIN READ

2026年 4月 20日

使用端到端 FP8 精度运行高吞吐量强化学习训练

随着 LLM 从简单的文本生成过渡到复杂的推理，强化学习 (RL) 发挥着核心作用。群相对策略优化 (GRPO) 等算法为这种转变提供动力，

3 MIN READ

2026年 4月 9日

使用约 30 行 Python 和 NVIDIA nvCOMP 降低检查点成本

训练 LLM 需要定期检查点。这些模型权重、优化器状态和梯度的完整快照将保存到存储中，以便在中断后恢复训练。在规模上，这些检查点变得庞大 (…

5 MIN READ

2026年 4月 9日

如何加速蛋白质组规模的蛋白质结构预测

蛋白质很少像单个单体那样独立发挥作用。大多数生物过程由与其他蛋白质相互作用的蛋白质控制，形成蛋白质配合物，

2 MIN READ

2026年 3月 24日

构建用于推理、多模态 RAG、语音和安全的 NVIDIA Nemotron 3 智能体

代理式 AI 是一个专业模型协同工作的生态系统，可处理规划、推理、检索和安全护栏。随着这些系统的扩展，开发者需要能够理解现实世界多模态数据、

3 MIN READ