数据中心/云端

2026年 7月 16日

借助 NVIDIA BlueField 实现极致协同设计，扩展代理式 AI 工厂

代理式 AI 改变了 AI 工厂的基础设施模式。在生成最终答案之前，一个请求可以触发多次模型调用、工具调用、内存查找、策略检查、

2 MIN READ

2026年 7月 13日

NVIDIA 正在解码，将色彩代码逻辑错误率降低超过 300 倍

实用的量子计算机需要容错逻辑运算。研究人员正在积极探索许多不同的量子纠错 (QEC) 代码来实现这一点，从而提高量子处理单元 (QPU)…

2 MIN READ

2026年 7月 10日

AI 模型协同设计：硬件友好型 LLM 设计

AI 性能可归结为三个维度：部署必须平衡这三者：如果响应速度缓慢，就会浪费高准确度；如果每个用户的体验滞后，则原始吞吐量就意味着微不足道。

5 MIN READ

2026年 7月 6日

使用 Noniform Tensor Parallelism 提高大规模 LLM 训练的效率

大规模训练 LLM 会带来独特的基础架构挑战，尤其是在作业跨越数千个 GPU 并长时间运行的情况下。这些作业运行的时间越长，

2 MIN READ

2026年 7月 2日

基于硬件的 AI 安全性不会拖慢您的速度

AI 改变了组织的运营方式，推动了前所未有的生产力和创新水平。但是，数据隐私、主权以及如何保护使用中的数据，

2 MIN READ

2026年 7月 1日

NVIDIA BlueField DPU：助力 AI 云兼顾效率与可信

随着大模型和高性能 AI 业务全面上云，用户的核心诉求正在从“有没有算力”转向“算力是否可控、是否隔离可信、能否高效调度”。

1 MIN READ

2026年 6月 30日

使用 NVIDIA GQE 设计 GPU 加速的查询引擎

GPU 加速的查询引擎通常会受到内存和 I/ O 带宽的限制。NVIDIA 硬件的进步 (包括高带宽显存 (HBM) 、

4 MIN READ

2026年 6月 29日

如何治理企业 AI 工厂中的自主智能体

AI 智能体正在迅速超越聊天。它们检查代码、运行测试、阅读文档、搜索知识库、查询内部系统，并代表用户运行几个小时。这样不仅可以提高工作效率，

1 MIN READ

2026年 6月 26日

在 Oracle 云基础设施上部署生产就绪型 NVIDIA AI-Q Blueprint

在过去两年中，AI 智能体发生了巨大变化。第一个问题一次只能回答一个问题。接下来是多轮聊天，模型可以在会议中保留一些上下文。如今，

3 MIN READ

2026年 6月 23日

通过全栈推理和训练优化，更大限度地提高 AI 工厂的能效

为运行 AI 工厂，电力成本可占运营支出（OpEx）的 40%。每瓦可用于开销、数据摄取、训练，或为客户生成 token。

2 MIN READ

2026年 6月 23日

使用 DFlash 预测解码，在 NVIDIA Blackwell 上将推理性能提升高达 15 倍

随着 AI 系统从单轮交互转向协调的多智能体工作流，低延迟推理成为越来越重要。自回归 LLM 按顺序生成 token，

2 MIN READ

2026年 6月 23日

使用 NVIDIA BioNeMo Agent Toolkit 打造适用于生命科学发现的 AI 科学家

AI 科学家正在成为科学计算的新界面。这些智能体可以阅读论文、编写代码、生成假设、调用 API、检查文件并对结果进行迭代。

2 MIN READ

2026年 6月 16日

构建您自己的金融智能交易基础模型

现代金融网络上的每一次刷卡、转账和付款都会对人类行为模式进行编码。事务数据是企业掌握的最丰富的信号之一。然而，

3 MIN READ

2026年 6月 16日

如何优化基于 Transformer 的模型以进行低精度训练

Transformer 架构是许多现代大型语言和生成式 AI 模型的支柱。随着这些模型规模的扩大，

3 MIN READ

2026年 6月 16日

NVIDIA Blackwell 凭借业界领先的规模和性能超越 MLPerf 训练 6.0

NVIDIA 对 MLPerf Training v6.0 进行了彻底的测试，这是 MLCommons 联盟开发的最新版行业标准 AI…

3 MIN READ

2026年 6月 15日

使用 NVIDIA BioNeMo Recipes 使用 LoRA 微调生物基础模型

基础模型正在重塑计算生物学。预训练在大量蛋白质或基因组序列的语料库上的模型，如 ESM2 （一种蛋白质语言模型）和 Evo 2 （一种…

4 MIN READ