最近文章
2026年 4月 2日
使用批量模式 VC-6 和 NVIDIA Nsight 加速视觉 AI 工作流
在视觉 AI 系统中,模型吞吐量不断提高。周围的工作流阶段必须与时俱进,包括解码、预处理和 GPU 调度。在上一篇文章中,
3 MIN READ
2026年 4月 2日
借助 Gemma 4,让 AI 更贴近边缘和设备端
随着最新 Gemma 4 多模态和多语言模型的推出,Gemmaverse 得以扩展,
2 MIN READ
2026年 4月 2日
为资本市场实现单位数微秒级延迟推理
在算法交易中,缩短对市场事件的响应时间至关重要。为了与高速电子市场保持同步,对延迟敏感的公司通常使用 FPGA 和 ASIC 等专用硬件。
3 MIN READ
2026年 4月 1日
NVIDIA Extreme Co-Design 带来 MLPerf 推理新纪录
共同设计的硬件、软件和模型是提供更高 AI 工厂吞吐量和更低词元成本的关键。测量这一点远远超出了峰值芯片规格。
3 MIN READ
2026年 4月 1日
使用统一服务和实时 AI 加速 AI 工厂的词元生产
在当今的 AI 工厂环境中,性能并不是理论性的。它是经济、竞争和生存的。可用 GPU 时间每减少 1%,就意味着每小时损失数百万词元。
2 MIN READ
2026年 3月 31日
借助 NVIDIA CloudXR 6.0 将高保真空间计算内容串流到任何设备
空间计算正在从可视化转向主动协作,这增加了对 XR 硬件的 GPU 需求,以实时渲染逼真、物理精准、高保真的空间内容。与此同时,
2 MIN READ
2026年 3月 31日
使用 NVIDIA CloudXR.js 构建和流式传输基于浏览器的 XR 体验
为企业用户提供高保真 VR 和 AR 体验通常需要本地应用开发、自定义设备管理和复杂的部署流程。现在,
3 MIN READ
2026年 3月 25日
通过整合未充分利用的 GPU 工作负载,更大限度地提高 AI 基础设施吞吐量
在生产 Kubernetes 环境中,模型要求与 GPU 大小之间的差异导致效率低下。轻量级自动语音识别 (ASR) 或文本转语音…
3 MIN READ
2026年 3月 25日
使用生成模型 Proteina-Complexa 设计蛋白质结合剂
开发基于蛋白质的新疗法和催化剂涉及到设计这一富有挑战性的任务蛋白质结合剂或与目标蛋白质或小分子结合的蛋白质。
3 MIN READ
2026年 3月 25日
通过更大限度地提高每瓦性能,提高词元工厂收入和 AI 效率
在 AI 时代,电力是终极限制,每个 AI 工厂 都在硬极限内运行。这使得每瓦性能 (将功率转换为创收智能的速率) 成为现代 AI…
2 MIN READ
2026年 3月 24日
构建用于推理、多模态 RAG、语音和安全的 NVIDIA Nemotron 3 智能体
代理式 AI 是一个专业模型协同工作的生态系统,可处理规划、推理、检索和安全护栏。随着这些系统的扩展,开发者需要能够理解现实世界多模态数据、
3 MIN READ
2026年 3月 24日
GR00T 模型真机部署指南
本指南用于帮助用户搭建完整的真机实验环境,覆盖视觉-语言-动作(VLA)模型从数据采集、训练到部署的完整流程。文档聚焦工程实践,
3 MIN READ
2026年 3月 23日
NVIDIA IGX Thor 为工业、医疗和机器人边缘 AI 应用提供动力支持
工业和医疗系统正在迅速增加高性能 AI 的使用,以提高工人的工作效率、人机交互和停机管理。从工厂自动化单元到自主移动平台,再到手术室,
4 MIN READ
2026年 3月 23日
为机密 AI 工厂构建零信任架构
AI 正在从实验转向生产。但是,企业需要的大多数数据都存在于公有云之外。这包括敏感信息,如患者记录、市场研究和包含企业知识的传统系统。此外,
2 MIN READ
2026年 3月 23日
在 Kubernetes 上部署解 LLM 推理工作负载
随着大语言模型 (LLM) 推理工作负载的复杂性不断增加,单个单一的服务进程开始达到其极限。预填充和解码阶段具有截然不同的计算配置文件,
4 MIN READ
2026年 3月 19日
NVIDIA Vera Rubin POD:7 个芯片、5 个机架级系统、1 台 AI 超级计算机
人工智能由 token 驱动。每个提示、推理步骤和智能体交互都会生成 tokens。在过去一年中,token 的消耗量增长了数倍,
5 MIN READ