精选
2026年 5月 26日
NVIDIA CUDA 13.3 通过 C++ 中的平铺式编程、编译器自动调整和 Python 更新来增强 GPU 开发
NVIDIA CUDA 13.3 为整个 CUDA 生态系统的开发者带来了新功能和性能优化。通过在 C++ 中引入 NVIDIA CUDA…
4 MIN READ
2026年 5月 14日
NVIDIA Vera Rubin 平台如何解决代理式 AI 的纵向扩展问题
代理式推理通过引入非确定性轨迹(即AI智能体在执行任务时生成的动作、观察结果和决策),从根本上改变了推理工作负载的运行时特性。
2 MIN READ
2026年 5月 8日
流式传输词元和工具:NVIDIA Dynamo 中的多回合代理线束支持
智能体交换必须保留结构化交互:助手通过一次或多次工具调用进行交错推理,随后用户轮流将相应的工具结果返回至模型上下文。
4 MIN READ
2026年 5月 5日
借助极致协同设计构建日益复杂的代理式系统
生成式 AI 具有爆炸性的第一章由发送请求的人类和响应的模型定义。代理式章节有所不同。 智能体不会遵循预先确定的动作序列。它们可以调用工具,
3 MIN READ
2026年 4月 28日
NVIDIA Nemotron 3 Nano Omni 在单个高效开放模型中助力多模态智能体推理
代理式系统通常会在单个感知到动作循环中跨屏幕、文档、音频、视频和文本进行推理。但是,它们仍然依赖于碎片化的模型链,即视觉、
3 MIN READ
2026年 4月 24日
使用 NVIDIA Blackwell 和 GPU 加速端点构建 DeepSeek V4
DeepSeek 刚刚发布了第四代旗舰模型,推出 DeepSeek-V4-Pro 和 DeepSeek-V4-Flash 两款产品,
2 MIN READ
2026年 4月 17日
使用 OpenClaw 和 NVIDIA NemoClaw 构建更安全、始终运行的本地 AI 智能体
智能体正在从问答系统发展为长期运行的自主助手,可读取文件、调用 API 并驱动多步骤工作流。但是,
3 MIN READ
2026年 4月 11日
MiniMax M2.7 在 NVIDIA 平台上推进复杂 AI 应用的可扩展代理工作流程
MiniMax M2.7 的发布为流行的 MiniMax M2.7 模型增加了增强功能,该模型专为代理式线束以及推理、ML 研究工作流程、
2 MIN READ
2026年 4月 2日
借助 Gemma 4,让 AI 更贴近边缘和设备端
随着最新 Gemma 4 多模态和多语言模型的推出,Gemmaverse 得以扩展,
2 MIN READ
2026年 4月 1日
NVIDIA Extreme Co-Design 带来 MLPerf 推理新纪录
共同设计的硬件、软件和模型是提供更高 AI 工厂吞吐量和更低词元成本的关键。测量这一点远远超出了峰值芯片规格。
3 MIN READ
2026年 3月 19日
NVIDIA Vera Rubin POD:7 个芯片、5 个机架级系统、1 台 AI 超级计算机
人工智能由 token 驱动。每个提示、推理步骤和智能体交互都会生成 tokens。在过去一年中,token 的消耗量增长了数倍,
6 MIN READ
2026年 3月 16日
使用 NVIDIA OpenShell 更安全地运行自主、自演化代理
AI 已经从跟随你指令的助手发展为独立行动的智能体。这些被称为“爪”的智能体可以达成目标,找出实现目标的方法,并无限执行任务,
1 MIN READ
2026年 3月 16日
NVIDIA Vera CPU 为 AI 工厂提供高性能、高带宽和高效率
AI 在不断发展,推理模型对 token 的需求不断增加,对 AI 基础设施的每一层都提出了新的要求。计算比以往任何时候都更需要高效扩展,
3 MIN READ
2023年 11月 9日
NVIDIA Merlin 助力陌陌推荐业务实现高性能训练优化
本案例中,NVIDIA 团队与陌陌推荐系统团队深度合作,共同使用 NVIDIA GPU 和 Merlin 软件解决方案替代其原有解决方案。
2 MIN READ
2023年 3月 22日
SDK 加速行业 5.0 、数据管道、计算科学等在 GTC 2023 上亮相
在 2023 年的 NVIDIA GTC 2023 上, NVIDIA 公布了其 NVIDIA AI 软件套件的显著更新,供开发者加速计算。
3 MIN READ
2023年 2月 13日
云计算中的 RAN :向 5G RAN 提供云经济
5G 部署在全球范围内不断加快。许多电信运营商已经推出了 5G 服务,并且正在快速扩张。除电信运营商外,
3 MIN READ