智能体/生成式 AI
2026年 4月 2日
借助 Gemma 4,让 AI 更贴近边缘和设备端
随着最新 Gemma 4 多模态和多语言模型的推出,Gemmaverse 得以扩展,
2 MIN READ
2026年 4月 2日
为资本市场实现单位数微秒级延迟推理
在算法交易中,缩短对市场事件的响应时间至关重要。为了与高速电子市场保持同步,对延迟敏感的公司通常使用 FPGA 和 ASIC 等专用硬件。
3 MIN READ
2026年 3月 25日
通过整合未充分利用的 GPU 工作负载,更大限度地提高 AI 基础设施吞吐量
在生产 Kubernetes 环境中,模型要求与 GPU 大小之间的差异导致效率低下。轻量级自动语音识别 (ASR) 或文本转语音…
3 MIN READ
2026年 3月 25日
使用生成模型 Proteina-Complexa 设计蛋白质结合剂
开发基于蛋白质的新疗法和催化剂涉及到设计这一富有挑战性的任务蛋白质结合剂或与目标蛋白质或小分子结合的蛋白质。
3 MIN READ
2026年 3月 25日
通过更大限度地提高每瓦性能,提高词元工厂收入和 AI 效率
在 AI 时代,电力是终极限制,每个 AI 工厂 都在硬极限内运行。这使得每瓦性能 (将功率转换为创收智能的速率) 成为现代 AI…
2 MIN READ
2026年 3月 24日
构建用于推理、多模态 RAG、语音和安全的 NVIDIA Nemotron 3 智能体
代理式 AI 是一个专业模型协同工作的生态系统,可处理规划、推理、检索和安全护栏。随着这些系统的扩展,开发者需要能够理解现实世界多模态数据、
3 MIN READ
2026年 3月 23日
为机密 AI 工厂构建零信任架构
AI 正在从实验转向生产。但是,企业需要的大多数数据都存在于公有云之外。这包括敏感信息,如患者记录、市场研究和包含企业知识的传统系统。此外,
2 MIN READ
2026年 3月 19日
NVIDIA Vera Rubin POD:7 个芯片、5 个机架级系统、1 台 AI 超级计算机
人工智能由 token 驱动。每个提示、推理步骤和智能体交互都会生成 tokens。在过去一年中,token 的消耗量增长了数倍,
5 MIN READ
2026年 3月 18日
如何使用 NVIDIA AI-Q 和 LangChain 构建用于企业搜索的深度智能体
虽然消费者 AI 提供了强大的功能,但工作场所工具通常会因数据不连贯和上下文有限而受到影响。 基于 LangChain 构建,
3 MIN READ
2026年 3月 17日
借助 NVIDIA 构建 AI 网格:随时随地编排智能
AI 原生服务暴露了 AI 基础设施的新瓶颈:随着数百万用户、智能体和设备需要访问智能,
3 MIN READ
2026年 3月 16日
NVIDIA Dynamo 1.0 如何助力量产级多节点推理
推理模型的规模正在迅速增长,并且越来越多地集成到与其他模型和外部工具交互的代理式 AI 工作流中。
4 MIN READ
2026年 3月 16日
使用 NVIDIA OpenShell 更安全地运行自主、自演化代理
AI 已经从跟随你指令的助手发展为独立行动的智能体。这些被称为“爪”的智能体可以达成目标,找出实现目标的方法,并无限执行任务,
1 MIN READ
2026年 3月 13日
借助 NVIDIA Cosmos 世界基础模型扩展合成数据和物理 AI 推理
新一代 AI 驱动的机器人 人形机器人 以及 智能汽车 取决于高保真、物理感知的训练数据。如果没有多样化且具有代表性的数据集,
2 MIN READ
2026年 3月 11日
隆重推出 Nemotron 3 Super:用于代理式推理的开放式混合式 Mamba-Transformer MoE
代理式 AI 系统需要具有专业深度的模型来自主解决密集的技术问题。它们必须在推理、编码和长上下文分析方面表现出色,同时保持足够的效率,
3 MIN READ
2026年 3月 10日
NVIDIA RTX 创新技术助力游戏开发新时代
NVIDIA RTX 光线追踪和 AI 驱动的神经网络渲染技术正在重新定义游戏制作方式,为视觉效果和性能树立新标准。
4 MIN READ
2026年 3月 10日
适用于虚幻引擎的可靠 AI 编码:提高准确性并降低 词元成本
随着工作室构建更大的世界、发布更多 DLC 以及为分布式团队提供支持,代理式代码助手正在进入日常游戏开发阶段。
1 MIN READ