AI 智能体

2026年 3月 23日

为机密 AI 工厂构建零信任架构

AI 正在从实验转向生产。但是，企业需要的大多数数据都存在于公有云之外。这包括敏感信息，如患者记录、市场研究和包含企业知识的传统系统。此外，

2 MIN READ

2026年 3月 23日

在 Kubernetes 上部署解 LLM 推理工作负载

随着大语言模型 (LLM) 推理工作负载的复杂性不断增加，单个单一的服务进程开始达到其极限。预填充和解码阶段具有截然不同的计算配置文件，

4 MIN READ

2026年 3月 19日

NVIDIA Vera Rubin POD：7 个芯片、5 个机架级系统、1 台 AI 超级计算机

人工智能由 token 驱动。每个提示、推理步骤和智能体交互都会生成 tokens。在过去一年中，token 的消耗量增长了数倍，

5 MIN READ

2026年 3月 17日

借助 NVIDIA 构建 AI 网格：随时随地编排智能

AI 原生服务暴露了 AI 基础设施的新瓶颈：随着数百万用户、智能体和设备需要访问智能，

3 MIN READ

2026年 3月 16日

NVIDIA Dynamo 1.0 如何助力量产级多节点推理

推理模型的规模正在迅速增长，并且越来越多地集成到与其他模型和外部工具交互的代理式 AI 工作流中。

4 MIN READ

2026年 3月 16日

使用 NVIDIA OpenShell 更安全地运行自主、自演化代理

AI 已经从跟随你指令的助手发展为独立行动的智能体。这些被称为“爪”的智能体可以达成目标，找出实现目标的方法，并无限执行任务，

1 MIN READ

2026年 2月 28日

使用 NVIDIA NeMo 构建电信自主网络推理模型

自主网络正迅速成为电信行业的重点任务之一。根据最新的 NVIDIA 电信行业 AI 现状报告，65% 的运营商表示 AI 正在推动网络自动化，

2 MIN READ

2026年 2月 27日

基于 NVIDIA GPU 加速端点，使用千问3.5 VLM 开发原生多模态智能体

阿里巴巴推出了全新开源千问3.5 系列，专为构建原生多模态智能体而设计。该系列的首个模型是一款总参数为 397B、

1 MIN READ

2026年 2月 17日

构建 AI 就绪型知识系统：掌握 5 种核心多模态 RAG 功能

企业数据本身具有高度复杂性：现实世界中的文档是多模态的，包含文本、表格、图表与图形、图像、扫描页面、表单以及嵌入式元数据。

3 MIN READ

2026年 2月 4日

基于 NVIDIA GPU 加速端点构建 Kimi K2.5 多模态视觉语言模型

Kimi K2.5 是 Kimi 模型家族最新推出的开放式视觉语言模型（VLM）。作为通用型多模态模型，Kimi K2.5…

1 MIN READ

2026年 1月 30日

沙箱代理工作流与执行风险管理的实用安全指南

AI 编码智能体通过简化任务和推动测试驱动的自动化开发，使开发者能够更高效地工作。然而，它们也引入了一个常被忽视的重要攻击面：

1 MIN READ

2026年 1月 15日

如何使用合成数据和强化学习训练 AI 智能体执行命令行任务

如果您的计算机智能体能够学习新的命令行界面（CLI），并且在无需编写文件或自由输入 shell 命令的情况下也能安全操作，该怎么办？

3 MIN READ

2026年 1月 9日

多智能体仓库 AI 命令层实现卓越运营和供应链智能

仓库的自动化程度从未如此之高，数据也从未如此丰富，运营要求同样日益提升，但许多仓库仍依赖于无法跟上需求的系统。吞吐量持续攀升，

2 MIN READ

2026年 1月 8日

借助 NVIDIA Blackwell 实现多专家模型推理的巨大性能飞跃

随着 AI 模型持续变得更加智能，人们能够依赖它们完成日益增多的任务。这导致用户（从消费者到企业）与 AI 的交互愈发频繁，

2 MIN READ

2026年 1月 8日

NVIDIA TensorRT Edge-LLM 加速汽车与机器人领域的 LLM 和 VLM 推理

大语言模型（LLM）与多模态推理系统正迅速突破数据中心的局限。越来越多的汽车与机器人领域的开发者希望将对话式 AI 智能体、

2 MIN READ

2026年 1月 6日

NVIDIA BlueField-4 赋能的推理上下文记忆存储平台，引领 AI 迈向新前沿

随着代理式 AI 工作流将上下文窗口扩展到数百万个 token，并将模型规模扩展到数百万亿个参数，AI 原生企业正面临着越来越多的扩展挑战。

1 MIN READ