智能体/生成式 AI
2026年 4月 22日
DGX Spark × NemoClaw × Ollama:构建你的本地AI智能体
在当今AI智能体技术爆发的时代,NVIDIA的开源项目NemoClaw无疑是企业用户和技术爱好者眼中的明星项目。
1 MIN READ
2026年 4月 20日
使用端到端 FP8 精度运行高吞吐量强化学习训练
随着 LLM 从简单的文本生成过渡到复杂的推理,强化学习 (RL) 发挥着核心作用。群相对策略优化 (GRPO) 等算法为这种转变提供动力,
3 MIN READ
2026年 4月 20日
缓解代理环境中的间接 AGENTS.md 注入攻击
AI 工具正在显著加速软件开发,并改变开发者处理代码的方式。这些工具可充当实时 copilot,自动执行重复性任务、执行任务、编写文档等。
5 MIN READ
2026年 4月 17日
借助 NVIDIA Dynamo 实现代理式推理的全栈优化
编程智能体开始大规模编写产品级代码。 Stripe 的智能体每周生成 1300 多个 PR。 Ramp 将 30%
4 MIN READ
2026年 4月 17日
使用 OpenClaw 和 NVIDIA NemoClaw 构建更安全、始终运行的本地 AI 智能体
智能体正在从问答系统发展为长期运行的自主助手,可读取文件、调用 API 并驱动多步骤工作流。但是,
3 MIN READ
2026年 4月 11日
MiniMax M2.7 在 NVIDIA 平台上推进复杂 AI 应用的可扩展代理工作流程
MiniMax M2.7 的发布为流行的 MiniMax M2.7 模型增加了增强功能,该模型专为代理式线束以及推理、ML 研究工作流程、
2 MIN READ
2026年 4月 2日
借助 Gemma 4,让 AI 更贴近边缘和设备端
随着最新 Gemma 4 多模态和多语言模型的推出,Gemmaverse 得以扩展,
2 MIN READ
2026年 4月 2日
为资本市场实现单位数微秒级延迟推理
在算法交易中,缩短对市场事件的响应时间至关重要。为了与高速电子市场保持同步,对延迟敏感的公司通常使用 FPGA 和 ASIC 等专用硬件。
3 MIN READ
2026年 3月 25日
通过整合未充分利用的 GPU 工作负载,更大限度地提高 AI 基础设施吞吐量
在生产 Kubernetes 环境中,模型要求与 GPU 大小之间的差异导致效率低下。轻量级自动语音识别 (ASR) 或文本转语音…
3 MIN READ
2026年 3月 25日
使用生成模型 Proteina-Complexa 设计蛋白质结合剂
开发基于蛋白质的新疗法和催化剂涉及到设计这一富有挑战性的任务蛋白质结合剂或与目标蛋白质或小分子结合的蛋白质。
3 MIN READ
2026年 3月 25日
通过更大限度地提高每瓦性能,提高词元工厂收入和 AI 效率
在 AI 时代,电力是终极限制,每个 AI 工厂 都在硬极限内运行。这使得每瓦性能 (将功率转换为创收智能的速率) 成为现代 AI…
2 MIN READ
2026年 3月 24日
构建用于推理、多模态 RAG、语音和安全的 NVIDIA Nemotron 3 智能体
代理式 AI 是一个专业模型协同工作的生态系统,可处理规划、推理、检索和安全护栏。随着这些系统的扩展,开发者需要能够理解现实世界多模态数据、
3 MIN READ
2026年 3月 23日
为机密 AI 工厂构建零信任架构
AI 正在从实验转向生产。但是,企业需要的大多数数据都存在于公有云之外。这包括敏感信息,如患者记录、市场研究和包含企业知识的传统系统。此外,
2 MIN READ
2026年 3月 19日
NVIDIA Vera Rubin POD:7 个芯片、5 个机架级系统、1 台 AI 超级计算机
人工智能由 token 驱动。每个提示、推理步骤和智能体交互都会生成 tokens。在过去一年中,token 的消耗量增长了数倍,
6 MIN READ
2026年 3月 18日
如何使用 NVIDIA AI-Q 和 LangChain 构建用于企业搜索的深度智能体
虽然消费者 AI 提供了强大的功能,但工作场所工具通常会因数据不连贯和上下文有限而受到影响。 基于 LangChain 构建,
3 MIN READ
2026年 3月 17日
借助 NVIDIA 构建 AI 网格:随时随地编排智能
AI 原生服务暴露了 AI 基础设施的新瓶颈:随着数百万用户、智能体和设备需要访问智能,
3 MIN READ