Posts by Ishan Dhanani
精选
2026年 5月 8日
流式传输词元和工具:NVIDIA Dynamo 中的多回合代理线束支持
智能体交换必须保留结构化交互:助手通过一次或多次工具调用进行交错推理,随后用户轮流将相应的工具结果返回至模型上下文。
4 MIN READ
数据中心/云端
2026年 4月 17日
借助 NVIDIA Dynamo 实现代理式推理的全栈优化
编程智能体开始大规模编写产品级代码。 Stripe 的智能体每周生成 1300 多个 PR。 Ramp 将 30%
4 MIN READ
数据中心/云端
2025年 5月 20日
NVIDIA Dynamo 新增 GPU 自动缩放、Kubernetes 自动化和网络优化功能
在 NVIDIA GTC 2025 上,我们宣布推出 NVIDIA Dynamo ,这是一种高吞吐量、低延迟的开源推理服务框架,
2 MIN READ