Posts by Maksim Khadkevich
精选
2026年 5月 27日
NVIDIA Dynamo Snapshot:面向 Kubernetes 上推理工作负载的快速启动
在生产环境中的推理部署里,需求会随时间波动,因此推理副本需要弹性扩缩容。然而,在 Kubernetes 上冷启动推理工作负载可能需要几分钟。
4 MIN READ
数据中心/云端
2025年 5月 20日
NVIDIA Dynamo 新增 GPU 自动缩放、Kubernetes 自动化和网络优化功能
在 NVIDIA GTC 2025 上,我们宣布推出 NVIDIA Dynamo ,这是一种高吞吐量、低延迟的开源推理服务框架,
2 MIN READ