Yongming Ding

Yongming Ding 是 NVIDIA 的高级软件工程师。他的工作重点是为数据中心级 AI 工作负载构建 LLM 推理系统和数据平台。

Posts by Yongming Ding

数据中心/云端

DynoSim:模拟帕累托前沿

现代 LLM 服务难以调优,因为每一次部署都是一组相互作用的选择堆栈:模型后端、张量并行形状、prefill/decode 拆分、 3 MIN READ