Jason Zhou

Jason Zhou 是 NVIDIA 的软件工程师,专注于 LLM 推理性能和优化。他于 2025 年底加入 NVIDIA。此前,他曾在字节跳动从事大规模训练框架方面的工作,在此之前,他曾在阿里巴巴集团和微软从事分布式云存储系统方面的工作。工作之余,Jason 喜欢看电影和环游世界。

Posts by Jason Zhou

数据中心/云端

从解服务中移除猜测

部署和优化大语言模型 (LLM) 以实现高性能、经济高效的服务可能是一项艰巨的工程难题。任何给定工作负载 (例如硬件、并行和预填充/ 3 MIN READ