DEVELOPER
首页
博客
论坛
论坛 (英文)
文档
下载
培训
搜索
加入
Jason Zhou
Jason Zhou 是 NVIDIA 的软件工程师,专注于 LLM 推理性能和优化。他于 2025 年底加入 NVIDIA。此前,他曾在字节跳动从事大规模训练框架方面的工作,在此之前,他曾在阿里巴巴集团和微软从事分布式云存储系统方面的工作。工作之余,Jason 喜欢看电影和环游世界。
Posts by Jason Zhou
数据中心/云端
0
2026年 3月 9日
从解服务中移除猜测
部署和优化大语言模型 (LLM) 以实现高性能、经济高效的服务可能是一项艰巨的工程难题。任何给定工作负载 (例如硬件、并行和预填充/
3 MIN READ
加载更多