Max Xu

Max Xu 是 NVIDIA 的高级技术主管,专门从事大规模 AI 训练和推理、性能工程和端到端应用部署。他将从芯片设计、CUDA 和内核级开发到服务器和云的全栈 GPU 专业知识用于模型训练和推理,将创新转化为现实世界的影响。在加入 NVIDIA 之前,Max 曾在各大 CSP 和半导体公司担任工程职务。

Posts by Max Xu

数据中心/云端

在 NVIDIA Blackwell 上使用 NVFP4,使用 JAX 和 MaxText 更快地训练模型

对前沿 LLM 进行预训练,可归结为吞吐量。当数千个加速器的训练规模达到数万亿词元时, 3 MIN READ
开发工具与技巧

使用 NVIDIA TensorRT Model Optimizer 剪枝和蒸 LLM

大语言模型(LLM)在自然语言处理(NLP)任务,如代码生成、推理和数学计算等方面,展现出卓越的性能,树立了新的标杆。然而, 3 MIN READ