Posts by Max Xu
数据中心/云端
2026年 6月 8日
在 NVIDIA Blackwell 上使用 NVFP4,使用 JAX 和 MaxText 更快地训练模型
对前沿 LLM 进行预训练,可归结为吞吐量。当数千个加速器的训练规模达到数万亿词元时,
3 MIN READ
开发工具与技巧
2025年 10月 7日
使用 NVIDIA TensorRT Model Optimizer 剪枝和蒸 LLM
大语言模型(LLM)在自然语言处理(NLP)任务,如代码生成、推理和数学计算等方面,展现出卓越的性能,树立了新的标杆。然而,
3 MIN READ