姜名扬

姜名扬是 NVIDIA AI DevTech 的工程师,特长是 CUDA kernel 的性能优化,以及 LLM 框架的性能优化。在 TensorRT LLM 中贡献了 fused moe 的优化,以及 DeepSeek 的 chunked prefill 功能以及其他的性能优化。

Posts by 姜名扬

智能体/生成式 AI

使用 NVIDIA TensorRT LLM 部署 MiniMax M2/M2.1 稀疏 MoE 大模型

MiniMax M2/M2.1 是一款面向 Agents 和 Coding 工作流的开源稀疏 MoE 模型,在工具调用、 2 MIN READ