陈芸

陈芸是 NVIDIA 深度学习解决方案架构师,负责 NVIDIA GPU 加速计算解决方案的落地,目前主要支持互联网客户在大语言模型训练优化的工作。

Posts by 陈芸

智能体/生成式 AI

使用 NVIDIA TensorRT LLM 部署 MiniMax M2/M2.1 稀疏 MoE 大模型

MiniMax M2/M2.1 是一款面向 Agents 和 Coding 工作流的开源稀疏 MoE 模型,在工具调用、 2 MIN READ