Selvaraj Anandaraj

Selvaraj Anandaraj 是一名深度学习性能工程师,致力于使用 NVIDIA 硬件和软件堆栈加速深度学习工作负载。他最近的工作重点是拥有一个高性能的软件堆栈来大规模训练和推理大语言模型。他拥有威斯康星大学麦迪逊分校的机器学习系统专业硕士学位。

Posts by Selvaraj Anandaraj

智能体/生成式 AI

采用 NVFP4 低精度训练提升吞吐量,兼顾精度无损

随着 AI 模型和数据集规模的不断扩大,仅依赖更高精度的 BF16 训练已难以满足需求。训练吞吐量预期、内存限制以及成本上升等关键挑战, 3 MIN READ
数据中心/云端

借助 NVIDIA Nemo 框架,在远程数据中心网络中加速 LLM 训练

多数据中心训练对 AI 工厂至关重要,因为预训练扩展会推动更大模型的创建,导致对计算性能的需求超过单个设施的能力。 2 MIN READ