Vikas Mehta

Vikas Mehta 是 NVIDIA 的首席软件工程师,在大规模分布式系统方面拥有 20 多年的经验,专门从事 AI 和服务平台的一级调度系统。他目前的工作重点是通过改进调度程序设计、车队运行状况和 ML 计算平台的效率来提高研究人员的工作效率。Vikas 是一位实用的多面手,负责领导复杂的跨职能工作,在模糊的问题空间中提高清晰度,同时指导团队扩大影响。他的工作重点是以客户为中心的执行,构建超大规模系统,并极其注重易用性、架构简单性、可靠性和运营卓越性。

Posts by Vikas Mehta

数据中心/云端

利用 NVIDIA 数据中心监控工具优化 GPU 集群性能

高性能计算(HPC)领域的客户持续快速扩展,生成式AI、大语言模型(LLM)、计算机视觉等应用推动了对GPU资源需求的显著增长。在此背景下, 2 MIN READ