Sachin Lakharia

Sachin Lakharia 是 NVIDIA 的首席软件工程师,负责领导多个专注于大规模 GPU 基础设施调度、资源管理和数据管理的项目。他的工作支持在高性能计算环境中高效运行关键 ML 工作负载。此前,他曾在 MetaPlatforms (Facebook) 担任多个高级工程职务,包括领先的 AI 基础设施资源管理和数据基础设施计划。凭借十多年的分布式系统构建和扩展经验,Sachin 为基础设施、机器学习平台和超大规模资源优化带来了深厚的专业知识。

Posts by Sachin Lakharia

数据中心/云端

利用 NVIDIA 数据中心监控工具优化 GPU 集群性能

高性能计算(HPC)领域的客户持续快速扩展,生成式AI、大语言模型(LLM)、计算机视觉等应用推动了对GPU资源需求的显著增长。在此背景下, 2 MIN READ