Anton Polyakov

Anton Polyakov 是 NVIDIA 的工程总监,他领导 AI 基础设施团队利用 Kubernetes 和尖端 GPU 硬件构建 AI 超级计算机。Anton 是云基础设施、大规模分布式系统和 AI 领域的实战经验行业资深人士。

Posts by Anton Polyakov

数据中心/云端

使用 Slurm 在 Kubernetes 上运行大规模 GPU 工作负载

Slurm 是适用于 Linux 的开源集群管理和作业调度系统。它可以管理超过 65% 的 TOP500 系统 的作业调度。 3 MIN READ