Omri Cohen

Omri Cohen 是 NVIDIA 的高级软件工程师。他是 KAIScheduler 的维护者,并在 Run:ai 调度程序团队中担任了四年的开发者。在此之前,他管理着大规模的多租户 AI Kubernetes 集群,确保研究团队能够访问所需资源,并帮助研究人员浏览 Kubernetes 以进行训练和推理。

Posts by Omri Cohen

智能体/生成式 AI

基于时间的公平共享实现 Kubernetes 集群 GPU 分配均衡

NVIDIA Run:ai v2.24 引入了基于时间的公平分享,这是一种全新的调度模式,可为 Kubernetes 集群实现公平分享调度, 2 MIN READ