Fan Yu

Fan Yu 是 NVIDIA 的人工智能开发技术工程师,从事 NVIDIA Merlin HugeCTR 嵌入式缓存和其他 NVIDIA Merlin 组件的开发。他的工作主要集中在所有 NVIDIA 架构和平台上的各种 HPC 和 AI 工作负载的性能优化。 Fan 拥有澳大利亚国立大学计算机科学硕士学位,在那里他研究了超级计算机的计算机系统架构和性能优化。

Posts by Fan Yu

智能体/生成式 AI

使用混合专家并行优化混合专家训练的通信

在 LLM 训练中,超大规模多专家模型 (MoE) 的专家并行 (EP) 通信面临巨大挑战。EP 通信本质上属于多对多模式, 4 MIN READ
推荐系统/个性化

使用 Merlin 分层参数服务器扩展推荐系统推理

如今,推荐系统被广泛用于个性化用户体验,并在电子商务、社交媒体和新闻源等各种环境中提高客户参与度。因此, 3 MIN READ