Fan Yu

Fan Yu 是 NVIDIA 的人工智能开发技术工程师，从事 NVIDIA Merlin HugeCTR 嵌入式缓存和其他 NVIDIA Merlin 组件的开发。他的工作主要集中在所有 NVIDIA 架构和平台上的各种 HPC 和 AI 工作负载的性能优化。 Fan 拥有澳大利亚国立大学计算机科学硕士学位，在那里他研究了超级计算机的计算机系统架构和性能优化。

Posts by Fan Yu

智能体/生成式 AI 2026年 2月 2日

使用混合专家并行优化混合专家训练的通信

在 LLM 训练中，超大规模多专家模型 (MoE) 的专家并行 (EP) 通信面临巨大挑战。EP 通信本质上属于多对多模式， 4 MIN READ

推荐系统/个性化 2022年 8月 31日

使用 Merlin 分层参数服务器扩展推荐系统推理

如今，推荐系统被广泛用于个性化用户体验，并在电子商务、社交媒体和新闻源等各种环境中提高客户参与度。因此， 3 MIN READ