Aichen Feng

Aichen Feng 是 NVIDIA 的解决方案架构师。Aichen 专注于 AI 推理框架和深度学习模型优化,对大语言模型和多模态模型特别感兴趣。

Posts by Aichen Feng

数据中心/云端

从解服务中移除猜测

部署和优化大语言模型 (LLM) 以实现高性能、经济高效的服务可能是一项艰巨的工程难题。任何给定工作负载 (例如硬件、并行和预填充/ 3 MIN READ