Lucas Liebenwein

Lucas Liebenwein 是 NVIDIA TensorRT-LLM 团队的技术主管兼高级工程师,他在团队中共同领导了 AutoDeploy 的开发,用于部署具有高性能推理的新兴 LLM 架构。Lucas 通过收购 OmniML,Inc. 加入 NVIDIA,在该公司担任创始工程师兼首席架构师。他在 MIT CSAIL 获得博士学位,主要研究高效深度学习。

Posts by Lucas Liebenwein

智能体/生成式 AI

借助 NVIDIA TensorRT LLM AutoDeploy 实现推理优化自动化

NVIDIA TensorRT LLM 使开发者能够为大语言模型 (LLM) 构建高性能推理引擎,但传统上部署新架构往往需要大量手动工作。 3 MIN READ