Suyog Gupta

Suyog Gupta 是 NVIDIA 的杰出工程师兼经理,从事大规模 AI 系统的推理软件架构研究。他拥有斯坦福大学的博士学位,曾在 IBM Research、Google 和 GM Cruise 从事机器学习硬件/ 软件代码设计工作。

Posts by Suyog Gupta

智能体/生成式 AI

借助 NVIDIA TensorRT LLM AutoDeploy 实现推理优化自动化

NVIDIA TensorRT LLM 使开发者能够为大语言模型 (LLM) 构建高性能推理引擎,但传统上部署新架构往往需要大量手动工作。 3 MIN READ