Daisy Chu

Daisy Chu 是 NVIDIA TensorRT 团队的高级系统软件工程师,专门从事多设备架构研究。她的工作重点是构建生产级推理系统,重点是跨单 GPU 和多 GPU 环境的性能优化、正确性验证和可扩展执行。Daisy 在为大语言和多模态模型实现高效的多 GPU 推理方面发挥了重要作用,确保了高可扩展性和鲁棒性。她拥有伊利诺伊大学香槟分校的计算机科学硕士学位。

Posts by Daisy Chu

边缘计算

使用 NVIDIA TensorRT 和多设备推理支持,跨多个 GPU 扩展 AI 推理

生成式 AI 工作负载的显存和计算预算正迅速超出单个 GPU。对于构建媒体生成工作流的推理开发者而言, 4 MIN READ