Peter Kisfaludi

Peter Kisfaludi 是 TensorRTM 多设备团队的高级软件工程师。担任此职位期间,他专注于开发可扩展的运行架构和优化通信开销,为多 GPU 模型服务提供低延迟执行。在 2022 年加入 NVIDIA 之前,Peter 是一位独立顾问,为实时嵌入式系统设计低延迟、任务关键型软件。

Posts by Peter Kisfaludi

边缘计算

使用 NVIDIA TensorRT 和多设备推理支持,跨多个 GPU 扩展 AI 推理

生成式 AI 工作负载的显存和计算预算正迅速超出单个 GPU。对于构建媒体生成工作流的推理开发者而言, 4 MIN READ