Carlo del Mundo

Carlo del Mundo 是 NVIDIA 工程总监,从事低精度数字推理和训练领域的研究。Carlo 负责 NemotronQuantization 工作。Carlo 曾在 Apple 从事高效 ML 的研究,使对性能要求严苛的 ML 工作负载能够在 iPhone 和未来的设备上运行。Carlo 拥有硕士学位。在华盛顿大学 CS 课程中获得学士学位。计算机工程,来自弗吉尼亚理工学院。

Posts by Carlo del Mundo

智能体/生成式 AI

使用 NVIDIA Model Optimizer 创建 NVIDIA Nemotron 3 Ultra NVFP4 Checkpoint

随着上下文窗口变长,高效移动大型模型权重对性能至关重要。解决此问题的常用方法是量化,这是一种将模型权重压缩为较小数据格式的优化技术。 6 MIN READ