Posts by Carlo del Mundo
智能体/生成式 AI
2026年 6月 26日
使用 NVIDIA Model Optimizer 创建 NVIDIA Nemotron 3 Ultra NVFP4 Checkpoint
随着上下文窗口变长,高效移动大型模型权重对性能至关重要。解决此问题的常用方法是量化,这是一种将模型权重压缩为较小数据格式的优化技术。
6 MIN READ