NCCL
2026年 2月 3日
在 JAX 和 XLA 中加速长上下文模型训练
大语言模型(LLM)的上下文窗口正在迅速扩展,近期的模型已支持128K、256K甚至更长的词元序列。然而,
3 MIN READ
2024年 3月 6日
CUDA 工具包 12.4 增强对 NVIDIA Grace Hopper 和机密计算的支持
最新版本的 CUDA 工具包,即 版本 12.4,继续利用最新的 NVIDIA GPU 来推动加速计算性能。
3 MIN READ