NVSHMEM

2026年 2月 3日

在 JAX 和 XLA 中加速长上下文模型训练

大语言模型（LLM）的上下文窗口正在迅速扩展，近期的模型已支持128K、256K甚至更长的词元序列。然而，

3 MIN READ

2022年 11月 22日

使用 NVIDIA Magnum IO NVSHMEM 和 GPUDirect Async 提高 HPC 系统的网络性能

今天的前沿高性能计算（ HPC ）系统包含数以万计的 GPU 。在 NVIDIA 系统中，

4 MIN READ