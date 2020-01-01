提升性能

卷积是一种计算密集型内核，广泛用于各种应用程序，包括图像 处理、机器学习和科学计算。空间并行化将域分解为 通过最近邻点通信分布在多个 GPU 上的子分区，通常称为 作为光环交换。

在利弗莫尔大型人工神经网络 (LBANN) 深度学习框架中，空间并行卷积 使用 MPI 和 NVSHMEM 等多种通信方法实现。基于 MPI 的光晕交换 使用标准的发送和接收基元，而基于 NVSHMEM 的实现使用单侧放置， 显著提升了劳伦斯利弗莫尔国家实验室的性能 Sierra 超级计算机。