Paweł Gadziński

Pawe Gadzi ski 是 NVIDIA 的一名深度学习性能工程师,专门从事 Transformer 引擎库的开发。他热衷于深度学习框架和加速大规模模型训练性能。他在华沙大学获得了计算机科学学位。

Posts by Paweł Gadziński

数据科学

如何优化基于 Transformer 的模型以进行低精度训练

Transformer 架构是许多现代大型语言和生成式 AI 模型的支柱。随着这些模型规模的扩大, 3 MIN READ