Nader Al Awar

Nader Al Awar 是 NVIDIA 的高级软件工程师,也是 CUDACore 计算库 (CCCL) 团队的成员,专注于 CUB 和 cuda.compute 的开发。他在德克萨斯大学奥斯汀分校获得电气和计算机工程博士学位,专门研究 Python 的高性能计算。Nader 热衷于通过使用 GPU 加速 Python 代码,在高级语言和硬件之间架起桥梁。

Posts by Nader Al Awar

智能体/生成式 AI

登顶 GPU 内核排行榜:借助 NVIDIA CUDA.compute 实现卓越性能

Python 在符合人体工程学的机器学习领域占据主导地位,但编写真正高效的 GPU 代码历来需要使用 C++ 编写自定义内核, 2 MIN READ