NVIDIA CUDA Tile
NVIDIA® CUDA® Tile 是一种基于 tile(分块)的 GPU 编程模型,面向 NVIDIA Tensor Core,旨在实现良好的可移植性。CUDA Tile 通过这种编程模型,简化了在各类 NVIDIA 平台上开发优化的分块(tile-based)内核,从而释放并发挥 GPU 的峰值性能。
开始使用
CUDA Tile 基于 Tile IR 规范及其相关工具,其中包括 cuTile——这是面向用户的 CUDA Tile IR(中间表示)语言支持,目前在 Python 中可用(未来将支持 C++)。NVIDIA 针对这一基于 tile 的编程模型,在 Python 中提供的实现称为 cuTile Python。
cuTile Python
Python 原生的分块(tiled)内核开发:
以高层 Python 语法无缝表达 CUDA Tile 编程模型。
构建在 Tile IR 规范之上。
允许开发者使用熟悉的 Python 语法来编写、定义和优化基于 tile 的 GPU 内核。