NVIDIA CUDA Tile
NVIDIA® CUDA® Tile 是一种基于 tile（分块）的 GPU 编程模型，面向 NVIDIA Tensor Core，旨在实现良好的可移植性。CUDA Tile 通过这种编程模型，简化了在各类 NVIDIA 平台上开发优化的分块（tile-based）内核，从而释放并发挥 GPU 的峰值性能。
开始使用
CUDA Tile 基于 Tile IR 规范及其相关工具，其中包括 cuTile——这是面向用户的 CUDA Tile IR（中间表示）语言支持，目前在 Python 中可用（未来将支持 C++）。NVIDIA 针对这一基于 tile 的编程模型，在 Python 中提供的实现称为 cuTile Python。
CUDA Tile IR
面向 tile 编程的虚拟指令集：
使开发者能够在 tile 编程模型这一结构化高性能范式下，直接对 GPU 进行原生编程。
cuTile Python
Python 原生的分块（tiled）内核开发：
以高层 Python 语法无缝表达 CUDA Tile 编程模型。
构建在 Tile IR 规范之上。
允许开发者使用熟悉的 Python 语法来编写、定义和优化基于 tile 的 GPU 内核。