HyperAIHyperAI

Command Palette

Search for a command to run...

CUDA 13.3 が正式に C++ タイルプログラミングをサポートし、GPU 開発のハードルを低下させる

CUDA 13.1 が初めてタイルベースの GPU プログラミングモデルを導入し Python をサポートした後に続き、NVIDIA は CUDA 13.3 でついにこの機能を C++ 開発者向けに公式に提供しました。 CUDA タイルの中核となる考え方は、多次元配列を「タイル」単位で計算を行うことであり、SIMT スレッドスケジューリング、メモリ転送、非同期処理といった下層の詳細を隠蔽します。開発者はデータがどのようにブロックされるかを宣言し、タイル間の数値演算を定義するだけでよく、コンパイラーが並列化、共有メモリの利用、Tensor コアなどのハードウェア機能呼び出しを自動的に処理するため、GPU カーネルの開発複雑さが劇的に軽減されます。 従来の CUDA C++ の SIMT モデルと比較して、タイルプログラミングは手動記述コード量を削減するだけでなく、アーキテクチャ横断的な移植性を備えています。同じコードにより Ampere および Hopper、それ以降の GPU アーキテクチャへ自動適応が可能であり、異なるハードウェアごとに書き直す必要はありません。 開発者は nvcc コンパイルオプションとして `--enable-tile` パラメーターを使用してタイルカーネルをビルドでき、Nsight Compute も同様にタイルカーネルのパフォーマンス解析をサポートしています。実行環境には Compute Capability 8.x 以上の GPU と R580 以降のドライバー、および CUDA Toolkit 13.3 が必要です。現在、本機能はすべての CUDA 開発者に開放されており、文書と API リファレンスは NVIDIA 公式サイトから入手可能です。

関連リンク