HyperAIHyperAI

Command Palette

Search for a command to run...

3ヶ月前
NVIDIA
GPU

CUDA 13.2 がタイルサポート強化と新 Python 機能を追加

NVIDIA は CUDA Toolkit 13.2 を正式にリリースしました。今回の更新では、CUDA Tile が Ampere、Ada、Blackwell などの最新の GPU アーキテクチャでサポートされるようになり、Python 開発者の生産性が大幅に向上します。cuTile Python を導入する際、システム全体の CUDA ツールキットを別々にインストールする必要なく、pip コマンドのみで必要な依存関係も自動的に取得できるため、セットアップが容易になりました。 コア機能の強化としては、メモリ転送の制御がより詳細に行えるようになり、単一の転送でもバッチ処理インターフェースを使わずに属性を指定する新しい API が追加されました。また、Windows 環境での GPU 固有メモリの使用量が削減され、メモリ制約のある仮想 GPU 環境においてパフォーマンスが向上しました。さらに、メモリプールのプロパティを照会する機能が実装され、既存のプール設定を踏襲した新しいプール作成が可能になります。Windows 用ドライバーでは、TCC モードから MCDM モードへのデフォルト切り替えが予定されており、システムとの互換性問題が解消されます。 数値計算ライブラリの cuBLAS では、Blackwell GPU 向けに MXFP8 をサポートする実験的 API が追加され、専門家のケースで最大 4 倍の高速化が実現しました。cuSOLVER には FP64 演算のエミュレーション技術が導入され、行列サイズが大きくなるほど最大 2 倍のパフォーマンス向上が確認されています。コンパイラー関連では、Visual Studio 2026 や ARM C 拡張への対応が追加され、Tegra とデスクトップ GPU 向けの統一ツールキットが提供されています。 組み込みデバイスでは、Arm 用の統一ツールキットが Jetson Thor や Orin デバイスで採用され、開発パイプラインの簡素化が図られます。特に Jetson Thor には NVIDIA 多インスタンス GPU(MIG)機能が導入され、安全が重要な作業とそれ以外の処理を GPU 上で物理的に隔離できるため、ロボット制御などのミックスクリティシティアプリケーションに役立ちます。 開発ツール面では、Python 開発者がカーネルをプロファイリングできる Nsight Python が新登場しました。また、Numba カーネルのデバッグが初めて可能になり、NVIDIA Nsight Tools にはレポート集約機能や CUDA Graphs ビューアの改善が加えられています。C++ 開発者向けには、CCCL 3.2 を通じて現代の C++ ランタイム API が導入され、Top-K 選択やセグメント化されたデータ処理などの高速アルゴリズムが提供されています。Python 生態系では、CuPy の CUDA ストリームプロトコル対応により、PyTorch や JAX とのゼロコピー連携が可能となり、ml_dtypes の bfloat16 サポートも強化されました。CUDA 13.2 は、Python と C++ の両面で GPU 開発の効率とパフォーマンスを飛躍的に高める内容となっています。

関連リンク

CUDA 13.2 がタイルサポート強化と新 Python 機能を追加 | 人気の記事 | HyperAI超神経