La prise en charge officielle du programmation de tuiles C++ dans CUDA 13.3 réduit la barrière à l'entrée pour le développement sur GPU.
Après le lancement initial de CUDA 13.1 avec un modèle de programmation GPU basé sur les tuiles ("tiles") et la prise en charge de Python, NVIDIA a officiellement ouvert cette capacité aux développeurs C++ dans CUDA 13.3. Le principe fondamental des Tuiles CUDA consiste à effectuer des calculs sur des tableaux multidimensionnels en utilisant la "tuile" comme unité élémentaire, masquant ainsi les détails sous-jacents du pilotage des threads SIMT, des transferts mémoire et de l'asynchronisme. Les développeurs se bornent à déclarer comment les données sont découpées et à définir les opérations mathématiques entre les tuiles ; le compilateur gère automatiquement la parallélisation, la mémoire partagée et l'appel des caractéristiques matérielles telles que les cœurs Tensor, réduisant considérablement la complexité de développement des noyaux GPU. Comparé au mode traditionnel CUDA C++ SIMT, la programmation par tuiles réduit non seulement la quantité de code devant être écrit manuellement mais offre également une portabilité inter-architectures : un même code s'adapte automatiquement aux architectures GPU Ampere, Hopper et ultérieures sans nécessiter de réécriture pour chaque matériel spécifique. Les développeurs peuvent compiler les noyaux de type tuile via nvcc en utilisant le paramètre `--enable-tile`, tandis que Nsight Compute prend désormais en charge l'analyse de performance de ces mêmes noyaux. L'environnement d'exécution requiert une carte graphique disposant d'une Capacité de Calcul 8.x ou supérieure, un pilote R580+, et le kit de développement logiciel CUDA 13.3. Cette fonctionnalité est actuellement accessible à tous les développeurs CUDA, dont les documents et références d'API sont disponibles sur le site web de NVIDIA.
