HyperAI

il y a 6 jours

Après le lancement initial de CUDA 13.1 avec un modèle de programmation GPU basé sur les tuiles ("tiles") et la prise en charge de Python, NVIDIA a officiellement ouvert cette capacité aux développeurs C++ dans CUDA 13.3. Le principe fondamental des Tuiles CUDA consiste à effectuer des calculs sur des tableaux multidimensionnels en utilisant la "tuile" comme unité élémentaire, masquant ainsi les détails sous-jacents du pilotage des threads SIMT, des transferts mémoire et de l'asynchronisme. Les développeurs se bornent à déclarer comment les données sont découpées et à définir les opérations mathématiques entre les tuiles ; le compilateur gère automatiquement la parallélisation, la mémoire partagée et l'appel des caractéristiques matérielles telles que les cœurs Tensor, réduisant considérablement la complexité de développement des noyaux GPU. Comparé au mode traditionnel CUDA C++ SIMT, la programmation par tuiles réduit non seulement la quantité de code devant être écrit manuellement mais offre également une portabilité inter-architectures : un même code s'adapte automatiquement aux architectures GPU Ampere, Hopper et ultérieures sans nécessiter de réécriture pour chaque matériel spécifique. Les développeurs peuvent compiler les noyaux de type tuile via nvcc en utilisant le paramètre `--enable-tile`, tandis que Nsight Compute prend désormais en charge l'analyse de performance de ces mêmes noyaux. L'environnement d'exécution requiert une carte graphique disposant d'une Capacité de Calcul 8.x ou supérieure, un pilote R580+, et le kit de développement logiciel CUDA 13.3. Cette fonctionnalité est actuellement accessible à tous les développeurs CUDA, dont les documents et références d'API sont disponibles sur le site web de NVIDIA.

Cette actualité est agrégée par l’IA afin de fournir efficacement des mises à jour sur le secteur. Elle ne constitue ni une opinion ni un conseil.

Liens associés

Develop High-Performance GPU Kernels in C++ with NVIDIA CUDA Tile

NVIDIA

HyperAI

il y a 6 jours

NVIDIA

Vibe Coding

Calcul À Haute Performance

Cette actualité est agrégée par l’IA afin de fournir efficacement des mises à jour sur le secteur. Elle ne constitue ni une opinion ni un conseil.

Liens associés

Develop High-Performance GPU Kernels in C++ with NVIDIA CUDA Tile

NVIDIA

HyperAI

il y a 6 jours

NVIDIA

Vibe Coding

Calcul À Haute Performance

Cette actualité est agrégée par l’IA afin de fournir efficacement des mises à jour sur le secteur. Elle ne constitue ni une opinion ni un conseil.

Liens associés

Develop High-Performance GPU Kernels in C++ with NVIDIA CUDA Tile

NVIDIA

La prise en charge officielle du programmation de tuiles C++ dans CUDA 13.3 réduit la barrière à l'entrée pour le développement sur GPU. | Articles tendance | HyperAI

Liens associés

Liens associés

Liens associés

Tutoriel Gratuit En Ligne Sur Les Processeurs | Agent Hermes : Apprendre La Mémoire À Long Terme ? Le Plugin D’amélioration De La Mémoire TencentDB Agent Memory Peut Stocker Séparément Les Faits, Les Préférences, Les États Des Tâches, etc.

Tutoriel Gratuit En Ligne Sur Les Processeurs | Agent Hermes : Apprendre La Mémoire À Long Terme ? Le Plugin D’amélioration De La Mémoire TencentDB Agent Memory Peut Stocker Séparément Les Faits, Les Préférences, Les États Des Tâches, etc.

Command Palette

La prise en charge officielle du programmation de tuiles C++ dans CUDA 13.3 réduit la barrière à l'entrée pour le développement sur GPU.

Liens associés

Command Palette

La prise en charge officielle du programmation de tuiles C++ dans CUDA 13.3 réduit la barrière à l'entrée pour le développement sur GPU.

Liens associés

Command Palette

La prise en charge officielle du programmation de tuiles C++ dans CUDA 13.3 réduit la barrière à l'entrée pour le développement sur GPU.

Liens associés

Tutoriel Gratuit En Ligne Sur Les Processeurs | Agent Hermes : Apprendre La Mémoire À Long Terme ? Le Plugin D’amélioration De La Mémoire TencentDB Agent Memory Peut Stocker Séparément Les Faits, Les Préférences, Les États Des Tâches, etc.

Tutoriel Gratuit En Ligne Sur Les Processeurs | Agent Hermes : Apprendre La Mémoire À Long Terme ? Le Plugin D’amélioration De La Mémoire TencentDB Agent Memory Peut Stocker Séparément Les Faits, Les Préférences, Les États Des Tâches, etc.