CASS : Transpilation de Nvidia à AMD avec données, modèles et benchmark

Nous présentons CASS, le premier ensemble de données et de modèles à grande échelle pour la transpilation de code GPU entre différentes architectures, visant les traductions au niveau source (CUDA ↔ HIP) et au niveau assembleur (Nvidia SASS ↔ AMD RDNA3). L'ensemble de données comprend 70 000 paires de code vérifiées, couvrant à la fois l'hôte et le dispositif, comblant une lacune critique dans la portabilité du code GPU de bas niveau. En utilisant cette ressource, nous formons la famille de modèles CASS spécialisés dans des domaines spécifiques, atteignant une précision de traduction source de 95 % et une précision de traduction d'assembleur de 37,5 %, surpassant considérablement les baselines commerciales telles que GPT-4o, Claude et Hipify. Le code généré correspond aux performances natives dans plus de 85 % des cas tests, préservant le comportement en temps d'exécution et en mémoire. Pour soutenir une évaluation rigoureuse, nous introduisons CASS-Bench, un banc d'essai curaté couvrant 16 domaines GPU avec des exécutions véritables. Toutes les données, modèles et outils d'évaluation sont mis à disposition sous licence open source afin de favoriser les progrès dans les outils compilateurs GPU, la compatibilité binaire et la traduction matérielle guidée par les LLM. Les jeux de données et le banc d'essai sont disponibles sur https://huggingface.co/datasets/MBZUAI/cass{HuggingFace}, tandis que le code est hébergé sur https://github.com/GustavoStahl/CASS{GitHub}.