CASS:从Nvidia到AMD的数据、模型和基准转换编译
Ahmed Heakl, Sarim Hashmi, Gustavo Bertolo Stahl, Seung Hun Eddie Han, Salman Khan, Abdulrahman Mahmoud
发布日期: 6/5/2025

摘要
我们介绍了CASS,这是首个大规模的跨架构GPU代码转译数据集和模型套件,旨在实现源代码级(CUDA ↔ HIP)和汇编级(Nvidia SASS ↔ AMD RDNA3)的双向翻译。该数据集包含7万个经过验证的主机和设备代码对,填补了低级GPU代码可移植性方面的一个关键空白。利用这一资源,我们训练了CASS系列的领域专用语言模型,实现了95%的源代码翻译准确率和37.5%的汇编代码翻译准确率,显著优于GPT-4o、Claude和Hipify等商业基线模型。生成的代码在超过85%的测试案例中达到了与原生代码相当的性能,保留了运行时间和内存行为。为了支持严格的评估,我们引入了CASS-Bench,这是一个涵盖16个GPU领域的精心策划的基准测试集,并提供了真实执行结果。所有数据、模型和评估工具均已开源发布,以促进GPU编译器工具、二进制兼容性和LLM引导硬件翻译的发展。数据集和基准测试集可在HuggingFace获取,代码则托管在GitHub上。