CASS: Nvidia에서 AMD로의 데이터, 모델, 및 벤치마크 변환
Ahmed Heakl, Sarim Hashmi, Gustavo Bertolo Stahl, Seung Hun Eddie Han, Salman Khan, Abdulrahman Mahmoud
발행일: 6/5/2025

초록
우리는 크로스-아키텍처 GPU 코드 변환을 위한 첫 번째 대규모 데이터셋 및 모델 스위트인 CASS를 소개합니다. 이 데이터셋은 호스트와 디바이스 간에 7만 개의 검증된 코드 쌍으로 구성되어 있으며, 저수준 GPU 코드의 이식성 문제를 해결하기 위해 설계되었습니다. 이 자원을 활용하여 우리는 도메인 특화 언어 모델인 CASS 가족을 훈련시켰으며, 소스 레벨(CUDA ↔ HIP) 변환 정확도는 95%, 어셈블리 레벨(Nvidia SASS ↔ AMD RDNA3) 변환 정확도는 37.5%를 달성했습니다. 이는 GPT-4o, Claude, Hipify 등의 상용 베이스라인을 크게 능가하는 성능입니다. 생성된 코드는 85% 이상의 테스트 사례에서 네이티브 성능과 일치하며, 런타임과 메모리 동작을 유지합니다. 엄격한 평가를 지원하기 위해, 우리는 16개의 GPU 도메인을 아우르고 실제 실행 결과를 포함하는 큐레이션된 벤치마크인 CASS-Bench를 소개합니다. 모든 데이터, 모델 및 평가 도구는 오픈 소스로 공개되어 GPU 컴파일러 도구, 바이너리 호환성 및 LLM(대형 언어 모델) 안내 하드웨어 변환 분야의 발전을 촉진할 것입니다. 데이터셋과 벤치마크는 HuggingFace에서 확인할 수 있으며, 코드는 GitHub에서 제공됩니다.