HyperAI

CASS: الترجمة من Nvidia إلى AMD مع البيانات والنموذج والمقياس الزمني

Ahmed Heakl, Sarim Hashmi, Gustavo Bertolo Stahl, Seung Hun Eddie Han, Salman Khan, Abdulrahman Mahmoud
تاريخ النشر: 6/5/2025
CASS: الترجمة من Nvidia إلى AMD مع البيانات والنموذج والمقياس الزمني
الملخص

نقدم CASS، أول مجموعة بيانات ونماذج على نطاق كبير مخصصة لتحويل الرموز البرمجية بين هياكل GPU المختلفة، والتي تستهدف الترجمة على مستوى المصدر (CUDA ↔ HIP) وعلى مستوى التجميع (Nvidia SASS ↔ AMD RDNA3). تتكون هذه المجموعة من 70 ألف زوج رموز برمجية تم التحقق منها عبر المستضيف والجهاز، مما يسد فجوة حرجة في قابلية نقل الرموز البرمجية لـ GPU على المستوى المنخفض. باستخدام هذا المورد، ندرب عائلة النماذج اللغوية المتخصصة CASS، مما يحقق دقة ترجمة تبلغ 95% على مستوى المصدر و37.5% على مستوى التجميع، مما يتفوق بشكل كبير على الخطوط الأساسية التجارية مثل GPT-4o، Claude، وHipify. يطابق الكود الذي تم إنشاؤه أداء الكود الأصلي في أكثر من 85% من حالات الاختبار، مع الحفاظ على سلوك وقت التشغيل واستخدام الذاكرة. لدعم التقييم الدقيق، نقدم CASS-Bench، وهو معيار مُعد بعناية يشمل 16 مجالًا للـ GPU مع تنفيذ حقيقي. تم إطلاق جميع البيانات والنماذج وأدوات التقييم كمصدر مفتوح لتعزيز التقدم في أدوات تكويد GPU، وتوافق二进制文件,以及由LLM指导的硬件翻译。数据集和基准测试可在https://huggingface.co/datasets/MBZUAI/cass{اللون الأزرق HuggingFace},代码位于https://github.com/GustavoStahl/CASS{اللون الأزرق GitHub}。注:在上述翻译中,“二进制文件”和“由LLM指导的硬件翻译”这两个术语在阿拉伯语中没有通用的对应词汇,因此保留了中文。建议将其替换为更合适的阿拉伯语术语或英文标注以确保信息完整性和专业性。以下是修正后的版本:نقدم CASS، أول مجموعة بيانات ونماذج على نطاق كبير مخصصة لتحويل الرموز البرمجية بين هياكل GPU المختلفة، والتي تستهدف الترجمة على مستوى المصدر (CUDA ↔ HIP) وعلى مستوى التجميع (Nvidia SASS ↔ AMD RDNA3). تتكون هذه المجموعة من 70 ألف زوج رموز برمجية تم التحقق منها عبر المستضيف والجهاز، مما يسد فجوة حرجة في قابلية نقل الرموز البرمجية لـ GPU على المستوى المنخفض. باستخدام هذا المورد، ندرب عائلة النماذج اللغوية المتخصصة CASS، مما يحقق دقة ترجمة تبلغ 95% على مستوى المصدر و37.5% على مستوى التجميع، مما يتفوق بشكل كبير على الخطوط الأساسية التجارية مثل GPT-4o، Claude، وHipify. يطابق الكود الذي تم إنشاؤه أداء الكود الأصلي في أكثر من 85% من حالات الاختبار، مع الحفاظ على سلوك وقت التشغيل واستخدام الذاكرة. لدعم التقييم الدقيق، نقدم CASS-Bench, وهو معيار مُعد بعناية يشمل 16 مجالًا للـ GPU مع تنفيذ حقيقي (ground-truth execution). تم إطلاق جميع البيانات والنماذج وأدوات التقييم كمصدر مفتوح لتعزيز التقدم في أدوات تكويد GPU, توافق الملفات الثنائية (binary compatibility)، والترجمة الموجهة بواسطة LLM (LLM-guided hardware translation). يمكن الوصول إلى مجموعة البيانات والمعيار عبرhttps://huggingface.co/datasets/MBZUAI/cass{اللون الأزرق HuggingFace},والكود متاح عبرhttps://github.com/GustavoStahl/CASS{اللون الأزرق GitHub}.