ChipSeek-R1: توليد وصف مستوى التسجيل (RTL) الذي يتفوق على الأداء البشري من خلال التعلم التعزيزي الهرمي بواسطة النماذج اللغوية الكبيرة (LLM)

تظهر نماذج اللغات الكبيرة (LLMs) إمكانات كبيرة في تلقين توليد رموز المستوى النقل السجل (RTL). ومع ذلك، فإن الأساليب الحالية تواجه تحديًا حاسمًا: لا يمكنها تحسين الوظائف الصحيحة وجودة الأجهزة (الطاقة، الأداء، المساحة - PPA) في الوقت نفسه. غالبًا ما تولد الطرق القائمة على التدريب المشرف كودًا وظيفيًا صحيحًا ولكنه غير مثالي من حيث PPA، حيث تعاني من عدم وجود آليات لتعلم مبادئ التحسين. بالمقابل، تكون تقنيات المعالجة اللاحقة التي تحاول تحسين مؤشرات PPA بعد التوليد غير فعالة غالبًا لأنها تعمل بشكل خارجي دون تحديث معلمات نموذج اللغة الكبير (LLM)، مما يؤدي إلى فشلها في تعزيز قدرات التصميم الداخلية للنموذج. لسد هذه الفجوة، نقدم ChipSeek-R1، وهو إطار تعليم تعزيزي هرمي مدفوع بالمكافآت لتدريب نماذج اللغات الكبيرة على توليد رموز RTL التي تحقق كل من الوظائف الصحيحة ومؤشرات PPA المحسنة. يستخدم ChipSeek-R1 نظام مكافآت هرمي يدمج الردود المباشرة حول الصياغة والوظائف الصحيحة (من المحاكاة) ومؤشرات PPA (من أدوات التركيب) أثناء عملية التعليم التعزيزي. هذا يتيح للنموذج تعلم التوازنات المعقدة في تصميم الأجهزة عبر التجربة والخطأ، مما يؤدي إلى توليد رموز RTL تكون صحيحة وظيفيًا ومُحسَّنة من حيث PPA. عند تقييم ChipSeek-R1 على مقاييس قياسية (VerilogEval، RTLLM)، حققنا أفضل النتائج الحالية في الوظائف الصحيحة. وبشكل لافت للنظر، على مقاييس RTLLM، تمكنت ChipSeek-R1 من إنتاج 27 تصميمًا لـ RTL يتفوق على مؤشرات PPA للرمز الذي كتبه البشر. تُظهر نتائجنا فعالية دمج ردود فعل سلسلة الأدوات في تدريب نماذج اللغات الكبيرة وتسلط الضوء على إمكانية استخدام التعليم التعزيزي لتحقيق توليد آلي لرموز RTL التي تتخطى مستوى البشر. لقد أطلقنا شفرتنا المصدرية بشكل مفتوح ومجهول الهوية على موقع GitHub. شرح بعض المصطلحات: نماذج اللغات الكبيرة (LLMs): Large Language Models مستوى النقل السجل (RTL): Register-Transfer Level PPA: Power, Performance, Area إطار تعليم تعزيزي هرمي مدفوع بالمكافآت: Hierarchical reward-driven reinforcement learning framework ردود فعل سلسلة الأدوات: Toolchain feedback شفرة مصدرية مفتوحة ومجهولة الهوية: Anonymous open-source code