HyperAIHyperAI
منذ 13 أيام

MoTCoder: رفع كفاءة النماذج اللغوية الكبيرة من خلال الوحدات الفكرية لأداء مهام برمجية صعبة

Jingyao Li, Pengguang Chen, Bin Xia, Hong Xu, Jiaya Jia
MoTCoder: رفع كفاءة النماذج اللغوية الكبيرة من خلال الوحدات الفكرية لأداء مهام برمجية صعبة
الملخص

أظهرت النماذج اللغوية الكبيرة (LLMs) قدرات مبهرة في التعامل مع المهام البرمجية البسيطة. ومع ذلك، تميل أداؤها إلى التراجع عند مواجهة المشكلات البرمجية الأكثر تعقيدًا. لاحظنا أن النماذج التقليدية غالبًا ما تُنتج حلولًا على شكل كتل برمجية متكاملة، مما يحد من فعاليتها في معالجة الأسئلة المعقدة. لتجاوز هذه القيود، نقدّم "مُنشِّئ الأفكار الوحدوية" (MoTCoder). نحن نقدّم إطارًا لتدريب التعليم حسب نمط التفكير الوحدوي (MoT)، مصمم لتشجيع تفكيك المهام إلى مهام فرعية منطقية ووحدات فرعية. تُظهر دراساتنا أن تطوير واستخدام الوحدات الفرعية يُحسّن بشكل كبير كلاً من التكامل الوحدوي والدقة في الحلول المُنتجة، ما يؤدي إلى تحسين ملحوظ في مؤشر "النجاح @1" بنسبة 5.9% على APPS و5.8% على CodeContests. كما حقق MoTCoder تحسينات كبيرة في قدرته على التصحيح الذاتي، متفوقًا على أحدث النماذج المتفوقة (SOTA) بنسبة 3.3%. بالإضافة إلى ذلك، نقدّم تحليلًا لعلاقة تعقيد المشكلة بتفكيك الوحدات الأمثل، ونقيّم مؤشر قابلية الصيانة، مما يؤكد أن الشفرة المُنتجة بواسطة MoTCoder تكون أسهل في الفهم والتعديل، ما يُعد ميزة كبيرة لصيانة الشفرة وتطورها على المدى الطويل. يمكن الوصول إلى الشفرة المصدرية لدينا عبر الرابط: https://github.com/dvlab-research/MoTCoder.