اللعبة المقلدة: آلة تورينج القابلة للتعميم في الطول هي جهاز الاستدلال

الترجمة:تعميم الطول، وهو القدرة على حل مشاكل تسلسلات أطول من تلك التي تم ملاحظتها أثناء التدريب، يشكل تحديًا أساسيًا للنماذج اللغوية الكبيرة المستندة إلى محولات (LLM). رغم أن معظم الدراسات الحالية ركزت على النهج القائمة على البيانات لعمليات الحساب والمهام المتعلقة بالمعالجة الرمزية، فإن هذه النهج تميل إلى أن تكون محددة للمهمة مع أداء محدود بشكل عام. بهدف السعي نحو حل أكثر عمومية، تركز هذه الورقة البحثية على حالة أوسع من مشاكل الاستدلال القابلة للحساب، أي المشاكل التي يمكن حلها بواسطة خوارزميات وبالتالي يمكن حلها بواسطة آلة تورينغ. من هذا المنظور، تقترح هذه الورقة طريقة التعلم المقلِّد لآلة تورينغ (TAIL) لتحسين قدرة تعميم الطول في النماذج اللغوية الكبيرة. تقوم TAIL بتركيب بيانات سلسلة الأفكار (CoT) التي تقليد عملية تنفيذ آلة تورينغ بواسطة برامج الكمبيوتر، والتي توسع خطوات الاستدلال بشكل خطي إلى حالات ذرية لتخفيف التعلم القصير وآلية الوصول إلى الذاكرة الصريحة لتقليل صعوبات الوصول الديناميكي والطويل المدى إلى البيانات في العمليات الأولية. لتأكيد موثوقية وشمولية TAIL، نقوم ببناء مجموعة بيانات اصطناعية صعبة تغطي 8 فئات من الخوارزميات و18 مهمة. بدون إضافة تعقيدات إضافية، يحسن TAIL بشكل كبير قدرة تعميم الطول وأداء Qwen2.5-7B في مهام مختلفة باستخدام بيانات اصطناعية فقط، مما يتفوق على الأساليب السابقة وDeepSeek-R1. كشفت نتائج التجارب أن المفاهيم الأساسية في آلة تورينغ، بدلاً من أساليب التفكير، هي ضرورية لـ TAIL للتعميم في الطول، حيث يظهر النموذج سلوكيات القراءة والكتابة متسقة مع خصائص آلة تورينغ في طبقاته الخاصة بالانتباه. يقدم هذا العمل اتجاهًا واعدًا للبحوث المستقبلية في مجال تعلم استدلال النماذج اللغوية الكبيرة من البيانات الاصطناعية.