HyperAIHyperAI
منذ 11 أيام

نماذج LMs اقتصادية التكلفة، التدريب على استدعاء حلّالات رمزية، تحقق استدلالًا حسابيًا كفؤًا من حيث المعاملات

Subhabrata Dutta, Joykirat Singh, Ishan Pandey, Sunny Manchanda, Soumen Chakrabarti, Tanmoy Chakraborty
نماذج LMs اقتصادية التكلفة، التدريب على استدعاء حلّالات رمزية، تحقق استدلالًا حسابيًا كفؤًا من حيث المعاملات
الملخص

تُظهر نماذج اللغة الكبيرة (LLM) قدرة على الاستدلال الرياضي بدون تدريب مسبق (zero-shot)، وهي سلوك يظهر تدريجيًا مع زيادة الحجم، وغالبًا ما يتجلى في استدلال سلسلة التفكير (Chain-of-Thoughts - CoT). ومع ذلك، تشير العديد من النتائج التجريبية إلى أن هذه القدرة تقتصر على نماذج LLM الضخمة جدًا (بما يتجاوز 50 مليار معلمة). من ناحية أخرى، تشير العلماء العصبيون التربويون إلى أنه ينبغي تقديم التمثيل الرمزي الجبري في نفس الوقت الذي يُقدَّم فيه المسائل الحسابية النصية، بهدف تفكيك عملية التحويل من اللغة إلى الصيغة، والتمثيل الرمزي للصيغة، والحساب النهائي. في هذه الورقة، نبدأ بافتراض أن نماذج لغة صغيرة (LMs) أقل قدرة على الاستدلال متعدد الخطوات يمكنها تحقيق استدلال حسابي معقول إذا تم طرح المسائل الحسابية النصية كمهمة "صياغة ثم حل". في معمارية لدينا، التي نسميها SYRELM، تقوم نموذج اللغة بدور مترجم لتحويل الأسئلة الحسابية باللغة الطبيعية إلى وصف بلغة رمزية (FL). ثم يقوم مُحلِّل رمزي بتقييم التعبير باللغة الرمزية للحصول على الإجابة. ويُظهر نموذج لغة صغير مُجمَّد، مزود بملحق منخفض الرتبة فعّال، قدرة على إنتاج تعبيرات باللغة الرمزية التي تتضمن وصفًا باللغة الطبيعية للمشكلة الحسابية (مثل أسماء المتغيرات وأغراضها، والتعبيرات الرمزية المركبة من المتغيرات، إلخ). نستخدم التعلم بالتعزيز القائم على مبدأ السياسة (policy-gradient reinforcement learning) لتدريب النموذج المُعدَّل، مع إشارة إلى المُحلِّل الرمزي غير القابل للتفاضل. يُشكِّل هذا انفصالًا حادًا عن التطورات الحديثة في نماذج LLM المُعزَّزة بالأدوات، حيث تكون الأدوات الخارجية (مثل الآلة الحاسبة، البحث عبر الويب، إلخ) في الغالب منفصلة تمامًا عن مرحلة التعلم الخاصة بنموذج اللغة. تُظهر SYRELM تحسينات كبيرة (مثل زيادة بنسبة 30.65 نقطة مطلقة في الدقة على مجموعة بيانات SVAMP باستخدام نموذج GPT-J 6B)، مقارنةً بالنموذج الأساسي، مع الحفاظ على بيئة الاختبار سهلة التشخيص والتفسير، وبعيدة عن متناول معظم الباحثين.

نماذج LMs اقتصادية التكلفة، التدريب على استدعاء حلّالات رمزية، تحقق استدلالًا حسابيًا كفؤًا من حيث المعاملات | أحدث الأوراق البحثية | HyperAI