Command Palette
Search for a command to run...
التعلم من خلال الإصلاح: حل مسائل الرياضيات الكلامية باستخدام الإشراف الضعيف
التعلم من خلال الإصلاح: حل مسائل الرياضيات الكلامية باستخدام الإشراف الضعيف
Yining Hong Qing Li Daniel Ciao Siyuan Huang Song-Chun Zhu
الملخص
الحلال العصبية السابقة لمشاكل الرياضيات النصية (MWPs) تُدرَّس باستخدام إشراف كامل، وتفشل في إنتاج حلول متنوعة. في هذه الورقة، نعالج هذه المشكلة من خلال تقديم منهجية \textit{مُشرَّفة بشكل ضعيف} لتعلم مشاكل الرياضيات النصية. تعتمد طريقتنا فقط على تسميات الإجابات النهائية، ويمكنها إنتاج حلول متنوعة لمشكلة واحدة. ولتعزيز التعلم المُشرَّف بشكل ضعيف، نقترح إطارًا جديدًا يُسمى \textit{التعلم من خلال التصحيح} (LBF)، والذي يصحح الفهم الخاطئ للشبكة العصبية من خلال الاستدلال الرمزي. وبشكل خاص، بالنسبة لشجرة حل خاطئة تُولَّد بواسطة الشبكة العصبية، فإن آلية \textit{التصحيح} تُنقل الخطأ من العقدة الجذرية إلى العقد الورقية، وتحدد التصحيح الأكثر احتمالاً الذي يمكن تنفيذه للحصول على الإجابة المرغوبة. ولإنتاج حلول أكثر تنوعًا، يتم تطبيق \textit{تقويم الشجرة} لتوجيه الانكماش الفعّال واستكشاف فضاء الحلول، كما تم تصميم \textit{ذاكرة مؤقتة} لتتبع وحفظ التصحيحات المتنوعة التي تم اكتشافها لكل مشكلة. أظهرت النتائج التجريبية على مجموعة بيانات Math23K أن الإطار المقترح LBF يتفوّق بشكل ملحوظ على الطرق القائمة على التعلم بالتعزيز في التعلم المُشرَّف بشكل ضعيف. علاوةً على ذلك، حقق أداءً مماثلاً في دقة الإجابة الأولى (top-1)، وبأداء أفضل بكثير في دقة الإجابات الأولى (top-3/top-5) مقارنة بالطرق المُشرَّفة بشكل كامل، مما يُظهر قوته في إنتاج حلول متنوعة.