ReasTAP: حقن مهارات الاستدلال الجدولية أثناء التدريب المسبق من خلال أمثلة استدلال صناعية

الاستدلال على البيانات الجدولية يتطلب فهم بنية الجدول ومجموعة واسعة من مهارات الاستدلال على الجداول. تؤدي النماذج الحالية ذات الهندسة المحددة للجداول والطرق التمهيدية إلى أداء جيد في فهم بنية الجداول، ولكنها لا تزال تعاني من المهام التي تتطلب مجموعة متنوعة من مهارات الاستدلال على الجداول. في هذا العمل، قمنا بتطوير ReasTAP لإظهار أن مهارات الاستدلال على الجداول من المستوى العالي يمكن حقنها في النماذج أثناء التدريب التمهيدي دون الحاجة إلى تصميم هندسة معقدة خاصة بالجداول. نحن نحدد 7 مهارات استدلال على الجداول، مثل العمليات العددية، والمقارنة الزمنية، والترابط (conjunction). يتم ربط كل مهارة استدلال بمولد أمثلة واحد، الذي ينتج أسئلة حول الجداول شبه المنظمة وفقًا للقوالب المستخرجة عشوائيًا. نحن نقوم بتمثيل مهمة التدريب التمهيدي للجدول كمهمة إنتاج سلسلة ونقوم بتدريب ReasTAP بشكل تمهيدي لإنتاج إجابات دقيقة للأمثلة الاصطناعية. تم تقييم ReasTAP على أربع مقاييس تغطي ثلاث مهمات متتابعة وهي: 1) WikiSQL و WTQ للاستجابة للأسئلة حول الجداول؛ 2) TabFact لتحقق الحقائق في الجداول؛ و 3) LogicNLG لإنتاج النص من الجدول بدقة. تظهر النتائج التجريبية أن ReasTAP حققت أداءً جديدًا يتفوق على جميع المقاييس وأدت إلى تحسين كبير في الإعدادات ذات الموارد المنخفضة. الكود الخاص بنا متاح بشكل عام على الرابط https://github.com/Yale-LILY/ReasTAP.