HyperAIHyperAI
منذ 17 أيام

APOLLO: نهج مُحسَّن للتدريب على الاستدلال العددي الطويل

Jiashuo Sun, Hang Zhang, Chen Lin, Xiangdong Su, Yeyun Gong, Jian Guo
APOLLO: نهج مُحسَّن للتدريب على الاستدلال العددي الطويل
الملخص

يهدف الاستدلال العددي الطويل النص إلى إنتاج برنامج استدلال لحساب الإجابة الصحيحة لسؤال معين. اتبع العمل السابق إطارًا مُستَرجع-مُولِّد، حيث يقوم المسترجع باختيار الحقائق الأساسية من مستند طويل، ويُولِّد المُولِّد برنامج استدلال بناءً على الحقائق المسترجعة. ومع ذلك، تم التعامل مع جميع الحقائق بشكل متساوٍ دون أخذ القيم المختلفة للحقائق ذات الأرقام والحقائق بدون أرقام بعين الاعتبار. بالإضافة إلى ذلك، تم تجاهل اتساق البرنامج أثناء التدريب المُشرف، مما أدى إلى انخفاض دقة التدريب وتنوع النتائج. ولحل هذه المشكلات، قمنا بطرح APOLLO لتحسين إطار الاستدلال العددي الطويل النص. بالنسبة للمسترجع، اعتمدنا استراتيجية عينة سلبية واعية بالأرقام، مما يمكّن المسترجع من التمييز بشكل أكثر دقة بين الحقائق العددية الأساسية. أما بالنسبة للمُولِّد، فقد صممنا استراتيجية تعلم تعزيز مبنية على الاتساق، بالإضافة إلى استراتيجية تعزيز البرنامج المستهدفة، وذلك بناءً على اتساق نتائج تنفيذ البرامج. وتم التحقق من فعالية الطريقة المقترحة من خلال النتائج التجريبية على لائحة FinQA وConvFinQA، حيث حققت أداءً جديدًا يُعتبر الأفضل في مجاله.

APOLLO: نهج مُحسَّن للتدريب على الاستدلال العددي الطويل | أحدث الأوراق البحثية | HyperAI