HyperAIHyperAI

Command Palette

Search for a command to run...

APOLLO: نهج مُحسَّن للتدريب على الاستدلال العددي الطويل

Jiashuo Sun Hang Zhang Chen Lin Xiangdong Su Yeyun Gong Jian Guo

الملخص

يهدف الاستدلال العددي الطويل النص إلى إنتاج برنامج استدلال لحساب الإجابة الصحيحة لسؤال معين. اتبع العمل السابق إطارًا مُستَرجع-مُولِّد، حيث يقوم المسترجع باختيار الحقائق الأساسية من مستند طويل، ويُولِّد المُولِّد برنامج استدلال بناءً على الحقائق المسترجعة. ومع ذلك، تم التعامل مع جميع الحقائق بشكل متساوٍ دون أخذ القيم المختلفة للحقائق ذات الأرقام والحقائق بدون أرقام بعين الاعتبار. بالإضافة إلى ذلك، تم تجاهل اتساق البرنامج أثناء التدريب المُشرف، مما أدى إلى انخفاض دقة التدريب وتنوع النتائج. ولحل هذه المشكلات، قمنا بطرح APOLLO لتحسين إطار الاستدلال العددي الطويل النص. بالنسبة للمسترجع، اعتمدنا استراتيجية عينة سلبية واعية بالأرقام، مما يمكّن المسترجع من التمييز بشكل أكثر دقة بين الحقائق العددية الأساسية. أما بالنسبة للمُولِّد، فقد صممنا استراتيجية تعلم تعزيز مبنية على الاتساق، بالإضافة إلى استراتيجية تعزيز البرنامج المستهدفة، وذلك بناءً على اتساق نتائج تنفيذ البرامج. وتم التحقق من فعالية الطريقة المقترحة من خلال النتائج التجريبية على لائحة FinQA وConvFinQA، حيث حققت أداءً جديدًا يُعتبر الأفضل في مجاله.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp