ConvFinQA: استكشاف سلسلة التفكير العددي في الإجابة على الأسئلة المالية التفاعلية

مع التقدم الأخير في النماذج اللغوية الكبيرة المُدرّبة مسبقًا، تمكن الباحثون من تحقيق أداءً قياسيًا في مهام معالجة اللغة الطبيعية التي تركز بشكل رئيسي على مطابقة الأنماط اللغوية. ويشهد المجتمع نقلة في طبيعة التحدي من كيفية نمذجة اللغة إلى محاكاة قدرات التفكير المعقدة المشابهة للبشر. في هذه الدراسة، نستكشف مجال التطبيقات المالي، الذي يتضمن استدلالات رقمية معقدة وواقعية. نُقدّم مجموعة بيانات جديدة بحجم كبير تُسمّى ConvFinQA، بهدف دراسة سلسلة التفكير العددي في الإجابات على الأسئلة في سياق المحادثات. تُشكّل هذه المجموعة تحديًا كبيرًا في نمذجة مسارات التفكير العددي الطويلة والمعقدة ضمن المحادثات الواقعية. قمنا بإجراء تجارب وتحليلات شاملة باستخدام كل من الأساليب العصبية الرمزية والأساليب القائمة على التحفيز (prompting)، بهدف توفير رؤى حول آليات التفكير لدى هاتين الفئتين. نعتقد أن مجموعة البيانات الجديدة لدينا ستُعدّ موردًا قيمًا لدفع عجلة البحث نحو مهام التفكير الواقعية المعقدة، والتي تمثل المحور التالي للبحث العلمي. تتوفر مجموعة البيانات والكود الخاص بنا بشكل عام عبر الرابط: https://github.com/czyssrs/ConvFinQA.