FinQA: مجموعة بيانات للاستدلال العددي على البيانات المالية

يُعدّ الحجم الهائل من البيانات المالية أمرًا يُعَسِّر على البشر الوصول إلى تحليل البيانات المالية لشركات معينة. كما تواجه التفكير العددي القوي تحديات فريدة في هذا المجال. في هذا العمل، نركّز على الإجابة على أسئلة عميقة حول البيانات المالية، بهدف أتمتة تحليل مجموعة كبيرة من الوثائق المالية. وعلى عكس المهام الحالية في المجال العام، يحتوي المجال المالي على تفكير عددي معقد وفهم لتمثيلات متنوعة. ولتمكين التقدم التحليلي، نقترح مجموعة بيانات جديدة على نطاق واسع تُسمى FinQA، تتضمن أزواج أسئلة وأجوبة مبنية على التقارير المالية، صاغها خبراء ماليون. كما نقوم بتوثيق البرامج المعرفية الصحيحة (gold reasoning programs) لضمان الشفافية الكاملة في التفسير. ونقدّم أيضًا قواعد مرجعية (baselines) ونُجري تجارب شاملة على هذه المجموعة. تُظهر النتائج أن النماذج الكبيرة المُدرّبة مسبقًا الشهيرة تُبقي على فجوة كبيرة أمام البشر الخبراء في اكتساب المعرفة المالية وفي التفكير العددي المتعدد الخطوات المعقد. وبالتالي، تمثل مجموعتنا البياناتية – وهي الأولى من نوعها – فرصة كبيرة لبدء أبحاث جديدة ومُتقدمة في مجالات تطبيقية معقدة. إن مجموعة البيانات والكود مُتاحان للجمهور عبر الرابط: \url{https://github.com/czyssrs/FinQA}.