HyperAIHyperAI
منذ 17 أيام

FinQA: مجموعة بيانات للاستدلال العددي على البيانات المالية

Zhiyu Chen, Wenhu Chen, Charese Smiley, Sameena Shah, Iana Borova, Dylan Langdon, Reema Moussa, Matt Beane, Ting-Hao Huang, Bryan Routledge, William Yang Wang
FinQA: مجموعة بيانات للاستدلال العددي على البيانات المالية
الملخص

يُعدّ الحجم الهائل من البيانات المالية أمرًا يُعَسِّر على البشر الوصول إلى تحليل البيانات المالية لشركات معينة. كما تواجه التفكير العددي القوي تحديات فريدة في هذا المجال. في هذا العمل، نركّز على الإجابة على أسئلة عميقة حول البيانات المالية، بهدف أتمتة تحليل مجموعة كبيرة من الوثائق المالية. وعلى عكس المهام الحالية في المجال العام، يحتوي المجال المالي على تفكير عددي معقد وفهم لتمثيلات متنوعة. ولتمكين التقدم التحليلي، نقترح مجموعة بيانات جديدة على نطاق واسع تُسمى FinQA، تتضمن أزواج أسئلة وأجوبة مبنية على التقارير المالية، صاغها خبراء ماليون. كما نقوم بتوثيق البرامج المعرفية الصحيحة (gold reasoning programs) لضمان الشفافية الكاملة في التفسير. ونقدّم أيضًا قواعد مرجعية (baselines) ونُجري تجارب شاملة على هذه المجموعة. تُظهر النتائج أن النماذج الكبيرة المُدرّبة مسبقًا الشهيرة تُبقي على فجوة كبيرة أمام البشر الخبراء في اكتساب المعرفة المالية وفي التفكير العددي المتعدد الخطوات المعقد. وبالتالي، تمثل مجموعتنا البياناتية – وهي الأولى من نوعها – فرصة كبيرة لبدء أبحاث جديدة ومُتقدمة في مجالات تطبيقية معقدة. إن مجموعة البيانات والكود مُتاحان للجمهور عبر الرابط: \url{https://github.com/czyssrs/FinQA}.

FinQA: مجموعة بيانات للاستدلال العددي على البيانات المالية | أحدث الأوراق البحثية | HyperAI