Doc2Graph: إطار فهم الوثائق المستقل عن المهمة والمُعتمد على شبكات العصبونات الرسومية

لقد جذبت التعلم العميق الهندسي اهتمامًا كبيرًا مؤخرًا في مجموعة واسعة من مجالات تعلم الآلة، بما في ذلك تحليل الوثائق. أصبحت تطبيقات شبكات الأعصاب الرسومية (GNNs) حاسمة في مهام مختلفة مرتبطة بالوثائق نظرًا لقدرتها على كشف الأنماط الهيكلية المهمة، والتي تعد أساسية في عمليات استخراج المعلومات الرئيسية. تقترح الدراسات السابقة في الأدبيات نماذج مدفوعة بالمهمة ولا تأخذ بعين الاعتبار القوة الكاملة للرسوم البيانية. نقترح Doc2Graph، وهو إطار فهم مستندات غير محدد المهمة يعتمد على نموذج شبكة عصبية رسومية (GNN)، لحل مهام مختلفة مع أنواع مختلفة من المستندات. قمنا بتقييم نهجنا على مجموعتين من البيانات الصعبتين لاستخراج المعلومات الرئيسية في فهم النماذج، تحليل تنسيق الفواتير وكشف الجداول. يمكن الوصول إلى شفرتنا البرمجية بشكل حر على https://github.com/andreagemelli/doc2graph.