HyperAIHyperAI
منذ 2 أشهر

Doc2Graph: إطار فهم الوثائق المستقل عن المهمة والمُعتمد على شبكات العصبونات الرسومية

Andrea Gemelli; Sanket Biswas; Enrico Civitelli; Josep Lladós; Simone Marinai
Doc2Graph: إطار فهم الوثائق المستقل عن المهمة والمُعتمد على شبكات العصبونات الرسومية
الملخص

لقد جذبت التعلم العميق الهندسي اهتمامًا كبيرًا مؤخرًا في مجموعة واسعة من مجالات تعلم الآلة، بما في ذلك تحليل الوثائق. أصبحت تطبيقات شبكات الأعصاب الرسومية (GNNs) حاسمة في مهام مختلفة مرتبطة بالوثائق نظرًا لقدرتها على كشف الأنماط الهيكلية المهمة، والتي تعد أساسية في عمليات استخراج المعلومات الرئيسية. تقترح الدراسات السابقة في الأدبيات نماذج مدفوعة بالمهمة ولا تأخذ بعين الاعتبار القوة الكاملة للرسوم البيانية. نقترح Doc2Graph، وهو إطار فهم مستندات غير محدد المهمة يعتمد على نموذج شبكة عصبية رسومية (GNN)، لحل مهام مختلفة مع أنواع مختلفة من المستندات. قمنا بتقييم نهجنا على مجموعتين من البيانات الصعبتين لاستخراج المعلومات الرئيسية في فهم النماذج، تحليل تنسيق الفواتير وكشف الجداول. يمكن الوصول إلى شفرتنا البرمجية بشكل حر على https://github.com/andreagemelli/doc2graph.

Doc2Graph: إطار فهم الوثائق المستقل عن المهمة والمُعتمد على شبكات العصبونات الرسومية | أحدث الأوراق البحثية | HyperAI