استخراج العلاقة بين الكيانات كتحليل ارتباطي في المستندات الغنية بصريًا

تركز الدراسات السابقة المتعلقة باستخراج المعلومات الأساسية من المستندات الغنية بصريًا (VRDs) بشكل رئيسي على وضع العلامات على النص داخل كل مربع حدودي (أي الكيانات الدلالية)، بينما تبقى العلاقات بين هذه الكيانات غير مُستكشفة بشكل واسع. في هذا البحث، نقوم بتعديل نموذج تحليل الاعتماد الشهير، وهو نموذج التحليل الثنائي التأثير (biaffine parser)، ليتم تطبيقه على مهمة استخراج العلاقات بين الكيانات. على عكس نموذج تحليل الاعتماد الأصلي الذي يُعرّف العلاقات الاعتمادية بين الكلمات، نحن نحدد العلاقات بين مجموعات من الكلمات باستخدام معلومات التخطيط (layout information) بدلًا من ذلك. قمنا بمقارنة تمثيلات مختلفة للكيانات الدلالية، ومختلف مشغّلات المستندات الغنية بصريًا (VRD encoders)، وفواصل العلاقات المختلفة. أظهرت النتائج أن النموذج المقترح يحقق درجة F1 قدرها 65.96% على مجموعة بيانات FUNSD. وفيما يتعلق بالتطبيقات الواقعية، تم تطبيق النموذج على بيانات الجمارك الداخلية، حيث أظهر أداءً موثوقًا في البيئة الإنتاجية.