استنتاج مع تحسين البنية الخفية لاستخراج العلاقات على مستوى المستند

استخلاص العلاقات على مستوى المستند يتطلب دمج المعلومات داخل الجمل المتعددة وعبرها في المستند، وفهم التفاعلات المعقدة بين الكيانات المتعددة عبر الجمل. ومع ذلك، لا يزال التجميع الفعّال للمعلومات ذات الصلة داخل المستند يُعدّ سؤالًا بحثيًا صعبًا. تعتمد النماذج الحالية على بناء رسوم بيانية ثابتة على مستوى المستند بناءً على أشجار تركيبية، أو تطابقات التصريح، أو قواعد تقريبية من النص غير المهيكل لتمثيل العلاقات الاعتمادية. على عكس الطرق السابقة التي قد لا تكون قادرة على التقاط التفاعلات الغنية غير المحلية لغرض الاستنتاج، نقترح نموذجًا جديدًا يُمكّن من التفكير العلاقة عبر الجمل من خلال استخلاص تلقائي للرسم البياني الخفي على مستوى المستند. علاوةً على ذلك، نطوّر استراتيجية تحسين تُمكّن النموذج من تجميع المعلومات ذات الصلة تدريجيًا لدعم الاستنتاج متعدد الخطوات. وبشكل خاص، حقق نموذجنا نتيجة F1 بلغت 59.05 على مجموعة بيانات واسعة النطاق على مستوى المستند (DocRED)، مُتفوّقًا بشكل كبير على النتائج السابقة، كما أنتج نتائج جديدة مُتقدّمة على مستوى الحالة (SOTA) في مجموعتي البيانات CDR وGDA. بالإضافة إلى ذلك، أظهر التحليلات الواسعة أن النموذج قادر على اكتشاف علاقات بين الجمل أكثر دقة.