استخراج العلاقات على مستوى المستند باستخدام مشغل تحويلي مُعزّز بالهيكل
استخلاص العلاقات على مستوى المستند يهدف إلى اكتشاف الحقائق المتعلقة بالعلاقات بين أزواج الكيانات في مستند، وقد لاقت هذه المهمة اهتمامًا متزايدًا في السنوات الأخيرة. تُلخَّص معظم الطرق الحالية بشكل رئيسي في نوعين: الطرق القائمة على الرسوم البيانية (graph-based) والطرق القائمة على المحولات (transformer-based). ومع ذلك، فإن الطرق السابقة القائمة على المحولات تتجاهل المعلومات الهيكلية بين الكيانات، في حين أن الطرق القائمة على الرسوم البيانية لا تستطيع استخلاص المعلومات الهيكلية بشكل فعّال بسبب فصل مرحلة ترميز الكيانات عن مرحلة الاستدلال الهيكلي. في هذا البحث، نقترح نموذجًا فعّالًا يُدعى "محول التشفير المُعزّز بالهيكل" (SETE)، يدمج المعلومات الهيكلية للكيانات داخل محول التشفير. نبدأ بتعريف رسم بياني على مستوى الإشارة (mention-level graph) بناءً على الاعتماديات بين الإشارات، ثم نحوّله إلى رسم بياني على مستوى الرموز (token-level graph). بعد ذلك، نصمم آلية انتباه ذاتي مزدوجة، تُثري المعلومات الهيكلية والسياقية بين الكيانات، مما يعزز قدرة محول التشفير الأصلي على الاستنتاج. أظهرت التجارب على ثلاث مجموعات بيانات عامة أن نموذج SETE يتفوق على الطرق الأفضل حتى الآن، كما تشير التحليلات الإضافية إلى قابلية تفسير نموذجنا.