HyperAIHyperAI
منذ 3 أشهر

إيدر: تمكين استخراج العلاقات على مستوى المستند من خلال استخراج الأدلة الفعالة ودمج الاستنتاج في مرحلة الاستنتاج

Yiqing Xie, Jiaming Shen, Sha Li, Yuning Mao, Jiawei Han
إيدر: تمكين استخراج العلاقات على مستوى المستند من خلال استخراج الأدلة الفعالة ودمج الاستنتاج في مرحلة الاستنتاج
الملخص

استخلاص العلاقات على مستوى المستند (DocRE) يهدف إلى استخلاص العلاقات الدلالية بين أزواج الكيانات في مستند. تأخذ الطرق التقليدية لـ DocRE المستند الكامل كمدخل بشكل أعمى، في حين أن مجموعة جزئية من الجمل في المستند، والمعروفة باسم "الأدلة"، غالبًا ما تكون كافية للبشر لاستنتاج العلاقة بين زوج من الكيانات. في هذه الورقة، نقترح إطارًا مُعززًا بالأدلة يُدعى Eider، والذي يُمكّن من استخلاص العلاقات على مستوى المستند من خلال استخلاص الأدلة بكفاءة ودمجها الفعّال أثناء الاستنتاج. نقوم أولًا بتدريب نموذج استخلاص العلاقات (RE) مع نموذج استخلاص الأدلة الخفيف الوزن بشكل مشترك، مما يُحقق كفاءة في استخدام الذاكرة والوقت أثناء التشغيل. من الناحية التجريبية، حتى عند تدريب نموذج الأدلة باستخدام علامات "فضّة" (silver labels) تم إنشاؤها بواسطة قواعد حسابية لدينا، يمكن تحقيق أداءً أفضل في استخلاص العلاقات. كما صممنا عملية استنتاج بسيطة ولكن فعّالة، تقوم بإجراء تنبؤات بالعلاقات على كل من الأدلة المستخرجة والمستند الكامل، ثم تدمج هذه التنبؤات من خلال طبقة خلط (blending layer). هذا يمكّن Eider من التركيز على الجمل المهمة مع الحفاظ على الوصول إلى المعلومات الكاملة في المستند. أظهرت التجارب الواسعة أن Eider يتفوق على أحدث الطرق في ثلاث مجموعات بيانات معيارية (مثل تحسين بنسبة 1.37/1.26 في مقياس Ign F1/F1 على مجموعة بيانات DocRED).

إيدر: تمكين استخراج العلاقات على مستوى المستند من خلال استخراج الأدلة الفعالة ودمج الاستنتاج في مرحلة الاستنتاج | الأوراق البحثية | HyperAI