تعزيز استخراج العلاقات على مستوى المستند من خلال دمج المعرفة الكائنية

استخراج العلاقات على مستوى المستند (RE) يهدف إلى تحديد العلاقات بين الكيانات عبر مستند كامل. ويتطلب هذا النوع من الاستخراج مهارات تفكير معقدة لدمج معارف متنوعة، مثل التماثل النحوي (coreferences) والمعرفة الشائعة (commonsense). تحتوي الرسوم البيانية المعرفية الضخمة (KGs) على كمّ هائل من الحقائق الواقعية، ويمكنها توفير معرفة قيمة لاستخراج العلاقات على مستوى المستند. في هذا البحث، نقترح إطارًا لدمج معرفة الكيانات بهدف تعزيز نماذج استخراج العلاقات الحالية على مستوى المستند. بشكل محدد، نُقدِّم تقنية تقطيع التماثل النحوي (coreference distillation) لدمج معرفة التماثل النحوي، مما يمنح نموذج استخراج العلاقات قدرة أوسع على استنتاج التماثل النحوي. كما نستخدم تقنية التوفيق في التمثيل (representation reconciliation) لدمج المعرفة الواقعية، ونُوحِّد تمثيلات الرسوم البيانية المعرفية مع تمثيلات المستندات في فضاء موحد. وقد أثبتت التجارب على مجموعتي بيانات معياريتين فعالية الإطار المقترح في تحسين القدرة على التعميم، بالإضافة إلى التحسين المستمر الذي يحققه على عدة نماذج لاستخراج العلاقات على مستوى المستند.