تمثيلات الكيانات من الخشنة إلى الدقيقة لاستخراج العلاقات على مستوى المستند

استخراج العلاقات على مستوى المستند (RE) يتطلب استخلاص العلاقات المُعبَّرة عنها داخل الجمل وعبرها. تُظهر الدراسات الحديثة أن الطرق القائمة على الرسوم البيانية، والتي تُنشئ عادةً رسمًا بيانيًا على مستوى المستند يُمكّن من التقاط التفاعلات المُدركة للمستند، يمكنها الحصول على تمثيلات مفيدة للكيانات، مما يسهم في معالجة استخراج العلاقات على مستوى المستند. تركز هذه الطرق إما على الرسم البياني بأكمله، أو تولي اهتمامًا أكبر بجزء منه، مثل المسارات بين زوج الكيانات المستهدفة. ومع ذلك، نلاحظ أن استخراج العلاقات على مستوى المستند قد يستفيد من التركيز على كليهما في آنٍ واحد. ولذلك، وللحصول على تمثيلات أكثر شمولاً للكيانات، نقترح نموذج التمثيل الكيني من المستوى الخشن إلى المستوى الدقيق (CFER) الذي يعتمد استراتيجية من المستوى الخشن إلى الدقيق، وتشمل مرحلتين. أولاً، يستخدم CFER شبكات عصبية رسومية لدمج المعلومات الشاملة في الرسم البياني بأكمله على مستوى خشون. ثانياً، يستخدم CFER المعلومات الشاملة كدليل لتجميع معلومات المسار بين زوج الكيانات المستهدفة بشكل انتقائي على مستوى دقيق. وفي عملية التصنيف، ندمج التمثيلات الكينية من كلا المرحلتين لتكوين تمثيلات أكثر شمولاً لاستخراج العلاقات. أظهرت النتائج التجريبية على مجموعتي بيانات استخراج العلاقات على مستوى المستند، DocRED وCDR، أن نموذج CFER يتفوق على النماذج الحالية، ويتميز بمتانته أمام توزيع غير متساوٍ للوسوم.