HyperAIHyperAI
منذ 18 أيام

تحسين استخراج العلاقات على مستوى المستند من خلال تعميق تمثيلات الإشارات السياقية ووزن أزواج الإشارات

{Ping Jiang;Xian-Ling Mao;Binbin Bian;Heyan Huang}
الملخص

استحوذ استخراج العلاقات على مستوى المستند (RE) على اهتمام كبير، نظرًا لأن العديد من الحقائق المتعلقة بالعلاقات تُعبّر عنها عبر جمل متعددة. في الآونة الأخيرة، أصبحت النماذج القائمة على المُشفِّر-المُجمّع واعدة في مجال استخراج العلاقات على مستوى المستند. ومع ذلك، تمتلك هذه النماذج عيبين رئيسيين: (أ) لا يمكنها الحصول على تمثيلات مُحتَوَية سياقيًا لذكرة معينة بتكلفة حسابية منخفضة عندما تكون هذه الذكرات جزءًا من أزواج كيانات مختلفة؛ (ب) تتجاهل الأوزان المختلفة المُخصصة لأزواج الذكرات المرتبطة بزوج كيانات مستهدف. لمعالجة المشكلتين السابقتين، نقترح في هذه الورقة نموذجًا جديدًا يعتمد على المُشفِّر-المُتابع-المُجمّع، والذي يُدخل عنصرين مُتابعَين بين المُشفِّر والمُجمّع. بشكل مفصّل، يتم أولًا استخدام مُتابع متبادل على الذكرات المختارة (الرأسية والنهائية) لإنتاج تمثيلات مُحتَوَية سياقيًا للذكرات بشكل فعّال. ثم، يُستخدم مُتابع تجميعي لتوزيع أوزان على أزواج الذكرات المرتبطة بزوج كيانات مستهدف. أظهرت التجارب الواسعة على مجموعتي بيانات استخراج العلاقات على مستوى المستند أن النموذج المقترح يتفوّق على النماذج الحالية الأفضل من حيث الأداء. تُتاح رموزنا بشكل عام عبر الرابط: "https://github.com/nefujiangping/EncAttAgg".