HyperAIHyperAI
منذ 2 أشهر

اختيار جمل السياق المثلى لاستخراج العلاقات بين الأحداث

{and Thien Huu Nguyen, Linh Van Ngo, Nghia Ngo Trung, Hieu Man Duc Trong}
الملخص

فهم الأحداث يتطلب التعرف على الترتيب الهيكلي والزمني بين الإشارات إلى الأحداث لبناء هيكل أو رسم بياني للأحداث لمستندات الإدخال. لتحقيق هذا الهدف، تتناول عملنا مشكلتي استخراج العلاقات الفرعية بين الأحداث (SRE) واستخراج العلاقات الزمنية بين الأحداث (TRE)، وهما يهدفان إلى التنبؤ بالعلاقات الفرعية والعلاقات الزمنية بين زوجين من الإشارات أو المُحفِّزات للحدث المذكورة في النصوص. وقد استخدمت الطرق الحديثة الأفضل في هذا المجال نماذج لغوية تعتمد على المُحَوِّل (مثل BERT) لاستخلاص تمثيلات سياقية فعّالة لزوجي الإشارات إلى الأحداث في الإدخال. ومع ذلك، يُعدُّ أحد القيود الرئيسية للنماذج القائمة على المُحَوِّل في SRE وTRE هو أنها قادرة فقط على تشفير نصوص إدخال ذات طول محدود (أي ما لا يتجاوز 512 مكوّنًا فرعيًا في BERT)، وبالتالي لا يمكنها التقاط السياقات المهمة التي تقع على بعد بعيد في المستندات. في هذا العمل، نقدّم طريقة جديدة لتمثيل أفضل للسياق على مستوى المستند، مع التركيز على الجمل السياقية المهمة، لاستخراج العلاقات بين الأحداث. تسعى طريقتنا إلى تحديد الجمل السياقية الأكثر أهمية لزوج معين من الإشارات إلى الكيانات في مستند، ثم تجميعها في مستندات أقصر يمكن لنماذج المُحَوِّل استهلاكها بالكامل لتعلم التمثيلات. وتم استخدام خوارزمية REINFORCE لتدريب النماذج، حيث تم تقديم دوال مكافأة جديدة لالتقاط أداء النموذج، بالإضافة إلى قياس التشابه القائم على السياق والمعارف بين الجمل في إطار هذه المشكلة. أظهرت التجارب الواسعة فعالية الطريقة المقترحة، حيث حققت أداءً متقدمًا على مستوى الأداء في مجموعات البيانات القياسية.