تحسين استخراج العلاقات من خلال التدريب المسبق المُحفَّز بالتركيب باستخدام التمويه الاعتمادي

استخراج العلاقة (RE) هو مهمة مهمة في معالجة اللغة الطبيعية تُقدّر العلاقة بين كائنين معطَيْن، حيث يُعدّ فهم معلومات السياق جزءًا أساسيًا لتحقيق أداء متميز للنموذج. من بين أنواع معلومات السياق المختلفة، أظهرت المعلومات النحوية التي تُولَّد تلقائيًا (أي الاعتماديات الكلامية) فعاليتها في هذه المهمة. ومع ذلك، تتطلب معظم الدراسات الحالية تعديلات على الهياكل الأساسية الحالية (مثل إضافة مكونات جديدة، مثل الشبكات التلافيفية التكرارية GCN، فوق مُشفّر نموذجي) للاستفادة من المعلومات النحوية. ولتقديم حل بديل، نقترح الاستفادة من المعلومات النحوية لتحسين استخراج العلاقة من خلال تدريب مُشفّر مُحفّز نحويًا على بيانات مُحلَّلة تلقائيًا باستخدام تقنية إخفاء الاعتماديات. وبشكل محدد، يتم تدريب المُشفّر المُحفّز نحويًا على استعادة الاتصالات والأنواع المُخفَّية من الاعتماديات من الدرجة الأولى والثانية والثالثة، وهو ما يختلف بشكل كبير عن الدراسات الحالية التي تُدرّب نماذج اللغة أو تمثيلات الكلمات من خلال التنبؤ بالكلمات السياقية على طول مسارات الاعتماديات. أظهرت النتائج التجريبية على مجموعتي بيانات معيار إنجليزية، وهما ACE2005EN وSemEval 2010 Task 8، فعالية النهج المقترح في استخراج العلاقة، حيث تفوق النهج المقترح على النماذج القوية وحقق نتائج من الطراز الأول على كلا المجموعتين.