استخراج الكيانات والعلاقات المشتركة باستخدام شبكات التنبؤ بالمجموعة

يهدف任务 استخراج الكيانات والعلاقات المشتركة إلى استخراج جميع ثلاثيات العلاقات من جملة واحدة. في الأساس، تكون ثلاثيات العلاقات المحتوية في الجملة غير مرتبة. ومع ذلك، تتطلب النماذج القائمة على seq2seq تحويل مجموعة ثلاثيات العلاقات إلى تسلسل خلال مرحلة التدريب. ولتجاوز هذا التحدي، نتعامل مع مسألة استخراج الكيانات والعلاقات المشتركة كمشكلة تنبؤ مباشرة بمجموعة، بحيث يمكن للنموذج المستخرج التخلص من عبء التنبؤ بترتيب ثلاثيات متعددة. ولحل هذه المشكلة، نقترح شبكات تعتمد على المُحَوِّلات (Transformers) مع عملية فك تشفير متوازية غير تلقائية (non-autoregressive). على عكس الطرق التلقائية التي تُولِّد ثلاثيات واحدة تلو الأخرى بترتيب معين، فإن الشبكات المقترحة تُخرِج مجموعة النتائج النهائية ثلاثيات العلاقات دفعة واحدة. علاوة على ذلك، قمنا بتصميم خسارة قائمة على المجموع (set-based loss) تُجبر النموذج على إعطاء تنبؤات فريدة من خلال التوافق الثنائي (bipartite matching). مقارنةً بخسارة التباديل (cross-entropy) التي تُعاقب بشدة على التغيرات الصغيرة في ترتيب الثلاثيات، فإن خسارة التوافق الثنائي المقترحة تكون غير حساسة لأي تبديل في ترتيب التنبؤات؛ وبالتالي، فهي توفر للشبكات المقترحة إشارة تدريب أكثر دقة من خلال تجاهل ترتيب الثلاثيات والتركيز على أنواع العلاقات والكيانات. أظهرت التجارب على مجموعتي بيانات معياريتين أن النموذج المقترح يتفوق بشكل ملحوظ على أحدث الطرق الحالية. سيتم إتاحة كود التدريب والنماذج المدربة على الرابط: http://github.com/DianboWork/SPN4RE.