نموذج تصنيف المجموعة لحل التضمين الكامل

أنظمة حل التكرار (الربط النحوي) المصممة لبيانات CONLL 2012 لا تستطيع عادةً التعامل مع جوانب أساسية من مهمة حل التكرار الكاملة، مثل تحديد العبارات المنفردة (singletons) والتعبيرات غير المُشِيرَة من نوع معين (مثل التعبيرات التوضيحية - expletives)، نظرًا لأن هذه الجوانب لم تُعلَّم في تلك المجموعة. ومع ذلك، أصبح بإمكاننا الآن استخدام المجموعة الجديدة التي أُطلقت مؤخرًا للفعالية المشتركة CRAC 2018 لهذا الغرض. في هذه الورقة، نقدم معمارية تُمكّن من تحديد التعبيرات غير المُشِيرَة (بما في ذلك التعبيرات التوضيحية، والتعبيرات الصِّفَةِية، وأنواع أخرى) وبناء سلاسل الربط النحوي (coreference chains) في آنٍ واحد، بما في ذلك العبارات المنفردة. يعتمد نظام تصنيف المجموعات (cluster-ranking) على آلية الانتباه (attention mechanism) لتحديد الأهمية النسبية للإشارات داخل نفس المجموعة. كما تُستخدم تصنيفات إضافية لتحديد العبارات المنفردة والعبارات غير المُشِيرَة. تتمثل مساهماتنا في النقاط التالية: أولاً، نُقدّم أول نتيجة مُحققة على بيانات CRAC باستخدام الإشارات الناتجة عن النظام؛ وقد بلغت هذه النتيجة تحسنًا بنسبة 5.8% مقارنة بنظام المعيار (baseline) المُستخدم في الفعالية المشتركة، والذي اعتمد على الإشارات الذهبية (gold mentions). ثانيًا، نُظهر أن توفر مجموعات العبارات المنفردة والتعبيرات غير المُشِيرَة يمكن أن يؤدي إلى تحسين ملحوظ في الأداء على المجموعات غير المنفردة. ثالثًا، نُظهر أن نموذجنا، رغم أنه لم يُصمم خصيصًا لبيانات CONLL، يحقق أداءً يعادل أداء أفضل نظام حالي (state-of-the-art) في تلك المجموعة، والذي طوّرته كانتور وغلوبرسون (2019).