HLT@SUDA في مهام SemEval-2019 المهمة 1: تحليل رسم UCCA كتحليل شجرة المكونات

يُقدّم هذا البحث منهجًا بسيطًا لتحليل الرسوم البيانية الدلالية UCCA. الفكرة الأساسية تكمن في تحويل الرسم البياني الدلالي UCCA إلى شجرة مكونة، حيث تم تصميم علامات إضافية بشكل متعمد لتسمية الحواف البعيدة والعقد غير المتصلة، وذلك لتمكين استعادتها لاحقًا. وبهذه الطريقة، يمكن الاستفادة من تقنيات التحليل النحوي الحالية. وبناءً على إحصائيات البيانات، نستعيد العقد غير المتصلة مباشرةً وفقًا للعلامات الناتجة عن مُحلّل الشجرة المكونة، ونستخدم نموذج تصنيف ثنائي التأثير (biaffine classification model) لاستعادة الحواف البعيدة الأكثر تعقيدًا. ويتم تدريب نموذج التصنيف والمحلّل المكون في نفس الوقت ضمن إطار التعلم متعدد المهام. كما نستخدم نموذج BERT متعدد اللغات كمميزات إضافية في المسارات المفتوحة. وقد حقق نظامنا المركز الأول في ستة مسارات مغلقة/مفتوحة باللغة الإنجليزية والألمانية بين سبعة أنظمة مشاركة. أما في المسار السابع المتعدد اللغات، حيث تتوفر كمية ضئيلة من البيانات التدريبية للغة الفرنسية، فقد اقترحنا منهجًا يعتمد على تمثيل اللغة لاستغلال بيانات التدريب باللغة الإنجليزية والألمانية، وحقق ناتجنا المركز الثاني.