الهياكل العصبية للكيانات الاسمية المضمنة من خلال التخطيط الخطي

نقترح معماريتين لشبكات العصبونات للتمييز بين الكيانات المسماة المركبة (NER)، وهي بيئة يمكن فيها أن تتداخل الكيانات المسماة وأن تُصنف أيضًا بأكثر من تصنيف واحد. نقوم بتشفير التصنيفات المركبة باستخدام نظام خطي. في النهج الأول الذي نقترحه، يتم نمذجة التصنيفات المركبة كتصنيفات متعددة تتوافق مع الجداء الديكارتي للتصنيفات المركبة في معمارية LSTM-CRF القياسية. أما في النهج الثاني، فيُنظر إلى NER المركب كمشكلة تحويل تسلسلي، حيث يتكون التسلسل الإدخالي من العلامات (tokens) والتسلسل الإخراجي من التصنيفات، باستخدام انتباه صلب على الكلمة التي يتم التنبؤ بتصنيفها. حققت الأساليب المقترحة أداءً أفضل من الحالة المتقدمة لـ NER المركب في أربع مجموعات بيانات: ACE-2004، ACE-2005، GENIA وCzech CNEC. كما زدنا تعقيد معمارياتنا باستخدام الدمج السياقي الحديث: ELMo، BERT وFlair، مما أدى إلى تحسينات إضافية للمجموعات الأربعة للكيانات المسماة المركبة. بالإضافة إلى ذلك، نقدم نتائج الحالة المتقدمة لـ NER البسيط لمجموعة بيانات CoNLL-2002 الهولندية والإسبانية ولمجموعة بيانات CoNLL-2003 الإنجليزية.