التعرف على الكيانات المسماة باستخدام شبكات LSTM-CNN ثنائية الاتجاه

التعرف على الكيانات المُسَمَّة هو مهمة صعبة تقليديًا تتطلب كميات كبيرة من المعرفة على شكل هندسة الخصائص ومُعجمات لتحقيق أداء عالٍ. في هذا البحث، نقدم معمارية شبكة عصبية جديدة تكتشف تلقائيًا الخصائص على مستوى الكلمات والأحرف باستخدام معمارية LSTM ثنائية الاتجاه وCNN مهجنة، مما يلغي الحاجة إلى معظم هندسة الخصائص. كما نقترح طريقة جديدة لترميز التطابقات الجزئية للمُعجمات في الشبكات العصبية ونقارنها بالطرق الموجودة حاليًا. تُظهر التقييمات الواسعة أن نظامنا يكون تنافسيًا على مجموعة بيانات CoNLL-2003 ويتفوق على الأداء السابق الذي تم الإبلاغ عنه على مجموعة بيانات OntoNotes 5.0 بمقدار 2.13 نقطة F1. من خلال استخدام مُعجمين تم بناؤهما من مصادر متاحة للجمهور، حققنا أداءً جديدًا يمثل الحالة الأكثر تقدمًا بدرجة F1 قدرها 91.62 على CoNLL-2003 و86.28 على OntoNotes، مما يتفوق على الأنظمة التي تعتمد على هندسة الخصائص الثقيلة والمُعجمات الخاصة والمعلومات الغنية عن ربط الكيانات.