التعرف على الكيانات المسماة متعددة الحبوب

يقدم هذا البحث إطارًا جديدًا، يُعرف بـ MGNER، لتحديد الكيانات الاسمية متعددة الحبوب (Multi-Grained Named Entity Recognition)، حيث يمكن أن تكون الكيانات أو الإشارات إليها في الجملة غير متقاطعة تمامًا أو متداخلة بشكل كامل. على عكس النهج التقليدي الذي يعتبر تحديد الكيانات الاسمية (NER) مهمة تسمية تسلسلية ويقوم بتسمية الكيانات بشكل متتابع، فإن MGNER يكتشف ويحدد الكيانات على مستويات حبيبية متعددة: فهو قادر على التعرف على الكيانات الاسمية دون افتراض صريح بأنها غير متقاطعة أو متداخلة بشكل كامل. يتكون MGNER من جهاز كشف (Detector) يقوم بفحص جميع المقاطع الكلامية الممكنة وجهاز تصنيف (Classifier) يقوم بتصنيف الكيانات. بالإضافة إلى ذلك، يتم استخدام المعلومات السياقية وآلية الانتباه الذاتي (self-attention mechanism) في جميع أنحاء الإطار لتحسين أداء تحديد الكيانات الاسمية. تظهر نتائج التجارب أن MGNER يتفوق على أفضل الأساليب الحالية بمقدار يصل إلى 4.4% من حيث درجة F1 في مهام تحديد الكيانات الاسمية المتداخلة وغير المتقاطعة.