مُعمَّر التعرف على الكيانات المُسمّاة المُدمج بين السياق والسمات العالمية

تمييز الكيانات المعرفة (NER) هو تقنية استخراج المعلومات التي تهدف إلى تحديد وتصنيف الكيانات المعرفة (مثل المنظمات، والمواقع، إلخ) داخل مستند ما ضمن فئات محددة مسبقًا. يُعدّ التعرف الصحيح على هذه العبارات مهمًا جدًا في تبسيط الوصول إلى المعلومات. ومع ذلك، لا يزال يُعدّ هذا المهمة صعبة بسبب التنوّع الكبير في أشكال الكيانات المعرفة، بالإضافة إلى اعتمادها على السياق. في حين يمكن تمثيل السياق باستخدام السمات السياقية، فإن النماذج التقليدية غالبًا ما تُخطئ في تمثيل العلاقات العالمية بين الكيانات. في هذا البحث، نقترح دمج السمات السياقية المستمدة من نموذج XLNet مع السمات العالمية المستمدة من شبكة الت(Convolution Network (GCN) لتحسين أداء تمييز الكيانات المعرفة. أظهرت التجارب على مجموعة بيانات شائعة الاستخدام، CoNLL 2003، فوائد الاستراتيجية المقترحة، حيث حققت النتائج تحسنًا متنافسًا مع أحدث النماذج المتطورة (SOTA).