أساس بسيط ولكن قوي للاعتراف بالكيانات المسماة المضمنة

التعرف على الكيانات المسماة (NER) هو مهمة كشف وتصنيف فترات الكيانات في النص. عندما تتداخل فترات الكيانات مع بعضها البعض، يُطلق على هذه المشكلة اسم التعرف على الكيانات المسماة المتداخلة (nested NER). تم استخدام طرق مستندة إلى الفترات بشكل واسع لمعالجة التعرف على الكيانات المسماة المتداخلة. تُحصل معظم هذه الطرق على مصفوفة نقاط بحجم $n \times n$، حيث يمثل $n$ طول الجملة، وكل عنصر في المصفوفة يتوافق مع فترة. ومع ذلك، فإن الأعمال السابقة تتجاهل العلاقات المكانية في مصفوفة النقاط. في هذا البحث، نقترح استخدام شبكة عصبية تقنية (CNN) لنمذجة هذه العلاقات المكانية في مصفوفة النقاط. رغم بساطتها، أظهرت التجارب في ثلاثة منsets المعروفة للتعرف على الكيانات المسماة المتداخلة أن نموذجنا يتخطى عدة طرق اقترحت حديثًا باستخدام نفس المُشفرات المسبقة التدريب. كما أظهرت التحليلات الإضافية أن استخدام CNN يمكن أن يساعد النموذج في العثور على المزيد من الكيانات المتداخلة. بالإضافة إلى ذلك، وجدنا أن الأوراق البحثية المختلفة استخدمت تقسيمات جمل مختلفة للثلاثة مجموعات بيانات للتعرف على الكيانات المسماة المتداخلة، مما سيؤثر على المقارنة. لذلك، قمنا بإصدار سكريبت معالجة ما قبل التعريف لتسهيل المقارنات المستقبلية.请注意,"sets" 在这里被翻译为 "مجموعات بيانات" 以符合上下文中的数据集含义。另外,为了更符合阿拉伯语的表达习惯,对一些句子进行了细微调整。