نموذج عصبي يراعي الحدود للتعرف على الكيانات الاسمية المتشابكة

في معالجة اللغة الطبيعية، من الشائع أن تحتوي العديد من الكيانات على كيانات أخرى داخلها. وغالبًا ما تتعامل الدراسات الحالية على التعرف على الكيانات المعرفة (NER) مع الكيانات المسطحة فقط، وتجاهل الكيانات المتشابكة. نقترح نموذجًا عصبيًا يراعي الحدود لمعالجة التعرف على الكيانات المتشابكة، والذي يستخدم حدود الكيانات للتنبؤ بفئات الكيانات. يمكن لنموذجنا تحديد مواقع الكيانات بدقة من خلال اكتشاف الحدود باستخدام نماذج التصنيف التسلسلي. وباستنادًا إلى الحدود المكتشفة، يستخدم نموذجنا المناطق المرتبطة بالحدود للتنبؤ بفئات الكيانات، مما يقلل من تكلفة الحساب ويقلل من مشكلة انتشار الأخطاء في النماذج التسلسلية متعددة الطبقات. ونُدخل التعلم متعدد المهام لالتقاط الارتباطات بين حدود الكيانات وفئاتها، مما يساعد على تحسين أداء التعرف على الكيانات. أجرينا تجاربنا على مجموعة بيانات GENIA، وأظهرت النتائج التجريبية أن نموذجنا يتفوق على الطرق الأفضل حالياً.