HyperAIHyperAI
منذ 11 أيام

شبكة تسلسل إلى مجموعة للتعرف على الكيانات الاسمية المضمنة

Zeqi Tan, Yongliang Shen, Shuai Zhang, Weiming Lu, Yueting Zhuang
شبكة تسلسل إلى مجموعة للتعرف على الكيانات الاسمية المضمنة
الملخص

تمثيل الكيانات المعرفة (NER) هو مهمة مُدرَّسة على نطاق واسع في معالجة اللغة الطبيعية. في الآونة الأخيرة، ركّز عدد متزايد من الدراسات على NER المُدمج (nested NER). تُعتبر الطرق القائمة على الفترات (span-based)، التي تُعامل تمييز الكيانات كمهمة تصنيف فترات، قادرة على التعامل مع الكيانات المُدمجة بشكل طبيعي. لكنها تعاني من الفضاء البحثي الكبير ونقص التفاعل بين الكيانات. ولحل هذه المشكلات، نقترح شبكة عصبية تسلسلية إلى مجموعة (sequence-to-set) جديدة لمعالجة NER المُدمج. بدلًا من تحديد الفترات المرشحة مسبقًا، نوفر مجموعة ثابتة من المتجهات القابلة للتعلم لاستخلاص أنماط الفترات القيّمة. نستخدم فكّاً غير تسلسلي (non-autoregressive decoder) للتنبؤ بالمجموعة النهائية للكيانات في عملية واحدة، مما يسمح لنا بالتقاط الاعتماديات بين الكيانات. مقارنةً بالطريقة التسلسلية إلى تسلسل (sequence-to-sequence)، فإن نموذجنا أكثر ملاءمة للمهام التي تتطلب تمييزًا غير مرتب، نظرًا لInsensitive تجاه ترتيب التسميات. بالإضافة إلى ذلك، نستخدم دالة خسارة تعتمد على التوافق الثنائي (bipartite matching) لحساب الخسارة التدريبية الشاملة. أظهرت النتائج التجريبية أن النموذج المقترح يحقق أفضل الأداء على ثلاث مجموعات بيانات NER مُدمجة: ACE 2004 وACE 2005 وKBP 2017. يمكن الوصول إلى الكود من خلال الرابط: https://github.com/zqtan1024/sequence-to-set.

شبكة تسلسل إلى مجموعة للتعرف على الكيانات الاسمية المضمنة | أحدث الأوراق البحثية | HyperAI