تحسين التعرف على الكيانات المحددة من خلال التجميع المُنتَبِه للمعلومات النحوية

تمييز الأسماء المحددة (NER) حساس للغاية بالنسبة للخصائص النحوية والدلالية للجملة، حيث يمكن استخلاص الكيانات بناءً على الطريقة التي تُستخدم بها وتوضع في النص المستمر. لتمثيل هذه الخصائص، يمكن الاعتماد على الموارد الحالية التي توفر معرفة مفيدة للمهمة، وقد أثبتت بعض الدراسات السابقة فعالية هذا النهج، لكنها تظل محدودة في الاستفادة المناسبة من هذه المعرفة، مثل التمييز بين العناصر المهمة في سياق معين. في هذه الورقة، نُحسّن أداء NER من خلال الاستفادة من أنواع مختلفة من المعلومات النحوية من خلال تجميع مُنتَبِه، حيث يتم تحقيق هذه الوظيفة من خلال شبكات الذاكرة ذات المفتاح والقيمة المقترحة، وانتباه النحو، وآلية البوابة، على التوالي، لتمثيل المعلومات النحوية، وتقدير أهميتها، ودمجها. أظهرت النتائج التجريبية على ستة مجموعات بيانات معيارية باللغة الإنجليزية والصينية فعالية النموذج المقترح، كما أظهرت أنه يتفوق على الدراسات السابقة على جميع مجموعات البيانات التجريبية.