شبكة عصبية رسمية تعتمد على القاموس لاستخراج الأسماء المحددة في النص الصيني

تم تحقيق نجاح كبير في استخدام الشبكات العصبية التكرارية (RNN) لتحديد الكيانات المعرفة باللغة الصينية (NER)، حيث تتبع هذه الشبكات معلومات الحروف والكلمات تسلسليًا. ومع ذلك، فإن البنية المتسلسلة المميزة لهذه النماذج، بالإضافة إلى نقصها في السياق العام، تجعلها عرضة للاضطرابات الناتجة عن الغموض في الكلمات. في هذا العمل، نسعى لتقليل هذه المشكلة من خلال إدخال شبكة عصبية رسمية قائمة على القاموس، تمتلك سياقًا عامًا، حيث تُستخدم معرفة القاموس لربط الحروف بهدف التقاط التركيب المحلي، في حين يمكن لعقدة تواصل عالمية التقاط السياق العام للجملة والاعتماديات طويلة المدى. وباستنادًا إلى التفاعلات المتعددة القائمة على الرسوم البيانية بين الحروف، والكلمات المحتملة، والسياق العام للجملة، يمكن التصدي بكفاءة لمشكلة غموض الكلمات. وأظهرت التجارب على أربع مجموعات بيانات لـ NER تحسنًا ملحوظًا في الأداء مقارنةً بالنماذج الأساسية الأخرى.