HyperAIHyperAI
منذ 2 أشهر

توحيد التعرف على الكيانات المسماة كتصنيف للعلاقة كلمة-كلمة

Jingye Li; Hao Fei; Jiang Liu; Shengqiong Wu; Meishan Zhang; Chong Teng; Donghong Ji; Fei Li
توحيد التعرف على الكيانات المسماة كتصنيف للعلاقة كلمة-كلمة
الملخص

حتى الآن، تم تناول التعرف على الكيانات المسمّاة (NER) في ثلاثة أنواع رئيسية، وهي: NER المسطحة، NER المتداخلة (أو المعروفة أيضًا باسم NER المضمنة)، وNER المنفصلة، والتي تم دراستها بشكل أساسي بشكل منفصل. مؤخرًا، ازداد الاهتمام بـ NER الموحد، الذي يتعامل مع الثلاثة مهام المذكورة أعلاه بشكل متزامن باستخدام نموذج واحد. تشمل أفضل الأساليب الحالية التي يتم استخدامها في هذا المجال بشكل رئيسي النماذج القائمة على الفواصل والنماذج القائمة على تحويل التسلسل إلى تسلسل، حيث تعاني الأولى للأسف من التركيز فقط على تحديد الحدود والثانية قد تتعرض لانحياز الإظهار. في هذا البحث، نقدم بديلًا جديدًا من خلال نمذجة NER الموحد كتصنيف علاقات الكلمة-الكلمة، والذي نطلق عليه اسم W^2NER. يحل هذا التصميم العقدة الأساسية لـ NER الموحد من خلال نمذجة العلاقات المجاورة بين كلمات الكيانات بكفاءة باستخدام علاقات الكلمة المجاورة التالية (NNW) والعلاقات بين الكلمات الأخيرة والأولى- (THW-). بناءً على مخطط W^2NER، قمنا بتطوير إطار عصبي حيث يتم نمذجة NER الموحد كشبكة ثنائية الأبعاد من أزواج الكلمات. ثم نقترح استخدام الالتفافات ثنائية الأبعاد متعددة الدقة لتحسين تمثيلات الشبكة بشكل أفضل. وأخيرًا، يتم استخدام متنبئ مشترك لتبرير علاقات الكلمة-الكلمة بشكل كافٍ. قمنا بأداء تجارب واسعة النطاق على 14 مجموعة بيانات معيارية شائعة الاستخدام لـ NER المسطحة والمتداخلة والمنفصلة (8 مجموعات بيانات باللغة الإنجليزية و6 مجموعات بيانات باللغة الصينية)، حيث فاقت نموذجتنا جميع الخطوط الأساسية ذات الأداء الرائد حاليًا، مما دفع أداء NER الموحد إلى أعلى مستوى له حتى الآن.

توحيد التعرف على الكيانات المسماة كتصنيف للعلاقة كلمة-كلمة | أحدث الأوراق البحثية | HyperAI