HyperAIHyperAI

Command Palette

Search for a command to run...

توحيد التعرف على الكيانات المسماة كتصنيف للعلاقة كلمة-كلمة

Jingye Li Hao Fei Jiang Liu Shengqiong Wu Meishan Zhang Chong Teng Donghong Ji Fei Li

الملخص

حتى الآن، تم تناول التعرف على الكيانات المسمّاة (NER) في ثلاثة أنواع رئيسية، وهي: NER المسطحة، NER المتداخلة (أو المعروفة أيضًا باسم NER المضمنة)، وNER المنفصلة، والتي تم دراستها بشكل أساسي بشكل منفصل. مؤخرًا، ازداد الاهتمام بـ NER الموحد، الذي يتعامل مع الثلاثة مهام المذكورة أعلاه بشكل متزامن باستخدام نموذج واحد. تشمل أفضل الأساليب الحالية التي يتم استخدامها في هذا المجال بشكل رئيسي النماذج القائمة على الفواصل والنماذج القائمة على تحويل التسلسل إلى تسلسل، حيث تعاني الأولى للأسف من التركيز فقط على تحديد الحدود والثانية قد تتعرض لانحياز الإظهار. في هذا البحث، نقدم بديلًا جديدًا من خلال نمذجة NER الموحد كتصنيف علاقات الكلمة-الكلمة، والذي نطلق عليه اسم W^2NER. يحل هذا التصميم العقدة الأساسية لـ NER الموحد من خلال نمذجة العلاقات المجاورة بين كلمات الكيانات بكفاءة باستخدام علاقات الكلمة المجاورة التالية (NNW) والعلاقات بين الكلمات الأخيرة والأولى- (THW-). بناءً على مخطط W^2NER، قمنا بتطوير إطار عصبي حيث يتم نمذجة NER الموحد كشبكة ثنائية الأبعاد من أزواج الكلمات. ثم نقترح استخدام الالتفافات ثنائية الأبعاد متعددة الدقة لتحسين تمثيلات الشبكة بشكل أفضل. وأخيرًا، يتم استخدام متنبئ مشترك لتبرير علاقات الكلمة-الكلمة بشكل كافٍ. قمنا بأداء تجارب واسعة النطاق على 14 مجموعة بيانات معيارية شائعة الاستخدام لـ NER المسطحة والمتداخلة والمنفصلة (8 مجموعات بيانات باللغة الإنجليزية و6 مجموعات بيانات باللغة الصينية)، حيث فاقت نموذجتنا جميع الخطوط الأساسية ذات الأداء الرائد حاليًا، مما دفع أداء NER الموحد إلى أعلى مستوى له حتى الآن.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp