HyperAIHyperAI
منذ 11 أيام

التصنيف الدقيق جدًا للكيانات باستخدام إشراف غير مباشر من الاستنتاج اللغوي الطبيعي

Bangzheng Li, Wenpeng Yin, Muhao Chen
التصنيف الدقيق جدًا للكيانات باستخدام إشراف غير مباشر من الاستنتاج اللغوي الطبيعي
الملخص

يهدف مهام التصنيف الدقيق للكيانات (UFET) إلى التنبؤ بعبارات أو كلمات متنوعة وحرة تصف الأنواع المناسبة للكيانات المذكورة في الجمل. وتكمن التحدي الرئيسي في هذه المهمة في كثرة الأنواع وندرة البيانات المُعلَّمة لكل نوع. تُصاغ الأنظمة الحالية هذه المهمة كمشكلة تصنيف متعدد الاتجاهات، وتُدرَّب فيها النماذج باستخدام تدريب مباشر أو غير مباشر. وهذا يؤدي إلى مشكلتين: (أ) لا تُدرك النماذج معاني الأنواع لأن الأنواع غالبًا ما تُحوَّل إلى فهارس؛ (ب) تكون الأنظمة المُطوَّرة بهذه الطريقة محدودة في التنبؤ ضمن مجموعة مُحددة مسبقًا من الأنواع، وغالبًا ما تفشل في التعميم على أنواع نادرة أو غير مُدرَّسة في البيانات التدريبية. تقدّم هذه الدراسة منهجية جديدة تُسمى LITE، التي تُصوغ تصنيف الكيانات كمشكلة استنتاج لغوي طبيعي (NLI)، مستفيدة من (أ) الإشراف غير المباشر من NLI لاستخلاص معلومات النوع بشكل معنوي مُمثَّل نصيًا كفرضيات، مما يخفف من مشكلة ندرة البيانات، و(ب) من هدف تعلُّم الترتيب (learning-to-rank) لتفادي الحاجة إلى تحديد مجموعة مسبقة من الأنواع. تُظهر التجارب أن LITE تحقق أداءً متقدمًا على مستوى الحالة في مهمة UFET، حتى مع كمية محدودة من البيانات التدريبية. علاوةً على ذلك، تُظهر LITE قدرة قوية على التعميم، إذ لا تُقدّم أفضل النتائج فقط على معايير تصنيف الكيانات الدقيقة الأخرى، بل أكثر من ذلك، فإن النظام المُدرّب مسبقًا باستخدام LITE يعمل بكفاءة على بيانات جديدة تحتوي على أنواع لم تُرَ من قبل في التدريب.

التصنيف الدقيق جدًا للكيانات باستخدام إشراف غير مباشر من الاستنتاج اللغوي الطبيعي | أحدث الأوراق البحثية | HyperAI