HyperAIHyperAI
منذ 2 أشهر

Sequence-to-Nuggets: كشف الذكرى الكيانات المضمنة عبر شبكات المناطق المرجعية

Hongyu Lin; Yaojie Lu; Xianpei Han; Le Sun
Sequence-to-Nuggets: كشف الذكرى الكيانات المضمنة عبر شبكات المناطق المرجعية
الملخص

تقتصر نماذج التسمية التسلسلية المستندة إلى التسمية التتابعية (Sequential Labeling-based NER) على تخصيص كل كلمة لذكر كيان واحد فقط، مما يؤدي إلى مشكلة جدية عند تحديد الذكريات المضمنة (nested entity mentions). في هذا البحث، نقترح حل هذه المشكلة من خلال نمذجة واستغلال الهياكل الجملية القائمة على الكلمات الرئيسية (head-driven phrase structures) للذكريات، أي أن رغم إمكانية تضمين ذكر ما لذكر آخر، لن تشترك الذكريات في نفس الكلمة الرئيسية. بشكل محدد، نقترح شبكات المنطقة الأساسية (Anchor-Region Networks - ARNs)، وهي هندسة تحويل تسلسلي إلى قطع صغيرة (sequence-to-nuggets architecture) للكشف عن الذكريات المضمنة. تقوم شبكات ARN أولاً بتحديد الكلمات الأساسية (أي الكلمات الرئيسية المحتملة) لجميع الذكريات، ثم تتعرف على حدود الذكر لكل كلمة أساسية من خلال استغلال الهياكل الجملية القياسية. بالإضافة إلى ذلك، صممنا دالة الخسارة الحقيبة (Bag Loss)، وهي دالة هدف يمكنها تدريب شبكات ARN بطريقة شاملة دون الحاجة لأي تسميات لكلمات أساسية. أظهرت التجارب أن شبكات ARN حققت أفضل الأداء في ثلاثة مقاييس معيارية لكشف الذكريات الكيان المضمنة.

Sequence-to-Nuggets: كشف الذكرى الكيانات المضمنة عبر شبكات المناطق المرجعية | أحدث الأوراق البحثية | HyperAI