HyperAIHyperAI
منذ 17 أيام

ربط الكيانات من خلال نمذجة صريحة للارتباط بين التسميات المذكورة

{Andrew McCallum, Nicholas Monath, Rico Angell, Dhruv Agarwal}
ربط الكيانات من خلال نمذجة صريحة للارتباط بين التسميات المذكورة
الملخص

تمثيل ذكر الكيانات يُعد عنصراً أساسياً في أنظمة ربط الكيانات الحديثة، سواء في توليد المرشحات أو في إجراء تنبؤات الربط. في هذه الورقة، نقدم ونحلل تجريبياً منهجاً تدريبياً جديداً لتمثيل ذكر الكيانات والكيانات نفسها، والذي يعتمد على بناء شجرة ممتدة حُرَفِية (أي شجرة ممتدة موجهة) على ذُكر الكيانات والكيانات عبر المستندات، بهدف نمذجة علاقات التماثل الذاتي (coreference) للذكر بشكل صريح. ونُظهر فعالية منهجنا من خلال إظهار تحسينات كبيرة في دقة استرجاع المرشحات (recall) ودقة الربط على مجموعة بيانات ربط الكيانات الصفرية (Zero-Shot Entity Linking) وMedMentions، وهي أكبر مجموعة بيانات حيوية متاحة علناً. وبالإضافة إلى ذلك، نُظهر أن التحسينات في توليد المرشحات تؤدي إلى نماذج إعادة تصنيف (re-ranking) ذات جودة أعلى في المراحل اللاحقة، مما يُسجّل نتيجةً جديدة في مستوى الأداء (SOTA) لدقة الربط على مجموعة MedMentions. وأخيراً، نُثبت أن تمثيلات الذكر المحسّنة التي نقدّمها فعّالة أيضاً في اكتشاف كيانات جديدة من خلال التماثل بين المستندات (cross-document coreference).