علامة معلقة مدمجة لاستخراج الكيان والعلاقة

تركز الأعمال الحديثة في استخراج الكيانات والعلاقات على دراسة كيفية الحصول على تمثيل أفضل للنطاقات من خلال المُشفّر المُدرّب مسبقًا. ومع ذلك، فإن أحد القيود الرئيسية للعمل الحالي هو تجاهله للعلاقة المتبادلة بين النطاقات (الأزواج). في هذا العمل، نقترح منهجية جديدة لتمثيل النطاقات تُسمى "العلامات المُحَفَّزة المُعبَّأة" (PL-Marker)، والتي تأخذ في الاعتبار العلاقة المتبادلة بين النطاقات (الأزواج) من خلال تعبئة علامات استراتيجية داخل المُشفّر. وبشكل خاص، نقترح استراتيجية تعبئة مبنية على الجوار، والتي تُراعي النطاقات المجاورة بشكل متكامل لتحسين نمذجة معلومات حدود الكيانات. علاوةً على ذلك، لمهام تصنيف أزواج النطاقات الأكثر تعقيدًا، صممنا استراتيجية تعبئة مبنية على الموضوع، حيث يتم تعبئة كل موضوع مع جميع كياناته المُستهدفة (الأجسام) لتمثيل العلاقة المتبادلة بين أزواج النطاقات ذات نفس الموضوع. أظهرت النتائج التجريبية أن نموذجنا، بفضل تحسين ميزات العلامة، يتفوّق على النماذج الأساسية في ستة معايير لاستخراج الكيانات الاسمية (NER)، ويحقق تحسنًا بنسبة 4.1% إلى 4.3% في دقة F1 الصارمة للعلاقة مقارنةً بالنماذج الرائدة السابقة على مجموعتي بيانات ACE04 وACE05، مع سرعة أعلى.