خسارة توازن الزاوية المُعدِّلة لاستخراج العلاقات على مستوى المستند

استخلاص العلاقات على مستوى المستند يهدف إلى التنبؤ بالعلاقات بين الكيانات المستمدة من جمل متعددة. إحدى الممارسات الشائعة هي اختيار حدود تصنيف متعددة التسميات لتحديد ما إذا كانت علاقة موجودة بين زوج من الكيانات. ومع ذلك، في المهام المتعلقة بالمستندات، فإن معظم أزواج الكيانات لا تعبّر عن أي علاقات، مما يؤدي إلى توزيع غير متوازن بشكل كبير بين الفئات الإيجابية والسلبية. نحن نرى أن مشكلة عدم التوازن هذه تؤثر على عملية اختيار الحدود، وقد تؤدي إلى تنبؤات خاطئة بـ"عدم وجود علاقة". في هذه الورقة، نقترح تقليل وزن العناصر السلبية السهلة من خلال استخدام المسافة بين حد التصنيف ودرجة التنبؤ لكل علاقة. تُعد خسارة التوازن المُتكيفّة بالحافة (Adaptive Hinge Balance Loss) التي نقترحها جديدة، حيث تقيس صعوبة كل فئة علاقة من خلال هذه المسافة، مع التركيز بشكل أكبر على العلاقات الصعبة والخاطئة التصنيف، أي العلاقات الإيجابية النادرة. أظهرت نتائج التجارب على مجموعة بيانات Re-DocRED تفوق منهجنا مقارنةً بطرق التوازن الأخرى. يمكن الوصول إلى الكود المصدري عبر الرابط: https://github.com/Jize-W/HingeABL.