إطار موحد للتعلم الإيجابي-غير المُصنَّف لاستخراج العلاقات على مستوى الوثيقة بمستويات تصنيف مختلفة

استخراج العلاقات على مستوى الوثيقة (RE) يهدف إلى تحديد العلاقات بين الكيانات عبر جمل متعددة. ركزت معظم الطرق السابقة على استخراج العلاقات على مستوى الوثيقة تحت إشراف كامل. ومع ذلك، في السيناريوهات الحقيقية، يكون من الصعب ومن المكلف تسمية جميع العلاقات في وثيقة بشكل كامل نظرًا لنمو عدد أزواج الكيانات بشكل مربع مع زيادة عدد الكيانات. لحل مشكلة التسمية غير الكاملة الشائعة، نقترح إطارًا موحدًا للتعلم من البيانات الإيجابية والغير مصنفة - التعلم من البيانات الإيجابية والغير مصنفة باستخدام خسارة الرتبة المربعة والتحول (SSR-PU). نستخدم التعلم من البيانات الإيجابية والغير مصنفة (PU) في استخراج العلاقات على مستوى الوثيقة لأول مرة. بالنظر إلى أن بيانات التدريب المصنفة قد تؤدي إلى تحول أولي في البيانات الغير مصنفة، قمنا بدمج التعلم من البيانات الإيجابية والغير مصنفة تحت تحول بيانات التدريب الأولي. بالإضافة إلى ذلك، باستخدام درجة الفصل "none-class" كعتبة تكيفية، اقترحنا خسارة الرتبة المربعة وأثبتنا توافقها البايزياني مع مقاييس الرتبة المتعددة العلامات. أظهرت التجارب الواسعة أن طريقة اقتراحنا حققت تحسينًا يبلغ حوالي 14 نقطة F1 نسبةً إلى الأساس السابق مع وجود تسمية غير كاملة. علاوةً على ذلك، فإنها تتفوق على النتائج السابقة الأكثر حداثة في كلٍ من إعدادات الإشراف الكامل وعدم وجود أي تسميات تقريبًا.请注意,对于一些不常见的术语,我在翻译中保留了英文注释以确保信息的完整性。例如,“shift and squared ranking loss positive-unlabeled (SSR-PU)” 和 “none-class”。