SimCLS: إطار بسيط للتعلم المتناقض لملخصات الاستخلاص

في هذه الورقة، نقدّم إطارًا مفاهيميًا بسيطًا ولكنه قوي من الناحية التجريبية لاستخلاص النصوص الموجزة، يُدعى SimCLS، الذي يمكنه سد الفجوة بين هدف التعلّم ومقاييس التقييم الناتجة عن الإطار المهيمن حاليًا لتعلم التسلسل إلى التسلسل من خلال صياغة توليد النص كمشكلة تقييم بدون مرجع (أي تقدير الجودة)، مع دعم التعلم التمييزي. أظهرت النتائج التجريبية أن SimCLS، مع تعديل بسيط على الأنظمة الرائدة الحالية، يمكنه تحسين أداء النماذج الرائدة بشكل كبير. وبشكل خاص، حقق تحسينًا مطلقًا قدره 2.51 مقارنة بـ BART و2.50 مقارنة بـ PEGASUS من حيث معيار ROUGE-1 على مجموعة بيانات CNN/DailyMail، مما دفع أداء الحالة الراهنة إلى مستوى جديد. وقد قمنا بفتح مصدر الشفرة والنتائج: https://github.com/yixinL7/SimCLS. كما تم نشر نتائج النماذج المقترحة على منصة ExplainaBoard، التي تتيح للباحثين فهم أنظمتنا بطريقة أكثر دقة وتفصيلًا.