التحقق من صحة الملخص: دمج معرفة الاستنتاج في تلخيص الجمل التوليدية

في هذه الورقة، نستعرض مهمة تلخيص الجملة التي تُنتج ملخصًا من جملة مصدرية. وقد حققت نماذج التسلسل العصبي نجاحًا كبيرًا في هذه المهمة، ومع ذلك فإن معظم النماذج الحالية تركز فقط على تحسين محتوى الملخص من حيث المعلوماتية، مما يتجاهل مسألة الدقة، أي أن الملخص لا ينبغي أن يحتوي على معلومات غير مرتبطة بالجملة المصدرية. نحن نرى أن الدقة تمثل متطلبًا أساسيًا لأنظمة التلخيص. وبما أن الملخص الصحيح يُستَنبَط معنويًا من الجملة المصدرية، فإننا نُدمج معرفة الاستنتاج (entailment) في نماذج التلخيص الاستخلاصي (abstractive summarization). ونُقدّم مشغلًا مُدركًا للاستنتاج ضمن إطار متعدد المهام (أي إنشاء التلخيص وتمييز الاستنتاج)، ونُقدّم أيضًا مشغلًا مُدركًا للاستنتاج باستخدام تقنية التدريب المعززة بالعائد (RAML) القائمة على مبدأ ماكسيموم الاحتمال المُعاد تعزيزه. وأظهرت نتائج التجارب أن نماذجنا تتفوق بشكل ملحوظ على النماذج الأساسية من حيث المعلوماتية والدقة.