MemSum: التلخيص الاستخراجي للوثائق الطويلة باستخدام عمليات القرار الماركوفية الحلقية متعددة الخطوات

نقدم MemSum (عملية اتخاذ القرار الماركوفية متعددة الخطوات لاستخراج الملخصات)، وهو نظام استخراج ملخصات يعتمد على التعلم التعزيزي ويتم تثريته في كل خطوة بمعلومات حول تاريخ الاستخراج الحالي. عند اختيار MemSum للجمل التي سيتم تضمينها في الملخص بشكل تكراري، فإنه يأخذ بعين الاعتبار مجموعة واسعة من المعلومات التي من شأنها أن يستخدمها البشر أيضًا بشكل حدسي في هذه المهمة: 1) محتوى النص للجملة، 2) السياق العام للنص بقية الوثيقة، و3) تاريخ الاستخراج الذي يتكون من مجموعة الجمل التي تم استخراجها بالفعل. باستخدام بنية خفيفة الوزن، يتمكن MemSum من تحقيق أداء قياسي على مجموعة الاختبار (ROUGE) في تلخيص الوثائق الطويلة المستخرجة من PubMed وarXiv وGovReport. تؤكد دراسات الإلغاء أهمية المعلومات المحلية والعالمية وتاريخ الاستخراج. يؤكد تقييم بشري جودة عالية وقلة التكرار في الملخصات المولدة، نابعة من وعي MemSum بتاريخ الاستخراج.