الملخص التحليلي من الأسفل إلى الأعلى

تتناول هذه الدراسة طريقة بسيطة لمعالجة مشكلة ضعف اختيار المحتوى في ملخصات التلخيص الاستخراجي التي تعتمد على الشبكات العصبية. تتمثل التقنية المقترحة في استخدام منتقي محتوى فعال من حيث البيانات لتحديد الجمل في الوثيقة الأصلية التي يجب أن تكون جزءًا من الملخص بشكل زائد عن الحد. نستخدم هذا المنتقي كخطوة انتباه من الأسفل إلى الأعلى لتقيد النموذج بالعبارات المحتملة. نوضح أن هذا النهج يحسن قدرة الضغط على النص، مع الحفاظ على إنتاج ملخصات سلسة. يعتبر هذا العملية ذات الخطوتين أبسط وأكثر فعالية من النماذج الأخرى التي تقوم باختيار المحتوى من البداية إلى النهاية، مما يؤدي إلى تحسينات كبيرة في مؤشر ROUGE لكل من مجموعة بيانات CNN-DM وNYT. بالإضافة إلى ذلك، يمكن تدريب منتقي المحتوى باستخدام ما لا يزيد عن 1,000 جملة، مما يجعل من السهل نقل ملخص تم تدريبه إلى مجال جديد.