الملخص السريع الإبداعي بإعادة صياغة الجمل المختارة باستخدام التعزيز

مستوحدين من الطريقة التي يلخص بها البشر الوثائق الطويلة، نقترح نموذج تلخيص دقيق وسريع يقوم أولاً بتحديد الجمل البارزة ثم بإعادة صياغتها بشكل مجرد (أي ضغطها وإعادة صياغتها) لإنتاج ملخص شامل وموجز. نستخدم طريقة جديدة للدرجات التدرجية على مستوى الجمل لربط الحساب غير القابل للمفاضلة بين هذين الشبكتين العصبية بطريقة تراتبية، مع الحفاظ على سلاسة اللغة. عملياً، حققنا أفضل النتائج الجديدة في جميع المقاييس (بما في ذلك التقييم البشري) على مجموعة بيانات CNN/Daily Mail، بالإضافة إلى درجات مجردة أعلى بكثير. علاوة على ذلك، من خلال العمل أولاً على مستوى الجمل ثم على مستوى الكلمات، نمكّن فك الرموز المتوازي لنموذجنا المولد العصبي، مما يؤدي إلى سرعة استدلال أكبر (10-20 مرة) وسرعة تقارب تدريب أسرع 4 مرات من النماذج السابقة لترميز الفقرات الطويلة. كما نظهر قدرة نموذجنا على التعميم في مجموعة بيانات DUC-2002 التي تحتوي فقط على اختبارات، حيث حققنا درجات أعلى من نموذج حديث رائد.