الملخص التلخيصي المركّز على الاستعلام: دمج صلة الاستعلام، تغطية الوثائق المتعددة، وقيود طول الملخص في نماذج seq2seq

تم التعامل مع تلخيص المستندات المركزة على الاستعلام (QFS) بشكل أساسي باستخدام الطرق الاستخراجية. ومع ذلك، فإن النص الذي تنتجه هذه الطرق يعاني من انخفاض التماسك. نقوم ببحث كيفية تطبيق الطرق الإبداعية على QFS لتجاوز مثل هذه القيود. لقد أدت التطورات الحديثة في نماذج التحويل المتتابعة القائمة على انتباه الشبكات العصبية إلى تحقيق أفضل النتائج في مهمة التلخيص الإبداعي العام للمستند الواحد. يتم تدريب مثل هذه النماذج بطريقة شاملة على كميات كبيرة من بيانات التدريب. نتناول ثلاثة جوانب لجعل التلخيص الإبداعي قابلاً للتطبيق في QFS: (أ) بما أن لا يوجد بيانات تدريب، ندمج صلة الاستعلام في نموذج إبداعي مُدرب مسبقًا؛ (ب) بما أن النماذج الإبداعية الموجودة تم تدريبها في سياق مستند واحد، نصمم طريقة متكررة لدمج النماذج الإبداعية ضمن متطلبّات QFS المتعددة المستندات؛ (ج) النماذج الإبداعية التي نتكيفها تم تدريبها لتوليد نصوص ذات طول محدد (حوالي 100 كلمة)، بينما نهدف إلى إنتاج خرج بحجم مختلف (حوالي 250 كلمة)؛ نصمم طريقة لتكييف حجم الخرج المطلوب للملخصات المُنشَأة بنسبة حجم معينة. نقارن طريقتنا (انتباه حساس للصلة لـ QFS) مع الطرق الاستخراجية الأساسية وبطرق مختلفة لدمج النماذج الإبداعية على مجموعات بيانات DUC QFS ونظهر تحسينات جوهرية في أداء ROUGE.