تحسين التجريد في تلخيص النصوص

الملخص التحليلي للنصوص يهدف إلى اختصار الوثائق النصية الطويلة إلى شكل قابل للقراءة من قبل الإنسان ويحتوي على أهم الحقائق من الوثيقة الأصلية. ومع ذلك، فإن مستوى التجريد الفعلي، كما يقاس بعبارات جديدة لا تظهر في الوثيقة المصدر، يظل منخفضًا في الأساليب الحالية. نقترح تقنيتين لتحسين مستوى التجريد للملخصات المولدة. أولاً، نفكك المفكك (decoder) إلى شبكة سياقية تسترجع أجزاء الوثيقة المصدر ذات الصلة، ونموذج لغوي مُدرب مسبقًا يدمج المعرفة السابقة عن إنتاج اللغة. ثانياً، نقترح مؤشر جديد يتم تحسينه مباشرة عبر التعلم بالسياسة (policy learning) لتحفيز إنتاج عبارات جديدة. حققت نموذجنا نتائج مماثلة لأنماط الرتب الأولى (state-of-the-art models)، حسبما تم تحديده من خلال درجات ROUGE وتقييمات البشر، مع تحقيق مستوى أعلى بكثير من التجريد كما يقاس بمعدل تداخل n-gram مع الوثيقة المصدر.