الوصول إلى الجist: التلخيص باستخدام شبكات المولد النقطي

قدّمت نماذج التسلسل العصبي إلى التسلسل (Sequence-to-Sequence) طريقةً جديدةً وقابلةً للتطبيق في مجال تلخيص النصوص الاستنتاجي (أي أنها غير مقيدة باختيار وإعادة ترتيب المقاطع من النص الأصلي فحسب). ومع ذلك، فإن لهذه النماذج عيبين رئيسيين: فهي معرّضة لإعادة إنتاج التفاصيل الواقعية بشكل غير دقيق، وتتكرر فيها المعلومات بسهولة. في هذا البحث، نقترح هندسةً جديدةً تعزز النموذج الانتباهي القياسي للتسلسل إلى التسلسل بطريقتين متعامدتين. أولاً، نستخدم شبكةً مُشتركة بين المؤشر والمولد (Pointer-Generator) يمكنها نسخ الكلمات من النص المصدر عبر الإشارة، مما يساعد على إعادة إنتاج المعلومات بدقة، مع الحفاظ على قدرتها على إنتاج كلمات جديدة عبر المولد. ثانياً، نستخدم تغطية لتتبع ما تم تلخيصه، مما يقلل من احتمالية التكرار. قدّمنا نموذجنا لمهام تلخيص الأخبار في CNN وDaily Mail، حيث حقق أداءً أفضل بمقدار نقطتين ROUGE على الأقل مقارنة بأفضل التقنيات الحالية في هذا المجال.