نموذج هرمي مهيكل ذاتي الانتباه لاختصار الوثائق الاستخراجي (HSSAS)

التطورات الحديثة في هندسة الشبكات العصبية وخوارزميات التدريب أظهرت فعالية تعلم التمثيل (representation learning). تولد النماذج القائمة على الشبكات العصبية تمثيلًا أفضل من تلك التقليدية. لديها القدرة على تعلم التمثيل الموزع تلقائيًا للجمل والوثائق. لهذا الغرض، اقترحنا نموذجًا جديدًا يعالج عدة مشكلات لم يتم التعامل معها بشكل كافٍ في النماذج المقترحة سابقًا، مثل مشكلة الذاكرة ودمج معرفة بنية الوثيقة. يستخدم نموذجنا آلية انتباه ذاتية متدرجة لخلق تمثيلات جملية ووثائقية. يعكس هذا التصميم البنيوية المتدرجة للوثيقة، مما يمكننا من الحصول على تمثيل خصائص أفضل. توفر آلية الانتباه مصدر معلومات إضافيًا لإرشاد استخراج الملخص. عولجت مهمة الإيجاز في النموذج الجديد كمشكلة تصنيف، حيث يقوم النموذج بحساب احتمالات انتماء الجملة إلى الملخص. يتم تقسيم توقعات النموذج إلى عدة خصائص مثل محتوى المعلومات، الأهمية، التجدد والتمثيل الموضعي. تم تقييم النموذج المقترح على مجموعتين من البيانات المعروفتين، وهما CNN / Daily Mail و DUC 2002. أظهرت نتائج التجارب أن نموذجنا يتفوق بشكل كبير على الحالة الحالية لأفضل النماذج الاستخراجية (state-of-the-art).