تحسين التلخيص المستخلص العصبي للوثائق من خلال الت régularisation الهيكلية

أظهرت النماذج التلافيفية التسلسلية الحديثة تقدماً ملحوظاً في ملخص النصوص القصيرة. ومع ذلك، تفشل في التقاط البنية طويلة المدى لكل من المستندات والملخصات متعددة الجمل، مما يؤدي إلى فقدان المعلومات وتكرار المحتوى. في هذه الورقة، نقترح الاستفادة من المعلومات البنائية لكل من المستندات والملخصات متعددة الجمل لتحسين أداء ملخص المستندات. وبشكل خاص، نُدخل كل من التماسك البنائي (structural-compression) وتنظيم التغطية البنائية (structural-coverage regularization) إلى عملية الملخص بهدف التقاط خاصيتين أساسيتين بنائيتين في ملخص المستندات: خاصية الضغط المعلوماتي وخاصية التغطية المعلوماتية. أظهرت النتائج التجريبية أن الت régularization البنائي يُحسّن أداء ملخص المستندات بشكل كبير، ما يمكّن نموذجنا من إنتاج ملخصات أكثر إفادة وانسيابية، وبالتالي يتفوق بشكل ملحوظ على أحدث الطرق العصبية الاستنتاجية (abstractive).