تخصيص البارزية كإرشاد لتلخيص استخلاصي

غالبًا ما تتعلم نماذج التلخيص الاستنتاجي (abstractive summarization) اكتشاف المعلومات البارزة من البداية بشكل غير صريح. وقد أضافت الدراسات الحديثة ملخصات استخلاصية (extractive summaries) كإرشاد لنماذج التلخيص الاستنتاجي، بهدف توفير مؤشرات حول المحتوى البارز، مما أدى إلى تحسين الأداء. ومع ذلك، قد تكون الملخصات الاستخلاصية كإرشاد صارمة جدًا، ما يؤدي إلى فقدان المعلومات أو إدخال إشارات مشوّشة. علاوةً على ذلك، يصعب تكييفها بسهولة مع الوثائق التي تختلف في درجة الاستخلاص (abstractiveness). وبما أن عدد وتقسيم عناصر المحتوى البارز تتغير حسب السياق، فإن العثور على حد ثابت يُحدد ما يجب تضمينه في الإرشاد يكون أمرًا صعبًا. في هذا البحث، نقترح منهجية جديدة للتلخيص تتميز بإرشاد مرنة وموثوقة للعناصر البارزة، تُعرف بـ SEASON (SaliencE Allocation as Guidance for Abstractive SummarizatiON). تعتمد SEASON على توزيع توقعات البارزة لتوجيه عملية التلخيص الاستنتاجي، وتُظهر أداءً جيدًا في التعامل مع المقالات التي تختلف في درجة الاستخلاص. وقد أظهرت التقييمات التلقائية والبشرية على مجموعتين معياريتين أن الطريقة المقترحة فعّالة وموثوقة. كما أظهرت النتائج التجريبية على أكثر من مليون مقال إخباري وجود توزيع طبيعي لعنصر البارزة بنسبة 15% إلى 50%، ما يوفر رؤية مفيدة لصياغة المقالات الإخبارية.