منذ 11 أيام
استخلاص ملخصات المستندات الطويلة من خلال دمج السياق العالمي والمحلي
Wen Xiao, Giuseppe Carenini

الملخص
في هذه الورقة، نقترح نموذجًا جديدًا للتلخيص الاستخراجي المستند إلى الشبكات العصبية لمستندات طويلة، يدمج بين السياق العالمي للوثيقة بأكملها والسياق المحلي ضمن الموضوع الحالي. وقد قمنا بتقييم النموذج على مجموعتي بيانات من الأوراق العلمية، وهما PubMed وarXiv، حيث تفوق النموذج على الأعمال السابقة، سواء على الصعيد النموذجية الاستخراجية أو المُجردة، من حيث مقاييس ROUGE-1 وROUGE-2 وMETEOR. كما أظهرنا أن فوائد منهجنا تزداد قوة باستمرار مع تطبيقه على الوثائق الأطول، وهو ما يتماشى مع هدفنا. وبشكل مفاجئ، تشير دراسة التحليل التجريبي (ablation study) إلى أن فوائد النموذج تأتي حصريًا من نمذجة السياق المحلي، حتى بالنسبة للوثائق الأطول.