HyperAIHyperAI
منذ 11 أيام

استخلاص ملخصات المستندات الطويلة من خلال دمج السياق العالمي والمحلي

Wen Xiao, Giuseppe Carenini
استخلاص ملخصات المستندات الطويلة من خلال دمج السياق العالمي والمحلي
الملخص

في هذه الورقة، نقترح نموذجًا جديدًا للتلخيص الاستخراجي المستند إلى الشبكات العصبية لمستندات طويلة، يدمج بين السياق العالمي للوثيقة بأكملها والسياق المحلي ضمن الموضوع الحالي. وقد قمنا بتقييم النموذج على مجموعتي بيانات من الأوراق العلمية، وهما PubMed وarXiv، حيث تفوق النموذج على الأعمال السابقة، سواء على الصعيد النموذجية الاستخراجية أو المُجردة، من حيث مقاييس ROUGE-1 وROUGE-2 وMETEOR. كما أظهرنا أن فوائد منهجنا تزداد قوة باستمرار مع تطبيقه على الوثائق الأطول، وهو ما يتماشى مع هدفنا. وبشكل مفاجئ، تشير دراسة التحليل التجريبي (ablation study) إلى أن فوائد النموذج تأتي حصريًا من نمذجة السياق المحلي، حتى بالنسبة للوثائق الأطول.

استخلاص ملخصات المستندات الطويلة من خلال دمج السياق العالمي والمحلي | أحدث الأوراق البحثية | HyperAI