GoSum: تلخيص استخلاصي للوثائق الطويلة باستخدام التعلم المعزز والحالة الترابطية المنظمة بالرسم البياني

استخلاص الملخصات من الوثائق الطويلة يمكن اعتباره تصنيفًا للجمل باستخدام المعلومات الهيكلية للوثائق. ويتطلب استخدام هذه المعلومات الهيكلية في تلخيص الوثائق تحديًا كبيرًا. في هذه الورقة، نقترح نموذج GoSum، وهو نموذج جديد يستند إلى الرسوم البيانية والتعلم بالتعزيز لاستخلاص ملخصات الأوراق البحثية الطويلة. وبشكل خاص، يقوم GoSum بتشفير حالات الجمل في التعلم بالتعزيز من خلال بناء رسم بياني غير متجانس لكل وثيقة مدخلة على مستويات تواصل مختلفة. ويعكس كل حافة في الرسم البياني الهرمية التواصلية للوثيقة، مما يساعد على تقليل الانحراف الدلالي عبر الحدود بين الأقسام. وقد تم تقييم GoSum على مجموعتي بيانات لملخصات المقالات العلمية: PubMed وarXiv. وقد أظهرت النتائج التجريبية أن GoSum تحقق أداءً متفوقًا مقارنةً بالأساليب القوية من النماذج المستخلصة والمُجردة. كما أكدت دراسات الإزالة (Ablation Studies) أن أداء نموذج GoSum يعود إلى الاستفادة الفعالة من المعلومات التواصلية.