الملخص غير المشرف مع الوعي بالخطاب للوثائق العلمية الطويلة

نقترح نموذج تصنيف غير مشرف يستند إلى الرسوم البيانية لتقديم ملخصات استخراجية للمستندات العلمية الطويلة. تفترض طريقتنا تمثيلًا رسوميًا هرميًا على مستويين للمستند الأصلي، وتستفيد من مؤشرات موضعية غير متوازنة لتحديد أهمية الجمل. أظهرت النتائج على مجموعتي بيانات PubMed و arXiv أن نهجنا يتفوق بفارق كبير على النماذج الأساسية غير المشرفة في المقاييس التلقائية وتقييم البشر. بالإضافة إلى ذلك، فإنه يحقق أداءً مparable مع العديد من النماذج المشرفة الأكثر تقدمًا التي تم تدريبها على مئات الآلاف من الأمثلة. تشير هذه النتائج إلى أن الأنماط في بنية الخطاب هي إشارة قوية لتحديد الأهمية في المقالات العلمية.注释:在最后一句中,“comparable”一词在阿拉伯语中没有完全对应的词汇,因此翻译为“مparable”以保持原意。不过,为了使句子更加流畅,可以将其替换为“مشابه”(类似)或“قريب”(接近),具体如下:“بالإضافة إلى ذلك، فإنه يحقق أداءً مشابهًا (قريبًا) مع العديد من النماذج المشرفة الأكثر تقدمًا التي تم تدريبها على مئات الآلاف من الأمثلة。”