HTSS: معمارية هجينة جديدة لاستخلاص ومبسطة النصوص
إن تبسيط النص وملخص النص هما مهام فرعية مرتبطة ولكنها مختلفة ضمن مجال توليد اللغة الطبيعية. في حين يسعى الملخص إلى تقليل طول المستند مع الحفاظ على المعنى الأصلي، فإن التبسيط يسعى إلى تقليل التعقيد الناتج عن النص. في هذه الدراسة، ندمج بين مهام التلخيص والتبسيط باستخدام بنية هجينة جديدة تجمع بين التلخيص الاستخلاصي والتحليلي تُعرف بـ HTSS. ونقوم بتوسيع نموذج "المحرّك المؤشر" الشهير لتمكينه من أداء المهمة المدمجة للاستخلاص والتبسيط. وقد جمعنا مجموعة النصوص المتوازية من ملخصات مبسطة كتبها خبراء في المجال، ونشروها على موقع الأخبار العلمية EurekaAlert (www.eurekalert.org). تُظهر النتائج أن نموذج HTSS المقترح يتفوق على تبسيط النص العصبي (NTS) من حيث مقياس SARI، وعلى التلخيص النصي التحليلي (ATS) من حيث مقياس ROUGE. كما نقدّم مقياسًا جديدًا يُسمى CSS1، الذي يدمج بين مقياسي SARI وROUGE، ويُظهر أن نموذج HTSS المقترح يتفوق على NTS وATS في المهمة المدمجة للتبسيط والتلخيص بنسبة 38.94% و53.40% على التوالي. ونقدّم جميع الكود، والنموذج، والبيانات للمجتمع العلمي لدعم الأبحاث المستقبلية عبر الرابط التالي: https://github.com/slab-itu/HTSS/.