HyperAIHyperAI
منذ 11 أيام

إلى توحيد تقسيم النص وملخص المستند الطويل

Sangwoo Cho, Kaiqiang Song, Xiaoyang Wang, Fei Liu, Dong Yu
إلى توحيد تقسيم النص وملخص المستند الطويل
الملخص

يُعد تقسيم النص أمرًا مهمًا لتمييز هيكل الوثيقة. فمن الصعب على القارئ فهم النص، لا سيما العثور على المعلومات المهمة، دون تقسيم الوثيقة الطويلة إلى أقسام متماسكة من حيث الموضوع. ويزداد هذا التحدي سوءًا في حال عدم وجود تقسيم في محاضر التسجيلات الصوتية أو المرئية. في هذه الورقة، نستعرض الدور الذي تلعبه عملية تقسيم الأقسام في عملية تلخيص النصوص المكتوبة والمحادثات الصوتية باستخلاص المحتوى. يعتمد نهجنا على تعلُّم تمثيلات قوية للجمل من خلال إجراء التلخيص والتقسيم في آنٍ واحد، ويُعزز هذا الأداء بعامل تنظيم مبني على التحسين لتشجيع اختيار جمل متنوعة في الملخص. قمنا بتجريب النموذج على عدة مجموعات بيانات تتراوح بين المقالات العلمية ومحاضر المحادثات الصوتية لتقييم أدائه. تشير نتائجنا إلى أن النموذج يمكنه تحقيق أداءً متميزًا على المعايير المفتوحة المتاحة، كما يُظهر أداءً أفضل في التحويل عبر الأجناس (cross-genre transferability) عند تزويده بعملية تقسيم الأقسام. وقمنا بسلسلة من التحليلات الكمية لقياس تأثير تقسيم الأقسام على تلخيص النصوص المكتوبة والمحادثات الصوتية ذات الطول والتعقيد الكبيرين.

إلى توحيد تقسيم النص وملخص المستند الطويل | أحدث الأوراق البحثية | HyperAI