HyperAIHyperAI
منذ 3 أشهر

نهج جديد لتجاوز التوليد المفرط وتقييم الملخصات الاستخلاصية

Kaiqiang Song, Bingqing Wang, Zhe Feng, Fei Liu
نهج جديد لتجاوز التوليد المفرط وتقييم الملخصات الاستخلاصية
الملخص

نُقدّم نهجًا جديدًا لإنشاء عدة نسخ مُختلفة للملخص المستهدف، بحيث تتنوع محتوياتها وتمتاز بأطوال متفاوتة، ثم نُقيّم ونختار النسخ المقبولة وفقًا لاحتياجات المستخدمين. قد يواجه مُلخّصات الاستخلاص (abstractive summarizers) التي تم تدريبها على ملخصات مرجعية واحدة صعوبة في إنتاج مخرجات تحقق خصائص مرغوبة متعددة، مثل احتواءها على المعلومات الأكثر أهمية، والالتزام بدقة بالنص الأصلي، والامتثال للقواعد النحوية والتدفق اللغوي. في هذه الورقة، نقترح استراتيجية مكونة من مرحلتين لإنشاء مجموعة متنوعة من الملخصات المرشحة من النص الأصلي في المرحلة الأولى، ثم تقييم وتحديد النسخ المقبولة في المرحلة الثانية. ومن المهم أن يكون لمُولّدنا تحكم دقيق في طول الملخص، وهو ما يجعله مناسبًا بشكل خاص في الحالات التي تكون فيها المساحة محدودة. صُمّمت أدوات التحديد لدينا لتتنبأ بأطول الملخصات المثلى، مع إعطاء أولوية خاصة للالتزام بدقة بالنص الأصلي. ويمكن تدريب كلا المرحلتين وتحسينهما وتقييمهما بفعالية. وتشير تجاربنا على مجموعات بيانات معيارية للتلخيص إلى أن هذا النموذج يمكنه تحقيق أداءً من الدرجة الأولى في مجاله.