الوفاء للأصلي: التلخيص الاستخراجي العصبي الواعي بالحقائق

على عكس التلخيص الاستخراجي، يتعين على التلخيص الإبداعي دمج أجزاء مختلفة من النص الأصلي، مما يميل إلى إنشاء حقائق مزيفة. تكشف دراستنا الأولية أن حوالي 30٪ من النتائج التي تنتجها نظام التلخيص العصبي المتقدم تعاني من هذه المشكلة. بينما تركز الأساليب السابقة للتلخيص الإبداعي عادةً على تحسين المعلوماتية، نحن نعتقد أن الدقة هي أيضًا شرط أساسي للنظام العملي للتلخيص الإبداعي. لتجنب إنشاء حقائق مزيفة في الملخص، نستفيد من تقنيات استخراج المعلومات المفتوحة وتحليل الارتباطات لاستخراج وصف الحقائق الفعلية من النص الأصلي. ثم يتم اقتراح إطار عمل متسلسل ذو انتباه مزدوج لإجبار التوليد على الاعتماد على كل من النص الأصلي والوصف المستخرج للحقائق. تظهر التجارب على مجموعة بيانات غيجاورد القياسية أن نموذجنا يمكنه خفض الملخصات المزيفة بنسبة 80٪. ومن الجدير بالذكر أن وصف الحقائق يجلب أيضًا تحسينًا كبيرًا في المعلوماتية لأنه غالبًا ما يكثف معنى النص الأصلي.