منذ 2 أشهر
توليد النص من البيانات مع اختيار المحتوى والتخطيط
Ratish Puduppully; Li Dong; Mirella Lapata

الملخص
التطورات الحديثة في توليد النص من البيانات أدت إلى استخدام قواعد بيانات كبيرة الحجم ونماذج الشبكات العصبية التي يتم تدريبها بشكل شامل، دون نمذجة صريحة لما يجب قوله وكيفية ترتيبه. في هذا البحث، نقدم معمارية شبكة عصبية تدمج اختيار المحتوى والتخطيط دون التضحية بالتدريب الشامل. نفكك مهمة التوليد إلى مرحلتين. بناءً على مجموعة من سجلات البيانات (المترافقة مع الوثائق الوصفية)، نقوم أولاً بتوليد خطة محتوى تسلط الضوء على المعلومات التي يجب ذكرها وكيفية ترتيبها، ثم نولد الوثيقة مع الأخذ بعين الاعتبار خطة المحتوى. أظهرت التجارب التقييمية الآلية والبشرية أن نموذجنا يتفوق على القواعد الأساسية القوية، مما يحسن الحالة الفنية على مجموعة البيانات RotoWire التي تم إصدارها مؤخرًا.