توليد النص من البيانات مع نمذجة الكيانات

النهج الحديثة لإنشاء النص من البيانات أظهرت وعودًا كبيرة بفضل استخدام قواعد بيانات على نطاق واسع وتطبيق هياكل الشبكات العصبية التي يتم تدريبها من البداية إلى النهاية. تعتمد هذه النماذج على تعلم التمثيل لاختيار المحتوى بشكل مناسب، تنظيمه بطريقة متسقة، وصياغته بنحو صحيح، مع التعامل مع الكيانات كأنها مجرد عناصر مفردية في المفردات. في هذا العمل، نقترح هندسة عصبية محورها الكيانات لإنشاء النص من البيانات. يخلق نموذجنا تمثيلات خاصة بالكيانات والتي يتم تحديثها ديناميكيًا. يتم إنشاء النص مشروطًا بالمدخلات البيانات وتمثيلات ذاكرة الكيان باستخدام انتباه متدرج في كل خطوة زمنية. نقدم تجارب على معيار RotoWire وأخرى على قاعدة بيانات جديدة في مجال البيسبول (أكبر خمس مرات) والتي أنشأناها. تظهر نتائجنا أن النموذج المقترح يتفوق على الخطوط الأساسية التنافسية في التقييم الآلي والبشري.