Command Palette
Search for a command to run...
توليد النص من الجداول بواسطة التعلم التتابعي الواعي بالهيكل
توليد النص من الجداول بواسطة التعلم التتابعي الواعي بالهيكل
Tianyu Liu Kexiang Wang Lei Sha Baobao Chang Zhifang Sui
الملخص
توليد النص من الجداول يهدف إلى إنشاء وصف للجدول الوقائعي الذي يمكن اعتباره مجموعة من السجلات المكونة من حقول وقيم. لترميز محتوى الجدول وبنائه، نقترح هندسة تسلسلية جديدة تعرف بالوعي البنيوي (seq2seq) والتي تتكون من مُشفِّر البوابة الحقلية ومولد الوصف ذو الانتباه المزدوج. في مرحلة الترميز، نقوم بتحديث ذاكرة الخلية للمؤلف LSTM باستخدام بوابة الحقل والقيمة المقابلة لها بهدف دمج معلومات الحقول في تمثيل الجدول. أما في مرحلة فك الترميز، فقد اقترحنا آلية انتباه مزدوجة تحتوي على انتباه على مستوى الكلمات وانتباه على مستوى الحقول لنمذجة الصلة الدلالية بين الوصف المنتج والجدول. أجرينا تجارب على مجموعة بيانات \texttt{WIKIBIO} التي تحتوي على أكثر من 700 ألف سيرة ذاتية ومعطياتها المرتبطة من ويكيبيديا. تظهر تصورات الانتباه والدراسات الحالة أن نموذجنا قادر على إنتاج وصفات متماسكة ومعلوماتية بناءً على الفهم الشامل لكل من محتوى الجدول وبنيته. كما تظهر التقييمات الآلية أن نموذجنا يتفوق بشكل كبير على النماذج الأساسية. يمكن الحصول على الكود المستخدم في هذا العمل من الرابط https://github.com/tyliupku/wiki2bio.