JointGT: تعلم التمثيل المشترك للرسوم البيانية والنصوص لتوليد النصوص من الرسوم البيانية المعرفية

النماذج المدربة مسبقًا الحالية لإنشاء النص من الرسم البياني للمعرفة (KG-to-text) تقوم بضبط نموذج التحويل بين النصوص مثل BART أو T5 على مجموعات بيانات الرسم البياني للمعرفة إلى النص، مما يؤدي في الغالب إلى تجاهل بنية الرسم البياني أثناء الترميز وعدم وجود مهام تدريب مسبقة معقدة لنمذجة تناسق الرسم البياني والنص بشكل صريح. لحل هذه المشكلات، نقترح نموذج تعلم تمثيل مشترك للرسم البياني والنص يُطلق عليه اسم JointGT. أثناء الترميز، نقوم بتصميم وحدة تجميع دلالية واعية للبنية يتم دمجها في كل طبقة من طبقات Transformer لحفظ بنية الرسم البياني. بالإضافة إلى ذلك، نقترح ثلاث مهام تدريب مسبقة جديدة لتعزيز تناسق الرسم البياني والنص بشكل صريح، بما في ذلك إعادة بناء النص / الرسم البياني، وتناسق الرسم البياني والنص في فضاء التضمين عبر النقل الأمثل (Optimal Transport). أظهرت التجارب أن JointGT حققت أداءً جديدًا على مستوى الدولة في مجموعة متنوعة من مجموعات بيانات الرسم البياني للمعرفة إلى النص.