الاستكمال المتجهي الاستقرائي باستخدام مُعَمِّل الرسم البياني

في الآونة الأخيرة، أظهرت الشبكة العصبية الرسومية (GNN) قدرة كبيرة في إكمال المصفوفات من خلال صياغة مصفوفة التقييم كرسم بيتي ثنائي الاتجاه، ثم التنبؤ بالارتباط بين عقد المستخدم والمنتج المقابلة. تعتمد معظم الطرق القائمة على GNN لإكمال المصفوفات على مُشفِّر الرسم البياني التلقائي (GAE)، والذي يُعد الفهرس ذا القيمة الواحدة (one-hot index) كمدخل، ويُحول فهرس المستخدم (أو المنتج) إلى تمثيل قابل للتعلم، ثم يطبّق GNN لاستخلاص تمثيلات محددة للعقد بناءً على هذه التمثيلات القابلة للتعلم، وأخيرًا يجمع بين تمثيلات المستخدم المستهدف وتمثيلات العقد المقابلة له من المنتجات للتنبؤ بالارتباطات المفقودة. ومع ذلك، وفي غياب محتوى العقدة (أي معلومات جانبية) أثناء التدريب، لا يمكن استخلاص تمثيل مخصص للمستخدم (أو المنتج) في البيئة الاستنتاجية (inductive setting)، أي أن النموذج الذي تم تدريبه على مجموعة معينة من المستخدمين (أو المنتجات) لا يمكنه التكيف مع مستخدمين (أو منتجات) جدد. ولحل هذه المشكلة، نقترح طريقة لإكمال المصفوفات استنتاجية باستخدام GAE (IMC-GAE)، والتي تستخدم GAE لاستخلاص تمثيلات مخصصة للمستخدم (أو المنتج) لتقديم توصيات شخصية، وبنفس الوقت لاستخلاص الأنماط المحلية للرسم البياني لتمكين إكمال المصفوفات الاستنتاجية. وبشكل خاص، قمنا بتصميم ميزتين معلوماتيتين للعقد، واستخدمنا خطة إسقاط للعقدة على مستوى الطبقات داخل GAE لاستخلاص الأنماط المحلية للرسم البياني التي يمكن تعميمها على البيانات غير المرئية. تكمن المساهمة الرئيسية في هذا البحث في القدرة على استخلاص الأنماط المحلية للرسم البياني بشكل فعّال داخل GAE، مع تحسين كبير في التوسعية (scalability) والأداء التعبيري مقارنة بالطرق السابقة القائمة على GNN لإكمال المصفوفات. علاوة على ذلك، أظهرت التجارب الواسعة أداءً متقدمًا جدًا على عدة معايير معيارية لإكمال المصفوفات. يُتاح الكود الرسمي للنموذج بشكل عام للجمهور.