MoCoKGC: تشفير الكيان بالتقريب الزمني لاستكمال رسم المعرفة

في السنوات الأخيرة، سعت العديد من الدراسات إلى تحسين قدرات النماذج اللغوية المُدرّبة مسبقًا (PLMs) في مهام إكمال المخططات المعرفية (KGC) من خلال دمج المعلومات الهيكلية من المخططات المعرفية. ومع ذلك، لم تتمكن الطرق الحالية من دمج السمات الهيكلية للمخططات المعرفية بشكل فعّال مع الوصف النصي للكيانات لتكوين ترميزات كيانات قوية. لمعالجة هذه المشكلة، تُقدّم هذه الورقة نموذج MoCoKGC (ترميز الكيانات بالاعتماد على التباين التدريجي لإكمال المخططات المعرفية)، والذي يدمج ثلاثة مشغلات رئيسية: مشغل الكيان-العلاقة، ومشغل الكيان، ومشغل الكيان التدريجي. يوفر التعلم التبايني التدريجي عددًا أكبر من العينات السلبية، كما يسمح بتحديث تدريجي لتشفيرات الكيانات. ونتيجة لذلك، نعيد تضمين الترميزات الكيانية المولّدة في المشغل لدمج المعلومات الهيكلية للمخطط. علاوةً على ذلك، يعزز MoCoKGC القدرات الاستنتاجية لمشغل الكيان-العلاقة من خلال استخدام أوامر عميقة للعلاقة. وعلى مقياس التقييم القياسي، وهو الترتيب المتوسط العكسي (MRR)، يُظهر نموذج MoCoKGC أداءً متفوّقًا، حيث حقق تحسينًا بنسبة 7.1% على مجموعة بيانات WN18RR، وتحسينًا بنسبة 11% على مجموعة بيانات Wikidata5M، وتفوّق على أفضل نموذج حالي على مجموعة بيانات FB15k-237. من خلال سلسلة من التجارب، تُحلّل هذه الورقة بشكل مفصّل الدور والمساهمة لكل مكوّن ومعامل في النموذج.