HyperAIHyperAI
منذ 3 أشهر

كيف تستند تضمينات الرسم المعرفي على البيانات غير المرئية: نظرة على الأدلة الدلالية

Ren Li, Yanan Cao, Qiannan Zhu, Guanqun Bi, Fang Fang, Yi Liu, Qian Li
كيف تستند تضمينات الرسم المعرفي على البيانات غير المرئية: نظرة على الأدلة الدلالية
الملخص

تهدف تضمينات الرسوم البيانية للمعرفة (KGE) إلى تعلم تمثيلات للكيانات والعلاقات. وقد حققت معظم نماذج KGE نجاحًا كبيرًا، خاصة في السيناريوهات التي تتطلب التعميم (extrapolation). وبشكل خاص، عند إعطاء مثلث غير مرئي (h, r, t)، يمكن لنموذج مُدرّب أن يتنبأ بشكل صحيح بـ t من خلال (h, r, ?)، أو بـ h من خلال (?, r, t)، وهذه القدرة على التعميم تُعد مُذهلة. ومع ذلك، فإن معظم الدراسات الحالية في مجال KGE تركز على تصميم دوال نمذجة معقدة للمثلثات، والتي تُخبرنا بشكل أساسي بكيفية قياس مدى معقولية المثلثات المرصودة، لكنها لا تقدم تفسيرًا كافيًا لسبب قدرة هذه الأساليب على التعميم على بيانات غير مرئية، وما هي العوامل المهمة التي تسهم في تمكين KGE من التعميم. ولذلك، في هذا العمل، نسعى إلى دراسة ظاهرة التعميم في KGE من خلال معالجة مسألتين رئيسيتين: 1. كيف يُمكن لـ KGE أن يُعمم على بيانات غير مرئية؟ 2. كيف يمكن تصميم نموذج KGE يتمتع بقدرة أفضل على التعميم؟بالنسبة للمشكلة الأولى، نناقش أولًا العوامل المؤثرة في التعميم من ثلاث مستويات: العلاقة، والكيان، والمثلث. ثم نقترح ثلاثة أدلة معنوية (Semantic Evidences - SEs)، يمكن ملاحظتها في مجموعة التدريب، وتُوفّر معلومات معنوية مهمة تُسهم في التعميم. وبعد ذلك، نُثبت فعالية هذه الأدلة المعنوية من خلال تجارب واسعة على عدة نماذج KGE شهيرة.أما بالنسبة للمشكلة الثانية، وللإسهام الأفضل في استغلال المستويات الثلاثة من الأدلة المعنوية، نقترح نموذجًا جديدًا لـ KGE يعتمد على الشبكات العصبية الرسومية (GNN)، يُسمّى الشبكة العصبية الرسومية المستندة إلى الأدلة المعنوية (SE-GNN). في نموذج SE-GNN، يتم تمثيل كل مستوى من مستويات الأدلة المعنوية بشكل صريح من خلال أنماط الجيران المقابلة له، ثم يتم دمجها بشكل كافٍ من خلال عملية التجميع متعددة الطبقات، مما يُسهم في الحصول على تمثيلات معرفية أكثر قابلية للتمديد (extrapolative). وأخيرًا، من خلال تجارب واسعة على مجموعتي بيانات FB15k-237 وWN18RR، نُظهر أن SE-GNN يحقق أداءً متقدمًا في مهام إكمال الرسوم البيانية للمعرفة، ويُظهر قدرة متفوقة على التعميم. يمكن الوصول إلى الكود الخاص بنا عبر الرابط التالي: https://github.com/renli1024/SE-GNN.