NSCaching: العين السلبية البسيطة والفعالة لتمثيل الرسم البياني للمعرفة

تعد ترميز الرسم البياني للمعرفة (Knowledge Graph Embedding - كج) مشكلة أساسية في بحوث تعدين البيانات ولها العديد من التطبيقات العملية. الهدف منها هو تشفير الكيانات والعلاقات في الرسم البياني إلى فضاء متجهي ذي أبعاد منخفضة، يمكن استخدامه في الخوارزميات اللاحقة. يعتبر التحليل العيني السلبي (Negative Sampling)، الذي يقوم بأخذ عينات من الثلاثيات السلبية من تلك غير الملاحظة في بيانات التدريب، خطوة مهمة في ترميز الرسم البياني للمعرفة. مؤخرًا، تم تقديم الشبكة المولدة المعادية (Generative Adversarial Network - جان) في التحليل العيني السلبي. من خلال أخذ عينات من الثلاثيات السلبية ذات النقاط العالية، تتجنب هذه الطرق مشكلة انخفاض التدرج وتحصل على أداء أفضل. ومع ذلك، فإن استخدام جان يجعل النموذج الأصلي أكثر تعقيدًا ويصعب تدريبه، حيث يجب استخدام التعلم التعزيزي (Reinforcement Learning).في هذا البحث، ومن خلال ملاحظتنا أن الثلاثيات السلبية ذات النقاط العالية مهمة ولكن نادرة، اقترحنا تتبعها مباشرة باستخدام ذاكرة التخزين المؤقت (الكاش). ومع ذلك، كيف يتم أخذ العينات منها وتحديثها هما سؤالان مهمان. قمنا بتصميم حلول بعناية، والتي ليست فقط فعالة ولكنها أيضًا تحقق توازنًا جيدًا بين الاستكشاف والاستغلال. بهذه الطريقة، يعمل طرحنا كنسخة "مُركزة" من الطرق السابقة التي تعتمد على جان، مما لا يضيع وقت التدريب في معلمات إضافية لتوافق التوزيع الكامل للثلاثيات السلبية.أظهرت التجارب الواسعة أن طرحتنا يمكن أن تحصل على تحسين كبير في مختلف نماذج ترميز الرسم البياني للمعرفة، وتتفوق على أفضل طرق أخذ العينات السلبية المستندة إلى جان حاليًا.