HyperAIHyperAI
منذ 11 أيام

زيادة سرعة مطابقة الكيانات 10*: شبكة مطابقة انتباه مزدوجة مع استخراج عينات صعبة مُعَمَّلة بالتوحيد

Xin Mao, Wenting Wang, Yuanbin Wu, Man Lan
زيادة سرعة مطابقة الكيانات 10*: شبكة مطابقة انتباه مزدوجة مع استخراج عينات صعبة مُعَمَّلة بالتوحيد
الملخص

البحث عن الكيانات المكافئة بين مصادر متعددة لرسوم المعرفة (KGs) يُعد الخطوة الأساسية في دمج رسوم المعرفة، ويُعرف أيضًا بـ \emph{محاذاة الكيانات} (EA). ومع ذلك، فإن معظم الطرق الحالية لمحاذاة الكيانات تُعاني من ضعف الكفاءة وسوء التوسع. وقد أشارت ملخصة حديثة إلى أن بعض هذه الطرق تتطلب عدة أيام لمعالجة مجموعة بيانات تحتوي على 200,000 عقدة (DWY100K). ونعتقد أن التعقيد الزائد في معالج رسوم المعرفة واستراتيجية أخذ العينات السلبية غير الفعالة هما السببان الرئيسيان وراء هذه المشكلة. في هذه الورقة، نقترح معالجًا جديدًا لرسوم المعرفة يُسمى الشبكة المتطابقة ذات الانتباه المزدوج (Dual-AMN)، والذي لا يُنمذج المعلومات داخل الرسم وخارج الرسم بذكاء فحسب، بل يقلل أيضًا بشكل كبير من التعقيد الحسابي. علاوةً على ذلك، نقترح دالة فقدان استخراج العينات الصعبة المُعَمَّلة (Normalized Hard Sample Mining Loss)، التي تسمح باختيار عينات سلبية صعبة بشكل سلس وتقلل من تأثير تغير الخسارة. وتشير النتائج التجريبية على مجموعات بيانات عامة شائعة الاستخدام إلى أن طريقة我们的 تحقق من كلاً من الدقة العالية والكفاءة العالية. فعلى مجموعة بيانات DWY100K، يمكن إتمام العملية الكاملة لطريقتنا خلال 1,100 ثانية، أي بأكثر من 10 مرات أسرع من الطرق السابقة. كما تفوق أداء طريقتنا جميع الطرق السابقة على جميع مجموعات البيانات، حيث ارتفعت قيم Hits@1 وMRR من 6% إلى 13%.

زيادة سرعة مطابقة الكيانات 10*: شبكة مطابقة انتباه مزدوجة مع استخراج عينات صعبة مُعَمَّلة بالتوحيد | أحدث الأوراق البحثية | HyperAI