منذ 11 أيام

المحاذاة بين الكيانات عبر اللغات مع الإشراف العرضي

Muhao Chen, Weijia Shi, Ben Zhou, Dan Roth

الملخص

بُذِلت جهود بحثية كبيرة في تطوير طرق تمثيل الرسوم المعرفية متعددة اللغات (KG) لمعالجة مهمة مطابقة الكيانات، التي تهدف إلى تطابق الكيانات في الرسوم المعرفية ذات اللغات المختلفة التي تشير إلى نفس الكائن في العالم الحقيقي. غالبًا ما تُعاني هذه الطرق من نقص في عدد التوافق الأولي المتوفر بين الرسوم المعرفية. ولذلك، نقترح نموذجًا مُدرَّسًا بشكل عرضي يُسمى JEANS، الذي يُمثل الرسوم المعرفية متعددة اللغات والنصوص النصية في إطار تمثيلي مشترك، ويسعى إلى تحسين مطابقة الكيانات باستخدام إشارات تدريب عرضية مستمدة من النصوص. يبدأ نموذج JEANS بعملية ترسيخ الكيانات لدمج كل رسم معرفي مع مجموعة نصية أحادية اللغة. ثم تُجرى عمليتان للتعلم: (أ) عملية تعلم التمثيل لتمثيل الرسم المعرفي والنص لكل لغة في فضاء تمثيلي واحد، و(ب) عملية تعلم مطابقة تعتمد على التعلم الذاتي لاستنتاج تطابق الكيانات وتطابق المفردات بين التمثيلات بشكل تكراري. أظهرت التجارب على مجموعات بيانات معيارية أن JEANS يحقق تحسينًا واعدًا في مطابقة الكيانات باستخدام التدريب العرضي، ويتفوق بشكل كبير على أحدث الطرق التي تعتمد فقط على المعلومات الداخلية للرسوم المعرفية.