HyperAIHyperAI
منذ 11 أيام

إكمال الرسم المعرفي متعدد اللغات مع التماثل المشترك للعلاقة والكائن

Harkanwar Singh, Prachi Jain, Mausam, Soumen Chakrabarti
إكمال الرسم المعرفي متعدد اللغات مع التماثل المشترك للعلاقة والكائن
الملخص

إكمال المعرفة الرسومية (KGC) يُعدّ تنبؤًا بالحقائق المفقودة في معرفة رسمية غير كاملة. تُطبَّق معظم أبحاث KGC الحالية على معرفة رسمية واحدة فقط وفي لغة واحدة فقط. ومع ذلك، قد يُحافظ متحدثو لغات مختلفة على معرفات رسومية منفصلة بلغاتهم، ولا يتوقع أن تكون أي معرفة رمزية فردية كاملة. علاوةً على ذلك، تمتلك الكيانات أو العلاقات المشتركة في هذه المعرفات أشكالًا سطحية ورموزًا مختلفة، مما يؤدي إلى تضخم في أرقام الهوية (ID proliferation). وتُحل هذه المشكلة من خلال مهام مطابقة الكيانات (EA) ومطابقة العلاقات (RA)، التي تعمل على تحديد أزواج من رموز الكيانات (العلاقات) في معرفات رسومية مختلفة تمثل نفس الكيان (العلاقة). ويمكن أن يُسهم ذلك في تحسين التنبؤ بالحقائق المفقودة، نظرًا لأن المعرفة من معرفة رمزية واحدة قد تفيد في إكمال معرفة رمزية أخرى. كما أن التنبؤات ذات الثقة العالية قد تضيف معلومات قيّمة لمهام المطابقة. استجابةً لذلك، ندرس المهمة الجديدة المتمثلة في تدريب مشترك لأنظمة KGC متعددة اللغات، ومطابقة العلاقات، ومطابقة الكيانات. نقدّم نموذج ALIGNKGC، الذي يستخدم بعض التوافقات الأولية (seed alignments) لتحسين تدريب مشترك لجميع خسائر KGC، EA، وRA. ويعتبر المكوّن الرئيسي في ALIGNKGC مفهومًا لطيفًا مبنيًا على التمثيل (embedding) للتشابه غير المتماثل المُعرّف على توقيعات مجموعات (الفاعل، المفعول) للعلاقات، والذي يُسهم في تحسين التنبؤ بالعلاقات التي تكون مكافئة أو مُستمدة من علاقات أخرى. أظهرت تجارب واسعة باستخدام DBPedia بلغات خمس، فوائد التدريب المشترك لجميع المهام، حيث حقق ALIGNKGC تحسينات تتراوح بين 10% إلى 32% في مقياس MRR مقارنة بنموذج متميز حديثًا لإنجاز KGC على كل معرفة رمزية أحادية اللغة. بالإضافة إلى ذلك، حقق ALIGNKGC تحسينات معقولة في مهام EA وRA مقارنة بنموذج أساسي للإكمال على معرفة رمزية تدمج جميع الحقائق دون مطابقة، مما يُبرز القيمة الحقيقية للتدريب المشترك لهذه المهام.

إكمال الرسم المعرفي متعدد اللغات مع التماثل المشترك للعلاقة والكائن | أحدث الأوراق البحثية | HyperAI