محاذاة الكيانات للرسوم المعرفية باستخدام شبكات ت(Convolutional) متعددة الرتب
أصبحت الرسوم المعرفية (KGs) هي الهيكل الشائع لدمج الكيانات في العالم الحقيقي من خلال نمذجة العلاقات بينها والخصائص المرتبطة بها. وقد لاقت مهمة توحيد الكيانات – وهي مهمة تحديد الكيانات المقابلة بين مختلف الرسوم المعرفية – اهتمامًا كبيرًا في الأوساط الأكاديمية والصناعية على حد سواء. ومع ذلك، فإن التقنيات الحالية لتوصيل الكيانات تتطلب غالبًا كميات كبيرة من البيانات المُعلَّمة، ولا تستطيع ترميز البيانات متعددة الوسائط في آن واحد، كما أنها تفرض قيودًا متسقة محدودة فقط. في هذا البحث، نقترح إطارًا شاملًا وغير مُعلَّم لتوحيد الكيانات بين الرسوم المعرفية عبر اللغات، يدمج أنواعًا مختلفة من المعلومات بهدف استغلال الغنى المتوفر في بيانات الرسوم المعرفية بشكل كامل. يُمكّن النموذج من التقاط الارتباط القائم على العلاقات بين الكيانات باستخدام نموذج شبكة تلافيفية متعددة الرتب (GCN) مصمم لاستيفاء قيود الاتساق، بينما يُدمج الارتباط القائم على الخصائص من خلال نموذج تحويل (translation machine). ونستخدم آلية دمج متأخرة (late-fusion) لدمج جميع المعلومات معًا، مما يسمح لهذه الأساليب بالتعويض المتبادل، وبالتالي يعزز النتيجة النهائية لتوحيد الكيانات، ويجعل النموذج أكثر مقاومةً لخرق الاتساق. تُظهر النتائج التجريبية أن نموذجنا أكثر دقة، وأسرع بمقدار رتبة من الرتب السابقة. كما نُظهر حساسية النموذج تجاه المُعامِلات، ووفرة الجهد في التسمية، ومقاومته للظروف المُضادة (adversarial conditions).