الحل المُنتَج باستخدام الشبكات العصبية الهرمية للانتباه الرسومية
تمييز الكيانات (Entity Resolution (ER)) يربط الكيانات التي تشير إلى نفس الكيان في العالم الحقيقي من مصادر مختلفة. تأخذ الدراسات الحالية عادة أزواجًا من الكيانات كمدخلات وتحدد هذه الأزواج بشكل مستقل. ومع ذلك، غالبًا ما توجد اعتماديات متبادلة بين أزواج مختلفة من قرارات تمييز الكيانات، على سبيل المثال، تكون الكيانات من نفس المصدر البياناتي عادةً مرتبطة معًا من حيث المعنى. علاوةً على ذلك، تعتمد الطرق الحالية لتمييز الكيانات بشكل رئيسي على مقارنة التشابه بين السمات، لكنها تتجاهل الاعتماديات المتبادلة بين السمات. لمعالجة قيود الطرق الحالية، نقترح طريقة جديدة تُسمى HierGAT، تعتمد على شبكة انتباه رسمية هيراركية (Hierarchical Graph Attention Transformer Network)، والتي يمكنها نمذجة واستغلال الاعتماديات المتبادلة بين قرارات تمييز الكيانات المختلفة. تكمن الفائدة من طريقتنا في: 1) استخدام نموذج شبكة الانتباه الرسومية لاتخاذ قرارات مشتركة لتمييز الكيانات؛ و2) القدرة على انتباه الرسم البياني لتحديد الكلمات التمييزية من السمات، وتحديد السمات الأكثر تمييزًا. علاوةً على ذلك، نقترح تعلم تمثيلات سياقية لتعزيز تمثيلات الكلمات، مما يؤدي إلى أداء أفضل. أظهرت النتائج التجريبية على مجموعات بيانات معيارية متاحة للجمهور أن HierGAT تتفوق على DeepMatcher بنسبة تصل إلى 32.5% في مقياس F1، وتفوق Ditto بنسبة تصل إلى 8.7% في مقياس F1.