ColNet: تضمين معاني جداول الويب لتنبؤ نوع العمود

تعد تسمية أنواع الأعمدة تلقائيًا باستخدام مفاهيم قاعدة المعرفة (KB) مهمة حاسمة للحصول على فهم أساسي لجداول الويب. تعتمد الطرق الحالية إما على بيانات وصفية للجدول مثل اسم العمود أو التوافق بين الكيانات في خلايا قاعدة المعرفة (KB)، وقد تفشل في التعامل مع جداول الويب المتزايدة التي تحتوي على معلومات وصفية ناقصة. في هذا البحث، نقترح إطارًا لتسمية أنواع الأعمدة يعتمد على الشبكات العصبية ويُسمى ColNet، والذي يمكنه دمج الاستدلال من قاعدة المعرفة والبحث فيها مع التعلم الآلي ويمكنه تدريب شبكات العصبانية التلافيفية تلقائيًا للتنبؤ. لا يقتصر نموذج التنبؤ على النظر في الدلالات السياقية داخل الخلية باستخدام تمثيل الكلمات فحسب، بل يقوم أيضًا بدمج دلالات العمود من خلال تعلم الخصائص المحلية من خلايا متعددة. تم تقييم الطريقة باستخدام DBPedia ومجموعتين مختلفتين من جداول الويب، وهما T2Dv2 من الويب العام وLimaye من صفحات ويكيبيديا، وأظهرت أداءً أعلى من أفضل الأساليب الحالية.