مطابقة الجداول الويبية مع DBpedia - دراسة مفيدة للميزات

تحتوي الجداول العلائقية في HTML على الويب على بيانات تصف مجموعة واسعة من الكيانات وتغطي طيفًا واسعًا من المواضيع. وبذلك، تكون الجداول الويبية أداة مفيدة جدًا لملء القيم المفقودة في قواعد المعرفة عبر المجالات مثل DBpedia وYAGO أو رسم المعرفة من جوجل. قبل استخدام بيانات الجداول الويبية لملء القيم المفقودة، يجب مطابقة هذه الجداول مع قاعدة المعرفة المطلوبة. ويشمل هذا المطابقة ثلاث مهام: مطابقة الجدول مع الفئة، ومطابقة الصف مع المثيل، ومطابقة السمة مع الخاصية. وتم اقتراح العديد من النماذج المختلفة لهذه المهام. لكن للأسف، يتم تقييم النماذج الحالية باستخدام مجموعات بيانات جداول ويب مختلفة، كما أن كل نموذج على حدة يستخدم فقط مجموعة جزئية من خصائص جداول الويب وقواعد المعرفة التي قد تكون مفيدة لمهام المطابقة. ونتيجة لهذه العيوب، يصبح من الصعب مقارنة النماذج المختلفة، أو تحديد تأثير كل خاصية على النتائج العامة للمطابقة. تساهم هذه الورقة في تحسين الفهم حول فائدة الخصائص المختلفة في مطابقة جداول الويب مع قواعد المعرفة من خلال إعادة تنفيذ تقنيات مطابقة مختلفة، إلى جانب أساليب تجميع درجات التشابه المستمدة من الأدبيات، ضمن إطار موحد للمطابقة، وتقييم مجموعات مختلفة من هذه التقنيات مقابل معيار ذهبي واحد. ويتكون هذا المعيار الذاتي من مطابقات بين الفئات، والمثيلات، والخصائص بين قاعدة معرفة DBpedia والجداول الويبية المستمدة من مجموعة جداول الويب التابعة لمشروع Web Data Commons.