جنتاب يواجه التحديات الجديدة لسمنتاب 2021

بينما تمثل الجداول مصدرًا غنيًا للمعلومات المُهيكلة، فإن استخدامها تلقائيًا يُعَرَّض أحيانًا لصعوبات ناتجة عن الغموض المتأصّل فيها. وتشمل المشكلات التي تُشكل عوائق كبيرة في استغلال هذه المصادر المعرفية من الأخطاء المطبعية البسيطة، إلى عدم اتساق تسميات الحقول، إلى التشابه الصوتي (الهومونيميا) بين القيم. وعلى الرغم من أن الويب المعنى (Semantic Web) يمكن أن يخفف من العديد من هذه المشكلات، إلا أن عملية التسمية الفعلية تظل تحديًا كبيرًا. ولتشجيع الأفكار الجديدة وتحسين النهج الحالية، تُنظّم مسابقة "الويب المعنى في مطابقة البيانات الجدولية مع الرسوم المعرفية" (SemTab) منذ عام 2019، حيث تُقام مسابقات سنوية تتيح للأنظمة عرض قدراتها الحالية. وتُبرز مجموعات البيانات من مصادر وخصائص مختلفة التحديات المتنوعة التي تواجه هذا المجال. في هذا البحث، نُقدّم تطور نظامنا "JenTab" خلال مسابقة SemTab2021. وقد أعادنا إعادة تصميم هيكل النظام، وحسّنّا الوحدات الفردية، وطوّرنا سلسلة من العمليات (pipelines) لمعالجة التحديات المحددة التي وُجهت خلال المسابقة. وتمكّن JenTab من التواجد ضمن أفضل 5 أنظمة في الجولتين الأولى والثانية من مسابقة SemTab2021. وتُظهر النتائج مرونة JenTab وقدرته على الاستجابة السريعة للتحديات الجديدة.