HyperAIHyperAI
منذ 9 أيام

TorchicTab: التسمية الدلالية للجداول باستخدام ويكي بيانات ونماذج اللغة

{Anastasia Dimou, Xuemin Duan, Duo Yang, Ioannis Dasoulas}
TorchicTab: التسمية الدلالية للجداول باستخدام ويكي بيانات ونماذج اللغة
الملخص

تتعدد البيانات الجدولية، وتُستخدم من قِبل مجموعة واسعة من التطبيقات. ومع ذلك، فإن جزءًا كبيرًا من هذه البيانات يفتقر إلى المعلومات الدلالية الضرورية لتمكين المستخدمين والآلات من فهمها بشكل صحيح. ويعيق هذا النقص في الفهم الدلالي للجداول استخدامها في سلاسل تحليل البيانات. توجد حلول لتفكيك الجداول دلاليًا، لكنها تركز على مهام وتصنيفات محددة من التصنيف، وتعتمد على قواعد معرفية كبيرة، ما يجعل إعادة استخدامها في البيئات الواقعية أمرًا صعبًا. وبالتالي، هناك حاجة إلى أنظمة أكثر متانة تُنتج تسميات دقيقة أكثر وتتكيف مع أنواع مختلفة من الجداول. وقد تم تقديم مسابقة الويب الدلالي لربط البيانات الجدولية بقواعد المعرفة (SemTab) بهدف تقييم أنظمة تفسير الجداول دلاليًا، من خلال تقييمها على مجموعات بيانات ومهمات متنوعة. في هذه الورقة، نُقدّم TorchicTab، وهي نظام مرن لتفسير الجداول دلاليًا قادر على تسمية الجداول ذات الهياكل المتنوعة باستخدام إما رسم معرفي خارجي مثل ويكي داتا، أو جداول مُعلَّمة مسبقًا باستخدام مصطلحات محددة مسبقًا لتدريب النظام. وقد قُمنا بتقييم النظام المقترح وفقًا للمهام المختلفة للتصنيف في مسابقة SemTab. وتُظهر النتائج أن نظامنا قادر على إنتاج تسميات دقيقة لمهام مختلفة عبر مجموعات بيانات متنوعة.

TorchicTab: التسمية الدلالية للجداول باستخدام ويكي بيانات ونماذج اللغة | أحدث الأوراق البحثية | HyperAI