TURL: فهم الجداول من خلال تعلم التمثيل

تخزن الجداول العلائقية على الويب كمية هائلة من المعرفة. بفضل هذا الثراء من الجداول، تم إحراز تقدم كبير في مجموعة متنوعة من المهام في مجال فهم الجداول. ومع ذلك، تعتمد الأعمال الحالية بشكل عام على خصائص وتصميمات نماذج مهندسة بشكل كبير ومحددة للمهمة. في هذه الورقة البحثية، نقدم TURL، إطارًا جديدًا يُدخل نموذج التدريب المسبق / التحسين الدقيق إلى الجداول العلائقية على الويب. خلال التدريب المسبق، يتعلم الإطار تمثيلات سياقية عميقة للجداول العلائقية بطريقة غير مراقبة. يمكن تطبيق تصميم النموذج الشامل مع التمثيلات المدربة مسبقًا على نطاق واسع من المهام مع تحسين دقيق محدد للمهمة بأقل قدر ممكن. تحديدًا، نقترح محول (Transformer) مشفرًا يعي بنية الصفوف والأعمدة للجداول العلائقية، ونقدم هدف استرجاع الكيانات المحجبة (Masked Entity Recovery - MER) جديدًا للتدريب المسبق لتقاطع الدلالات والمعرفة في البيانات غير المنظمة على نطاق واسع. نقيم TURL بشكل منهجي باستخدام مقاييس تتكون من 6 مهام مختلفة لفهم الجداول (مثل استخراج العلاقات، وإكمال الخلايا). نوضح أن TURL يتعمم بشكل جيد إلى جميع المهام ويتفوق بشكل كبير على الأساليب الموجودة في几乎所有情况下。然而,最后一句中的“几乎所有情况下”需要调整以适应阿拉伯语的表达习惯。以下是调整后的版本:نوضح أن TURL يتعمم بشكل جيد إلى جميع المهام ويتفوق بشكل كبير على الأساليب الموجودة في معظم الحالات تقريبًا.