قطعة من الجدول: نهج تقسيم وغلبة لاختيار الجداول الفرعية في إجابة أسئلة الجداول

تطبيق نماذج اللغة (LMs) على الجداول يشكل تحديًا بسبب الاختلافات البنيوية الطبيعية بين الجداول ثنائية الأبعاد والنصوص أحادية البعد التي تم تصميم النماذج اللغوية لها في الأصل. بالإضافة إلى ذلك، عند تطبيق الجداول المُستَقيمة على النماذج اللغوية، فإن أطوال الرموز القصوى غالبًا ما يتم فرضها في حسابات الانتباه الذاتي مما يجعل من الصعب فهم السياق بشكل شامل موزع عبر جداول كبيرة. لمعالجة هذه التحديات، نقدم إطار عمل جديد للإجابة على الأسئلة بناءً على جزء من الجدول يُسمى "بيتا" (PieTa). يعمل بيتا من خلال عملية تكرارية تتضمن تقسيم الجداول إلى نوافذ أصغر، استخدام النماذج اللغوية لاختيار الخلايا ذات الصلة داخل كل نافذة، ودمج هذه الخلايا في جزء من الجدول. هذا النهج متعدد الدقة يلتقط الارتباطات عبر عدة صفوف وأعمدة مع تجنب القيود الناجمة عن إدخال سياقات طويلة. عندما يتم تنفيذه كخوارزمية اتحاد جزء من الجدول البسيطة والمكررة، يظهر بيتا تحسينًا في الأداء مقارنة بالطرق السابقة للإجابة على الأسئلة بناءً على جزء من الجدول.