مجموعة بيانات الإجابة على الأسئلة الجدولية شبه المنظمة SSTQA
التاريخ
رابط النشر
رابط الورقة البحثية
SSTQA هي مجموعة بيانات مرجعية لمهام الإجابة على أسئلة الجدول شبه المنظمة، صدرت عام ٢٠٢٥ من قِبل جامعة شنغهاي جياو تونغ، وجامعة سيمون فريزر، وجامعة تسينغهوا، ومؤسسات أخرى. نتائج البحث ذات الصلة هي:ST-Raptor: برنامج الإجابة على الأسئلة باستخدام جدول شبه منظم مدعوم من برنامج LLM"، والذي يهدف إلى اختبار قدرات الفهم والإجابة على نماذج اللغة واسعة النطاق وأنظمة الإجابة على أسئلة الجدول عند مواجهة تخطيطات معقدة في الجداول الحقيقية (مثل الخلايا المدمجة، والرؤوس الهرمية، والتداخل متعدد المستويات، وما إلى ذلك).
تحتوي هذه المجموعة من البيانات على 102 جدول معقد من العالم الواقعي و764 سؤالاً مُقابلاً، تغطي 19 سيناريو تطبيقي عملي مُمثل. تتضمن ميزات الجدول خلايا مُتداخلة، وعناوين متعددة المستويات، وتخطيطات غير منتظمة، مما يعكس تمامًا التعقيد الهيكلي للمسائل الواقعية. تُبنى أزواج الأسئلة والأجوبة من خلال الجمع بين التوليد التلقائي والمراجعة اليدوية، وتُصنف إلى ثلاثة مستويات صعوبة: سهل، ومتوسط، وصعب. تغطي مجموعة البيانات مهامًا تتراوح من الاسترجاع المباشر إلى التفكير المُعقد، مما يضمن تنوعًا وتحديًا للمهام.
تُعالج هذه المجموعة من البيانات مشاكل مجموعات البيانات شبه المنظمة الحالية، مثل صغر حجمها وبساطة بنيتها وانقطاعها عن التطبيقات الحقيقية. تتميز ببنية معقدة، وسيناريوهات غنية، ومستويات صعوبة واضحة، وشرح توضيحي عالي الجودة. وهي مناسبة لتدريب وتقييم النماذج متعددة الوسائط الكبيرة وأنظمة الإجابة على أسئلة الجداول، وتُمثل معيارًا مهمًا لتعزيز فهم الجداول والتطبيقات الذكية.