الإجابة على الأسئلة بفعالية ومتانة من سياق محدود في الوثائق

النماذج العصبية للاستجابة للأسئلة (QA) على الوثائق قد حققت تحسينات أداء كبيرة. ومع ذلك، فإن هذه النماذج لا تتوسع إلى المجموعات الكبيرة من البيانات بسبب تعقيدها في نمذجة التفاعلات بين الوثيقة والسؤال. بالإضافة إلى ذلك، أظهرت الدراسات الحديثة أن مثل هذه النماذج حساسة للمدخلات المعادية. في هذا البحث، ندرس السياق الأدنى المطلوب للإجابة على السؤال، ونجد أن معظم الأسئلة في قواعد البيانات الحالية يمكن الإجابة عليها باستخدام مجموعة صغيرة من الجمل. مستوحىً من هذه الملاحظة، نقترح منتقي جمل بسيطًا لاختيار أقل مجموعة من الجمل لإدخالها إلى نموذج الاستجابة للأسئلة. يحقق نظامنا الشامل تخفيضات كبيرة في وقت التدريب (حتى 15 مرة) وأوقات الاستدلال (حتى 13 مرة)، مع دقة مقاربة أو أفضل من الحالة المتقدمة حاليًا على SQuAD، NewsQA، TriviaQA و SQuAD-Open. علاوة على ذلك، تظهر نتائج تجاربنا وتحليلاتنا أن نهجنا أكثر صلابة تجاه المدخلات المعادية.