الاسترجاع الكثيف للعبارات في الإجابة على الأسئلة في النطاق المفتوح

يعتمد الإجابة على الأسئلة في النطاق المفتوح على استرجاع فقرات فعّالة لاختيار السياقات المرشحة، حيث تُعد النماذج الفضاءية النادرة التقليدية، مثل TF-IDF أو BM25، الطريقة المتبعة بشكل شائع. في هذه الدراسة، نُظهر أن استرجاع الفقرات يمكن تنفيذه عمليًا باستخدام التمثيلات الكثيفة وحدها، حيث يتم تعلم التمثيلات (الإدخالات) من عدد قليل من الأسئلة والفقرات باستخدام إطار عمل بسيط يعتمد على مُشفّر مزدوج. عند تقييمه على مجموعة واسعة من مجموعات بيانات الإجابة على الأسئلة في النطاق المفتوح، تفوق مُسترجعنا الكثيف على نظام Lucene-BM25 القوي بنسبة تصل إلى 9%–19% من حيث الدقة في استرجاع الفقرات العُشرة والعشرين الأولى، كما ساهم في تمكين نظامنا المتكامل للإجابة على الأسئلة من تحقيق حالة جديدة من التقدّم على العديد من معايير الإجابة على الأسئلة في النطاق المفتوح.