HyperAIHyperAI
منذ 17 أيام

R2-D2: أساس معياري معياري لأسئلة الإجابة في المجال المفتوح

Martin Fajcik, Martin Docekal, Karel Ondrej, Pavel Smrz
R2-D2: أساس معياري معياري لأسئلة الإجابة في المجال المفتوح
الملخص

تقدم هذه الدراسة نموذجًا جديدًا لخط أنابيب استجابة الأسئلة في المجال المفتوح يتكون من أربع مراحل يُعرف باسم R2-D2 (التصنيف مرتين، والقراءة مرتين). يتكون هذا الخط الأنابيب من مُسترجع (retriever)، ومرتبّت مُعاد ترتيب النصوص (passage reranker)، وقارئ استخلاصي (extractive reader)، وقارئ توليدي (generative reader)، بالإضافة إلى آلية تجمع التنبؤ النهائي من جميع مكونات النظام. نُظهر قوة النموذج عبر ثلاث مجموعات بيانات لاستجابة الأسئلة في المجال المفتوح: NaturalQuestions وTriviaQA وEfficientQA، حيث تفوق النموذج على أحدث النماذج في المجموعتين الأولى والثانية. وتوصل تحليلنا إلى النتائج التالية: (أ) دمج القارئ الاستخلاصي والقارئ التوليدي يؤدي إلى تحسين مطلق يصل إلى 5 نقاط في مقياس التطابق الدقيق (exact match)، وهو ما يُعد أكثر فعالية بمرتين على الأقل مقارنةً بأسلوب التجميع بالتوسط اللاحق (posterior averaging) للنماذج نفسها ذات المعلمات المختلفة؛ (ب) يمكن للقارئ الاستخلاصي الذي يحتوي على عدد أقل من المعلمات تحقيق أداء يوازي أداء القارئ التوليدي على مجموعات بيانات استجابة الأسئلة الاستخلاصية.