استرجاع الشعاع من الطرف إلى الطرف لأسئلة الإجابة متعددة الخطوات

إجابة متعددة الخطوات (QA) تتضمن العثور على عدة فقرات ذات صلة واستنتاج منطقي متدرج للإجابة على أسئلة معقدة، مما يشير إلى نموذج استرجاع وقراءة. ومع ذلك، كانت الأدوات المستخدمة في الاسترجاع السابقة مخصصة لأسئلة ذات خطوتين فقط، ومعظمها تم تدريبها بشكل منفصل عبر كل خطوة، مما أدى إلى نقص في الإشراف على عملية الاسترجاع متعددة الخطوات بأكملها، ونتج عنه أداء ضعيف في السيناريوهات المعقدة التي تتجاوز خطوتين. في هذا العمل، نقدّم "استرجاع الشعاع" (Beam Retrieval)، وهي إطار عمل متكامل لاسترجاع الشعاع للأسئلة متعددة الخطوات. يُعد هذا النهج نموذجًا لعملية الاسترجاع متعددة الخطوات بطريقة متكاملة من خلال تحسين مشترك لمحول (encoder) ورأسين تصنيف عبر جميع الخطوات. علاوةً على ذلك، يُحافظ "استرجاع الشعاع" على عدة افتراضات جزئية للفقرات ذات الصلة في كل خطوة، مما يوسع مساحة البحث ويقلل من خطر تفويت الفقرات ذات الصلة. ولبناء نظام QA كامل، ندمج قارئًا مُشرَّفًا أو نموذجًا لغويًا كبيرًا (LLM). تُظهر النتائج التجريبية أن "استرجاع الشعاع" يحقق تحسنًا يقارب 50% مقارنةً بالأساليب الأساسية على مجموعة MuSiQue-Ans الصعبة، كما يتفوق على جميع الأدوات السابقة في استرجاع البيانات على HotpotQA، ويحقق دقة تبلغ 99.9% على مجموعة 2WikiMultiHopQA. وبفضل توفير سياق عالي الجودة، يُسهم "استرجاع الشعاع" في تمكين القارئ المُشرَّف من تحقيق أفضل أداء مُحقَّق حتى الآن، ويُحسّن بشكل كبير أداء نماذج LLM في المهام القائمة على عدد قليل من الأمثلة (few-shot QA).