رابتور: المعالجة الاستنتاجية المتكررة للبيانات المرتبة شجريًا

يمكن للنماذج اللغوية المدعومة باسترجاع أن تتكيف بشكل أفضل مع التغيرات في الحالة العالمية وتمدّد المعرفة الطويلة الذيلية. ومع ذلك، فإن معظم الطرق الحالية تسترجع فقط قطعًا قصيرة متتالية من مجموعة الاسترجاع، مما يحد من الفهم الشامل للسياق العام للوثيقة. نقدّم منهجية جديدة تتمثل في تضمين النصوص بشكل متكرر، وتصنيفها، وتلخيصها، مع بناء شجرة تحتوي على مستويات مختلفة من التلخيص بدءًا من الأسفل. أثناء التقييم، تسترجع نموذج RAPTOR من هذه الشجرة، مع دمج المعلومات عبر الوثائق الطويلة على مستويات مختلفة من الاستخلاص المفاهيمي. أظهرت التجارب المُحكَمة أن الاسترجاع باستخدام الملخصات المتكررة يحقق تحسينات كبيرة مقارنة بالنماذج اللغوية المدعومة باسترجاع التقليدية في عدة مهام. وفي مهام الإجابة عن الأسئلة التي تتطلب تفكيرًا معقدًا ومتعدد الخطوات، نُظهر نتائج رائدة في المجال؛ على سبيل المثال، من خلال دمج استرجاع RAPTOR مع استخدام GPT-4، نتمكن من تحسين الأداء الأفضل على معيار QuALITY بنسبة 20% من حيث الدقة المطلقة.