
الملخص
أظهرت النماذج اللغوية الكبيرة إمكانات قوية كمُعدِّلات إعادة الترتيب (rerankers) لتعزيز الأداء العام لأنظمة RAG. ومع ذلك، تواجه النماذج الحالية للإعادة الترتيب تحديًا نظريًا وعمليًا جوهريًا: فالمُعدِّلات النقطية (Pointwise) ببساطتها العالية ومرونتها الكبيرة، تقيّم المستندات بشكل منفصل، مما يجعلها عرضة لـ "فخ ضعف الرؤية الترتيبية" (Ranking Myopia Trap)، حيث تتجاهل الأهمية النسبية بين المستندات. في المقابل، تتيح المُعدِّلات القائمة على القوائم (Listwise) إدراك السياق الترتيبية الشامل، لكنها تعاني من "مرونة القوائم المُتَعَقِّدة" (List Rigidity) المتأصلة فيها، ما يؤدي إلى مشاكل حادة في التوسع (scalability) والمرونة عند التعامل مع مجموعات مرشحة كبيرة. لمعالجة هذه التحديات، نقترح "Groupwise"، وهي نموذج جديد لإعادة الترتيب. في هذا النموذج، يتم إدخال الاستعلام مع مجموعة من المستندات المرشحة بشكل مشترك إلى النموذج، الذي يقوم بإجراء مقارنات داخل المجموعة لتعيين درجات ملاءمة فردية لكل مستند. ويحافظ هذا التصميم على مرونة النماذج النقطية، في الوقت الذي يتيح فيه القدرة على المقارنة مثل النماذج القائمة على القوائم. كما نستخدم تقنية GRPO لتدريب النموذج، مع دالة مكافأة غير متجانسة تدمج مقاييس الترتيب مع مكافأة توزيعية تهدف إلى مواءمة توزيع الدرجات عبر المجموعات. وللتغلب على العائق الناتج عن ندرة البيانات المُعلَّمة عالية الجودة، نقترح أيضًا مسارًا مبتكرًا لاستخلاص بيانات استرجاع وترتيب عالية الجودة. ويمكن استخدام هذه البيانات لا فقط لتدريب مُعدِّل إعادة الترتيب، بل أيضًا لتدريب مُسترجع (retriever). وقد أثبتت التجارب الواسعة فعالية نهجنا. فعلى مBenchmarkين مكثفيي التفكير، BRIGHT و R2MED، أظهرت النتائج تفوقًا ملحوظًا.
بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.