HyperAIHyperAI

Command Palette

Search for a command to run...

منذ 7 أيام

GroupRank: منهج إعادة ترتيب جماعي يُقود بواسطة التعلم المعزز

GroupRank: منهج إعادة ترتيب جماعي يُقود بواسطة التعلم المعزز

الملخص

أظهرت النماذج اللغوية الكبيرة إمكانات قوية كمُعدِّلات إعادة الترتيب (rerankers) لتعزيز الأداء العام لأنظمة RAG. ومع ذلك، تواجه النماذج الحالية للإعادة الترتيب تحديًا نظريًا وعمليًا جوهريًا: فالمُعدِّلات النقطية (Pointwise) ببساطتها العالية ومرونتها الكبيرة، تقيّم المستندات بشكل منفصل، مما يجعلها عرضة لـ "فخ ضعف الرؤية الترتيبية" (Ranking Myopia Trap)، حيث تتجاهل الأهمية النسبية بين المستندات. في المقابل، تتيح المُعدِّلات القائمة على القوائم (Listwise) إدراك السياق الترتيبية الشامل، لكنها تعاني من "مرونة القوائم المُتَعَقِّدة" (List Rigidity) المتأصلة فيها، ما يؤدي إلى مشاكل حادة في التوسع (scalability) والمرونة عند التعامل مع مجموعات مرشحة كبيرة. لمعالجة هذه التحديات، نقترح "Groupwise"، وهي نموذج جديد لإعادة الترتيب. في هذا النموذج، يتم إدخال الاستعلام مع مجموعة من المستندات المرشحة بشكل مشترك إلى النموذج، الذي يقوم بإجراء مقارنات داخل المجموعة لتعيين درجات ملاءمة فردية لكل مستند. ويحافظ هذا التصميم على مرونة النماذج النقطية، في الوقت الذي يتيح فيه القدرة على المقارنة مثل النماذج القائمة على القوائم. كما نستخدم تقنية GRPO لتدريب النموذج، مع دالة مكافأة غير متجانسة تدمج مقاييس الترتيب مع مكافأة توزيعية تهدف إلى مواءمة توزيع الدرجات عبر المجموعات. وللتغلب على العائق الناتج عن ندرة البيانات المُعلَّمة عالية الجودة، نقترح أيضًا مسارًا مبتكرًا لاستخلاص بيانات استرجاع وترتيب عالية الجودة. ويمكن استخدام هذه البيانات لا فقط لتدريب مُعدِّل إعادة الترتيب، بل أيضًا لتدريب مُسترجع (retriever). وقد أثبتت التجارب الواسعة فعالية نهجنا. فعلى مBenchmarkين مكثفيي التفكير، BRIGHT و R2MED، أظهرت النتائج تفوقًا ملحوظًا.

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة المشتركة بالذكاء الاصطناعي
وحدات معالجة رسومات جاهزة
أفضل الأسعار
ابدأ الآن

Hyper Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
GroupRank: منهج إعادة ترتيب جماعي يُقود بواسطة التعلم المعزز | الأوراق البحثية | HyperAI