HyperAIHyperAI

Command Palette

Search for a command to run...

RocketQA: نهج تدريب مُحسَّن للبحث الكثيف عن الفقرات في إجابة الأسئلة في النطاق المفتوح

Yingqi Qu Yuchen Ding Jing Liu Kai Liu Ruiyang Ren Wayne Xin Zhao Daxiang Dong Hua Wu Haifeng Wang

الملخص

في الإجابة على الأسئلة في المجال المفتوح، أصبح استرجاع الفقرات الكثيفة (Dense Passage Retrieval) نموذجًا جديدًا لاسترجاع الفقرات ذات الصلة للعثور على الإجابات. عادةً ما يتم اعتماد بنية المُشفر المزدوج (Dual-Encoder) لتعلم تمثيلات كثيفة للأسئلة والفقرات بهدف التوافق الدلالي. ومع ذلك، يُعد من الصعب تدريب المُشفر المزدوج بشكل فعّال بسبب التحديات التي تشمل الفجوة بين التدريب والاستنتاج، وجود أمثلة إيجابية غير مُعلمة، وندرة بيانات التدريب. ولحل هذه التحديات، نقترح منهجية تدريب مُحسَّنة تُسمى RocketQA، بهدف تحسين استرجاع الفقرات الكثيفة. ونُقدِّم ثلاث مساهمات تقنية رئيسية في RocketQA، وهي: السلبيات عبر الحزمة (Cross-batch negatives)، والسلبيات الصارمة المُنظَّفة (Denoised hard negatives)، وتعزيز البيانات (Data augmentation). وتُظهر نتائج التجارب أن RocketQA تتفوّق بشكل ملحوظ على النماذج السابقة المُتقدمة في مجال الأداء على كلا المجموعتين: MSMARCO وNatural Questions. كما أجرينا تجارب واسعة لفحص فعالية الاستراتيجيات الثلاث في RocketQA. علاوة على ذلك، نُظهر أن أداء أنظمة الإجابة النهائية (End-to-end QA) يمكن تحسينه باستخدام مُسترجع RocketQA.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
RocketQA: نهج تدريب مُحسَّن للبحث الكثيف عن الفقرات في إجابة الأسئلة في النطاق المفتوح | مستندات | HyperAI