العالم ليس ثنائيًا: تعلم الترتيب باستخدام البيانات الرمادية لاختيار استجابة الحوار

يقوم اختيار الاستجابة بدور حاسم في بناء أنظمة المحادثة القائمة على الاسترجاع. رغم أن اختيار الاستجابة هو بطبيعته مشكلة تعلم الترتيب، فإن معظم الأعمال السابقة تتبنى وجهة نظر نقطة واحدة وتخضع مصنفات ثنائية للتدريب لهذه المهمة: يتم تصنيف كل مرشح استجابة إما بأنه ذي صلة (واحد) أو غير ذي صلة (صفر). من ناحية، يمكن أن يكون هذا التشكيل غير مثالي بسبب عدم اعتباره تنوع جودة الاستجابات. ومن ناحية أخرى، يمكن أن تكون عملية وضع العلامات على البيانات الرمادية لتعلم الترتيب باهظة الثمن ومليئة بالتحديات. في هذا العمل، نوضح أنه يمكن بناء البيانات الرمادية تلقائيًا دون الحاجة إلى جهد بشري. يستخدم أسلوبنا نماذج استرجاع الاستجابة الجاهزة ونماذج توليد الاستجابة كمولدات بيانات رمادية آلية. باستخدام البيانات الرمادية التي تم بناؤها، نقترح أهداف ترتيب متعددة المستويات للتدريب، والتي يمكنها (1) تعليم نموذج التطابق كيفية التقاط الفروقات الدقيقة بين سياق الاستجابة والمراسلات ذات الصلة، و(2) تقليل الاختلاف بين التدريب والاختبار فيما يتعلق بقوة المشتتات. طريقة عملنا بسيطة وفعالة وشاملة. أظهرت التجارب على ثلاثة مجموعات بيانات معيارية وأربعة نماذج متطابقة رائدة أن النهج المقترح يحقق تحسينات في الأداء كبيرة ومتسقة.