التغييرات الصغيرة تحدث فروقات كبيرة: تحسين اختيار الردود المتعددة الدورات في أنظمة الحوار عبر التعلم التضادي الدقيق

اختيار الاستجابة القائمة على الاسترجاع يهدف إلى العثور على استجابة مناسبة من مجموعة مرشحة معطاة في سياق متعدد الأدوار. قد أدت الطرق المستندة إلى نماذج اللغة المدربة مسبقًا (PLMs) إلى تحسينات كبيرة في هذا المهمة. يلعب تمثيل التسلسل دورًا مهمًا في تعلم درجة التطابق بين سياق الحوار والاستجابة. ومع ذلك، لاحظنا أن أزواج السياق-الاستجابة المختلفة التي تشترك في نفس السياق دائمًا لديها تشابه أكبر في التمثيلات التسلسلية التي يتم حسابها بواسطة PLMs، مما يجعل من الصعب تمييز الاستجابات الإيجابية عن السلبية. انطلاقًا من هذا، نقترح طريقة جديدة للتعلم التبايني الدقيق (FGC) لمهام اختيار الاستجابة المستندة إلى PLMs. يساعد هذا الأسلوب التعلم التبايني الدقيق (FGC) النماذج اللغوية المدربة مسبقًا على إنشاء تمثيلات تطابق أكثر تمييزًا لكل حوار عند الحبوب الدقيقة، وبالتالي تحقيق تنبؤات أفضل في اختيار الاستجابات الإيجابية. تظهر الدراسات التجريبية على مجموعتين قياسيتين للبيانات أن الطريقة المقترحة للتعلم التبايني الدقيق (FGC) يمكن أن تحسن بشكل عام وملحوظ أداء النموذج للنماذج التطابقية القائمة على PLMs الحالية.