الاستدلال الشائع السياقي متعدد الآراء: مجموعة بيانات ومهام جديدة

الاستدلال السياقي بالفطنة هو مهمة توليد أنواع مختلفة من التفسيرات حول الأحداث في حوار ثنائي، بما في ذلك السبب والدوافع والردود العاطفية وغيرها. إنتاج تفسير متماسك وغير بسيط يتطلب الوعي ببنية الحوار وكيفية تأصيل الحدث في السياق. في هذا العمل، ننشئ CICEROv2، وهو مجموعة بيانات تتكون من 8,351 حالة من 2,379 حوارًا، تحتوي على إجابات متعددة كتبها البشر لكل سؤال استدلال سياقي بالفطنة، مما يمثل نوعًا من التفسير للسبب والأحداث اللاحقة والدوافع والردود العاطفية. نظهر أن الاستدلالات في CICEROv2 أكثر تنوعًا معنويًا من مجموعات البيانات الأخرى للاستدلال السياقي بالفطنة. لحل مهمة الاستدلال، نقترح مجموعة من أهداف التدريب المسبق، بما في ذلك تنظيف المفاهيم وترتيب الجمل (utterance sorting) لإعداد نموذج تم تدريبه مسبقًا لمهمة الاستدلال السياقي بالفطنة اللاحقة. تُظهر نتائجنا أن أهداف التدريب المسبق المقترحة فعّالة في تعديل نموذج T5-Large المتدرب مسبقًا لمهمة الاستدلال السياقي بالفطنة.