قل لي لماذا: استخدام الإجابة على الأسئلة كإشراف بعيد لتأييد الإجابة

لعدد كبير من تطبيقات الإجابة على الأسئلة (QA)، يُعد القدرة على تفسير سبب اختيار نموذج معين لإجابة ما أمرًا بالغ الأهمية. ومع ذلك، فإن نقص البيانات المُعلَّمة الخاصة بتبريرات الإجابات يجعل تعلُّم هذا الأمر صعبًا ومرتبطًا بتكاليف عالية. في هذا العمل، نقترح نهجًا يستخدم ترتيب الإجابات كمصدر تدريب بعيد (distant supervision) لتعلم كيفية اختيار تبريرات مفيدة، حيث تُشكِّل التبريرات روابط استنتاجية بين السؤال والإجابة الصحيحة، وغالبًا ما تحتوي على تداخل لغوي ضئيل مع أي منهما. نقترح بنية شبكة عصبية لـ QA تقوم بإعادة ترتيب تبريرات الإجابات كخطوة وسيطة (وقابلة للتفسير البشري) في عملية اختيار الإجابة. يُبنى هذا النهج على مجموعة من الميزات المصممة لدمج التمثيلات المُتعلَّمة مع الميزات الصريحة، بهدف التقاط العلاقة بين الأسئلة والإجابات وتبريرات الإجابات. ونُظهر أن استخدام هذا النهج المتكامل من الطرف إلى الطرف يُمكننا من تحسين أداء نموذج قوي يستند إلى البحث المعلوماتي (IR baseline) بشكل ملحوظ، سواء في ترتيب التبريرات (+9% من التبريرات المُصنَّفة كمُهمة جدًا) أو في اختيار الإجابة (+6% في P@1).