نهج EM صعب منفصل لاستجابة الأسئلة ذات الإشراف الضعيف

تُقدّم العديد من مهام الإجابة على الأسئلة (QA) فقط إشرافًا ضعيفًا حول كيفية حساب الإجابة. على سبيل المثال، تكون إجابات TriviaQA كيانات يمكن ذكرها عدة مرات في المستندات الداعمة، في حين يمكن حساب إجابات DROP من خلال استخلاص معادلات مختلفة متعددة من الأرقام الواردة في النص المرجعي. في هذا البحث، نُظهر إمكانية تحويل هذه المهام إلى مشكلات تعلّم متغيرات خفية منفصلة، باستخدام مجموعة مسبقة الحساب من الحلول الممكنة الخاصة بالمهام (مثل ذكر مختلف أو معادلات مختلفة)، والتي تتضمّن خيارًا صحيحًا واحدًا. ثم نطوّر خوارزمية تعلّم من نوع EM صارمة (hard EM) تُحسب فيها المشتقات بالنسبة للحل الأكثر احتمالًا في كل تحديث. وعلى الرغم من بساطتها، نُظهر أن هذه الطريقة تتفوّق بشكل كبير على الأساليب السابقة في ست مهام للإجابة على الأسئلة، بما في ذلك مكاسب مطلقة تتراوح بين 2% إلى 10%، وتحقيق أفضل أداء ممكن (state-of-the-art) في خمسة منها. إن استخدام التحديثات الصارمة بدلًا من تعميم الاحتمالات الحدية هو العامل المحوري في هذه النتائج، لأنه يشجّع النموذج على اكتشاف الإجابة الصحيحة الوحيدة، وهو ما نُظهره من خلال تحليل نوعي مفصل.